Basic Information

Insect: Trichogramma evanescens
Gene Symbol: bun_1
Assembly: GCA_902732785.1
Location: CACVKI010145819.1:39057-43898[-]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 1 1.9e+04 -5.5 3.9 37 57 113 133 111 135 0.64

2 7 1 1.9e+04 -7.7 5.9 27 56 410 439 406 440 0.64

3 7 1 1.9e+04 -6.6 4.6 43 56 499 511 488 513 0.53

4 7 0.032 6.2e+02 0.7 1.1 32 57 656 681 651 682 0.85

5 7 2.1e-30 4.1e-26 91.0 3.9 1 54 754 807 754 814 0.97

6 7 1 1.9e+04 -15.5 15.7 52 52 850 850 809 870 0.65

7 7 1 1.9e+04 -9.1 8.4 35 42 863 870 852 888 0.45

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	1	1.9e+04	-5.5	3.9	37	57	113	133	111	135	0.64
2	7	1	1.9e+04	-7.7	5.9	27	56	410	439	406	440	0.64
3	7	1	1.9e+04	-6.6	4.6	43	56	499	511	488	513	0.53
4	7	0.032	6.2e+02	0.7	1.1	32	57	656	681	651	682	0.85
5	7	2.1e-30	4.1e-26	91.0	3.9	1	54	754	807	754	814	0.97
6	7	1	1.9e+04	-15.5	15.7	52	52	850	850	809	870	0.65
7	7	1	1.9e+04	-9.1	8.4	35	42	863	870	852	888	0.45

Sequence Information

Coding Sequence: ATGGCAGATCACAACAATATCATACGCAAGCCCGCCACCACCACGTCCCTGAGCCAGATCGCTAAGCAGCACGGGGGGGCGACCACGACGACCAGCGTGACGATGGGTCATCATCATCACGCAGGAGGAGGGGTAGGAGGAGGACCTGCGGGACAGGTCCCCGTGAGAAAGATCTCGGCGCCGGTGCATCGTACCACCTCGGAGACCATGAGGCTCGGCGAGCCCGTTGAAAATTCCGGTACCCTGCTCGCCGGCACGTTAAtaacggcgacgacgacgacctcgACGGGCACGACCACGGCGACGACGGTACAGAGCGGCGGTAGCGGTAGCAACAACAATGTCCTCgtcaacaacagcagcagcagccaaagcCAAagtcaacagcagcagcagcagcagcaacagaaccTCGCCGCATCGAGCGGTAGCAGCACCGGCAGCCCGCAGCAGCGCACCAAGAAGACGTCCTCGTTTCAGATAACCAGCGTGACGGTGGGCTGCCGCATGAGCAACGACGCCGGCGAGGACTCGAACGACGACCTCGACGAGTCGCACACGGACGACAACACGAGCTGCGAGCAGAACTCCACGCGGCTGGGCGGCAACGGAGGCGACACGACGACGGACACGGAGAGGACCACCCCGACGACGAGCTACTCCGAGGACACGTTCTCCAAGGACGACGTGTTCTTCAACACGAGCAACTCGGCGCTGAGCACGGCGCCCGTCATACCGACCAGCTCGCAGTACGGCCTGGCCATAGTGCCCTCGTCCGAGGCGAGCGGCTGTCTGCACCCGGGCAACTCGACGACGATCAACGCCAACGACATCAACGCCCTGGAGATGGTGACCGCCGTGACGGACAACAACATCATCAATCTGCTGTCGGCCAGTGCCAAGCAAGACGCCGACCTGCGCGAAGTACACTCGCACGGGAGGAACGAGCGATTCAAGGTTGTCAAAATCGAGAGCACGGATCCGTACAAGCGCGGCCGATGGACCTGCATGGATTACCTGGACCAGGCCTCGGTCAATCCGGGCGGGGGCGGTGGCGTGACCGTGACGAAAAATTCCACGGATCCGAACGAGGTCTGCATCTCGTACGGCGTTCTGGAGTCGGGAAAGATCATTCCcgacaagcagcagcagcagatgagCATGGACGAGAACAGCGTGGGCGCCGGTGGTGTGACGGTGGACGCGAACGGCACCATGCATCAAACGATGCAAcagatgcagcagcaacaggtgCCGCAGCAGCAATATTATCAGTCGTCTAatgcgcaacagcagcagcaacaacctcagcagcagcaacaccaaCCGAGTCAGGGTGCGACGTTACCAAATAATTTGCAATTAACGCACACGGCTCCGAGCTTAGTACAGCCGCAGCCACCGCAGAGTATGCCCCCAGGAAGCATTCCTATTCTGAATCAGCAGGGAGTGTCTGTTGCGCAAGCCAGTAATAACGTTTCTgctcaacaacaacaagcacctcaacagcagcaacagcaacagcaacaacaacaaccgcaacagcaacaacagcagacCTTACCGCCTCACCCCAACGACGAAACGTCGTTCGTCCACGTGAACTCGCAAGGTCAAAATATGATGCAAGCGCAAAATGTTGCCGCCAGCTCTCCGTCTCAAAGTTCCCAGACCAATATGCTGTtgacgcagcagcaacagcagcagccgtcgaCGTCGCCAGCCCAACAGATGCAAGACCCCATGCAGACTGCGATGCAGAATATGGCGTGTTTACATAAAGTTCCTCAATCGGGTTCGTCTCCcaaccaacagcagcagcagcaaccccaGCCCCAGCAAATGCAACAGCACTCGCAAGTGATGGGACAAATTGCTCAaccacagcaacagcagcagcagcacgtgcaTGACATGAGCTCGGCGCCTAGCTCAGCGGGAGCTTCTCAAGTGCAAATGGTCGGTGGTTTACAGCAAGGTAATATGCAGTATCATCAACCACCGCCAccgcaacagcaacaacaacagcaacaacagcagcagcaacagcaacagcagcaacatcaacaGCAAACCGATGCCGAGCAGGACTCTTTGGCAACGGGTATAATAATTCCCAATTCGGCTGTAGAAGCTGCACTGCTGGAGTCGCTGGCTGaagttaataaaattaacgaCGGGGGCGAGCCAGCCAAGGAGGACAATGAAAGCTTATCTGGTACGGGAGCAGTTGCGATTGACAATAAAATAGAACAAGCCATGGATCTTGTGAAAAGTCATTTAATGTTCGCTGTGCGAGAGGAAGTTGAAGtgctcaaagaaaaaattgccgaACTGATGGATAGGATAAATCAATTGGAGGCCGAAAATATGTTGTTGAAAGCTCATGCGTCGCCTGATGTCTTGTCTCAATTGAGCCAAGTGCTTGCGAAACAGCAGCAGGCACAACAAgcgcaacaacagcaacaacaacagcaacagcaggcCCCTCAGCAACAACAACCGTCCcaaccacagcagcagcaatcaccgcaacaacagcagcaacagcagcagcaacaacagcaacaacaacaacaacaacaacaacaacaacaacaacaacaacaacaaccaccgccgcaacagcaacagcagcagcagcaacagttgCAACAACAGCAACCGCCTCAGACACAGCAACAGTTAAATATGAACAATACTCAAGGTAGTGGTCAGTAG
Protein Sequence: MADHNNIIRKPATTTSLSQIAKQHGGATTTTSVTMGHHHHAGGGVGGGPAGQVPVRKISAPVHRTTSETMRLGEPVENSGTLLAGTLITATTTTSTGTTTATTVQSGGSGSNNNVLVNNSSSSQSQSQQQQQQQQQNLAASSGSSTGSPQQRTKKTSSFQITSVTVGCRMSNDAGEDSNDDLDESHTDDNTSCEQNSTRLGGNGGDTTTDTERTTPTTSYSEDTFSKDDVFFNTSNSALSTAPVIPTSSQYGLAIVPSSEASGCLHPGNSTTINANDINALEMVTAVTDNNIINLLSASAKQDADLREVHSHGRNERFKVVKIESTDPYKRGRWTCMDYLDQASVNPGGGGGVTVTKNSTDPNEVCISYGVLESGKIIPDKQQQQMSMDENSVGAGGVTVDANGTMHQTMQQMQQQQVPQQQYYQSSNAQQQQQQPQQQQHQPSQGATLPNNLQLTHTAPSLVQPQPPQSMPPGSIPILNQQGVSVAQASNNVSAQQQQAPQQQQQQQQQQQPQQQQQQTLPPHPNDETSFVHVNSQGQNMMQAQNVAASSPSQSSQTNMLLTQQQQQQPSTSPAQQMQDPMQTAMQNMACLHKVPQSGSSPNQQQQQQPQPQQMQQHSQVMGQIAQPQQQQQQHVHDMSSAPSSAGASQVQMVGGLQQGNMQYHQPPPPQQQQQQQQQQQQQQQQQHQQQTDAEQDSLATGIIIPNSAVEAALLESLAEVNKINDGGEPAKEDNESLSGTGAVAIDNKIEQAMDLVKSHLMFAVREEVEVLKEKIAELMDRINQLEAENMLLKAHASPDVLSQLSQVLAKQQQAQQAQQQQQQQQQQAPQQQQPSQPQQQQSPQQQQQQQQQQQQQQQQQQQQQQQQQQQPPPQQQQQQQQQLQQQQPPQTQQQLNMNNTQGSGQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01484403; iTF_01481404;
90% Identity: -
80% Identity: -