Basic Information

Insect: Coenonympha arcania
Gene Symbol: Evi5_4
Assembly: GCA_036785405.1
Location: JAWDAA010000032.1:2702983-2719356[-]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 1.9 8.9e+03 -2.2 0.0 28 42 66 80 60 85 0.81

2 17 0.039 1.8e+02 3.2 0.2 31 50 90 107 86 113 0.74

3 17 0.29 1.4e+03 0.4 0.5 9 48 131 170 130 178 0.80

4 17 0.00021 1 10.4 0.5 24 55 212 243 208 245 0.90

5 17 0.00021 1 10.4 0.5 24 55 259 290 255 292 0.90

6 17 0.00021 1 10.4 0.5 24 55 306 337 302 339 0.90

7 17 0.00021 1 10.4 0.5 24 55 353 384 349 386 0.90

8 17 0.00021 1 10.4 0.5 24 55 400 431 396 433 0.90

9 17 0.00021 1 10.4 0.5 24 55 447 478 443 480 0.90

10 17 0.00021 1 10.4 0.5 24 55 494 525 490 527 0.90

11 17 0.00021 1 10.4 0.5 24 55 541 572 537 574 0.90

12 17 0.00021 1 10.4 0.5 24 55 588 619 584 621 0.90

13 17 0.00021 1 10.4 0.5 24 55 635 666 631 668 0.90

14 17 0.00018 0.86 10.6 0.8 24 55 682 713 678 715 0.91

15 17 1.5 7e+03 -1.9 2.6 26 47 787 808 762 819 0.64

16 17 3.3 1.5e+04 -3.0 0.2 28 41 845 858 832 864 0.59

17 17 0.037 1.7e+02 3.3 0.0 14 34 880 900 879 903 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	1.9	8.9e+03	-2.2	0.0	28	42	66	80	60	85	0.81
2	17	0.039	1.8e+02	3.2	0.2	31	50	90	107	86	113	0.74
3	17	0.29	1.4e+03	0.4	0.5	9	48	131	170	130	178	0.80
4	17	0.00021	1	10.4	0.5	24	55	212	243	208	245	0.90
5	17	0.00021	1	10.4	0.5	24	55	259	290	255	292	0.90
6	17	0.00021	1	10.4	0.5	24	55	306	337	302	339	0.90
7	17	0.00021	1	10.4	0.5	24	55	353	384	349	386	0.90
8	17	0.00021	1	10.4	0.5	24	55	400	431	396	433	0.90
9	17	0.00021	1	10.4	0.5	24	55	447	478	443	480	0.90
10	17	0.00021	1	10.4	0.5	24	55	494	525	490	527	0.90
11	17	0.00021	1	10.4	0.5	24	55	541	572	537	574	0.90
12	17	0.00021	1	10.4	0.5	24	55	588	619	584	621	0.90
13	17	0.00021	1	10.4	0.5	24	55	635	666	631	668	0.90
14	17	0.00018	0.86	10.6	0.8	24	55	682	713	678	715	0.91
15	17	1.5	7e+03	-1.9	2.6	26	47	787	808	762	819	0.64
16	17	3.3	1.5e+04	-3.0	0.2	28	41	845	858	832	864	0.59
17	17	0.037	1.7e+02	3.3	0.0	14	34	880	900	879	903	0.87

Sequence Information

Coding Sequence: ATGGACGTATTCCTGTCCGAGGGGATAGAGATCGTCTTCAAAGTCGCCCTCGCACTTCTAACTCTGGGCAAAGATGATCTTTTGTCACTGGATATGGAAAACATCTTAAAGTTCATGCAAAAAGAGCTGCCACAGAAGGCCGAAGCTGATGAAGACGCGTTTATGAATCTCGCCTACTCCATCAAAGTTAACCCCGAGAAAATGAAGAAATTAGAAAAGGAATACACTGTTATCAAGACTAAGGAACAAGGAGACATAGCAGTTCTCAGATGTTTACGCCAGGAAAATCGTCTACTCAAACAAAGTGTTGAATTACTGGAGAAAGAAAGTTCAGCCTTAGTCGAAAGACTTGTCCAGGGTCAAGTGGACCGAGCTGAAGGCGAAGAGAAGACTTTTGCTTTGGCCCGAGAAGTGCAAGCTCTGCGTCGCGCAAATATGGATGCCCAGCAACGCCTTGCTGTTGCCCAGGATGAGATACGGAGCTTGGAAATGACTATAGCTGagAACAACTCCAGGCAATCGTCGCTAGAACGCACAGaggcgcacaacgcgaagggcgaagagctggctcgttgcctccagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagcgcgagctggtgcgggccaggctcgacgcagcggagcgGCGAGCCGCGGAGAGGGAGCTCCACGCTAGGGTCGCGGAGCTGGAGgacgagaacaagagcctgaggaaacagcgggtcgacaacaacgtagctcacttgcagGAACACAGACAAGAggctccgccgccgccgcccagtCAGTCAAACGTGGTCTCCGACATCATGGCCACTCCGAAGAAGCTTCTAAGAGCGTGGGAGGGCAGGTCCTCTGACATGCAAAAACTGGAAGAAGACTTGATGACTGTTAAAATTAAGGAAGTGGAGGCACTCACCGAGCTGAAGGAGCTCAGACTTAAGGAAATGGAGCTTCGTACCCAAGTGCAAGTATCGACCGACCAGCTGAGGAGGCAGGACGAGGAGCTGCGGCAGCTGCGCGAGGCGCTGCAGCGGGAGCGCGCCCTGCAGACCCGCCAGCGGGAGTTCCAGCACAAATACGCAGACCTGGAGAGCGAGGCTAAATATGAATCGATGCAAGCCAACATTCGCAACATGGAAGACGCACAGCGTATTGCCGAGTTGAAAATCGAAGTTTCAGAGTATAAATTAAAGCATGAAGTGATGGCGACGGAGGGTGCACTTCGGAGCAACAACAACACGGAGGACTCTGAACCGGTTCGTGGACTGCAGGATCAAATCACTGAACTGCGGACCGAGGTTATGCGGTTAGAGGCATGGAAGGCACGATTTCTCGGCCACTCGCCCGTTCGCGCTATCTCTGTGGACGAGGACCTCACTGAAGACGACAAATGCGTATCTATCGATCTCAACGACAAGAGTATGTCGTAG
Protein Sequence: MDVFLSEGIEIVFKVALALLTLGKDDLLSLDMENILKFMQKELPQKAEADEDAFMNLAYSIKVNPEKMKKLEKEYTVIKTKEQGDIAVLRCLRQENRLLKQSVELLEKESSALVERLVQGQVDRAEGEEKTFALAREVQALRRANMDAQQRLAVAQDEIRSLEMTIAENNSRQSSLERTEAHNAKGEELARCLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQRELVRARLDAAERRAAERELHARVAELEDENKSLRKQRVDNNVAHLQEHRQEAPPPPPSQSNVVSDIMATPKKLLRAWEGRSSDMQKLEEDLMTVKIKEVEALTELKELRLKEMELRTQVQVSTDQLRRQDEELRQLREALQRERALQTRQREFQHKYADLESEAKYESMQANIRNMEDAQRIAELKIEVSEYKLKHEVMATEGALRSNNNTEDSEPVRGLQDQITELRTEVMRLEAWKARFLGHSPVRAISVDEDLTEDDKCVSIDLNDKSMS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00352789;
90% Identity: iTF_00352789;
80% Identity: iTF_00352789;