Basic Information

Insect: Macrosiphum euphorbiae
Gene Symbol: -
Assembly: GCA_949089665.1
Location: CARXXK010000002.1:39074144-39075922[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 0.084 2.1e+02 4.0 0.0 20 44 57 81 50 90 0.83

2 19 0.65 1.6e+03 1.2 0.1 20 43 85 108 80 113 0.83

3 19 0.04 1e+02 5.1 0.0 14 44 107 137 104 147 0.82

4 19 0.57 1.5e+03 1.4 0.1 20 43 141 164 135 173 0.81

5 19 0.041 1e+02 5.0 0.0 14 44 163 193 157 201 0.83

6 19 0.09 2.3e+02 3.9 0.1 19 43 196 220 191 229 0.82

7 19 0.053 1.3e+02 4.7 0.0 14 43 219 248 215 252 0.85

8 19 0.1 2.6e+02 3.7 0.0 20 43 253 276 247 285 0.83

9 19 0.67 1.7e+03 1.1 0.1 20 43 281 304 276 308 0.83

10 19 0.054 1.4e+02 4.7 0.0 14 43 303 332 300 337 0.85

11 19 0.092 2.3e+02 3.9 0.0 20 43 337 360 330 370 0.82

12 19 0.67 1.7e+03 1.1 0.1 20 43 365 388 360 392 0.83

13 19 0.039 1e+02 5.1 0.0 14 44 387 417 383 427 0.83

14 19 0.46 1.2e+03 1.7 0.1 20 44 421 445 415 453 0.82

15 19 0.37 9.5e+02 2.0 0.1 14 43 443 472 440 477 0.81

16 19 0.088 2.2e+02 4.0 0.0 20 43 477 500 472 509 0.83

17 19 0.17 4.2e+02 3.1 0.1 20 44 505 529 500 537 0.82

18 19 0.4 1e+03 1.9 0.1 15 43 528 556 525 560 0.80

19 19 0.014 36 6.5 0.0 20 43 561 584 552 589 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	0.084	2.1e+02	4.0	0.0	20	44	57	81	50	90	0.83
2	19	0.65	1.6e+03	1.2	0.1	20	43	85	108	80	113	0.83
3	19	0.04	1e+02	5.1	0.0	14	44	107	137	104	147	0.82
4	19	0.57	1.5e+03	1.4	0.1	20	43	141	164	135	173	0.81
5	19	0.041	1e+02	5.0	0.0	14	44	163	193	157	201	0.83
6	19	0.09	2.3e+02	3.9	0.1	19	43	196	220	191	229	0.82
7	19	0.053	1.3e+02	4.7	0.0	14	43	219	248	215	252	0.85
8	19	0.1	2.6e+02	3.7	0.0	20	43	253	276	247	285	0.83
9	19	0.67	1.7e+03	1.1	0.1	20	43	281	304	276	308	0.83
10	19	0.054	1.4e+02	4.7	0.0	14	43	303	332	300	337	0.85
11	19	0.092	2.3e+02	3.9	0.0	20	43	337	360	330	370	0.82
12	19	0.67	1.7e+03	1.1	0.1	20	43	365	388	360	392	0.83
13	19	0.039	1e+02	5.1	0.0	14	44	387	417	383	427	0.83
14	19	0.46	1.2e+03	1.7	0.1	20	44	421	445	415	453	0.82
15	19	0.37	9.5e+02	2.0	0.1	14	43	443	472	440	477	0.81
16	19	0.088	2.2e+02	4.0	0.0	20	43	477	500	472	509	0.83
17	19	0.17	4.2e+02	3.1	0.1	20	44	505	529	500	537	0.82
18	19	0.4	1e+03	1.9	0.1	15	43	528	556	525	560	0.80
19	19	0.014	36	6.5	0.0	20	43	561	584	552	589	0.87

Sequence Information

Coding Sequence: ATGGAGAAGAATCATTATCCGTGCGACGTATGTGACAAGTCATTTGCCGAAAGTGGCAAGTTAACGAATCATCGAAGGATGCACACAGGCGAGAAACCATACGCATACGATGTATGCAACAAGTCGTTTGCTGTAAGTAAAGCATTGACGATTCATCGACGAACACACACAGGCGAAAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGACGGCTCACCGACGAACACACACAGGCGAGAAAccatacgcatgcgatgtatgcgacaagtcatttGCTAATAGTGACCAATTAACGAAACATCGACGAACACACACAGGCGAAAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGATGGCTCACCGACAAACACACACAGGCGAGAAACCATACGCATGTGACGTATGTGACAAGTCATTTGCTAATAGTGGCCAATTAACGAAACATCGACGGACGCACACAGGCGAGAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGATGGCTCACCGACGAACACACACAAGCGAGAAACCATACGCATGTGACGTATGTGACAAGTCATTTGCTAATAGTGGCCAATTAACGAAACATCGACGAACACACACAGGCGAAAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGACGGCTCACCGACGAACACACACAGGCGAGAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGATGGCTCACCGACGAACACACACAGGCGAGAAACCATACGCATGTGAcgtatgcgacaagtcatttGCTAATAGTGACCAATTAACGAAACATCGACGAACACACACAGGCGAGAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGACGGCTCACCGACGAACACACACAGGCGAAAAACCATACGCATgtgatgtatgcgacaagttgTTTAGTCAAAGTGGCCATCTGATGGCTCACCGACGAACACACACAGGCGAGAAACCATACGCATGTGAcgtatgcgacaagtcatttGCTAATAGTGACCAATTAACGAAACATCGACGAACACACACAGGCGAGAAACCATACGCATGCAATGTATGCGACAAGTTGTTTAGTCAAAGTGGCCATCTGATGGCTCACCGACGAACACACACAGGCGAGAAACCATACGCATGTGAcgtatgcgacaagtcatttGCTAATAGTGACCAATTAACGAAACATCGACGAACACACACAGGCGAGAAAccatacgcatgcgatgtatgtgacaagtcgtttGCCGAAAGTAAAACATTGACGATTCATCGACGAACACACACAGGCGAGAAACCATACGCATGCAATGTATGCGACAAGTTGTTTAGTCAAAGTGGCCATCTGACGGCTCACCGACGAACACACACAGGCGAGAAACCATAcgcatgcgatatatgcgacaagtcatttGCTAATAGTGACCAATTAACGAAACATCGACGAACACACACAGGCGAAAAAccatacgcatgcgatgtatgtgacaagtcgtttGCCGAAAGTAAAACATTGACGATTCATCGACGAACACACACAGGCGAGAAACCATACGCATGCggtgtatgcgacaagtcgtttaGTCAAAGTAGTAATCTGATGACTCACCGACGAACACACATTTGTGACAAGTAG
Protein Sequence: MEKNHYPCDVCDKSFAESGKLTNHRRMHTGEKPYAYDVCNKSFAVSKALTIHRRTHTGEKPYACDVCDKLFSQSGHLTAHRRTHTGEKPYACDVCDKSFANSDQLTKHRRTHTGEKPYACDVCDKLFSQSGHLMAHRQTHTGEKPYACDVCDKSFANSGQLTKHRRTHTGEKPYACDVCDKLFSQSGHLMAHRRTHTSEKPYACDVCDKSFANSGQLTKHRRTHTGEKPYACDVCDKLFSQSGHLTAHRRTHTGEKPYACDVCDKLFSQSGHLMAHRRTHTGEKPYACDVCDKSFANSDQLTKHRRTHTGEKPYACDVCDKLFSQSGHLTAHRRTHTGEKPYACDVCDKLFSQSGHLMAHRRTHTGEKPYACDVCDKSFANSDQLTKHRRTHTGEKPYACNVCDKLFSQSGHLMAHRRTHTGEKPYACDVCDKSFANSDQLTKHRRTHTGEKPYACDVCDKSFAESKTLTIHRRTHTGEKPYACNVCDKLFSQSGHLTAHRRTHTGEKPYACDICDKSFANSDQLTKHRRTHTGEKPYACDVCDKSFAESKTLTIHRRTHTGEKPYACGVCDKSFSQSSNLMTHRRTHICDK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00941987; iTF_00942456; iTF_00941984;
90% Identity: iTF_00941984;
80% Identity: iTF_00941984;