Basic Information

Insect: Macrosiphum euphorbiae
Gene Symbol: -
Assembly: GCA_949089665.1
Location: CARXXK010000002.1:50604595-50606145[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 1 2.6e+03 0.6 0.0 27 44 16 33 12 41 0.85

2 18 0.023 57 5.9 0.1 15 43 32 60 24 66 0.84

3 18 0.014 36 6.5 0.0 21 43 66 88 61 97 0.85

4 18 0.24 6.1e+02 2.6 0.0 20 43 93 116 88 127 0.76

5 18 2.5 6.4e+03 -0.7 0.0 21 39 122 140 109 147 0.77

6 18 0.0092 23 7.1 0.1 20 44 149 173 141 181 0.86

7 18 0.27 6.8e+02 2.4 0.1 18 43 175 200 172 211 0.78

8 18 1.7 4.3e+03 -0.2 0.1 21 43 206 228 197 237 0.77

9 18 0.9 2.3e+03 0.7 0.1 19 42 232 255 220 267 0.72

10 18 1.8 4.5e+03 -0.2 0.0 20 43 261 284 252 288 0.81

11 18 0.016 40 6.3 0.0 21 45 290 314 282 322 0.84

12 18 1 2.5e+03 0.6 0.2 21 43 318 340 313 349 0.75

13 18 0.93 2.3e+03 0.7 0.1 19 42 344 367 333 379 0.72

14 18 1.2 3.2e+03 0.3 0.0 20 44 373 397 362 406 0.81

15 18 1.6 4e+03 -0.0 0.0 21 43 402 424 392 435 0.77

16 18 1.4 3.5e+03 0.1 0.1 20 41 429 450 418 456 0.77

17 18 0.019 49 6.1 0.0 20 43 457 480 451 484 0.88

18 18 0.06 1.5e+02 4.5 0.3 21 43 486 508 481 513 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	1	2.6e+03	0.6	0.0	27	44	16	33	12	41	0.85
2	18	0.023	57	5.9	0.1	15	43	32	60	24	66	0.84
3	18	0.014	36	6.5	0.0	21	43	66	88	61	97	0.85
4	18	0.24	6.1e+02	2.6	0.0	20	43	93	116	88	127	0.76
5	18	2.5	6.4e+03	-0.7	0.0	21	39	122	140	109	147	0.77
6	18	0.0092	23	7.1	0.1	20	44	149	173	141	181	0.86
7	18	0.27	6.8e+02	2.4	0.1	18	43	175	200	172	211	0.78
8	18	1.7	4.3e+03	-0.2	0.1	21	43	206	228	197	237	0.77
9	18	0.9	2.3e+03	0.7	0.1	19	42	232	255	220	267	0.72
10	18	1.8	4.5e+03	-0.2	0.0	20	43	261	284	252	288	0.81
11	18	0.016	40	6.3	0.0	21	45	290	314	282	322	0.84
12	18	1	2.5e+03	0.6	0.2	21	43	318	340	313	349	0.75
13	18	0.93	2.3e+03	0.7	0.1	19	42	344	367	333	379	0.72
14	18	1.2	3.2e+03	0.3	0.0	20	44	373	397	362	406	0.81
15	18	1.6	4e+03	-0.0	0.0	21	43	402	424	392	435	0.77
16	18	1.4	3.5e+03	0.1	0.1	20	41	429	450	418	456	0.77
17	18	0.019	49	6.1	0.0	20	43	457	480	451	484	0.88
18	18	0.06	1.5e+02	4.5	0.3	21	43	486	508	481	513	0.85

Sequence Information

Coding Sequence: ATGACGACACACCAGCGGACGTATATGAAGATGAAAGCTTATccatgcgatgtatgcgacatgTCATTCAGTCAAAGTAGTGGTCTGACAAGACATCGACGGACCCATACTGGCGAGAAACCATACGCATGTGATATATGCGAAAAATCGTTTACTGAAAGTGGCTCATTGACGAGACATCGTAGGACTCACACGGGCGAGAAACCATTCAAATGCGATATATGTGACATGTCGTTCAGTCAAAGTGGGAATTTGATAAGTCATCGACGATCCCACACTGGTGAGAAGCCTTTTGCGTGCGATATATGTGACAAATCGTTTGCTACAAGTCATACTTTGATGGATCATCATCGGACTCACACGGGCGAGAAACCATTTgcgtgcgatgtatgcgacaagtcgttcgctGAAAGTGGCTCATTGACGTTTCATCGTAGGACTCACACAGGGGAGAGACCATTTGCGTGTGATGTATGTAACATGTCATTCAGTCAAAGTGGTCATTTGACAAGACATCGACGGAAACACACTGGCGAGAAGCCTTTTGCATGCGATATATGTGAAAAATCGTTTGCTACAAGTTACACTCTGACGAATCATCATCGGACTCACACGGGCGAGAAACCATTTgcgtgcgatgtatgcgacaagtcgttctctgaaAGTGGCACATTGACGTGTCATCGTAGGACTCACACGGGTGAAAAGCCTTTTGAGTGCGATATATGTGACAAATCGTTTGCTGCGAGTTTCACATTGACGTGTCATCGTAGGACTCACACGGGTGAAAAGCCATTTGTTTGCGATTTATGTGACAAATCGTTTACTACAAGTCACACTCTGACGAATCATCATCGGACTCACACGGGCGAGAAACCATTAgcgtgcgatgtatgcgacaagtcgttcagTCAAAGTGGCGGTTTGACTAGACATCGCAGGACTCACAATGGCCAGAAACCATTTAcgtgcgatgtatgcgacaagtcgttctctgaaAGTGGCACATTGACGTGTCATCGTAGGACTCACACGGGTGAAAAGCCTTTTGAGTGCGATATATGTGACAAATCGTTTGCTGCGAGTTTCACATTGACGTGTCATCGTAGGACTCACACGGGTGAAAAGCCATTTGTTTGCGATTTATGTGACAAATCGTTTACTACAAGTCACACTCTGACGAATCATCATCGGACTCACACGGGCGAGAAACCATTTgcgtgcgatgtatgcgacaagtcgttcgctGAAAGTGGCGCATTGACGTGTCATCGTAGGACTCACACGGGTGAAAAGCCATTTGCGTGCGATGTATGCGAGAAGTCATTCAGTAATAGTAGTAGTTTGATTTCTCATCGACGAACCCACACGGGCGAGAAACCATACGCATGCAATGTATGCGACATGTCGTTCAGTCAAAGTGGCGGTTTGACTAGACATCGCAGGACTCACAATGGCCAGAAACCATTTACGTGCGATCTATGTAATAGGTCGTTTGCTAAATGTAGAAATTTAACGATACACAAGCGGAAACACACTTTAGTTCTATGA
Protein Sequence: MTTHQRTYMKMKAYPCDVCDMSFSQSSGLTRHRRTHTGEKPYACDICEKSFTESGSLTRHRRTHTGEKPFKCDICDMSFSQSGNLISHRRSHTGEKPFACDICDKSFATSHTLMDHHRTHTGEKPFACDVCDKSFAESGSLTFHRRTHTGERPFACDVCNMSFSQSGHLTRHRRKHTGEKPFACDICEKSFATSYTLTNHHRTHTGEKPFACDVCDKSFSESGTLTCHRRTHTGEKPFECDICDKSFAASFTLTCHRRTHTGEKPFVCDLCDKSFTTSHTLTNHHRTHTGEKPLACDVCDKSFSQSGGLTRHRRTHNGQKPFTCDVCDKSFSESGTLTCHRRTHTGEKPFECDICDKSFAASFTLTCHRRTHTGEKPFVCDLCDKSFTTSHTLTNHHRTHTGEKPFACDVCDKSFAESGALTCHRRTHTGEKPFACDVCEKSFSNSSSLISHRRTHTGEKPYACNVCDMSFSQSGGLTRHRRTHNGQKPFTCDLCNRSFAKCRNLTIHKRKHTLVL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00942014;
90% Identity: iTF_00942014;
80% Identity: iTF_00942014;