Basic Information

Insect: Tipula unca
Gene Symbol: -
Assembly: GCA_951394425.1
Location: OX596382.1:44841995-44854137[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 0.0019 24 6.6 0.1 23 47 9 33 6 39 0.85

2 17 0.066 8.3e+02 1.7 0.1 21 45 35 59 32 68 0.81

3 17 0.012 1.6e+02 4.0 0.0 21 46 91 116 85 122 0.78

4 17 0.021 2.6e+02 3.2 0.0 21 46 119 144 116 149 0.89

5 17 0.011 1.4e+02 4.1 0.0 22 52 148 178 143 180 0.85

6 17 0.028 3.5e+02 2.9 0.1 21 46 175 200 173 206 0.91

7 17 0.5 6.3e+03 -1.2 0.0 23 47 205 229 196 234 0.77

8 17 0.016 2e+02 3.7 0.0 21 51 231 261 223 262 0.86

9 17 1.3e-06 0.016 16.8 0.1 21 48 259 286 255 290 0.88

10 17 0.0033 42 5.8 0.0 22 46 316 340 311 348 0.88

11 17 0.021 2.6e+02 3.2 0.0 26 48 348 370 342 375 0.82

12 17 0.027 3.4e+02 2.9 0.0 21 52 371 402 367 403 0.86

13 17 0.023 2.9e+02 3.1 0.1 21 46 399 424 391 430 0.86

14 17 0.019 2.4e+02 3.4 0.2 21 51 427 457 421 460 0.86

15 17 0.067 8.3e+02 1.6 0.2 21 52 455 486 451 488 0.86

16 17 0.021 2.6e+02 3.2 0.1 21 47 483 509 477 514 0.85

17 17 0.035 4.3e+02 2.6 0.1 21 46 511 536 506 538 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	0.0019	24	6.6	0.1	23	47	9	33	6	39	0.85
2	17	0.066	8.3e+02	1.7	0.1	21	45	35	59	32	68	0.81
3	17	0.012	1.6e+02	4.0	0.0	21	46	91	116	85	122	0.78
4	17	0.021	2.6e+02	3.2	0.0	21	46	119	144	116	149	0.89
5	17	0.011	1.4e+02	4.1	0.0	22	52	148	178	143	180	0.85
6	17	0.028	3.5e+02	2.9	0.1	21	46	175	200	173	206	0.91
7	17	0.5	6.3e+03	-1.2	0.0	23	47	205	229	196	234	0.77
8	17	0.016	2e+02	3.7	0.0	21	51	231	261	223	262	0.86
9	17	1.3e-06	0.016	16.8	0.1	21	48	259	286	255	290	0.88
10	17	0.0033	42	5.8	0.0	22	46	316	340	311	348	0.88
11	17	0.021	2.6e+02	3.2	0.0	26	48	348	370	342	375	0.82
12	17	0.027	3.4e+02	2.9	0.0	21	52	371	402	367	403	0.86
13	17	0.023	2.9e+02	3.1	0.1	21	46	399	424	391	430	0.86
14	17	0.019	2.4e+02	3.4	0.2	21	51	427	457	421	460	0.86
15	17	0.067	8.3e+02	1.6	0.2	21	52	455	486	451	488	0.86
16	17	0.021	2.6e+02	3.2	0.1	21	47	483	509	477	514	0.85
17	17	0.035	4.3e+02	2.6	0.1	21	46	511	536	506	538	0.89

Sequence Information

Coding Sequence: ATGATTAATAATTACATTGCTCGGAAACCATTCACATGTGAAATATGTTCGAAGGCATTTCGATACAAAGCCAATTTACAGGTGCATACACGAATCCATACCGGAGAAAAGCCATTCAAATGTGAAATATGTTTGAAATCGTTTCGGGTTAATGATCATTTGCAAATACACAAGAGAATTCATACGGGAGAAAAACCTTTTAAATGTCTGGAATGTCCAATGGAATTTCGCAGCAGTGGACCACTCCAGaTTCATATGAAAGTTCATTCCGGTGAAAAACCATTTACATGTGAAGTTTGCACAAAATCATTTCGATTAAAATCACATTTAGATgtTCATATGAGAATACATACTGGGGAGAAACCGTTTAAATGTGAAATATGTTCAAAAGAATTTCGTGTTAGTGCTCCTCTACAAATTCATATGAAAATTCATACTGGCGAAAAATCGTATACGTGTGAAGTATGTTTTAAACCATTTCGAGAAAAATCTCATCTACAAGATCATATACGGATTCATACTGGCGAGAAGCCGTTTATATGTGAACTATGCTCAAAACCGTTTCGTGTAAAAGCTCATTTACagAGGCACATGAAAGTTCACTCCGAAGAAAATGGTTACAAATGTGAGGTGTGTGGCAATATTTTCCGTGACGGCTATCAATTAGAGGTGCACAAGAACATTCATACGGGAGAAAAACCGTTCAAATGTGAAATTTGTTCAAAAGATTTCCGTGGAAATTCTCATTTACAGAATCATATGAGAATGCATCGTGAGGAAAAACCACTTACTTGTGAAATTTGTTACAAAGCTTTTCGTGAAAAAGCAAATTTACAGGTTCATATGAAAGTGCACACAGTAgccaattattataaatgtgaAATGTGTCCACAAATATTCTATCAATTTATCGATCTTCAAGTGCACATGAAACAGCATCCGCCAGATAATCCATTCCAGTGCATAATTTGTTTCAAAGAATTTAATGTTAAAGCAAATTTACAGAGACACATGAAAATCCACACCGAAGATAAATCATTTGTTTGTGAAATTTGCTATAAGGAATTTCGTGAAAATGCAACATTGTTGGCTCATATGCGAATACATACCGGCGAAAAACCATTCCAATGTGGTGTTTGTGCCAAAGAATTCCGTGGTCAATCAGCACTGCATAAACATATGAAAATTCATACTGGCGAAAAGCCATATCAATGTGATGTGTGCGAAAAGCATTTCCGTGAGGCTGTACATTTGAGGGTGCATAAGCGAATTCATACGGGCGAGAAGCCATACAAATGTGAAGTTTGTCATAAGGAATTTCGATGTAGTGGCACAATGCAGTACCACATGCGAATACATACAGGCGAAAAACCATATAGTTGCGAAGTTTGTGCAAAACCCTTCCGGGAGAGAGGACATTTACAAGTTCATATGCGTATCCACACACAAGAGAAACCATATCCGTGCATAGAGTGTGCTAAAACTTTTCGTGATTCGGGACAATTGAGTAGACACAAGAAAATCCATTCCGGTGAAAAACCTTACAAATGTATAATATGCGCAAAACCATTCCGCGAGAAATGCCATTTAAAGGCGCACATGAATATACATGTGGGCGATGAAAATTTGGGACGTGAAATAGCAAACGCTATGTACAATAATTCGGATGAGCTAATCATGGTGAGCCACTATCAACCAAATCTAAATTCGGACGCAAACATATTACCACAACTGAATGTGCATATAAAATGTGAACCGAATATTGATGAGCTGCCCATAATTGAGCCGGCCGATCATTTAAGACTGTCGATGTTTAAAGATGAACCGGACTATGAGTTGgaacaattataa
Protein Sequence: MINNYIARKPFTCEICSKAFRYKANLQVHTRIHTGEKPFKCEICLKSFRVNDHLQIHKRIHTGEKPFKCLECPMEFRSSGPLQIHMKVHSGEKPFTCEVCTKSFRLKSHLDVHMRIHTGEKPFKCEICSKEFRVSAPLQIHMKIHTGEKSYTCEVCFKPFREKSHLQDHIRIHTGEKPFICELCSKPFRVKAHLQRHMKVHSEENGYKCEVCGNIFRDGYQLEVHKNIHTGEKPFKCEICSKDFRGNSHLQNHMRMHREEKPLTCEICYKAFREKANLQVHMKVHTVANYYKCEMCPQIFYQFIDLQVHMKQHPPDNPFQCIICFKEFNVKANLQRHMKIHTEDKSFVCEICYKEFRENATLLAHMRIHTGEKPFQCGVCAKEFRGQSALHKHMKIHTGEKPYQCDVCEKHFREAVHLRVHKRIHTGEKPYKCEVCHKEFRCSGTMQYHMRIHTGEKPYSCEVCAKPFRERGHLQVHMRIHTQEKPYPCIECAKTFRDSGQLSRHKKIHSGEKPYKCIICAKPFREKCHLKAHMNIHVGDENLGREIANAMYNNSDELIMVSHYQPNLNSDANILPQLNVHIKCEPNIDELPIIEPADHLRLSMFKDEPDYELEQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01457738;
90% Identity: iTF_01455051;
80% Identity: iTF_01458832;