Basic Information

Insect: Lampropteryx suffumata
Gene Symbol: -
Assembly: GCA_948098915.1
Location: OX402569.1:1500907-1507665[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 0.0043 50 5.0 0.0 21 48 269 296 260 299 0.91

2 13 0.0021 25 6.0 0.0 22 48 299 325 294 328 0.92

3 13 0.0041 47 5.1 0.1 21 50 370 399 366 404 0.90

4 13 0.0062 71 4.6 0.0 21 45 427 451 418 454 0.87

5 13 0.0011 12 7.0 0.2 21 48 498 525 495 530 0.90

6 13 0.011 1.2e+02 3.8 0.0 24 46 530 552 527 555 0.91

7 13 0.036 4.2e+02 2.1 0.0 21 48 598 625 595 628 0.91

8 13 0.26 3e+03 -0.7 0.0 26 48 642 664 639 670 0.83

9 13 0.46 5.3e+03 -1.4 0.1 22 43 722 743 714 747 0.83

10 13 1.1e-05 0.12 13.4 0.1 21 46 749 774 741 782 0.89

11 13 0.18 2e+03 -0.1 0.0 23 52 779 808 775 810 0.83

12 13 0.038 4.4e+02 2.0 0.0 21 48 805 832 800 838 0.87

13 13 0.088 1e+03 0.9 0.1 21 44 834 857 831 865 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	0.0043	50	5.0	0.0	21	48	269	296	260	299	0.91
2	13	0.0021	25	6.0	0.0	22	48	299	325	294	328	0.92
3	13	0.0041	47	5.1	0.1	21	50	370	399	366	404	0.90
4	13	0.0062	71	4.6	0.0	21	45	427	451	418	454	0.87
5	13	0.0011	12	7.0	0.2	21	48	498	525	495	530	0.90
6	13	0.011	1.2e+02	3.8	0.0	24	46	530	552	527	555	0.91
7	13	0.036	4.2e+02	2.1	0.0	21	48	598	625	595	628	0.91
8	13	0.26	3e+03	-0.7	0.0	26	48	642	664	639	670	0.83
9	13	0.46	5.3e+03	-1.4	0.1	22	43	722	743	714	747	0.83
10	13	1.1e-05	0.12	13.4	0.1	21	46	749	774	741	782	0.89
11	13	0.18	2e+03	-0.1	0.0	23	52	779	808	775	810	0.83
12	13	0.038	4.4e+02	2.0	0.0	21	48	805	832	800	838	0.87
13	13	0.088	1e+03	0.9	0.1	21	44	834	857	831	865	0.88

Sequence Information

Coding Sequence: ATGTCTGAAACAGCACTGTGCAGAGTGTGCCTCGCTGATAGCGCCAAGATGCATGCGATCACCAGCTCCCGTTACCAAGAATTGTATGAGAAGCTGACGGGCGAGTCGCTACTATCAGATGACCGGCCTGACTCCCTTTGTACCCTGTGCCACACCCTGGTGCACAGGTTCTGGAGATTCTTTGAGATGTCGCATAATTCAGAGAAGAACCTCACAAAACTGCTTCAATATGGAGTCAAACTAACCCGATTATCAGTAGCTCTGGTTGAGAAACTGAATGTGCACAACTTGTCAGTCACTCCTGTCAAGCACACATCAATATTTGACAGCGTGAAAGAAGAAATCGAAGTGCCTGTCAAGATGGAGAGGTTTTCTGACGAGGGAAAGCTTGCAGATGAAATTGAAGCCTTACCCGCAGCTGAGTCGAACGATGAAGATTCAGAAATGGACCCTCTCGAAGCTGTCAAAATCGATGTTAAAATCGAGCCAATAATTGAACCCAATGTTTCAATAACGCCGTATCCCTGCGAAGATTGCCCTCGTCGGTTCCACACTTCAGAAGATTTGTTGCGTCACCAAAACTGTGTGCATAAAAAAGAACTATGCATAGAGACATCTAATGATCCTGACGATTTAAAAACCAATACAAAAATCAATGAAGAAAATCCATTTGATAATGACAGTGATAGTATACAACGGGACAGTTTAATGCTTTCTTCAGGGGAGAAGTTTACTTGTGTGTTATGTAGAAGGCCGTTCACACAGAAAGGACATTTAAAAACACATATAATGGCTTTCCACACAGGGGAACGGCCATTTGCATGCACTGTGTGTGATAAACGATTTGTACAAAAGAGCAACCTGAAAAGTCATATGAAGACGGTGCATACTGAGGATAAACCATTTACATGTACCAGCTGCAAAGGTGTTTGTAAAGACGAAAGCCATTTAAAAGAACATATGAATATACACCACGGAGATTCTTTAGTAGTTAATTATATTGAAATACTTGAGAATGTGGATGGAAAGCCGTTCGCTTGCGGGCGATGCGGAAAGACATTTACTGCGAAAGCTCATTTAAAATCTCACATAATGGCTATACATACAGGGGAACGTCCATTTGCATGCACTATGTGCGATAAAAAGTACACGCAAAAAAGCCATTTAAGATTACATGCGAAATTGTCGCATGTTGTTGAAAAGCCATTTGCTTGCGACGATTGTGAAATAAGATTTGAAGATGCTAATGATTTGAGAAAACACTCGATAACGCACAGGAATGAGAAATTATATACGTGTACGAGTTGTGATAAAGTCTTCTTATCTGAAAACAACTTGAAAAGACATATGACTTTTCACACTGGATCAACAACAAAGAATGAAGAGATTGATGTAAATCATATTAAAGTTAAGCCATTTGCATGTGTGCTGTGTAGTAGAAGATTTGGATGGAAATCTCATTTAAAATCACATATAATGGCGCTTCATACCGGAGAAAGGCCATATGCATGCTCAGTTTGTGACAAAACTTTTGTCCAACGCAGTAATCTCCGGTTACATGCCAAAGTTGCGCATGGTATTTTTAAACCATTGAAATGCGCAACATGTGACAAAGCATTCCGTAAAGAAAGCAACTTGCAAAAACATATGACTCTTCACGACGAGTCTGTGGACAATGAAGTTGAACTCCAACCAAATAATACAAAATCAAAGCAGTTCCCTTGTGTATTATGTAGTAAGTCATTCGGTTGGAAATCTCATTTAAAAACTCATATAATGGCGCTTCACACTGGAGAAAGGCCATTTGAATGTACCATGTGTGATAAGAAATTCGTACAGAAAAGCTATTTAAGATTCCACATGAAGGTTTCACATCCCGGTGAACGAGCAACTCATATTATCGACTTTGATGGTAGACTGTTCACATGTAATATATGTTCTGTTAAATTCAGTAATAAAGCTAACTATGAGAAACATAAGCAGCTGCATAAAACCACGCCGCCGTTCGTCTGTCTGAAGTGTGATAAGAAATTCAACACAAAAGTTGACATTGACTCGCACTACTTAAGTGTTCATGGTGAGTTACCGTTTTCCTGTGGCACTTGTAACTTAAGATTCGATACCCAAATTGCTTTAAAGCAGCATCAGTCAACCCACATAGAATCTAAACCGTTATCTTGTGAAACATGTAACAGAACGTTCCTCTCTGGAAGCGCTTTAAGAAGGCATTCGGTTATCCACAGCGATGAGAAACCGTTCTCATGCAAAATTTGCAAGAAGACTTTTAAACAGGACCGGGTATTAAGAAAGCATATGCAAATACACACTGAAGAGAAGAAATTTGGGTGTGATATTTGTGATCGGAGGTTTTACCAACGAGGGAACTTGATAAGCCATATGAGGATACATTCAGGGGAGAAGCCGTTTGTGTGTGACCGTTGTGGTAACAGTTTTAATCAGAAAAGTCATCTTCGAACGCATGTTTTGTTTATGCATAGTTCAGATAAACCATTCTCTTGCGGTCTTTGTAATAAGAGGTTTAGGTTAAAGAGTTGTTTGCGGAACCATCAGATGGTACATACTGGTGAGAGACCTTATCCGTGCGATAGGTGTGAGAAAAAGTACTATAAAAAAGGCGAATTGAAATCGCATGTTGCTAAAATGCATTCTTGA
Protein Sequence: MSETALCRVCLADSAKMHAITSSRYQELYEKLTGESLLSDDRPDSLCTLCHTLVHRFWRFFEMSHNSEKNLTKLLQYGVKLTRLSVALVEKLNVHNLSVTPVKHTSIFDSVKEEIEVPVKMERFSDEGKLADEIEALPAAESNDEDSEMDPLEAVKIDVKIEPIIEPNVSITPYPCEDCPRRFHTSEDLLRHQNCVHKKELCIETSNDPDDLKTNTKINEENPFDNDSDSIQRDSLMLSSGEKFTCVLCRRPFTQKGHLKTHIMAFHTGERPFACTVCDKRFVQKSNLKSHMKTVHTEDKPFTCTSCKGVCKDESHLKEHMNIHHGDSLVVNYIEILENVDGKPFACGRCGKTFTAKAHLKSHIMAIHTGERPFACTMCDKKYTQKSHLRLHAKLSHVVEKPFACDDCEIRFEDANDLRKHSITHRNEKLYTCTSCDKVFLSENNLKRHMTFHTGSTTKNEEIDVNHIKVKPFACVLCSRRFGWKSHLKSHIMALHTGERPYACSVCDKTFVQRSNLRLHAKVAHGIFKPLKCATCDKAFRKESNLQKHMTLHDESVDNEVELQPNNTKSKQFPCVLCSKSFGWKSHLKTHIMALHTGERPFECTMCDKKFVQKSYLRFHMKVSHPGERATHIIDFDGRLFTCNICSVKFSNKANYEKHKQLHKTTPPFVCLKCDKKFNTKVDIDSHYLSVHGELPFSCGTCNLRFDTQIALKQHQSTHIESKPLSCETCNRTFLSGSALRRHSVIHSDEKPFSCKICKKTFKQDRVLRKHMQIHTEEKKFGCDICDRRFYQRGNLISHMRIHSGEKPFVCDRCGNSFNQKSHLRTHVLFMHSSDKPFSCGLCNKRFRLKSCLRNHQMVHTGERPYPCDRCEKKYYKKGELKSHVAKMHS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00856866;
90% Identity: iTF_00856866;
80% Identity: iTF_00856866;