Basic Information

Insect: Chrysoperla carnea
Gene Symbol: topi_4
Assembly: GCA_905475395.1
Location: FR997758.1:9968720-9974095[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 2.9 2e+03 -0.6 0.0 21 45 127 151 121 156 0.86

2 11 0.52 3.5e+02 1.8 0.1 20 48 180 208 171 213 0.85

3 11 0.87 5.8e+02 1.1 0.0 18 51 281 314 271 315 0.81

4 11 0.0014 0.92 10.1 0.1 22 47 313 338 310 343 0.85

5 11 0.0072 4.9 7.7 0.0 21 46 340 365 338 371 0.88

6 11 0.89 6e+02 1.1 0.1 23 48 554 579 544 582 0.85

7 11 3.9 2.6e+03 -1.0 0.0 21 46 601 627 591 635 0.70

8 11 0.15 1e+02 3.5 0.0 16 52 654 690 649 690 0.83

9 11 0.0039 2.6 8.6 0.3 22 43 688 709 683 714 0.90

10 11 0.0024 1.6 9.3 0.1 21 52 715 746 712 748 0.86

11 11 1.3 8.8e+02 0.5 0.0 21 43 743 765 739 769 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	2.9	2e+03	-0.6	0.0	21	45	127	151	121	156	0.86
2	11	0.52	3.5e+02	1.8	0.1	20	48	180	208	171	213	0.85
3	11	0.87	5.8e+02	1.1	0.0	18	51	281	314	271	315	0.81
4	11	0.0014	0.92	10.1	0.1	22	47	313	338	310	343	0.85
5	11	0.0072	4.9	7.7	0.0	21	46	340	365	338	371	0.88
6	11	0.89	6e+02	1.1	0.1	23	48	554	579	544	582	0.85
7	11	3.9	2.6e+03	-1.0	0.0	21	46	601	627	591	635	0.70
8	11	0.15	1e+02	3.5	0.0	16	52	654	690	649	690	0.83
9	11	0.0039	2.6	8.6	0.3	22	43	688	709	683	714	0.90
10	11	0.0024	1.6	9.3	0.1	21	52	715	746	712	748	0.86
11	11	1.3	8.8e+02	0.5	0.0	21	43	743	765	739	769	0.82

Sequence Information

Coding Sequence: ATGATTAATTTTGAAAATGTTTGCCGTACCTGTTCACTTCAAGGTGAATTACAGTCTCTATTTGTTGAAGGGGGTTTACTAAATCCTGCAGAAATGTTAAACGAAATTGTTGAAATTAAGGTAATAAAAGGCGATAACTATCCACAAAATATTTGTGTAAGATGTTTGGATGTTCTAAAATCAGCGTATCTATTTAAGAATCAATGCCATCAAGTGTATAAGAAATTCGAACAATATTTATCAGAAACCATTGTGAATTCCGATTGTAAAGAAGAAGTTATTGATGCTGTTTATATTAAAGAGGAAAAAGAATTCGATTGTTCAGAAACTAATGAAGATTGGTTTCAACTACCAAATAACGAACAAGAAAATAACACGTCAGTACAGGCTTATAATTGTGAAAAATGTAGTGCGGGATTTCAAAATCAAAAATCTTATGAACGACATTTAAAAAAACATGAAAAATTGTTCATATGTACAATTTGTGGTGGTCAATTTTCTCGTAAATATAATTTGGAACAACATAGTCGTACACATTTTAGTGACAAGCCATTTAATTGTGAATATTGTGCGAAAACGATGAAAAATAAACAGCAACTGGAATGTCACATAAAATTTGAACATGATCATGAAATTGGAACTGCAAATGAGGCAAACCAACAAATTGTGAAACAAGTTAGACAAAAAAAATTTATTTGTGATTTCTGTGGACGTGGATACACTCAAGCTTATAAATTGACCCTTCATATTAGAACCCATACCGGTGAAAAACCTTTATCATGTAATGATTGTGATAAATCATTTCATAGTCACTCACTTTTAAGCCAACATAAACGAATACATCATTCAACTGAAAAACCATATAAATGTAAGTTTTGTGAAAAATCGTTTGCACTTCCACGATGGTTAAAAGCACATTTAATGATACATACAAATGATAAACCATTTACATGTGATGTTTGTAATCAAACATTTCGACAAAAACATCATTTGGATCGACATCAACTCTTACATACCGGAGAAAAACCATTTGCATGTAGTGTTTGTGGAAAAAAATTTACTCAAAATAGTAATTTACGATCGCATATGCGAACACATACAGTAGCCCAAGAAATTAAAGAGAAGGAAAATATGCTAAATTTTGAAATTATTTGCCGTACATGTTCTTCACAGGGTGAATTACATTCTTTATTTGGTGATGATTTAAGTCCTGCAGAAATGCTAACCGAAATTGTTGATATTAAGATAATTAGAGGCGACAAATATCCACAAAATATATGCGTGAGATGTTTGGATGTACTAAAATCTGCGTACTTATTTAAGAATCAATGTGTTGAAGTGTATAGGAAATTCGAACAATATTTATCGCTTAGTTCAGAAAATTTTATAGATTGTAAAGAAGGACTGGTTAATTCTATTAAAGAAGAAAGGCAAGAAGACCATTCAGACATTGATGAAGAATGGGTCGAACTAGATGATGTTAATGTTACAGAGAAAAAACTCTTTGGATGTGAACAGTGTAACGTACAATTCAAAAATCAAAAACCTTATAAACGACATCTTAAACAACATGAACAATTGTATATGTATCCCATTTCTGGTGCCCATTTTTCCAGTGAATATAATTTAGAACAACAAAGCCGTAAAAATTTTACTGATACATCTTTTACTTGTGAATATTGCAATAAATCTTACAAACGTAAACAGCAATTGCTTTCTCACATCAATTTAAAACACGCTGATGAGCAATTATTCACTTCAAATGTGACTCCTGAGCAATTTTCTAGTAGAGCTAAACATTCAGAAAAAGGGAAATCATTGTGCGACTACTGTGGACGTGGTTTTCGTCAAGCTGGAAAACTTAAAATTCATATTAGAACTCATACCGGCGAAAAACCTTATGCGTGTACTGAATGCGATAAATCATTTCATTGTCAATCACTTTTAACCCATCACACACGAATAAATCATACAAAAGAAAAACCATATAAATGCGACTTCTGTGGGAAATCTTTTGGATTGTCACGATGGTTAAAACTACATTTAAGGATACATACAAATGATAAACCATTTACATGTGATATTTGTAATCAAAAATTTCGACAAATACATCATTTAACACGACATAAATACGTACATACCGGTGAAAAACCATTTTCATGTAGTGTTTGCAATAAACAATTCACTCAAAACAGTAATTTACGAACGCATATGAGAACACATACGGGGGAAAAACCTTACGTGTGTTCGATATGTGGGAAAGGTTTTCATGATTCTAGTAGCATGAAAAACCATCATAAAAAGCATATTTTGTTGAATAATGAAGAAAATAAAATTGTATCAAATGATTTACAGAATACAGAAAAATGA
Protein Sequence: MINFENVCRTCSLQGELQSLFVEGGLLNPAEMLNEIVEIKVIKGDNYPQNICVRCLDVLKSAYLFKNQCHQVYKKFEQYLSETIVNSDCKEEVIDAVYIKEEKEFDCSETNEDWFQLPNNEQENNTSVQAYNCEKCSAGFQNQKSYERHLKKHEKLFICTICGGQFSRKYNLEQHSRTHFSDKPFNCEYCAKTMKNKQQLECHIKFEHDHEIGTANEANQQIVKQVRQKKFICDFCGRGYTQAYKLTLHIRTHTGEKPLSCNDCDKSFHSHSLLSQHKRIHHSTEKPYKCKFCEKSFALPRWLKAHLMIHTNDKPFTCDVCNQTFRQKHHLDRHQLLHTGEKPFACSVCGKKFTQNSNLRSHMRTHTVAQEIKEKENMLNFEIICRTCSSQGELHSLFGDDLSPAEMLTEIVDIKIIRGDKYPQNICVRCLDVLKSAYLFKNQCVEVYRKFEQYLSLSSENFIDCKEGLVNSIKEERQEDHSDIDEEWVELDDVNVTEKKLFGCEQCNVQFKNQKPYKRHLKQHEQLYMYPISGAHFSSEYNLEQQSRKNFTDTSFTCEYCNKSYKRKQQLLSHINLKHADEQLFTSNVTPEQFSSRAKHSEKGKSLCDYCGRGFRQAGKLKIHIRTHTGEKPYACTECDKSFHCQSLLTHHTRINHTKEKPYKCDFCGKSFGLSRWLKLHLRIHTNDKPFTCDICNQKFRQIHHLTRHKYVHTGEKPFSCSVCNKQFTQNSNLRTHMRTHTGEKPYVCSICGKGFHDSSSMKNHHKKHILLNNEENKIVSNDLQNTEK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00332817;
90% Identity: iTF_00332817;
80% Identity: iTF_00332817;