Basic Information

Insect: Trialeurodes vaporariorum
Gene Symbol: -
Assembly: GCA_011764245.1
Location: HIC:3173433-3198261[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.064 4.3 8.0 0.1 2 23 306 328 305 328 0.94

2 29 4.4e-05 0.003 18.0 1.6 1 23 521 544 521 544 0.96

3 29 6.1e-05 0.0041 17.5 0.2 3 23 552 572 550 572 0.98

4 29 4.5 3.1e+02 2.2 0.7 1 9 578 586 578 588 0.91

5 29 0.006 0.41 11.2 2.3 1 23 730 753 730 753 0.98

6 29 0.008 0.54 10.8 0.4 2 23 794 816 793 816 0.94

7 29 2.1 1.4e+02 3.2 2.6 1 23 840 863 840 863 0.92

8 29 0.12 8.1 7.2 7.5 1 23 879 902 879 902 0.97

9 29 0.018 1.2 9.7 0.1 2 23 920 942 919 942 0.96

10 29 0.2 13 6.5 0.0 3 23 957 978 955 978 0.91

11 29 9.3e-05 0.0063 16.9 1.6 2 23 1008 1029 1008 1029 0.97

12 29 0.0025 0.17 12.4 0.8 1 23 1055 1077 1055 1077 0.98

13 29 0.0087 0.59 10.7 8.3 1 23 1083 1106 1083 1106 0.96

14 29 0.00013 0.0086 16.5 0.6 1 23 1112 1134 1112 1134 0.99

15 29 0.0021 0.15 12.6 5.1 2 23 1141 1162 1140 1162 0.96

16 29 0.0046 0.31 11.6 2.9 2 23 1169 1192 1168 1192 0.93

17 29 0.016 1.1 9.9 0.5 1 23 1198 1222 1198 1222 0.95

18 29 0.0087 0.59 10.7 5.1 1 23 1228 1251 1228 1251 0.98

19 29 0.61 41 4.9 0.5 1 20 1364 1383 1364 1387 0.88

20 29 0.76 52 4.6 0.3 3 23 1445 1466 1444 1466 0.94

21 29 2.2 1.5e+02 3.2 0.4 3 23 1481 1502 1480 1502 0.94

22 29 0.0087 0.59 10.7 0.5 3 23 1528 1548 1526 1548 0.96

23 29 0.0025 0.17 12.5 0.2 1 23 1574 1596 1574 1596 0.96

24 29 0.0023 0.15 12.6 1.3 1 23 1602 1625 1602 1625 0.95

25 29 0.00024 0.016 15.6 1.5 1 23 1631 1653 1631 1653 0.98

26 29 0.00043 0.029 14.8 3.0 2 23 1660 1681 1659 1681 0.96

27 29 9.2e-05 0.0063 16.9 0.3 1 23 1687 1711 1687 1711 0.96

28 29 2.4e-06 0.00016 21.9 0.5 1 23 1717 1739 1717 1739 0.97

29 29 0.00017 0.011 16.1 6.6 1 23 1745 1768 1745 1769 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.064	4.3	8.0	0.1	2	23	306	328	305	328	0.94
2	29	4.4e-05	0.003	18.0	1.6	1	23	521	544	521	544	0.96
3	29	6.1e-05	0.0041	17.5	0.2	3	23	552	572	550	572	0.98
4	29	4.5	3.1e+02	2.2	0.7	1	9	578	586	578	588	0.91
5	29	0.006	0.41	11.2	2.3	1	23	730	753	730	753	0.98
6	29	0.008	0.54	10.8	0.4	2	23	794	816	793	816	0.94
7	29	2.1	1.4e+02	3.2	2.6	1	23	840	863	840	863	0.92
8	29	0.12	8.1	7.2	7.5	1	23	879	902	879	902	0.97
9	29	0.018	1.2	9.7	0.1	2	23	920	942	919	942	0.96
10	29	0.2	13	6.5	0.0	3	23	957	978	955	978	0.91
11	29	9.3e-05	0.0063	16.9	1.6	2	23	1008	1029	1008	1029	0.97
12	29	0.0025	0.17	12.4	0.8	1	23	1055	1077	1055	1077	0.98
13	29	0.0087	0.59	10.7	8.3	1	23	1083	1106	1083	1106	0.96
14	29	0.00013	0.0086	16.5	0.6	1	23	1112	1134	1112	1134	0.99
15	29	0.0021	0.15	12.6	5.1	2	23	1141	1162	1140	1162	0.96
16	29	0.0046	0.31	11.6	2.9	2	23	1169	1192	1168	1192	0.93
17	29	0.016	1.1	9.9	0.5	1	23	1198	1222	1198	1222	0.95
18	29	0.0087	0.59	10.7	5.1	1	23	1228	1251	1228	1251	0.98
19	29	0.61	41	4.9	0.5	1	20	1364	1383	1364	1387	0.88
20	29	0.76	52	4.6	0.3	3	23	1445	1466	1444	1466	0.94
21	29	2.2	1.5e+02	3.2	0.4	3	23	1481	1502	1480	1502	0.94
22	29	0.0087	0.59	10.7	0.5	3	23	1528	1548	1526	1548	0.96
23	29	0.0025	0.17	12.5	0.2	1	23	1574	1596	1574	1596	0.96
24	29	0.0023	0.15	12.6	1.3	1	23	1602	1625	1602	1625	0.95
25	29	0.00024	0.016	15.6	1.5	1	23	1631	1653	1631	1653	0.98
26	29	0.00043	0.029	14.8	3.0	2	23	1660	1681	1659	1681	0.96
27	29	9.2e-05	0.0063	16.9	0.3	1	23	1687	1711	1687	1711	0.96
28	29	2.4e-06	0.00016	21.9	0.5	1	23	1717	1739	1717	1739	0.97
29	29	0.00017	0.011	16.1	6.6	1	23	1745	1768	1745	1769	0.97

Sequence Information

Coding Sequence: ATGTGGGCAAAGATGGCATTAGAGAACCATCTTCAATCGAATGACTCTATGATGGAAGTTTCCGATGATTTCTTTGAAGTTACTGTCGCAACTTCTGATGAGCAAACTCCAGCGGAAAGAAGCAAAGCAGATTTCTCTACTCTTTGCAGAATTTGTGCCGGCAGCAATGAGTATCTAATTCCAATTTTTGAAGGTGAAGGTGTCCAGTTAGACCTCCGGCAAAAAATTGAAAAGTATTTGCCTGTCAAAATAAATTCAACAGACGAGTTACCAACAAGTATGTGTTACCAGTGTGCATCCTCCATTTTGAATTGGCACGAGTTAGTTGAAAACTGTGTCGAGGCTGACAAGCAATTGAAATGTATCAAGAATGTGAAAGAAGAGGCTTCAGACATAACTGAACTTTGGGAAGAAGACAGCCCCGATTGTGATAGGAGCAGTAATGTTAAGTCCGCTTCAATTAGTTCCAAAGAAAGCTGCTCCAAGCTAGGCGAAGATTCGATTAGTCCATCGCCAGTTTCCTTGCCCAAGTTTACTGCATCTAGCTCAACTTTAAGCCTTCCTGATATTAAAAAAGAATTTTTAAATGATGTTAACATGACTGATATAAAAAGTAGTAAAGAACTTTCCTCAGAAAAGTCACGGACTGCCGCATTCTCTGACCATCACGTAACGCAAGTGCCAAAAAAAAATTTCACAACCGAACTGCGTTTAAACCTAGAAAACAAATTTTCCAGTGTAAATATCCTGGAAGCAAATAGTATTTTGCATGAGTCGCCTGATAGATCATATTGCAACCAGACTACGGGTTTTAATATTTTTAGTAAAAACGTCAACTTACCTTCATCGAGCTGTTTAAACTCGGAGCATGGTCCGTCCATTACCCCTAATGTAGGTAAAACTGGAATGGAAGTTGTGTGCAAGTTGTGCAATGCAGGATTTGTTAATGAAGTAGAGCTCAGATACCATTCCAACGTCTTTCATCAGGAGTTCAACAACTCAAAACCTCAGCAATCTGATTTGACAGATAACAAAAAAGTGATATCATCAAACGCTCTCATCAGTTCCGTTAAAGGTGACAAACTTTCTGGCAGCAACCCACCAATGAATGAAACCAGCGGAATGAAAGTGAAGACTTTAAATTTTAGAAGCAAGAAGTTGATAGGCAGTGACTTTGATAGTAATTTTTCAAAAAATTACCCTATCCGTGTGATAAACAAAAGTAACATATTCTCAAAAAGTTCTAATATGGATAATAGCAATGAGTCATTGCTTTGTCCCTCTACGGTTATCTCTAAAAGTGAAAACAAAGCAAGTGATAGTAATAGATTCAATGATGATAATAATACTAGGTTCAATGAAAGTGATAAGTACCTCAAAACCAACTATCGGATTGACTGTATGACTGACGAAGCTGTTGCTCTCAAAGTAGAGGAAGGATTTAAGTTACCAGAAAGGACGGAAAGTGTTTCGGATAATTTCCAGTATTCAGGTCCGATTACTGGTTCTGGCACAAATAGCCTAGTTCGTCATATAAGGATTCACACCAACGAACGACCTTACTCGTGCCATTTGTGTAGTAAAAAGTTTCGAGATTCTGGAGGCCTCTCCCGCCATGTAAGAGACGTTCATGTAAAATTGAAAGAATTCGGCTGTGATATTTGTCCGAAACGTTTTGCGAGCAAAGCAACTTTGCTGGATCACAGACGCATTCACACAAAGGAACGACCATTCACATGCGAATTCTGTGGGAAGTCATCGGAATGTGCAAAAGTTCAGGACAAGGGATCTAAAGTAAAGAGGACAAAAAAGCTGACTGACCGTGATTTGATGGCGTCCTTGATCCCGGATGTTAAACTAGTCGAAGAGGTAGAGGAGGTGCAAGCCAAACCCGTCCTAGGAAAAAGGAAACGTCAAAGATCGAGCTATTTCTCGTATGATGATTTTATTTACAATGCTTTAAATAAAAGCAAAGCTGAAAGTAGTAGGGATAATTCTAATGTAAAAAAATCAAAACATACCTCCAAAGAGAAAACCAGTAGGGATAATTCTAGTGAAATAAAAGCAAAAAAAACCTTCAAAGAGAAAAGCAGTAGGGATAATTCTAGTGAAAAGAAATCAAAACAAACCTCCAAAGACAAAACCAAAGATTCCTCAACTGTAGAGTCAAAGATGAGTGACAAGAGTTTCCGATGCAGCTACTGTCCAGCTTACTACACGCGTAAAAACGATGCACGACGCCATGAGCGGAAAAAGCACCCTGCTGAATTACGGAAAGCTGATCAGAAGAAAAAGACAGATAAAGAAGTTCAAGACAAACCACCCCAGACATCTGCTGTAGCAAAAATTTTCAAAGCCGACCCAGAAGACTATATTCTGTCTTGTGATCTGTGTCAGTCCGAATTCAAAAACAAACTTGAGCTTATTAAGCATCTGCGAGATGATCATAGTGATTTGTTCCAATTTGACGATGATGTTTTGAAACCGAATAACTTGGACAAGAGTCGGTCGAAAAGGTATCTGTGTAACATTTGCTCTACTTTTTTGCGCGGTCGAAAGTCGTATCTATCGCATCACAGGTTGGAGCATCCTGGTGAGAAACTTGATTTCATCCGGGAACTTCCCAAGCAGCAATTCCATTGTGAGTTCTGCAGTTCTGGATTTACACGCTATCATGATCTATTCAGGCATCTTAAAAAGAAACATCTTGAATTTATTGTTATCTTAGAGACTAAGAGAGTTCTCAGGAAACGAATTGTGTGTCTCCTCTGTCAAGAGGAGTTTTCGCAAAATGAGGATGCAACTTTACACTTAAAGACTGACCATAAAGTCGCTGATAATCAGATAATGTTGCACATGAGATGGGCATGTAGTCAATGTGAGGAGAGGTTTGAAACTGTTGGAAGTTTGGTCACTCATGGGAACGAAATGCACAGTATCGGATCGGGAGAAGATCGGAAGTCAGAATTCACCACTTTCCAAGGTGTTAGAACGACGCACGAAAAGAAGTTGTCGCCAGCAACATGTGATGTTTGCGGACTGACTTTTAAGCAGCGCTATCAACTAATGACGCACAAGAGCCGTCACATCACTCTCGAAGATCGTGTCAAATACGAACCTGTTGTCCATGCTTGTCGAGTTCTAATCAACAATGAACCAAATTTCAGATGCAGCCGTTGCTCACGCATGTTCGCCAAAGAAGACCCCTTCATTCGCCACATGTTACTGCATGACACCGGTCGTGCCTACTGTTGCCATATGTGTGGATACCAATGCTTCACGCAAGCGCACCTCAATCGTCACTTAAATATCGTCCACTTCAAGAAGCGTGACTTCAAATGTGACATCTGCGGTCATGCTTTTGCAGAAAAACAAGCAATGATTGATCACAGGCGCACTCACACTGGAGAGAGACCATGTCAATGCAAAATTTGTGGTAAAATGTTTCCCTCCTGGACCTGTGTTTACACGCACAAAAGATCTCATACTGATTATTTTCCTCACGCTTGCACGGAGCCAGGTTGTAAGAGTAAGTTCCGCACCAAATATCGACTGACAGAGCACATGCGTCGTCATACAGGAGAGAGACCATTTGCATGTCCAATTGCATCCTGTGATAAAACGTTTCATGATAAACGAGCCATCTCTAGACATTTAACTGTTCATACCAACGCTAGACCTTTTGAATGTACGCTTTGTCCTCGATCGTATAAACATAAAAAGTATCTAAGTTTTCATATGAAAACTAATCATGAAAAAAGTATTGAAGTTGCAAGTCTACAGAAAGAACCATCTACTATGGTAAATCCCTCGAGTAAGTTTTTTGTCCCACTAGACGGACAATACATTTGCTTGTTCTGTTTCTACCTAACGTCCGAGTTAGCATCTCTATTCGATCATCAAGCCAATGAACATTTAGATTTAGTCAAATCCAATGCTGATTTTATTAAAGAAAAAGCCAAGAGCTGGTTTTGTGCAGCTTGCAATATCCAATTAAATTCCCTGGAATCGTATAATGCTAACAAGAGATACACTCACCCAGTTTTGTACTTGGAACAAAAGGAAAAGGAGCCAAAACTAACACCGCAATATCTCTGTGATATTTGTTCAATAATCTTTGAAGGCAAAGACAAGTTCAGGACACATAATGTCAACAAACACTTGTTTAATAAGCGAGATGTCATCGACTGTCTTAGTCGCAAGTGTCAACGCTGTGATCTTTGTGATAGCATCTACCCCTGTCAAGCCACATTTTGTGATCATTTAAAAGAGGATCATCCTAAAGACGTAATTCAAATCAGCCGCCAGACTGTTGTCGTGAAAAATCCAATCTGTTCACTTTGCTGGACTGAGACACGTTTCTCCGATGAAATGCGAAGTCATCTGAAAGCTGAACACAGTATACAAGATGATAACTTAGAAGAGTGCGTTTATCTCTTATGTCGTGCCTGCTCACAATCCTTTCCAACCGAATTAGAGTTTATAGATCATTACCAGAAAAAACATTTAAGAAATTATCGAGCTAAAGCACGACTTAGATTTCCCACAAGTAGGACATCTGGGACTGATAGGAGCACAATTTGTGATCAGTGTGGTCAAGTTTTTGATAAGCATGCCCAAATGGTTGCTCATCGAGAACGTCATGTCCTTCCAGAAGATCGCATTAAATATCAAATAGAGCTTGAGGAATCGATTGTCATCATAAATGGTGAGACTAATTATCAGTGTACTCGTTGCCCGCGAGTTTGTGAGGAAGCAGACGAACTAATCCGTCACCTTGTCCTTCATGATAAGCCCAAGTCGTTTATTTGCCATGAGTGCGGTTTTCAAACATCAAGGGAACAGCTCCTAACTCGACACACTGTTACTATCCATTTGAAAAAGCGTGATCATAAGTGTGATCTCTGCCCGAAAGCGTTTGGCACAAAAAGATACCTGGACGATCATCGACGAATTCACACCGGTGAGCGGCCTTGGTCGTGTAAACTTTGCGATAAGACATTTCCTACAGCCACTTGCCTCTACAGGCACAAACAATCGCACACTGATTACTTTCCATTCCCATGCACTGAGCCTGGCTGTGATAAAAAATTACGGACAAAGTCCAAATTGGCAGAACACATGCGACTCCATACCGGTCACAAACCTTACGCGTGCACGGAATGCACAAAAGCGTTCAAAAGAAGTGGAGACCTGCAAAAACATCTTACTGTGCATACCGATCAAAGGCCTTTCGTCTGCAGTGTTTGTGACCGCACTTATAAGCATAAAAAATATCTTCGGTATCATATGAAAATGATGCACCATTAA
Protein Sequence: MWAKMALENHLQSNDSMMEVSDDFFEVTVATSDEQTPAERSKADFSTLCRICAGSNEYLIPIFEGEGVQLDLRQKIEKYLPVKINSTDELPTSMCYQCASSILNWHELVENCVEADKQLKCIKNVKEEASDITELWEEDSPDCDRSSNVKSASISSKESCSKLGEDSISPSPVSLPKFTASSSTLSLPDIKKEFLNDVNMTDIKSSKELSSEKSRTAAFSDHHVTQVPKKNFTTELRLNLENKFSSVNILEANSILHESPDRSYCNQTTGFNIFSKNVNLPSSSCLNSEHGPSITPNVGKTGMEVVCKLCNAGFVNEVELRYHSNVFHQEFNNSKPQQSDLTDNKKVISSNALISSVKGDKLSGSNPPMNETSGMKVKTLNFRSKKLIGSDFDSNFSKNYPIRVINKSNIFSKSSNMDNSNESLLCPSTVISKSENKASDSNRFNDDNNTRFNESDKYLKTNYRIDCMTDEAVALKVEEGFKLPERTESVSDNFQYSGPITGSGTNSLVRHIRIHTNERPYSCHLCSKKFRDSGGLSRHVRDVHVKLKEFGCDICPKRFASKATLLDHRRIHTKERPFTCEFCGKSSECAKVQDKGSKVKRTKKLTDRDLMASLIPDVKLVEEVEEVQAKPVLGKRKRQRSSYFSYDDFIYNALNKSKAESSRDNSNVKKSKHTSKEKTSRDNSSEIKAKKTFKEKSSRDNSSEKKSKQTSKDKTKDSSTVESKMSDKSFRCSYCPAYYTRKNDARRHERKKHPAELRKADQKKKTDKEVQDKPPQTSAVAKIFKADPEDYILSCDLCQSEFKNKLELIKHLRDDHSDLFQFDDDVLKPNNLDKSRSKRYLCNICSTFLRGRKSYLSHHRLEHPGEKLDFIRELPKQQFHCEFCSSGFTRYHDLFRHLKKKHLEFIVILETKRVLRKRIVCLLCQEEFSQNEDATLHLKTDHKVADNQIMLHMRWACSQCEERFETVGSLVTHGNEMHSIGSGEDRKSEFTTFQGVRTTHEKKLSPATCDVCGLTFKQRYQLMTHKSRHITLEDRVKYEPVVHACRVLINNEPNFRCSRCSRMFAKEDPFIRHMLLHDTGRAYCCHMCGYQCFTQAHLNRHLNIVHFKKRDFKCDICGHAFAEKQAMIDHRRTHTGERPCQCKICGKMFPSWTCVYTHKRSHTDYFPHACTEPGCKSKFRTKYRLTEHMRRHTGERPFACPIASCDKTFHDKRAISRHLTVHTNARPFECTLCPRSYKHKKYLSFHMKTNHEKSIEVASLQKEPSTMVNPSSKFFVPLDGQYICLFCFYLTSELASLFDHQANEHLDLVKSNADFIKEKAKSWFCAACNIQLNSLESYNANKRYTHPVLYLEQKEKEPKLTPQYLCDICSIIFEGKDKFRTHNVNKHLFNKRDVIDCLSRKCQRCDLCDSIYPCQATFCDHLKEDHPKDVIQISRQTVVVKNPICSLCWTETRFSDEMRSHLKAEHSIQDDNLEECVYLLCRACSQSFPTELEFIDHYQKKHLRNYRAKARLRFPTSRTSGTDRSTICDQCGQVFDKHAQMVAHRERHVLPEDRIKYQIELEESIVIINGETNYQCTRCPRVCEEADELIRHLVLHDKPKSFICHECGFQTSREQLLTRHTVTIHLKKRDHKCDLCPKAFGTKRYLDDHRRIHTGERPWSCKLCDKTFPTATCLYRHKQSHTDYFPFPCTEPGCDKKLRTKSKLAEHMRLHTGHKPYACTECTKAFKRSGDLQKHLTVHTDQRPFVCSVCDRTYKHKKYLRYHMKMMHH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -