Basic Information

Insect: Conistra vaccinii
Gene Symbol: -
Assembly: GCA_948150665.1
Location: OX411342.1:8502133-8521569[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 35 0.12 9.4 7.5 3.5 1 23 242 265 242 265 0.91

2 35 1.1 85 4.5 0.2 2 23 291 313 290 313 0.95

3 35 0.51 41 5.5 0.7 1 23 378 400 378 400 0.94

4 35 0.0062 0.5 11.5 0.4 2 23 472 494 471 494 0.94

5 35 0.0088 0.7 11.0 1.7 2 23 500 522 499 522 0.94

6 35 0.017 1.3 10.1 0.8 1 23 527 550 527 550 0.96

7 35 0.71 57 5.0 0.1 2 23 553 575 552 575 0.92

8 35 0.11 9 7.5 2.2 2 21 582 601 581 602 0.93

9 35 0.017 1.3 10.1 0.3 1 23 661 684 661 684 0.91

10 35 0.13 10 7.4 0.2 3 23 713 734 711 734 0.92

11 35 0.027 2.2 9.5 0.4 2 23 757 780 756 780 0.95

12 35 1.4 1.1e+02 4.1 0.1 3 19 787 803 785 806 0.88

13 35 0.2 16 6.7 0.9 1 23 831 853 831 853 0.95

14 35 0.66 52 5.1 0.0 2 23 881 903 880 903 0.93

15 35 0.00021 0.016 16.1 0.4 2 23 924 946 923 946 0.96

16 35 0.00034 0.027 15.5 2.7 1 23 951 973 951 974 0.96

17 35 7.6e-05 0.0061 17.5 1.4 1 23 978 1001 978 1001 0.94

18 35 0.072 5.7 8.1 0.5 2 23 1004 1026 1003 1026 0.96

19 35 0.088 7.1 7.9 1.3 2 20 1032 1050 1031 1055 0.91

20 35 0.0041 0.33 12.1 2.6 2 23 1100 1122 1099 1122 0.94

21 35 3.7 3e+02 2.8 0.1 2 23 1151 1173 1150 1173 0.94

22 35 0.0059 0.47 11.6 0.0 1 23 1195 1218 1195 1218 0.91

23 35 0.00025 0.02 15.9 0.7 1 23 1223 1246 1223 1246 0.95

24 35 0.00012 0.0093 16.9 0.5 1 23 1252 1275 1252 1275 0.96

25 35 0.0041 0.33 12.1 3.2 1 23 1312 1334 1312 1334 0.96

26 35 0.022 1.8 9.7 0.3 1 23 1394 1417 1394 1417 0.92

27 35 0.029 2.3 9.4 0.3 3 23 1449 1470 1447 1470 0.94

28 35 0.018 1.5 10.0 2.3 2 23 1493 1514 1493 1515 0.95

29 35 0.0014 0.11 13.5 1.7 1 23 1520 1543 1520 1543 0.97

30 35 0.086 6.9 7.9 0.2 1 23 1548 1571 1548 1571 0.93

31 35 0.0028 0.22 12.6 0.7 2 23 1577 1599 1576 1599 0.92

32 35 0.0019 0.15 13.1 0.2 2 23 1607 1629 1606 1629 0.97

33 35 0.3 24 6.2 0.0 2 23 1636 1657 1635 1657 0.95

34 35 6.1e-06 0.00049 20.9 0.6 1 23 1663 1685 1663 1685 0.92

35 35 6.8e-06 0.00055 20.8 1.2 1 23 1691 1714 1691 1714 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	35	0.12	9.4	7.5	3.5	1	23	242	265	242	265	0.91
2	35	1.1	85	4.5	0.2	2	23	291	313	290	313	0.95
3	35	0.51	41	5.5	0.7	1	23	378	400	378	400	0.94
4	35	0.0062	0.5	11.5	0.4	2	23	472	494	471	494	0.94
5	35	0.0088	0.7	11.0	1.7	2	23	500	522	499	522	0.94
6	35	0.017	1.3	10.1	0.8	1	23	527	550	527	550	0.96
7	35	0.71	57	5.0	0.1	2	23	553	575	552	575	0.92
8	35	0.11	9	7.5	2.2	2	21	582	601	581	602	0.93
9	35	0.017	1.3	10.1	0.3	1	23	661	684	661	684	0.91
10	35	0.13	10	7.4	0.2	3	23	713	734	711	734	0.92
11	35	0.027	2.2	9.5	0.4	2	23	757	780	756	780	0.95
12	35	1.4	1.1e+02	4.1	0.1	3	19	787	803	785	806	0.88
13	35	0.2	16	6.7	0.9	1	23	831	853	831	853	0.95
14	35	0.66	52	5.1	0.0	2	23	881	903	880	903	0.93
15	35	0.00021	0.016	16.1	0.4	2	23	924	946	923	946	0.96
16	35	0.00034	0.027	15.5	2.7	1	23	951	973	951	974	0.96
17	35	7.6e-05	0.0061	17.5	1.4	1	23	978	1001	978	1001	0.94
18	35	0.072	5.7	8.1	0.5	2	23	1004	1026	1003	1026	0.96
19	35	0.088	7.1	7.9	1.3	2	20	1032	1050	1031	1055	0.91
20	35	0.0041	0.33	12.1	2.6	2	23	1100	1122	1099	1122	0.94
21	35	3.7	3e+02	2.8	0.1	2	23	1151	1173	1150	1173	0.94
22	35	0.0059	0.47	11.6	0.0	1	23	1195	1218	1195	1218	0.91
23	35	0.00025	0.02	15.9	0.7	1	23	1223	1246	1223	1246	0.95
24	35	0.00012	0.0093	16.9	0.5	1	23	1252	1275	1252	1275	0.96
25	35	0.0041	0.33	12.1	3.2	1	23	1312	1334	1312	1334	0.96
26	35	0.022	1.8	9.7	0.3	1	23	1394	1417	1394	1417	0.92
27	35	0.029	2.3	9.4	0.3	3	23	1449	1470	1447	1470	0.94
28	35	0.018	1.5	10.0	2.3	2	23	1493	1514	1493	1515	0.95
29	35	0.0014	0.11	13.5	1.7	1	23	1520	1543	1520	1543	0.97
30	35	0.086	6.9	7.9	0.2	1	23	1548	1571	1548	1571	0.93
31	35	0.0028	0.22	12.6	0.7	2	23	1577	1599	1576	1599	0.92
32	35	0.0019	0.15	13.1	0.2	2	23	1607	1629	1606	1629	0.97
33	35	0.3	24	6.2	0.0	2	23	1636	1657	1635	1657	0.95
34	35	6.1e-06	0.00049	20.9	0.6	1	23	1663	1685	1663	1685	0.92
35	35	6.8e-06	0.00055	20.8	1.2	1	23	1691	1714	1691	1714	0.97

Sequence Information

Coding Sequence: ATGGAGTTCGACGAGATTGTGGTGAAGGAGAGCCCCGGGCTGTGCCGGTGCTGTCTCTCCGAAGGATGCTACAAGGATTTGGGCACCGAATATACTTGGATGAATGAAACCGAGGTTTATGCAGATATGCTGCTCGAATGCTTCGATATTAGTATAACCCAACACAATGAAGGTCCAAATGGTCCAAACCGGCTCATCTGTGAGGTATGCATCACTAGGCTGCGGGACGCTTGCAACTTCAAGAAACAAGTTATGGACTCGGAGAAGAAATTCATTGATATGATGGGCAGGGGAGAATTTAGACCTAAAATGCTTATCTACCAGACACAGCTGAAGTGTGAGGGTCCATCTGCGGTGGAGGACCCTGATGATGCAGACGTTGAATATCTTGAAGATGATCTTGATTTCGGTGAGGTAGACCTCAAAGACGAATTGGTACAGCCTTCAGTATCGGATGTCACCGTATCCACGCTGCCGGTCAAAGGCAAGCGCGGTCGTCCTCGCAAGAACACACCAGTGAAGCCCGATAAGAGGGCCAAAGTGGCTAAAGTCGACGATAAGACCAAGACGAGAGCTGTTGCTAAAGGTGAGAAACGGCGCACCACAGAGGCGTCGAGTAAGTCCTCAATGACGTCCACAAGACGCAACAAACTAATGAAGACTAACGCTATTATAGTTCTAGAAACATCCACCGTCATCCCCTTCAAATGGCATAGACAAAATTACCTCTGTTTCTTCTGCCATCTGACTTTCAAAGACACTGATTTACTCAAAGAACATACTACAAATCAGCATAAGAAATCAAATGTCAAAGCTGCTGTTTCATATTTGAGAAGAGACGAGAAAGTTAAAATTGACGTCTCCGTGTTAGAATGTCGTTCTTGCAATGATAAATTCGACGATCTAAACGCTCTCATAGAACATTTAAAGAGTACACATAACCTTAAATTCACAGAAGAATGTGGTTACGGACTCATACCGTACTTCCTACAAAACGAGGTCTATAATTGCGCTGTTTGTAAAAAACCGAGGAAATACAAGGGCACAGAGTCTTCCTCGATGAGAAGGCGACGGAATCTACAAATTCTATTCAACAATACATCTATTATTCCCTTTAAATGGCGTGGGAAGTACTTGTGTTTCTATTGCAGCAAAGATATTGCCGAGTATACAGAGTTAAGGAAACATACGAAAGCACATGGCAGCTGTTCCATAAAAGACCATTCTCTCAAAGTCCTAAAAGGAGGACAGAACATGGAAATAAAAGTAGACATATCATTGATTAATTGTGAAGTGTGCGCAGAAACATTACCGTCTTTCGATGAAATAATCGCTCATTTGTTTGACAAACATGAACTTGAGTACGATAAAGGAGTAGAAATGGCTATAGAGGAGTATAAACTTGCTGATCTCAGTTGCACCGGATGCGATGAAAAGTTCACGTATTTCGGCTACCTAGTGTCTCACGTCAATAATACCCACCCGAAAAATTGCCTCATTTGCGATAACTGCAACCAAAAATTCAACAAAAGGAGAGATTTGTTTTCACACGTTAAAAATTACCATCGAGAAGGAGGATATCAATGCGAAATGTGCCCTCAAATCTTCAACTCATTGAATATCCTAAGAAAACATCGAAATAATAGGCATTTGACTCGATGCAATATTTGCAATTTAAAACTGCCGTCAGCTGCTTTGAGACAAAAACATATCGACTTAGAACATCCCGACGACGGGTCTTTGCAGTGCGATACCTGCTTCAAAGAGTTCCACACGAAACAGGGCCTAAAAATGCATTCAAGAAAATGTAAAGGAGAAGAAATTTTCGGAATCGCCATCAAAGAAGAAAATATTGCCATGGACTTAGATCTCAACTACGAGGATCAAGCCAAAAAACCTTGCGTCAAACAAATACGAGAAAATATAGTTATAGTCATAAACATGTCTACGGCAATACCCTTTAACTTTTATAAGAATAAGTTCAACTGCTTTTACTGCTCCAAAGATTTCGCCGATTCTGATTTGATGAGAGAACACGCGGTTATGGAACATCCTGTTTGCGATGTTAAAGAAAAGTGTATTAGGAAATGTAGGGAGTCAGTCGCTTGCGTCAAAATCGATATTTCTTCACTCGCTTGCAAAGTCTGCTTCGAGTCATTGAATGACTTGGATCATTTAATCGATCACCTAATCGCGAAACACGATGCGAAATACGACAAATCGATAACAACGTGTCTACAGCCCTACAGGCTGGTGAAAGACAACATGGTCTGTCCTCACTGTCCAGGCGAAGTATTCCGCTTCTTCGGAACACTTCTTAAACATATGAACATCAAACATACCAACAACAATATCATTTGCGTTTACTGCGGCCAAACATTCCATTTGGAAACAGAGGTGACAAAGCACAGTGCTAGTTATCTAAGGAGGAGAAATCTACAAATATTACTCAACAATACAACATTGATACCTTTTAAATGGCGAGGCAAATACCTCTGCTTTTATTGCGGTGACGATACGAAGACGCCCGATCGTCTCCGGAAACACACGAAAGGCCACGGTCCTTGCAGTGATAGCGACAGAGCTATAAGACTAGTTAAATCAGCTGATATAGAAATCAAAATAGACGTTTCCGATGTCTCCTGCGAGATTTGTTCAGAAAGGTTCCCATTTTTAAACGAAATTATTGATCATTTGATAGTTAAACATCAACTGCCTTATGCGAAAGATGTGGAGATGCTGTTATCAGCCTACAGGCTGTTAGATCTTCAGTGTCTCCTTTGCGATAAAACCTTCAATTACTTACGTAAATTAATCAGCCATATGAACGTCGTTCATCCAAATAACAGCTTTGAGTGTGCCGAATGTAAAAAGAACTTTAATAAAAAGAGAGATTTGGATTCGCACATAAGATTACATCACAAGAAGTACCATTCTTGTACTAAATGCGATGAAACGTTCCCAACTAACTCCGAGTTACAGATGCATAGGTCTAACGCTCATTCGTCGACGTGTAACATCTGCTTCCAAGTATTTGCGTCAGACAGCAAGCGGTTAGCTCATCAGAAATCTGACCATGATTCTAATCAGAGCCAATGTGGATTTTGCAACAAAGTTTTGACAACAAAACAAGCCTTTATAAGACATGCTGCAAATTGCGAACATAAACCTCAAGAAGAAATTGTCATAATAGATGACGAAGACAAAAAAGTATCCGTTAAAGAAATAAGAAAAAGTTTAGCATGCATCTTTAACATGACTACCGCACTACCTTTCAAATTCTTTATGAATAGGTTACGATGTTTTTATTGCACGAAAGACTTCACCTCATGCGAAGATTTAAAAGAACATACGTCGATAGAACACCCTCACTGCGATATATCCTTTAAGTCTATGAGGTTAAGGAACAGATATGACGGTGTCCAAATCAAAGTTGATACTTCTTCTTTGTCTTGTAGACTATGCCAAGTCACCTTGCAGGATTTGAACGACTTGATTGATCATTTGAGCAAAGAGCATAAGGTGAAATGCGACTTTTCTGTCGAGAGTAATCTGCAACCGTTCAAACTGATTAAAGACAACTACCCCTGCCCTATTTGCGGGGAAGTCTACAGATATTTTGGCGTCTTACTCAAGCACGTCAGTGCGTCTCATAGCGGCAATAAACATATATGCATGTACTGCGGTACAGCGTTCAGAACTGACCCTAATCTTAGAGCTCATATTTCAAGACGTCATAAAATCGCTGACAACCACAAGTGCGGTAATTGCGATCTAGTATTTGGGACTAATAGTGCGTTAAGAAATCATCAAGGCACCGTTCACGATGGTCTGCCAGGGCCGTACGAAGGCTGTACCTCTGAGAGACGACGGAAAAACTTGAAAATACTGTTCAACAACACTACGATCATGCCATTTAAATGGCGGGGCAAATACCTGTGCTTTTACTGCGGAAAAAACTATACAGAATACACAGAATTTAGAAAGCATACAAAATCCCACGGTCTGTGCACCACAAAAGATTACTCTCTTAAACTAATCAAAGGTTCAAAATTCAATACAGTGGAGGACAAATATAAGAAAATGGAAGTCGCCCGTAAGCTATTGATAAAACGGCGGAATGTCGAGTATGTTTTACAGTATAGCAACGTCACACCTTTCATGTGGCATAAGGGGAAATATAAATGCTTTTACTGCAACGAAACTACTAAAGACCCAGTCGTTCTACGAGAGCATACAACCGCAGCTCATCAATTCGCGAATCTCGAACTCGTTGTGTTTGACAGAACCAAAAATAACCGAAATAAAGACGCTGCTGTCAAAATTGACGTTACTAATATATGTTGCAAGCTTTGTCCACAAGCTGTGACTAATTTAGAAGAGCTGATCCACCATTTAATCATTGCACATGACGCAGAATACGATGTAAGCGTCCCAAATTGCCTGCTACCCTTTAAATTAGACAAGGACCAGCCCACGTGTCCAACATGCAACATGAAATTCGTCTTCTTCGAATATCTGTTGCGCCACGCGAACAAACATCACCTATCCCACCATTACATTTGCGATGTCTGTGGCACCAGTTTTCAAGGAGAGAACCATTTGAAAATGCACTATAGGTACTATCATAGAGAGGGTGGTTACACTTGCGAATACTGTGGTATCAGTCTTGCTACTCTATCTAAAAAGATTCTACACGAAAAGAACGTGCATTTAGTCAACTTATCGACCTGCCCACATTGTCCGGAAACTTTCAAAAGTCCTTACTTAAAGAAACTTCATTTGGCGAATGTCCATGAGGTCGAAGAGCTCAAAATTAAGTGCCCATTTTGCCCAAAAGTTTATCCGCAGGAATCTATCATGTCGCGTCATATGAGGAGAGTGCATCTGAGAGAGAAGAATGTAGAATGCGAAGTCTGTGGGGACAAATTCTTCGGTCCTTACGATGTTAAACTACATATGGTAAAACATAATGGCGAAAAAAAATTCGTCTGCTCTGTTTGCGGGAAAAAATTCTCCAAGCGAAGTAATTTGAACTCCCATGCCGTATTACATACAAAAGAAAAGGACTACGTATGTGTCGTTTGCAATAAGGCATTTGCGCACCAAACGAATTTGCGTATGCATATCCGCAATAGACATAGTCGGTTTGACCTAGCACCTATCGTTGATGAAATCGATGAAAGCGATATGGTTCAAATGGAAATCATTCAAGAGGAATTAGAAGGCGAAGTGGCGGGACAATACATTCAATGA
Protein Sequence: MEFDEIVVKESPGLCRCCLSEGCYKDLGTEYTWMNETEVYADMLLECFDISITQHNEGPNGPNRLICEVCITRLRDACNFKKQVMDSEKKFIDMMGRGEFRPKMLIYQTQLKCEGPSAVEDPDDADVEYLEDDLDFGEVDLKDELVQPSVSDVTVSTLPVKGKRGRPRKNTPVKPDKRAKVAKVDDKTKTRAVAKGEKRRTTEASSKSSMTSTRRNKLMKTNAIIVLETSTVIPFKWHRQNYLCFFCHLTFKDTDLLKEHTTNQHKKSNVKAAVSYLRRDEKVKIDVSVLECRSCNDKFDDLNALIEHLKSTHNLKFTEECGYGLIPYFLQNEVYNCAVCKKPRKYKGTESSSMRRRRNLQILFNNTSIIPFKWRGKYLCFYCSKDIAEYTELRKHTKAHGSCSIKDHSLKVLKGGQNMEIKVDISLINCEVCAETLPSFDEIIAHLFDKHELEYDKGVEMAIEEYKLADLSCTGCDEKFTYFGYLVSHVNNTHPKNCLICDNCNQKFNKRRDLFSHVKNYHREGGYQCEMCPQIFNSLNILRKHRNNRHLTRCNICNLKLPSAALRQKHIDLEHPDDGSLQCDTCFKEFHTKQGLKMHSRKCKGEEIFGIAIKEENIAMDLDLNYEDQAKKPCVKQIRENIVIVINMSTAIPFNFYKNKFNCFYCSKDFADSDLMREHAVMEHPVCDVKEKCIRKCRESVACVKIDISSLACKVCFESLNDLDHLIDHLIAKHDAKYDKSITTCLQPYRLVKDNMVCPHCPGEVFRFFGTLLKHMNIKHTNNNIICVYCGQTFHLETEVTKHSASYLRRRNLQILLNNTTLIPFKWRGKYLCFYCGDDTKTPDRLRKHTKGHGPCSDSDRAIRLVKSADIEIKIDVSDVSCEICSERFPFLNEIIDHLIVKHQLPYAKDVEMLLSAYRLLDLQCLLCDKTFNYLRKLISHMNVVHPNNSFECAECKKNFNKKRDLDSHIRLHHKKYHSCTKCDETFPTNSELQMHRSNAHSSTCNICFQVFASDSKRLAHQKSDHDSNQSQCGFCNKVLTTKQAFIRHAANCEHKPQEEIVIIDDEDKKVSVKEIRKSLACIFNMTTALPFKFFMNRLRCFYCTKDFTSCEDLKEHTSIEHPHCDISFKSMRLRNRYDGVQIKVDTSSLSCRLCQVTLQDLNDLIDHLSKEHKVKCDFSVESNLQPFKLIKDNYPCPICGEVYRYFGVLLKHVSASHSGNKHICMYCGTAFRTDPNLRAHISRRHKIADNHKCGNCDLVFGTNSALRNHQGTVHDGLPGPYEGCTSERRRKNLKILFNNTTIMPFKWRGKYLCFYCGKNYTEYTEFRKHTKSHGLCTTKDYSLKLIKGSKFNTVEDKYKKMEVARKLLIKRRNVEYVLQYSNVTPFMWHKGKYKCFYCNETTKDPVVLREHTTAAHQFANLELVVFDRTKNNRNKDAAVKIDVTNICCKLCPQAVTNLEELIHHLIIAHDAEYDVSVPNCLLPFKLDKDQPTCPTCNMKFVFFEYLLRHANKHHLSHHYICDVCGTSFQGENHLKMHYRYYHREGGYTCEYCGISLATLSKKILHEKNVHLVNLSTCPHCPETFKSPYLKKLHLANVHEVEELKIKCPFCPKVYPQESIMSRHMRRVHLREKNVECEVCGDKFFGPYDVKLHMVKHNGEKKFVCSVCGKKFSKRSNLNSHAVLHTKEKDYVCVVCNKAFAHQTNLRMHIRNRHSRFDLAPIVDEIDESDMVQMEIIQEELEGEVAGQYIQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00038040;
90% Identity: iTF_00038040;
80% Identity: -