Basic Information

Insect: Diachasma alloeum
Gene Symbol: -
Assembly: GCA_001412515.3
Location: NW:50857-61202[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 0.0061 0.47 10.5 1.9 1 23 281 303 281 303 0.97

2 19 0.062 4.7 7.3 0.5 1 23 352 374 352 374 0.98

3 19 0.0052 0.39 10.7 0.3 1 19 415 433 415 435 0.95

4 19 0.18 14 5.8 2.1 1 23 448 471 448 471 0.88

5 19 0.045 3.4 7.7 2.3 2 23 477 498 476 498 0.95

6 19 0.98 74 3.5 0.1 3 22 527 546 525 547 0.90

7 19 3.3e-07 2.5e-05 23.9 0.3 2 23 595 617 594 617 0.97

8 19 3.3e-05 0.0025 17.6 0.2 1 23 623 646 623 646 0.94

9 19 5.3e-05 0.004 16.9 1.4 1 23 659 682 659 682 0.96

10 19 3.5e-05 0.0027 17.5 0.9 3 23 692 712 690 712 0.92

11 19 0.074 5.6 7.1 0.0 3 20 771 788 769 788 0.94

12 19 0.00042 0.032 14.1 0.0 2 23 807 828 806 828 0.97

13 19 7.2e-05 0.0054 16.5 0.6 2 23 844 865 843 865 0.96

14 19 7.5e-05 0.0057 16.5 0.3 1 23 886 909 886 909 0.91

15 19 0.046 3.5 7.7 0.3 2 23 972 994 971 994 0.95

16 19 4.1e-05 0.0031 17.3 0.4 2 23 1015 1037 1014 1037 0.95

17 19 0.17 13 5.9 0.5 1 23 1043 1067 1043 1067 0.95

18 19 8.6 6.5e+02 0.6 0.7 1 23 1072 1095 1072 1095 0.75

19 19 0.096 7.3 6.7 0.1 2 23 1125 1147 1125 1147 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	0.0061	0.47	10.5	1.9	1	23	281	303	281	303	0.97
2	19	0.062	4.7	7.3	0.5	1	23	352	374	352	374	0.98
3	19	0.0052	0.39	10.7	0.3	1	19	415	433	415	435	0.95
4	19	0.18	14	5.8	2.1	1	23	448	471	448	471	0.88
5	19	0.045	3.4	7.7	2.3	2	23	477	498	476	498	0.95
6	19	0.98	74	3.5	0.1	3	22	527	546	525	547	0.90
7	19	3.3e-07	2.5e-05	23.9	0.3	2	23	595	617	594	617	0.97
8	19	3.3e-05	0.0025	17.6	0.2	1	23	623	646	623	646	0.94
9	19	5.3e-05	0.004	16.9	1.4	1	23	659	682	659	682	0.96
10	19	3.5e-05	0.0027	17.5	0.9	3	23	692	712	690	712	0.92
11	19	0.074	5.6	7.1	0.0	3	20	771	788	769	788	0.94
12	19	0.00042	0.032	14.1	0.0	2	23	807	828	806	828	0.97
13	19	7.2e-05	0.0054	16.5	0.6	2	23	844	865	843	865	0.96
14	19	7.5e-05	0.0057	16.5	0.3	1	23	886	909	886	909	0.91
15	19	0.046	3.5	7.7	0.3	2	23	972	994	971	994	0.95
16	19	4.1e-05	0.0031	17.3	0.4	2	23	1015	1037	1014	1037	0.95
17	19	0.17	13	5.9	0.5	1	23	1043	1067	1043	1067	0.95
18	19	8.6	6.5e+02	0.6	0.7	1	23	1072	1095	1072	1095	0.75
19	19	0.096	7.3	6.7	0.1	2	23	1125	1147	1125	1147	0.93

Sequence Information

Coding Sequence: ATGGACGAAGTCGTCGAGCTGGAGGCACTGGACAATGTGTGCAGACTTTGTCTGTCAACGGACGAGCCCAAGTCACCAATATTCGGCGTCCAAGGGGCAGCTGTACCATTGGCCGAGAAGATTCAAGACTGTCTCAGCATCGAGGTGCTGCGGGACGACAAACTCGGGACGATGATCTGCGGGAGCTGTGTCAAGAGTGTCAATCAGTGGCACTTGTACAGGGATAGCTGTCTCAGGTCCCAGGAGAAGCTGCAGAGATGGGTGGAGAAACGTGGAGATGTTATAACTCACATAAAATCGGAGCCAATCGACCCAGACGAGATGTCCTCCCCAGAGGATCTCATCGATACCATGGACAATATGGACGACATCCCCGAGGACAGATCCCCCCCTCGCTCCAAACGTCGTCGATCATCAAGCCATTCATCAGAAGCGGACTCAGTCGCGGGCACACAGCTCCTGCTGAACCCAATGGCGGCAGCCGCGAAGGACCTCCTGGACCCGACCTCAGGGGACTACCACTCCTCCCGCAAAAAACTAAAGCGCGGTCCCCACACCCACTTCCGCGGTATCAAAGTATTCAAACGTAAGTGCCCCCACTGCATGATCCACTTGCACTCAAAGCTCTCGTACAAGAACCACATGGATCGCTACCACCGCGCAAGCGCCCCAAAGCCGCGAAACGGTCCGCTATCATTCCGCCTCCCCTCGACGGACAAGTCCTCCTCCCTGGACGAGGACATAGAGATGGTGGAGGACGTCGAGGACGAGCTCCTCTCAATGGAGAAGAACGCGCCCCTCACCCAAGTCCAAGAGAACATAATAAGCCAATTAAAGACCTTCTCGTGCTACTCGTGTCAGCAAGTGTTTAGCGATCGCCGCAGCACCCTCAACCACATCCGCCAGCACATGCCAGACTTGCGTCCGTACACGTGTATTGCATGCCTGACCGAGTTCCCAGACCGTTCGATATACAAGCTCCATTGCGGCGCGTCCTTTGAGTGCGCCATGAAAATCGCCCTCGTAGTCCCCAAACACGGCACGGAGAAGTATTTCACGTGCAACATGTGCCTTAGACCAATGCCGAACAGAAAAGAACTGCTGTCCCACCTGTCGAAGCACTCTGACAAGCAGTACGAGCCCCTGACGTCGTCCGCCCCGACGGCGCTCAAATCCCCAAAGACAAAAGAGCGCTCGGCAACGGCCCCGGGGCCCTACCGCCACGGCGACCCAGCGCACAACCACACGTGCGACTACTGCGGCATGATCTATCGCTACAAGCCCAACATGCTCAAGCACGAAGACCTGTGCAAGCGTCTACCGCCGGACGAGCGGACCTCCTACCGCTGCGCCCACTGCGGCATGACATTCCTTGTTTTCAAGAAATTCCAGTCCCACATTACCCTCGAGCACAACCGCAAAGATCTCGTCTGCTACGAGTGCAACTCAAAGTTCAAGCAGTCTAATGAGTACTTGATCCACCACCAGCAGCACAGAAACAGTGCTGTGAGGGACGGGGCGAAGAGCGTCTGGAAGAACTACAACTCGAGCTTGACCAAGGTCACCATGAAGTACGGCTGTGCCATGTGCCCCCAGGAGTTCCTCACTAAGGAGGAGCTGGCACAGCACAGGCCGACGCATTCAAAAACCAAGAGCCAAGCCCAGAATCACGTTGAAGTTATAGATCCCGACGTGGACGACAGCATGAGCCAGTCGGGATCGGAGCTCAATGCATCCGCCTACTCCATCCCCCGGGAGAACAATTCCCACACGAGGAGCACAGAGTGCACCACCTGCGGCAAGATATTCGCCAACTATCCCAACTTGCGGAGGCACATAAGAACGGTGCACATAATCGCAGGTAGGTTCAGTTGTCCCAAGTGCCCGAAGACGTTTACGAGCGAGGATCTGTGGAATCAGCACGCCGAGAGGGCGCACCCGAAGGAGGTGCCCGCCGAGGGAGGGGCGCCCCCTTTCAAGTGTATGCAGTGCAAGAAGGTCTTCGATTCGCAGGAGATGTTGAACAGCCATCTTCAGCAGTCACACGGAATGGCTGAGGACGATCACTTGGCTTGCGACATATGCGGCAAGCGCTTCAGCAACGAGACGTCGCTGAAGATTCACAGAGGGCACCACTTCAGACGTGACTCTAGACTGTCGATTCGGTCGGTGCCCCATCCGCTGGATCAGGTGCAAGTTGAGATGCAGGAGGGGCCGCTGGAGTTGAGCCTGACACCGCGTCCGGCTAAAGCCAAGAAGTCCTTTCCAACGCCGAGTTTCAAGCAGTCTTTGTCACCGAGTAATTTGGCCTGCGCTGTCTGCGACGACTCCTTCTCAGACGTCGGGGAATTGCGGAAGCACCTGTGGGAGGTCCACTGCCAGAAGCACAAGTCCGAGAAGTCCTTTGTCGGAGATCTTCAGTGTGAGCTGTGCACAAACGTCTTTCCGGATGAGAAGGCACTGGAGGAGCACATGAGGTGGCACAAGGAGAATCCGATCTTGGCCGAGGTGACGCGACCCGTCGACATCTCCTGCGACATCTGCGGAAAGTTCTACAGCTCGACAAAAGCCCTGTGGAAGCACAAGAAGCTGCACAAGACGACGCCGGTGGCGGGCATCAAGTTCCAGTCGCTCAAGAAGACGACGCCCACGTCCTTCCCCTGCCCCGTCTGCAAGAAGGTCTTCAACAACGAGACTTCCATGAAGAAGCATAAGGCCGCTGCGCACTACGTGAGGAAGTCGTTGAACTCGATAACCAGGAAGTCGACGACACCGTCCCCCTCCAAGGCCGACGAAGACGGCAAGCCAAAACGACCGAAATTGGACTTTGACATGATCAGGAAGGCGTATCACCTGGGGGAGCCTTCGGGCAGCAGCTTTGGGACACCAACCGCCACGACCAAGAAACCTGTCACCTGCGGCATCTGCAAGAAGCTGCTGCCCAGCATGAGCTCGCTCTACAAGCATCGCCAGAACGTACACAAGAGCAGCATTGGCAAGCCTCTGGAGGTCGACGAGGGCGAGGTCGAGGGCGAGGGGGTCTCCTGCACCGAGTGCTACAAGGTCTTCTCTAACCCTGCCAACATGAAACAGCACTACACCAAGGTTCACGGCAATGGCGACAAGCATTACTGCACCATGGACGACTGCGAGGAAGTCTTTGATACTTCGTTGGCCAAGCAGGCCCACGAGAAGAGCCACATGAACATCCTCTACAGCTGCAATCTGTGCTCTAGGCACATGTTCAATCGCTCCGCCATCGATGGCCATCTCAATAATGAGCACGCCGAAGAGGTCGAGGGGAAGAAGACGGAGATGTTCTACAGGAAAACCGATTTGGGGAGCTATGAGGTCAAGGGCGCTGACGGCAGGGTCTGCCCCATTTGCAAGATCAAGTATCCGAACATCAAGGCTATGAAGATTCATTATGTCAAGATCCATGAGGGCGTCAGTTAG
Protein Sequence: MDEVVELEALDNVCRLCLSTDEPKSPIFGVQGAAVPLAEKIQDCLSIEVLRDDKLGTMICGSCVKSVNQWHLYRDSCLRSQEKLQRWVEKRGDVITHIKSEPIDPDEMSSPEDLIDTMDNMDDIPEDRSPPRSKRRRSSSHSSEADSVAGTQLLLNPMAAAAKDLLDPTSGDYHSSRKKLKRGPHTHFRGIKVFKRKCPHCMIHLHSKLSYKNHMDRYHRASAPKPRNGPLSFRLPSTDKSSSLDEDIEMVEDVEDELLSMEKNAPLTQVQENIISQLKTFSCYSCQQVFSDRRSTLNHIRQHMPDLRPYTCIACLTEFPDRSIYKLHCGASFECAMKIALVVPKHGTEKYFTCNMCLRPMPNRKELLSHLSKHSDKQYEPLTSSAPTALKSPKTKERSATAPGPYRHGDPAHNHTCDYCGMIYRYKPNMLKHEDLCKRLPPDERTSYRCAHCGMTFLVFKKFQSHITLEHNRKDLVCYECNSKFKQSNEYLIHHQQHRNSAVRDGAKSVWKNYNSSLTKVTMKYGCAMCPQEFLTKEELAQHRPTHSKTKSQAQNHVEVIDPDVDDSMSQSGSELNASAYSIPRENNSHTRSTECTTCGKIFANYPNLRRHIRTVHIIAGRFSCPKCPKTFTSEDLWNQHAERAHPKEVPAEGGAPPFKCMQCKKVFDSQEMLNSHLQQSHGMAEDDHLACDICGKRFSNETSLKIHRGHHFRRDSRLSIRSVPHPLDQVQVEMQEGPLELSLTPRPAKAKKSFPTPSFKQSLSPSNLACAVCDDSFSDVGELRKHLWEVHCQKHKSEKSFVGDLQCELCTNVFPDEKALEEHMRWHKENPILAEVTRPVDISCDICGKFYSSTKALWKHKKLHKTTPVAGIKFQSLKKTTPTSFPCPVCKKVFNNETSMKKHKAAAHYVRKSLNSITRKSTTPSPSKADEDGKPKRPKLDFDMIRKAYHLGEPSGSSFGTPTATTKKPVTCGICKKLLPSMSSLYKHRQNVHKSSIGKPLEVDEGEVEGEGVSCTECYKVFSNPANMKQHYTKVHGNGDKHYCTMDDCEEVFDTSLAKQAHEKSHMNILYSCNLCSRHMFNRSAIDGHLNNEHAEEVEGKKTEMFYRKTDLGSYEVKGADGRVCPICKIKYPNIKAMKIHYVKIHEGVS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00351346;
90% Identity: iTF_00438927; iTF_01273968; iTF_01273276;
80% Identity: -