Basic Information

Insect: Eurytoma adleriae
Gene Symbol: -
Assembly: GCA_900480045.1
Location: UXGC01000053.1:45177-67547[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 8.1e-06 0.00086 20.3 1.0 1 23 222 244 222 244 0.98

2 30 0.0035 0.37 12.0 1.9 1 23 267 290 267 290 0.96

3 30 0.00056 0.06 14.5 0.5 2 23 297 319 296 319 0.96

4 30 0.00042 0.044 14.9 0.5 1 21 339 359 339 360 0.95

5 30 0.0051 0.54 11.5 0.0 2 23 464 485 463 485 0.96

6 30 0.011 1.1 10.5 0.3 2 23 492 514 491 514 0.91

7 30 0.00015 0.016 16.3 0.1 1 23 584 607 584 607 0.96

8 30 0.094 10 7.5 0.4 1 23 613 636 613 636 0.96

9 30 0.16 17 6.8 1.5 1 23 649 671 649 671 0.97

10 30 0.0023 0.24 12.6 2.2 3 23 716 737 714 737 0.95

11 30 0.048 5.1 8.5 0.9 2 23 797 820 796 820 0.93

12 30 4 4.3e+02 2.4 0.0 2 23 829 851 829 851 0.84

13 30 0.26 28 6.2 0.1 2 23 858 880 857 880 0.93

14 30 1.7e-05 0.0018 19.3 1.2 1 23 888 910 888 910 0.98

15 30 0.00027 0.029 15.5 3.3 1 23 986 1009 986 1009 0.97

16 30 0.0071 0.76 11.1 0.4 2 23 1016 1038 1015 1038 0.95

17 30 0.00092 0.098 13.9 4.8 1 21 1077 1097 1077 1098 0.94

18 30 0.0035 0.37 12.0 1.8 2 23 1112 1133 1111 1134 0.93

19 30 1 1.1e+02 4.3 2.6 1 23 1137 1159 1137 1160 0.95

20 30 0.032 3.4 9.0 0.8 2 23 1167 1190 1166 1190 0.91

21 30 1.3 1.3e+02 4.0 0.2 2 23 1198 1220 1198 1220 0.95

22 30 4.7 5e+02 2.2 0.0 2 23 1227 1249 1226 1249 0.87

23 30 0.29 31 6.0 2.7 2 23 1258 1280 1258 1280 0.96

24 30 0.16 17 6.8 0.9 2 23 1286 1308 1286 1308 0.93

25 30 0.071 7.5 7.9 0.4 1 23 1375 1398 1375 1398 0.96

26 30 0.027 2.9 9.2 2.0 1 21 1428 1448 1428 1449 0.92

27 30 0.41 44 5.5 1.9 2 23 1544 1566 1543 1566 0.94

28 30 0.56 59 5.1 0.4 2 23 1573 1595 1572 1595 0.95

29 30 0.22 23 6.4 1.8 1 23 1606 1628 1606 1628 0.97

30 30 0.016 1.7 10.0 0.2 1 20 1635 1654 1635 1656 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	8.1e-06	0.00086	20.3	1.0	1	23	222	244	222	244	0.98
2	30	0.0035	0.37	12.0	1.9	1	23	267	290	267	290	0.96
3	30	0.00056	0.06	14.5	0.5	2	23	297	319	296	319	0.96
4	30	0.00042	0.044	14.9	0.5	1	21	339	359	339	360	0.95
5	30	0.0051	0.54	11.5	0.0	2	23	464	485	463	485	0.96
6	30	0.011	1.1	10.5	0.3	2	23	492	514	491	514	0.91
7	30	0.00015	0.016	16.3	0.1	1	23	584	607	584	607	0.96
8	30	0.094	10	7.5	0.4	1	23	613	636	613	636	0.96
9	30	0.16	17	6.8	1.5	1	23	649	671	649	671	0.97
10	30	0.0023	0.24	12.6	2.2	3	23	716	737	714	737	0.95
11	30	0.048	5.1	8.5	0.9	2	23	797	820	796	820	0.93
12	30	4	4.3e+02	2.4	0.0	2	23	829	851	829	851	0.84
13	30	0.26	28	6.2	0.1	2	23	858	880	857	880	0.93
14	30	1.7e-05	0.0018	19.3	1.2	1	23	888	910	888	910	0.98
15	30	0.00027	0.029	15.5	3.3	1	23	986	1009	986	1009	0.97
16	30	0.0071	0.76	11.1	0.4	2	23	1016	1038	1015	1038	0.95
17	30	0.00092	0.098	13.9	4.8	1	21	1077	1097	1077	1098	0.94
18	30	0.0035	0.37	12.0	1.8	2	23	1112	1133	1111	1134	0.93
19	30	1	1.1e+02	4.3	2.6	1	23	1137	1159	1137	1160	0.95
20	30	0.032	3.4	9.0	0.8	2	23	1167	1190	1166	1190	0.91
21	30	1.3	1.3e+02	4.0	0.2	2	23	1198	1220	1198	1220	0.95
22	30	4.7	5e+02	2.2	0.0	2	23	1227	1249	1226	1249	0.87
23	30	0.29	31	6.0	2.7	2	23	1258	1280	1258	1280	0.96
24	30	0.16	17	6.8	0.9	2	23	1286	1308	1286	1308	0.93
25	30	0.071	7.5	7.9	0.4	1	23	1375	1398	1375	1398	0.96
26	30	0.027	2.9	9.2	2.0	1	21	1428	1448	1428	1449	0.92
27	30	0.41	44	5.5	1.9	2	23	1544	1566	1543	1566	0.94
28	30	0.56	59	5.1	0.4	2	23	1573	1595	1572	1595	0.95
29	30	0.22	23	6.4	1.8	1	23	1606	1628	1606	1628	0.97
30	30	0.016	1.7	10.0	0.2	1	20	1635	1654	1635	1656	0.94

Sequence Information

Coding Sequence: ATGGATACGTCCAGGGACAGGTACGACGAGCTCTGCAGGCTCTGCGCCTCCTACGATGCCGTCAAGATGGACATCTTCGGCCAGGAAGGCAAGAACCGCCAGCTAGTCGACAAGATCCAGACCTGCCTGCCCTTCAAGATTGCGGAGGATGATCGATTACCAAAATGCCTTTGCTACAGATGCATGTACAATTTGGAGAACTTCTATGATTTTAGAACAGCCTGCGTCAATGCGGTCGCACTGCTGGAAAGATGTTTACCGGCGGACAGGGAGCAACCGCAGATAAAGCAGGAGCAGACCGAGGATGCGGAGCCATACTCGGAATTGCGTATGGAGCTCTTGAAAGAGAAGGAGACAACGCCGATGCTCATACCCGAGGCGCCTGTGGTAAATCCCAACGCGGCTCTCGGTACTCCACCGAGACTCAGGTCGGAGGATGGCGAGCAAGACGGCGAGGGTTTGCCCCAGGAGAACAACGACGAACACCTTGAGGACCACGACGATGATCACAAGTCGGACGAGTACGACATGGAGGTGGAGATGAATCCGAGTGACTTCCTGGAGATGAGCGCGATGATGCCCGAGGAGGAGAACCACGGGCTGCCGCAGCCCTCGGCCCAGGACACCGGCGTCTTCCAGCACCGCAACGAGCAGCACGAGGTTTACGTCTGCTCGCTCTGCAACAAGGCCTTCAGCTCCAAGGGCCACTTGTCCCTCCACGCCCGGATTCACGTGGGCGCCGGCGACGTCATCGGCGAGAAGGTCATCACCGACGATCACACCTCGTACAAGAGGCCTTACCAGTGCGACCTCTGCAACAAGTCGTACTCCACCGCGAAGCATCGCTGGGGACACGTATCTACCACGCATCGgggACATCCTGCAGTGACGTGCGGCTACTGTTCGCGTATCTATTCGACGCGCACGAATCTTGAGGAACATGTAAAGTCTCGACATGCGGGCCTGCCACCGCCACCGGAGATACCCGTGCCGTACGTTCAGCCGGACTCTCGATTCCAGTGCAAGACGTGCCCCAAGATGTACACGAATATCACGGATCTCAACAAGCACAGCAGAGTTTGTCAGGGCGATCAGCGTAAGGACTTAGCCAACAACAGCTTCAATGCCCACAGCTTTAGCTCAAAACTTAAAAACGCATTAGAGCCGAATTCAGACATGTCAAGTGTAGATTCGGATTATGAGAATAGAGATTACAAGAGTGCTGAGGCAAAACTTGCCAAAAATCCACAGTTAACTATTCTCAAACAAGCTCTAATCAAGGGCGAAAGTGTTAAGAAGGAGTATGAAGAAAGGCAGAAAATGTTGAGCAAAGCGAAAAAACAAAGCAACTCAACAAACAAAGaTTCCGAGACTGAAGGCAAAAGGTGGTATTGTGAGGTTTGTCCCGTCAACTTTGCTACAGTAGACGAATTGAGGCAGCATGAAAAATCACACGATGCTGACAAGCCTTTCATATGTATTTTGTGTGAGAAGGACTTCGTTCTCAAATCATCCTTGAGCAGGCATATACTTACGTCTCATGGAGTAGATCCGACACCGTTAGTGGAGAGTGACAAATGCCTGAAAAAATCGGTGCAAGAGTCTAATAATCATCCGGAAACGATAGTAAAGGAAGAAATAAACATTACCAAAGATAATTCCTCATCCCCATTTTCTGCCGATAATATGGAAAATGACGATGAAGAACAAGAAAACGGAAATGAAAACATGCTCGAAATGGAGACTGTATTTGTTTGTGAAATTTGTACGCGAGACTTTAACGATCGAGCGTCACTTTGGTTACACATTCGTGCTACTCATAAAGAGTATGCAGCCTTTGCCTGTGGAGTTTGTCTGAAAATCTGCCAGGACAATGCGCAACTACTGAATCATGTCAATATGTATCATGGAGGTTCAAAACTTTTGATGTCTGAACAGAGAAGgTACAGTTGTACAATCTGCGGAAGGCAACACGATTCGAGGAAGAAACTTATAACTCACGTGTCTATCCACAACGTGGATTCGTCTTATGATCCAGCTAGTTTCGTACAATTGAATACAAACTActataatgaaaatgttaatagcAATGAGGGTAATGATGGATTAATCATGGATTGCGATGAAGACAGTGAGAAGATAGACTGCTACATTTGCTGCAAGTCGTTCCCTAACGAAGATCATCTCATTCGCCATCAAAGGAATGCTCACAAATCTGAACAGATGGGTACTGGCGAATATCCAGGTGGATCGCCTGGTCAAAATGGAACGGGTAATCGCGCCCAATATCATCTTTTCTTTGTATGCGAACTTTGCGGCAGTTCGCACCCCAGTAAGTGGGAACGTTGGCTACACGTCAGTAGTGCTCACGGAAATGAAACTACTATAAGGtgcGAACGTGACGATTGCGGTAAAATTTTCGCGACAAAGACGTTGCGCAACGAGCATGCTCAGCATCACCAACTGCAAGGCAATTCGCCCAATACCTGTGAGATCTGCGGAAAATTGTGGGGCAGTCGAGTAGATTATTGGAAGCATGTGATGGGCGTGCATGCAGACACGGTGCCACTCATCTGCGGCGTCTGTCTCAAAGTCTTCCCGGACGTGTTGCAACTGAGTCAGCACGTCAAGCTTAAGCACTGGCCTTTGACCAACGGCGATTTCAGTTGCGACATCTGCGGTCGGCCCTACTCAAACAAGAGCAAAATGTCGAGACACCGCAAGATCCACGGACTCGATGGCGAAGTTTACAATCCAGCTGCAACCAACAGCAGCCTTGTTATTAACGATGCTATGAGTGAAATGTCTTcTCTTCCGGTATCGGTGCAAATGGATAACGGTTTACCTCAACCGGTAGATCCAGCCTCAATGGACTTGAGCTGCGAGATGTGCGGCGATCTTAAATTCCCCTGTTTAGAAGATCTGTGCAATCATAGAAGAATTGCACACAACCTTTTCCCATGCGATTTGTGCAACAAGTGTTACGGTCGAACTTCTCACCTTTGGAAGCACGTAAATCGTGTGCACAAAGGTCATGAGGATGTCACTTGCcgttattgtttaaaaacaagCGCATCTAAAGAGCACCTAGCGGCCCACATCGCTAAAATACACCGGTATGAGCCTGAGGTAAAGAGCGAGTTTAAAGACACGTTGAACTTCAAGCAGAGCTATAACATGGCCGCGGCGGCTGCCGCTGCTGCAGCTGCTGCTGAGGAAGACGGTCTGCACTTCTGCGAAAAGTGTAACAAATCGTTCCacaaaaggtaCTTGTTACGTCGTCATATGAAGGGTTGTCAGAACTATCGAAAGGATCCGGGTGCCCTGTTAACAAGATGCCGCGCTTGCGAGCGAATCTTCAAGGATCGCGCGAGCTTACAAAAACACATCGAGAACCACCACAGTTCGTACGAATGTCACCTCTGCAAGGAGACCATCACCTCTAAGCTCGGCATAATGACACATAATCGTGTGCATCACATGCAACATCCTGACCTCACCTGCGAGCTCGAGAGTTGCCGCAAACTGTTCAGGACAAAAGAAGATCTCGAATCCCACCGCAAAGATCATAAACATTTCGGCATGCCTAACGTTTGCGATTTCTGCGGCGACACCGTTGagaataaactaaaattgaaaatgcacATACTGAGCTTGCATAGGAATGAGATTGGTGTTTCCTGTGGAGTTTGTCTCATTCCCATGAAGGATCCAAAGGATCTCAAGAAACACGTGGAAGATGTTCACGCGAGCATACTGCAGAGACCAAATACTTGTcagGTTTGCGGCAAGCAATACGCTTCGAAGTGGAAAGCGTTCGACCACACGAAGAAGTGCCACGGTAAAGTATTCCGTACTTGCAAGCAGTGCCTGGCAGTATTCACTTCGGACGAGGACCTGCGCTCGCATTACGAGCACGTGCACAACATTCCGAAAGATCAGCTTGACGCTTATCAGTATCGCCTCGAGGTGTCTGGAGTCAAAATGGAAGATTACGACCTCGGCCCGCTTGAAGTCGTCGTGAAGGAAGAGCCCGACGAGCTCGATTTCGATGTCGATGCGTTCGAAGATGACAATGGCAACTCGAACGATTCCAAGCGACGCCGATCCGTCACCGACACGTTTGACTGCGAAATCTGTCCGGAGATATTCCTGAATCACGAGCTGCTGTCCTCGCATTATCGCAACGTGCACAATACCGACCCGGAGCGTATGTTCAAACGCGTGAAACTTGAATTTACGCCTAACAAGGCTAAGAAGAAGATGCGAGAGCGCGAGAACTACGAGTGTAAAAACTGCCAAAAACAGTTCTGCACTAAGACACTGTACCTGGGTCACGTGAACGTGTGCACGCGTAAATCTGTGCCTGGTCCACCTACGTCGATTCTGGAGGCGCACTTGAAGAACAACAATCAGATTCATCAGATAAAGCGCGAGGAACCCGAGCCGATTCTCTGTGAGACGAATCTCAACATTCCAGACTTCAACCTCTTCGAAGATATCAATATGCAGTTGTCTGGACAAAAACCGGTGCCGAGTCTTATGCCGCTCGGTCACTCGTCCAAGTCCGCCAAGTACTCGCGCAAAGATTCGCGCAAGGTGTACGACGAGTCAACGAATACCGAGTGCACCTGCGAGGTTTGCGGCAAACAGTGGCCGGCTAAGAAGCACCTGTGGCAGCATTTGATACGTTTCCACCGTGCGGAGGCGGCTGTCACATGCGGCGTCTGTCTTAAGCTGTGCGCTACTTATGACGATCTGTCGGAGCACTTGAAGAACGTGCACCCGGCGATCCTCTCCACGGCCGGTAACAACTTTACCTGCAAAATCTGCGGCAGGTATCACAATGCGCGAAGCAAACTGCTGCTGCACATGAGCATCCATATCAACTGCAAGAACAACTTCATGTGTGGTCGGTGCAACAGGAGCTTTGAGAACGACGAGAAGCTGAAGGAGCATATTGGAACGTGCCTCGGCGTGAAGGAGGAACAGACTGCCGAAGCCGATGCTGACAGTATCGTCGTAAAAGAGGAGAACGAGGAGAAGGGTAGCTTGATTGGCGATGAAGAAGAGGCGCCCGAAGAGAACGAATATGAATCGGAGGACAATTCGGATAACGGAAATAGTAGCTCCAATGACTCCGACAGCAACAGCAGTAACAGCAACAGCGATAGTTCTAGCGACAACAGCGATGATGACAGCAGCGATGACGAAGATGGTCGATCTCGCAATGTTGATGAGGACAGTAGCAATAGCAAGGAGTCTGACAACGTTGATCAAGTTCAAGTGCAGCAGGCTGCGGTAAAGATTGAGGAAAACGAGACGATGAGTCTAGGCGAGGATGACGAAGATGAGGAGGATGAGGATGAGGACGAGGAGAAGCCGTCGAGGTACGGTGTGATGTCCGAGTCCGAAGATGACGAgaaaattaaatataaaacctTTACAGGTGAGGAAGAGCAAGAAGAAGGCGAAATGCAGGAAGTAGAAGAGGAGCAAGAAGAAGGAGAGGAGGTTGAGGCTGAGGTCGAGGCtgaagaggaagaggaggaaggcGAGGTCGAAGAGGAAGTGCAGGATCAAGAACAAGAACAAGAACACGAGGAGCAAGAAGAGCTGGAAGAAGTTGAGGAACAAGAGATGCAAGAGGTCGAAGAGGGCGAGGAGGAAGAAGTCGAGCACGATATGAACGAAGCGGAGGTGCTGGAAGTCGATGAGAACGACATGCACAACCTGAACGGCACCGTACTGATGCTCACCAACGACGCCGACGGCAATCAGATCCTCATCCAGCGCAATATGTCCGACCTCGAGAACGACGAGTCGGTCCACGATATGGCGCAGTACGTATTCCAAGACGGCACTGGTTTTGCTCTCGAGGACTACGAAGCGATCGTGGAAAGCCAAGCCGACGAAGAAGACGAGGAACATCAGCAGCACCAACACTTCGAGATGGAAATCGGTCAAGAAGTCGAGGAGCACGAGCACGTGCAAGAGGAGGAGGCTGAGGAagtcgaggaggaggaggtggaggcgCCGATGGCGAACGATGAGGAACACAGTTCCAGTGCCAAAAGCTAA
Protein Sequence: MDTSRDRYDELCRLCASYDAVKMDIFGQEGKNRQLVDKIQTCLPFKIAEDDRLPKCLCYRCMYNLENFYDFRTACVNAVALLERCLPADREQPQIKQEQTEDAEPYSELRMELLKEKETTPMLIPEAPVVNPNAALGTPPRLRSEDGEQDGEGLPQENNDEHLEDHDDDHKSDEYDMEVEMNPSDFLEMSAMMPEEENHGLPQPSAQDTGVFQHRNEQHEVYVCSLCNKAFSSKGHLSLHARIHVGAGDVIGEKVITDDHTSYKRPYQCDLCNKSYSTAKHRWGHVSTTHRGHPAVTCGYCSRIYSTRTNLEEHVKSRHAGLPPPPEIPVPYVQPDSRFQCKTCPKMYTNITDLNKHSRVCQGDQRKDLANNSFNAHSFSSKLKNALEPNSDMSSVDSDYENRDYKSAEAKLAKNPQLTILKQALIKGESVKKEYEERQKMLSKAKKQSNSTNKDSETEGKRWYCEVCPVNFATVDELRQHEKSHDADKPFICILCEKDFVLKSSLSRHILTSHGVDPTPLVESDKCLKKSVQESNNHPETIVKEEINITKDNSSSPFSADNMENDDEEQENGNENMLEMETVFVCEICTRDFNDRASLWLHIRATHKEYAAFACGVCLKICQDNAQLLNHVNMYHGGSKLLMSEQRRYSCTICGRQHDSRKKLITHVSIHNVDSSYDPASFVQLNTNYYNENVNSNEGNDGLIMDCDEDSEKIDCYICCKSFPNEDHLIRHQRNAHKSEQMGTGEYPGGSPGQNGTGNRAQYHLFFVCELCGSSHPSKWERWLHVSSAHGNETTIRCERDDCGKIFATKTLRNEHAQHHQLQGNSPNTCEICGKLWGSRVDYWKHVMGVHADTVPLICGVCLKVFPDVLQLSQHVKLKHWPLTNGDFSCDICGRPYSNKSKMSRHRKIHGLDGEVYNPAATNSSLVINDAMSEMSSLPVSVQMDNGLPQPVDPASMDLSCEMCGDLKFPCLEDLCNHRRIAHNLFPCDLCNKCYGRTSHLWKHVNRVHKGHEDVTCRYCLKTSASKEHLAAHIAKIHRYEPEVKSEFKDTLNFKQSYNMAAAAAAAAAAAEEDGLHFCEKCNKSFHKRYLLRRHMKGCQNYRKDPGALLTRCRACERIFKDRASLQKHIENHHSSYECHLCKETITSKLGIMTHNRVHHMQHPDLTCELESCRKLFRTKEDLESHRKDHKHFGMPNVCDFCGDTVENKLKLKMHILSLHRNEIGVSCGVCLIPMKDPKDLKKHVEDVHASILQRPNTCQVCGKQYASKWKAFDHTKKCHGKVFRTCKQCLAVFTSDEDLRSHYEHVHNIPKDQLDAYQYRLEVSGVKMEDYDLGPLEVVVKEEPDELDFDVDAFEDDNGNSNDSKRRRSVTDTFDCEICPEIFLNHELLSSHYRNVHNTDPERMFKRVKLEFTPNKAKKKMRERENYECKNCQKQFCTKTLYLGHVNVCTRKSVPGPPTSILEAHLKNNNQIHQIKREEPEPILCETNLNIPDFNLFEDINMQLSGQKPVPSLMPLGHSSKSAKYSRKDSRKVYDESTNTECTCEVCGKQWPAKKHLWQHLIRFHRAEAAVTCGVCLKLCATYDDLSEHLKNVHPAILSTAGNNFTCKICGRYHNARSKLLLHMSIHINCKNNFMCGRCNRSFENDEKLKEHIGTCLGVKEEQTAEADADSIVVKEENEEKGSLIGDEEEAPEENEYESEDNSDNGNSSSNDSDSNSSNSNSDSSSDNSDDDSSDDEDGRSRNVDEDSSNSKESDNVDQVQVQQAAVKIEENETMSLGEDDEDEEDEDEDEEKPSRYGVMSESEDDEKIKYKTFTGEEEQEEGEMQEVEEEQEEGEEVEAEVEAEEEEEEGEVEEEVQDQEQEQEHEEQEELEEVEEQEMQEVEEGEEEEVEHDMNEAEVLEVDENDMHNLNGTVLMLTNDADGNQILIQRNMSDLENDESVHDMAQYVFQDGTGFALEDYEAIVESQADEEDEEHQQHQHFEMEIGQEVEEHEHVQEEEAEEVEEEEVEAPMANDEEHSSSAKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01380123;
90% Identity: iTF_01380779;
80% Identity: -