Basic Information

Insect: Hermetia illucens
Gene Symbol: -
Assembly: GCA_905115235.1
Location: NC:7475035-7497241[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 0.49 27 5.1 0.2 3 20 62 79 61 81 0.94

2 28 0.54 29 5.0 3.7 5 23 360 378 358 378 0.94

3 28 0.37 20 5.5 1.8 5 23 417 435 414 435 0.93

4 28 0.38 21 5.4 0.2 1 23 452 475 452 475 0.94

5 28 4.9 2.7e+02 2.0 1.8 2 23 491 512 490 512 0.95

6 28 0.00016 0.0087 16.1 1.0 1 23 519 541 519 541 0.97

7 28 0.014 0.76 10.0 6.9 1 21 547 567 547 573 0.96

8 28 4.5e-05 0.0024 17.8 0.2 2 23 577 598 576 598 0.92

9 28 0.00058 0.031 14.3 3.0 1 23 604 626 604 626 0.98

10 28 0.00071 0.038 14.0 0.5 1 23 632 654 632 654 0.98

11 28 7.2e-06 0.00039 20.3 4.4 1 23 659 681 659 681 0.98

12 28 0.046 2.5 8.3 0.1 2 20 825 843 824 846 0.94

13 28 1.9 1.1e+02 3.2 3.1 2 23 863 884 862 884 0.96

14 28 0.00042 0.023 14.8 1.0 1 23 891 913 891 913 0.93

15 28 0.012 0.66 10.2 0.1 1 23 919 942 919 942 0.95

16 28 0.00064 0.035 14.2 1.4 1 23 955 977 955 977 0.96

17 28 0.00045 0.025 14.7 0.3 2 23 984 1005 983 1005 0.97

18 28 0.087 4.7 7.5 0.5 1 21 1011 1031 1011 1032 0.94

19 28 8.4 4.6e+02 1.2 0.1 8 19 1074 1085 1067 1087 0.85

20 28 9.8 5.3e+02 1.0 2.1 5 23 1544 1562 1541 1562 0.93

21 28 0.02 1.1 9.5 2.4 3 23 1599 1619 1598 1619 0.97

22 28 0.0018 0.099 12.8 1.1 1 23 1634 1657 1634 1657 0.95

23 28 0.033 1.8 8.8 0.9 1 23 1701 1723 1701 1723 0.94

24 28 0.0063 0.34 11.1 3.8 3 23 1731 1752 1730 1752 0.95

25 28 6.4e-05 0.0035 17.3 5.7 1 23 1758 1780 1758 1780 0.96

26 28 0.0022 0.12 12.5 5.3 1 23 1784 1806 1784 1806 0.98

27 28 1.1e-05 0.00059 19.8 2.7 1 23 1812 1834 1812 1834 0.98

28 28 0.00026 0.014 15.4 0.6 1 23 1839 1861 1839 1861 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	0.49	27	5.1	0.2	3	20	62	79	61	81	0.94
2	28	0.54	29	5.0	3.7	5	23	360	378	358	378	0.94
3	28	0.37	20	5.5	1.8	5	23	417	435	414	435	0.93
4	28	0.38	21	5.4	0.2	1	23	452	475	452	475	0.94
5	28	4.9	2.7e+02	2.0	1.8	2	23	491	512	490	512	0.95
6	28	0.00016	0.0087	16.1	1.0	1	23	519	541	519	541	0.97
7	28	0.014	0.76	10.0	6.9	1	21	547	567	547	573	0.96
8	28	4.5e-05	0.0024	17.8	0.2	2	23	577	598	576	598	0.92
9	28	0.00058	0.031	14.3	3.0	1	23	604	626	604	626	0.98
10	28	0.00071	0.038	14.0	0.5	1	23	632	654	632	654	0.98
11	28	7.2e-06	0.00039	20.3	4.4	1	23	659	681	659	681	0.98
12	28	0.046	2.5	8.3	0.1	2	20	825	843	824	846	0.94
13	28	1.9	1.1e+02	3.2	3.1	2	23	863	884	862	884	0.96
14	28	0.00042	0.023	14.8	1.0	1	23	891	913	891	913	0.93
15	28	0.012	0.66	10.2	0.1	1	23	919	942	919	942	0.95
16	28	0.00064	0.035	14.2	1.4	1	23	955	977	955	977	0.96
17	28	0.00045	0.025	14.7	0.3	2	23	984	1005	983	1005	0.97
18	28	0.087	4.7	7.5	0.5	1	21	1011	1031	1011	1032	0.94
19	28	8.4	4.6e+02	1.2	0.1	8	19	1074	1085	1067	1087	0.85
20	28	9.8	5.3e+02	1.0	2.1	5	23	1544	1562	1541	1562	0.93
21	28	0.02	1.1	9.5	2.4	3	23	1599	1619	1598	1619	0.97
22	28	0.0018	0.099	12.8	1.1	1	23	1634	1657	1634	1657	0.95
23	28	0.033	1.8	8.8	0.9	1	23	1701	1723	1701	1723	0.94
24	28	0.0063	0.34	11.1	3.8	3	23	1731	1752	1730	1752	0.95
25	28	6.4e-05	0.0035	17.3	5.7	1	23	1758	1780	1758	1780	0.96
26	28	0.0022	0.12	12.5	5.3	1	23	1784	1806	1784	1806	0.98
27	28	1.1e-05	0.00059	19.8	2.7	1	23	1812	1834	1812	1834	0.98
28	28	0.00026	0.014	15.4	0.6	1	23	1839	1861	1839	1861	0.99

Sequence Information

Coding Sequence: ATGGATTTAGTACCATTTCTAAATTCGGGTCTTCTAGCAAATATTAAATTAGAGAAAGAGATTCCAACCGAGTTCTTAGATGACCCCGAAACTGAGAGAAATTGTGCAAATTACCTTAATATTGACCAGAAACCGAAGTATGGTCGCGTCTTGATTTCAGCTAGTGGCAAATATACCTTATTGTGTGATGGCTGTAAGGGCCGTTTCGACAGTACGGATTCATTTACCAGGCATGCTAAGGGGGTATACTCGGGTTGTGGCATATGGAAGGATAGCAACGATGGAATTTCCATCAACAAGGTCGCCTTCGAGCGAGGCGATTTTAGAAGTAAAGAGGACATTAAGGAGGATATCACTGTGTGCAGGATTACGAAAGACTTCAATGTGAAGGAATCTGTGACCAATGATCGGgagactattgtcagaaacgAAACCTCAAGTAAAGAGAAAAATCTATGCTTCACTAAATGTTCGGAATCAACGAAGAAACCAAATGTGATAATTACCGCTAAACCCATCTAcgatgagaaaaaaaatttttgtatcACATGCGATCGTCAGTGGGAATCGCGGAAGACTTTTTTGCGACATAAATATTATCACAGGGAGAAGTTCCGTAAGCAGATGATGGCCCGTTCAAATCAAGGCAGACAGGAAGATATTTCAGGCGAGGTTATAGTCAAGGATGAGCTAGATTTCGGAGACTACGAGATGCATGACTCAGCATACAATGAAGGAAGCATTAAAACAATAGACGATGACGGGGCAGAACGACTGAGGTTATATTCCGGCGATACGCTCGATTCACAGTCTTTTCATGGCGGATCTTCAGTACAAGGCTGGATTAAGACTGAACCCATGACCAATACAACGAACGAGGACGGTGTAAGAAACGAAATGATAAGTGCGACACTTGGTAAATTAGGGTTGGTAACCTCAGAAGAGAAAACATCGCTATGCGAGGATGTTAGTGGGAAATATGGAACAGATGCAGACCAAGGGCTAGAGTCCGGTGGGAGCGCATCAGtcgtatttgctttggagcccgaTTTCGACGATGCCAAAACCTTGTGTATTACCTGCAATTGTCAATTCAATTCGAAGGAAGCATTCAAGCGCCATAAAAAGATTCATAAATCGGAAATTGTAAAGTGGAAGATCGCTAATGGTTTCGAAGTGGAACAAGGGAAGATCAAAGtggtattttctgaaaatccgATCTTCGATGATGAGAAGAACTTCTGTATCACATGTAATCGCGGATTCACCTCCATAGACAGCTTTAAGACTCATAAGAAATTGCATAGAAGGAAAATTCGCGCCAAGGGAGGTTTTATTAAGACAGAAGCAAGATTTTCTTGTGAATTCTGCTCGGAACAATTAAGATCAGAAATCGGCTTAAGAACACATATTGTGTCGCAACATGGAGATAACATTCCAGAGTTCCTACAAAATGATCCAACATACCTTGAATGTCGATTTTGTTTTATGCGTTTTGAGAAGCCAACAGAACGTTTCCAACATGAGAAGAGCCATTCTGACGAACCAGAACCATATCGATGCCCAGTTTGCCCGAAATCATTTGCCAGGAATATGCACCGCAAAATTCACGAATCCATTCATAGAAAAGATCGTCCATTTCGCTGTGTACATTGTCCTAAATCCTTCTCAACTCGGCAACGCCTCAATAGTCATGTTAGATGTGTACATTGTAGCAAGAAACCATTAATGTGCGAAGATTGCGGAAAGATATTTGATTCCAAAGTACAGCTTAGGAGACACAGCTTAGCTCAcacgaaagaaaaaaattatgaatgtGATGAATGTGGGATTCGACTCCGCCATCAAACGAGTTTATATAGGCATAAGAAAAGACACGCTAATCAACGTGACTTTAAATGTGAAAAAtgcgaaaaattatttttcaccaaCGGCGAATTGCTCGGTCATATGAGTGTGCATTCCGAGGTGTATTTTCAATGTCCGCATTGTGAAAAGCGATTTAGAAGGAAGAATAATATGACGGCTCATAAAAAGGTACATGAGAAGGTCGATGAGGATAGTGAATCGCGTGATCTAGAGGACGAGAATAGTCAAGAGTGTGAAGGGGAGAAAGGCAAAAAGTTGAAATTTAAGTGCACTGCAAAGGTATTCTCACTAGAACCTCAGTTCGATGAAGAAAAACACTTTTGCATCACATGCAATCGTCAAATGCACTCGATTGAAGCATTCAGATTTCATAAAAGTAGtcataaattcaaaattcataaaTGGAAGCAACGCAACGGAtgggaaataaaaaaaggacCCATAAGAATAGTGTTTTCTGAAAATCCCAGTTTCGATGACGAGAGAAACTTTTGCATTACATGCAATCGTGGGTTCGCTACCAGAGCTACCTATAGATGTCACAAACGAATACATAGAATACGGATTCGTAAACGACAAGGCCTTCTGCCGAAAGCTACAATTTCATGCGAATTTTGCACTAGACAATTCCGATCAGAAGCAGGTTTACGAGAGCATATTGTGCCCCATCACGGAGATAAGATCCCGACGTCGCTCAAAGACGATCCAACATACCTAATGTGTCGATTCTGTCATGAGCAGTTTGAAAAACCAACAGAACGTTTCCAACACGAGAAAACCCATGCCAACGAAGAAAAGCCGTATAGATGCCCACTATGCCCGAAATCCTTCACCAAAAGCTCAGCTCGTAGAATTCATGAGTCATTCCATGGTGAAACTCGTCTATTTCCCTGTTTGCAATGCCCAAAAATTTTTGGATTCCTTCCATATCTTAATCGTCATGTGGAACGTGTTCATTCTAACGTAAAATCAtcacaattaaaaataaaatcatatccGTGCAAGAAGTGCGGAAATTCATTTAACACGAAAAGAAAACTAGCATCGCACAATGTTACTcatataaaagaaaaaccgCTTGAATGCGAGGAATGCGGTATCCGATTCTCAGGCCTACAAAGTTTACGTGTACATAAGAAAAGGCATGCTAACCGGCGGAATTATAAATGTGAAAAATGTGGAACATTATTCCTCACTGACGCTGAATTTCAAAAGCATATGTCTAAGACCTCTGACGATGGTGCGTTTCAGTGCCCGATTTTTGACGAGCAGTCCGAGGGGGGGAACTCGTTAATTGTTAAAAAGGAAGTAGAAGACTGCGAGGAAACGTATAGTTGCCCGATTTCCGAAGAAAAATTCACGCAACATAGTGAATTGCAATCGCATTTCGAGCCCTATGGATTAGGGACTAGCCGCGAATTCCTATTTTCTGTGGAAGATTTATTACTCAAAATAAAGCCTTTGAACGTGAATTTGATATCTGTACTGAATTCGGGAATCCCGGCAGAGGTTGAATCACAACAGGAAATTATAGAAACGTTGCTAGAAGGCGATGAAGCTGTGGGTGGTAATCAAGGTTCTTCAAGCGTCGACCTGAGAGCGAAGTGCGGACGTATCCTGATATCACTCACTGGAAAATATTTCGCAGTTTGCGACGCTTGTAACTCTCGTTTTGGCGGTATGGATTCATTAAGCAAACATCTAAAGGAACCCCGCTCGGACTGTTGTGTACGGGAGGATAGCTGTTTTGAAATTACGGCCAGGGAGGAAGTCGCTTCCAGCAAAGACGCAATTGAAGAGAAAGAAATAACCGTAACAAAAACCGATGTAACTTGTCCTCCGAAAAACACCATTCCTAATAAATTTGTCATCAATATTTCCGACAACATCGTTGCGAAGGATAACCATGATCAAGCCGAACCTCAACATTCCAAAGTATCTTCGATAATATCAAGAGAACCTACAGTGATACTAACCAACGAATCTAACGAAGATAAACAGTTAGACATTATCTACGATCATCAGTTAGACTCCAGAAAAGCCTTAATGCAACATAGGAGCTCTCATAAGGAGCTGTTTCGTCGGCCCAAGAGACCTCGTTTGCATTCTAACAAGGAAGAGAGTACATCAAACGAATCTGGAACAAAGGACGAGTTGAATATTGGAAATTATAAGGACCAAGGATCAGCAAAACAGAAGGAGGCATTCCCGAGTCCATACCCTTCTCGTTCGGAATTCTTGGAGAGCAGCTGTAATAATATGCAACCCAAGCCTGTCACATCAATTGATGCAAATACTCAACAACTGAACGTGGCTggacaaaaaggagaaacctcGGGAgaaagtgttcaaaaatctGAATCAGAGAAGGACCAAGAAATGAATGTGAGCTTTGGCACGTTGATAAAGGCTTTTTTGAGTCATGATTATCATCGGACGCCACCAATTAAAGCTTTTGCGATAATGGGCATTGATACGCGGCCTATTCATCAGCAAGGATTGATGAAGGTTGCGGATACCCCATCAGAGGATGCTACTCATAGCGAAAAATCATCGCCTTGCGAAGGAAGCAGTCGCCAATGTGCAAGTGAGAAAGACCACGATCTGGTTCCAAACTCCAGCGAATCGGTTATAGGCAAACGTACTGAATGTGAACCAAATAAGATTGGAAACTCAACTGAAGTTGAATTGgccaagaaaaatggaaaagtgaTATTTGCAGCTAAACCTAAGTTCGATGACGAAAGACAGTTTTGCATTACATGCAATCGTCAACTGGATTCCAAAGAATCATTCAGACTCCATAAAAATAGGCATAAAAGACAAATTCGTATGTGGAAGCTTCGGAAAGGATGGGAAATCAAACGGGCGTCCATAACCATCGTATTTTCCCAGAACCCAGAATTCGACgaacaaaacaatttttgtacCACATGTAATCGGGGATTCCCCTCTCGAATAAGTTTTAAGACTCATAAAAACTCACATTGGGCTGAGATTCGTAAGAAACGTGTCCGCTCTGAAGTCACGTTTTCTTGTGAATTGTGCTCTGAACAATTTAAATCGAAATTTTCCCTAAGAGAGCATGTTGTGACGCAGCACGGAGATAGGATTCCAAAATCCTTAGAAGGCGATCCAACATACCTTAAATGTCGTTTTTGTCACAATCAATTTGAGAAACCAACGGAACGGTACCTGCACGAAAAAAGTCATGCTAACGAACAAACTCCGTATCGATGCTCACTATGTGCCCAGTCTTTTCCCAGGAGTTCGGGTCGTAGAAATCATGAGCTATTTCACAGAGAAAATGGGCCCGTTTTCTGCTCGCACTGTCCCAAAGCCTTCAGGATTCAGGCGCATCTTGATCGTCATACTAAACTTTTCCATTCTCTGACAAAATCCTTTTCATGTGAATACTGCAACAAATCCTTCCGCAGGAACTCGTATCTTGTTCACCACAAATTTAGTCATTCAAGACCTCATAAATGTGACGAATGTGGCAAGCGATTGGCTCAACTACGAAGTTTGCATAGACATAAGAAAAGACACGCGAATCAACGAAATCATAAATGTGAAACTTGCGATAAATTGTTCTCCAGTACCAGCGATTTACAACGTCATATGACGGTACATCTGGATGTGTGGTTTCAGTGCCCCAACTGCGAAAGACGGTATAAGGAGAAGAACGATATGACGGCTCATTTGGAAACACATGGAGGCGAGGATACAAATGACGGTACAATTTGTGACGATAAATTCACTCAGGGAAGCGGATTGCATCCTCAGTTGCAATCCCATAGTGATAAGTTATAA
Protein Sequence: MDLVPFLNSGLLANIKLEKEIPTEFLDDPETERNCANYLNIDQKPKYGRVLISASGKYTLLCDGCKGRFDSTDSFTRHAKGVYSGCGIWKDSNDGISINKVAFERGDFRSKEDIKEDITVCRITKDFNVKESVTNDRETIVRNETSSKEKNLCFTKCSESTKKPNVIITAKPIYDEKKNFCITCDRQWESRKTFLRHKYYHREKFRKQMMARSNQGRQEDISGEVIVKDELDFGDYEMHDSAYNEGSIKTIDDDGAERLRLYSGDTLDSQSFHGGSSVQGWIKTEPMTNTTNEDGVRNEMISATLGKLGLVTSEEKTSLCEDVSGKYGTDADQGLESGGSASVVFALEPDFDDAKTLCITCNCQFNSKEAFKRHKKIHKSEIVKWKIANGFEVEQGKIKVVFSENPIFDDEKNFCITCNRGFTSIDSFKTHKKLHRRKIRAKGGFIKTEARFSCEFCSEQLRSEIGLRTHIVSQHGDNIPEFLQNDPTYLECRFCFMRFEKPTERFQHEKSHSDEPEPYRCPVCPKSFARNMHRKIHESIHRKDRPFRCVHCPKSFSTRQRLNSHVRCVHCSKKPLMCEDCGKIFDSKVQLRRHSLAHTKEKNYECDECGIRLRHQTSLYRHKKRHANQRDFKCEKCEKLFFTNGELLGHMSVHSEVYFQCPHCEKRFRRKNNMTAHKKVHEKVDEDSESRDLEDENSQECEGEKGKKLKFKCTAKVFSLEPQFDEEKHFCITCNRQMHSIEAFRFHKSSHKFKIHKWKQRNGWEIKKGPIRIVFSENPSFDDERNFCITCNRGFATRATYRCHKRIHRIRIRKRQGLLPKATISCEFCTRQFRSEAGLREHIVPHHGDKIPTSLKDDPTYLMCRFCHEQFEKPTERFQHEKTHANEEKPYRCPLCPKSFTKSSARRIHESFHGETRLFPCLQCPKIFGFLPYLNRHVERVHSNVKSSQLKIKSYPCKKCGNSFNTKRKLASHNVTHIKEKPLECEECGIRFSGLQSLRVHKKRHANRRNYKCEKCGTLFLTDAEFQKHMSKTSDDGAFQCPIFDEQSEGGNSLIVKKEVEDCEETYSCPISEEKFTQHSELQSHFEPYGLGTSREFLFSVEDLLLKIKPLNVNLISVLNSGIPAEVESQQEIIETLLEGDEAVGGNQGSSSVDLRAKCGRILISLTGKYFAVCDACNSRFGGMDSLSKHLKEPRSDCCVREDSCFEITAREEVASSKDAIEEKEITVTKTDVTCPPKNTIPNKFVINISDNIVAKDNHDQAEPQHSKVSSIISREPTVILTNESNEDKQLDIIYDHQLDSRKALMQHRSSHKELFRRPKRPRLHSNKEESTSNESGTKDELNIGNYKDQGSAKQKEAFPSPYPSRSEFLESSCNNMQPKPVTSIDANTQQLNVAGQKGETSGESVQKSESEKDQEMNVSFGTLIKAFLSHDYHRTPPIKAFAIMGIDTRPIHQQGLMKVADTPSEDATHSEKSSPCEGSSRQCASEKDHDLVPNSSESVIGKRTECEPNKIGNSTEVELAKKNGKVIFAAKPKFDDERQFCITCNRQLDSKESFRLHKNRHKRQIRMWKLRKGWEIKRASITIVFSQNPEFDEQNNFCTTCNRGFPSRISFKTHKNSHWAEIRKKRVRSEVTFSCELCSEQFKSKFSLREHVVTQHGDRIPKSLEGDPTYLKCRFCHNQFEKPTERYLHEKSHANEQTPYRCSLCAQSFPRSSGRRNHELFHRENGPVFCSHCPKAFRIQAHLDRHTKLFHSLTKSFSCEYCNKSFRRNSYLVHHKFSHSRPHKCDECGKRLAQLRSLHRHKKRHANQRNHKCETCDKLFSSTSDLQRHMTVHLDVWFQCPNCERRYKEKNDMTAHLETHGGEDTNDGTICDDKFTQGSGLHPQLQSHSDKL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -