Basic Information

Insect: Hermetia illucens
Gene Symbol: -
Assembly: GCA_905115235.1
Location: NC:98250457-98283448[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 0.03 1.3e+02 2.3 0.2 25 52 210 237 203 239 0.83

2 16 0.017 75 3.2 0.0 23 49 236 261 231 267 0.86

3 16 0.061 2.8e+02 1.4 0.2 18 43 259 284 254 295 0.77

4 16 0.2 8.8e+02 -0.3 0.3 26 48 298 317 283 324 0.59

5 16 0.32 1.4e+03 -0.9 0.1 22 46 322 346 315 348 0.78

6 16 0.099 4.4e+02 0.7 0.1 22 44 784 806 777 810 0.84

7 16 0.0046 21 5.0 0.0 21 44 811 834 807 842 0.88

8 16 0.066 3e+02 1.3 0.1 22 45 840 863 837 867 0.85

9 16 0.019 87 3.0 0.0 18 45 864 891 862 897 0.88

10 16 0.033 1.5e+02 2.2 0.0 20 44 907 931 899 935 0.82

11 16 0.019 83 3.0 0.0 21 43 936 958 934 964 0.84

12 16 5.4e-06 0.024 14.3 0.0 18 48 961 991 958 994 0.90

13 16 0.079 3.5e+02 1.0 0.0 23 44 1109 1130 1103 1134 0.88

14 16 0.011 49 3.8 0.0 21 45 1135 1159 1132 1167 0.84

15 16 0.0088 39 4.1 0.5 18 48 1160 1190 1159 1194 0.90

16 16 0.025 1.1e+02 2.6 0.1 20 45 1193 1222 1191 1231 0.67

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	0.03	1.3e+02	2.3	0.2	25	52	210	237	203	239	0.83
2	16	0.017	75	3.2	0.0	23	49	236	261	231	267	0.86
3	16	0.061	2.8e+02	1.4	0.2	18	43	259	284	254	295	0.77
4	16	0.2	8.8e+02	-0.3	0.3	26	48	298	317	283	324	0.59
5	16	0.32	1.4e+03	-0.9	0.1	22	46	322	346	315	348	0.78
6	16	0.099	4.4e+02	0.7	0.1	22	44	784	806	777	810	0.84
7	16	0.0046	21	5.0	0.0	21	44	811	834	807	842	0.88
8	16	0.066	3e+02	1.3	0.1	22	45	840	863	837	867	0.85
9	16	0.019	87	3.0	0.0	18	45	864	891	862	897	0.88
10	16	0.033	1.5e+02	2.2	0.0	20	44	907	931	899	935	0.82
11	16	0.019	83	3.0	0.0	21	43	936	958	934	964	0.84
12	16	5.4e-06	0.024	14.3	0.0	18	48	961	991	958	994	0.90
13	16	0.079	3.5e+02	1.0	0.0	23	44	1109	1130	1103	1134	0.88
14	16	0.011	49	3.8	0.0	21	45	1135	1159	1132	1167	0.84
15	16	0.0088	39	4.1	0.5	18	48	1160	1190	1159	1194	0.90
16	16	0.025	1.1e+02	2.6	0.1	20	45	1193	1222	1191	1231	0.67

Sequence Information

Coding Sequence: ATGTTTTTGAAGTTTGCATCCAGTATCTGTCGGGTTTGTTTAGGTCCTGATGCGAAAATCGGATTGTTTGGCGAAGACGGAAATGACCACAAATTTAAAAGTACCACAAATTTACAGATTTTTGAAGATGATGGTCTGCCATCATCGCTTTGCGGAAATTGTTCGGAGCGCTTGAATTCAGCATATGAGTTCCAACAACAGAGTATGGCATCTGATGTACACCTGCGCACATTCGTTCACACTGTGAATACCAAGTTCGCGTCTGAAATAGGAAACTTCCAACAGAATAGTCAGCAAAATAGGGGAGATTCGATGATTTCGGAACATACAATTCACAGTACAAACGATGAAAGGGAATGTGAAGACGACCCAAATAAACAGCGAACGATGTTGGAAATAGAAGTACTGCCCGAAAATCTTGCAGATAACACAAAAATGGGAAATGAGGACGAAAGCGAAGTTATCACCCTTAATTACACATACGTTGAGCCTTTAGTAGAGCAATCCTGTGAAGAGGCAGAAAACAAGGAAGAAATGTACGTTGAAAAGTCTGCGAATTTTTCCGAGGGCAATAACGAAGAGGAAGATTTCCTAGATGAAACAATACGACCACATCCCTCCGATGCTACCCTCTGCCATATATGCAATAAAACTTTCTCTAGTCGGACGAATTTAACTCGTCATATCCTAACACATTCAGATGCTAAACCGTTTCAATGCTCGGTATGTCAGAGCGCATTTACTCAGAAAGGATCGCTAAAGCAGCACATGCTACGACATACAGGGGAAAAACCCCATACATGCACTATGTGTGGGAGGGGATTTAGTCGAAAGAGATTGCTCAGCATGCATCAAAGGATTCATACTGGCGAAAAGCCGTTCCGCTGTGAAGATTGCAATCTGTGTTTCACTGTAAAGGAAGGATTACGGCGTCATAACATACGTAAGCATTCTAGCTATCGAGGGCAAATCTACACGTGTGAAATATGCGATAAAAAACTGCATTCGAAGTACACTTTCCGAAATCATATGTTTTTGCACAATAAGGAAGGCAAAAACAAAATAAGTTGCAAGTATTGCTGCAAATCTTTTGGTACAAAACAATCGCTGCAAACACATTTGCGAATCCATGACGAATCCGCTCATCAGAGAGAGGAGCTTTCTGCGAATAACGAAACAGAAGCAGAACCAGACGTTATCGATTCAGACCAAGAGGGTAGCGAGTCTGAAGACAGTTTCCTTTGTGAAGAATGCAACGAGGTTTTTATAAGCAGGGAGGAATTTCTGAATCACCTAAAAATGCATCAGACACTCGAACAAATGACTGTGTCGGAaattgttttgacatttggttCTGTGAAGTGGCGGACTGATTTGTCTGACTTATATGGGTTGTTTACAGATAAAATTCTAgtgaaaatgaatttaaaagTGGACGTTAATTTGTGCCGAGCTTGCTTGGGCTCGGAATTGATTGCCGTGCTGGATGACCAAAAAGATTTGATACAAAAATTCCAGCACACAACTCAATTGACGATTGAAAGCAATGATCCATTTAATTTATGTAAACGGTGCGTGACACGTCTGAAAGTTGCTTACGACTTTCGCCGTGAATGCTTGGTTTCTGCTTCTTATTTTGAGCATCTGCGAGCATGTATTAACAAAATGAATGCAGAATTGGAAGAAGTAGTGAATTCTGCGGTGACAACAAAGATGGCTTTTGCCAACGATGAAATGAAACTGTTACTCGAAGCTGGATACAAACCTGACGATATTGTTGTTGTATTTGAAGAACCGAATTCTACACAAACTAAGAGCGAACAAGTCACTCAAGAGTCAGCAGGAAATGTAGGTGAAaagcaacaagtttgtgaaattGTTGATACGGTGGGCTTTATTAGTAAAGAAGAAGACGACGATGAGGAACACCATTATGAAGAAGATTTTCATATGGAGGAAGTTGGCTCGATGTCTCCTAAGCCTGAATGTATTGAATACATTGAAACTGTAAAATCATCTTACATGTGTTTAGAATGTAATAAGGAGTTCAGTACAAAGGAAGCTTTAACGAATCATATGGCAACACATGATGAAAATGTTAACCCATTAGAAAATAGTAGTTGCGAAGGGAAGTTACCTGAGAAAGATAATATGGAGGCTCAAATTCTTGCCGAAACTGTTCAGAGTGAATATATGTGTGACGTTTGTGGCAAGGCTTATGAAAATGAAGATTCTCTAGCCTGCCATATGGAAACGCATCAGGACAAAACAGCACACGAATgtgaaatatgtaaaaaaaaattcagttcaAAGGATAAACTGATGCAACACTTGACCATACATTCTCGCAGTCAACCGTATAAGTGCAAGGTTTGCGACAAATATTTTATCCAAAGCTATTCTCTTGTTTATCATATGAGAACCCATACAGGAGAAAGACCATTTGCGTGCGATAAATGTGGAGCCAGCTTTCGTCAAAAAGGTAGTCTAAAGCAACATATATTAATTCATACGGGTGAGCGGCCTTACAAGTGCAGTGTTTGCGATCGAGGATTTACACAGAGCCATTCGCTCACCTTTCATATGAGACGCCACACAGGAGAAAAACCGTTTATATGTGATAAGTGCGGAAACCGTTTTCGTCAAAAGGAAGCACTGAAGCACCATATGCGAGTTCATATGGAAGGCAGAATTACCCGAGCTCGTAAAATTCAACCCAGCAGTGACAAATGTTTTACATGCGAGTTATGTGGCGCAGTTTTTAATCGTTTGGCTATTTTGAAACAACACATGTATATCCATACGGGGGAACGACCTTATACTTGTGATGTATGTGGTAGAGGTTTTACGCAAAGTCACTCTCTTACTTTCCATGCTAGACGACATACAGGCGAGAAACCATTTACATGTGAAAAATGTGGTGCAATGTTTCGTCATTCAATTGGATTGAAGcgacatttattttcaaaacacTCAGATGTAACTACACCAGTTCGTCAAACAGTGTTTTCATGTGAAATTTGTGACGAAAAGTTTTCATCGAAAGAAAAACTAGATGAACATGCGCAGCACCATTTGGATGGAGAACCTGAAATGGAATCAAATCAAGCAGAACAAAATGGAGAAGAAGAAAACGACAAGGAAGAAGCCGAATTTAGCAAGGAATCACTCCAAATTGAATGCCTGGATGAGCAAATGGAAGACGTAAACCCGTTAGCTGAAGTAGAGGCAAAACCAGAAATTCATCTATATTCCTGTACACAATGTGATGCTGGATTCGATACACAAGGAATGTTCACAAAACATATGCAAGAACACGATGTAAAACCATATACTTGTGATGTATGTGGAAATGGCTTTACACAGAATGGTTCTTTGAAGCAGCATATGTTTATTCACACGGGGGAACGTCCGTACAAATGTGATATTTGCGGAAGAGGGTTCACCCAAAGCAAATCTCTCACATTTCACATGAGGCGACATACAGGCGAGAAACCATTTCAGTGTGAGCAATGTGATTTGAGTTTTCGTGTAAGGGATGCGTTGAAGCGCCATATCCAAATGCATCATTCTGGTCAGTCTGCTAAAGTGCACATTTGCTCAATATGTCAAAGTGTCCTAAAATCGAAACCTTCTTTGGTTGCTCACATGAAGAAACATCTAGAACAAAATTCAGAAATAAAATGCGGTGTATGTGAAAAGGTTTTCTCGAATCGATGCTCACTGGATGAGCATGCCAGAGTGCATACAGGAGAAAAACCATTTCGATGCGATGAATGCGGTAAGGAGTTCACGCGGCGCTCATCATATCGACGACACCAAAAATGGCATCAGGAGAAAAAGTAA
Protein Sequence: MFLKFASSICRVCLGPDAKIGLFGEDGNDHKFKSTTNLQIFEDDGLPSSLCGNCSERLNSAYEFQQQSMASDVHLRTFVHTVNTKFASEIGNFQQNSQQNRGDSMISEHTIHSTNDERECEDDPNKQRTMLEIEVLPENLADNTKMGNEDESEVITLNYTYVEPLVEQSCEEAENKEEMYVEKSANFSEGNNEEEDFLDETIRPHPSDATLCHICNKTFSSRTNLTRHILTHSDAKPFQCSVCQSAFTQKGSLKQHMLRHTGEKPHTCTMCGRGFSRKRLLSMHQRIHTGEKPFRCEDCNLCFTVKEGLRRHNIRKHSSYRGQIYTCEICDKKLHSKYTFRNHMFLHNKEGKNKISCKYCCKSFGTKQSLQTHLRIHDESAHQREELSANNETEAEPDVIDSDQEGSESEDSFLCEECNEVFISREEFLNHLKMHQTLEQMTVSEIVLTFGSVKWRTDLSDLYGLFTDKILVKMNLKVDVNLCRACLGSELIAVLDDQKDLIQKFQHTTQLTIESNDPFNLCKRCVTRLKVAYDFRRECLVSASYFEHLRACINKMNAELEEVVNSAVTTKMAFANDEMKLLLEAGYKPDDIVVVFEEPNSTQTKSEQVTQESAGNVGEKQQVCEIVDTVGFISKEEDDDEEHHYEEDFHMEEVGSMSPKPECIEYIETVKSSYMCLECNKEFSTKEALTNHMATHDENVNPLENSSCEGKLPEKDNMEAQILAETVQSEYMCDVCGKAYENEDSLACHMETHQDKTAHECEICKKKFSSKDKLMQHLTIHSRSQPYKCKVCDKYFIQSYSLVYHMRTHTGERPFACDKCGASFRQKGSLKQHILIHTGERPYKCSVCDRGFTQSHSLTFHMRRHTGEKPFICDKCGNRFRQKEALKHHMRVHMEGRITRARKIQPSSDKCFTCELCGAVFNRLAILKQHMYIHTGERPYTCDVCGRGFTQSHSLTFHARRHTGEKPFTCEKCGAMFRHSIGLKRHLFSKHSDVTTPVRQTVFSCEICDEKFSSKEKLDEHAQHHLDGEPEMESNQAEQNGEEENDKEEAEFSKESLQIECLDEQMEDVNPLAEVEAKPEIHLYSCTQCDAGFDTQGMFTKHMQEHDVKPYTCDVCGNGFTQNGSLKQHMFIHTGERPYKCDICGRGFTQSKSLTFHMRRHTGEKPFQCEQCDLSFRVRDALKRHIQMHHSGQSAKVHICSICQSVLKSKPSLVAHMKKHLEQNSEIKCGVCEKVFSNRCSLDEHARVHTGEKPFRCDECGKEFTRRSSYRRHQKWHQEKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00793681;
90% Identity: iTF_00793681;
80% Identity: iTF_00793681;