Basic Information

Insect: Clunio marinus
Gene Symbol: l(2)dtl_2
Assembly: GCA_900005825.1
Location: CVRI01000054.1:969546-977188[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 2 1.4e+04 -3.5 0.1 21 45 731 755 722 759 0.71

2 9 0.002 14 6.1 0.0 21 52 975 1006 970 1007 0.88

3 9 0.0006 4.2 7.8 0.0 21 44 1003 1026 1000 1031 0.91

4 9 0.0091 65 4.0 0.0 21 45 1031 1055 1027 1063 0.90

5 9 0.046 3.2e+02 1.8 0.0 21 45 1087 1111 1081 1118 0.82

6 9 0.00067 4.7 7.6 0.1 23 47 1117 1141 1111 1147 0.84

7 9 0.063 4.5e+02 1.3 0.0 22 44 1172 1194 1167 1198 0.88

8 9 0.0013 9 6.7 0.0 21 48 1199 1226 1194 1230 0.86

9 9 0.00083 5.9 7.3 0.1 21 45 1227 1251 1223 1257 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	2	1.4e+04	-3.5	0.1	21	45	731	755	722	759	0.71
2	9	0.002	14	6.1	0.0	21	52	975	1006	970	1007	0.88
3	9	0.0006	4.2	7.8	0.0	21	44	1003	1026	1000	1031	0.91
4	9	0.0091	65	4.0	0.0	21	45	1031	1055	1027	1063	0.90
5	9	0.046	3.2e+02	1.8	0.0	21	45	1087	1111	1081	1118	0.82
6	9	0.00067	4.7	7.6	0.1	23	47	1117	1141	1111	1147	0.84
7	9	0.063	4.5e+02	1.3	0.0	22	44	1172	1194	1167	1198	0.88
8	9	0.0013	9	6.7	0.0	21	48	1199	1226	1194	1230	0.86
9	9	0.00083	5.9	7.3	0.1	21	45	1227	1251	1223	1257	0.91

Sequence Information

Coding Sequence: atgactaaaataaataacataacAGCTAGACTAATTAATAGGCAATATGGAAAATATTATGAAAAATCTTATGATAATGCTCTAGTAAGACTGATGGTGAGACCATGGGATAACTGGAGAGGAATAAATCCTTCAGGAATAGGAGCAGACTTTAATCCAGATCCGCCAATATTTGCGGCAAAATTTGCAAATACTGAAAACTATAATCACATTCTTGCGGTTGCCAACGAGGATGGAAGAATTGCACTACAAAATACTTTTGTTAAGAACTCTACAAGTGAAGATTTATCACTTGAAGGCGATCAATGCCATTACaaTGCAGTTTTTGATATCGCATGGATGCCTTATCATTTAAAGTTAATCAGTGCAAGTGGGGACCATACTGCCCGATTATGGGACGTTACAGAAAGCAAACTTATTAATATCCGAGAGTTTTGTGGACATTCACGATCAGTTAAAGTTGCTGCCTTTAGGAAGAACGATTGTTCTGTGTTCTCAACAGGTGGACGTGATGGAGCAATTCTTATCTGGGATTTGAGAAGTAACACAAACAACGAAGTTCAAAAAATTGACAATCGCATTTATAATGCACACATTGGTGGCGGTCCAACAACTCCATCAACAAGACGAAGAGGAAACAGATATGCAACTCCAAAGAATCAAACAAATGTCAGCAATTCGAGTGTGACTGGACTGATCTTTCAAAATGAGAACACTTTGGTGTCTTGTGGACCTGCAGACGGCGTCATCAAAATGTGGGACCTTCGAAGATGTTATTCAACACTTAAAAAAGAACCAGTAGCAAAGCATAGTTTGCCTTATGCTGGAAATTCCACATTAAAAGGCTtcacaaatttaattgttgatGATTCAGAAACGAGACTTTTCGCCAGTTGTATGGACAGCAAAATTTACAGCTACAACATCTCAGCTTATTCAAAAGAGCCGACAATGATTTATTCCGGTCTTCAAATTAATTCGTTTTATATAAAATCATGTTTAAGTCCTGATGGACGTTATCTGTTGAGCGGAAGTAGTGATGAAAAAGCTTACATTTGGAACATTGAAAATCCTCATCCTGTTGCATCATTGGTTGGACATAATTTTGAAGTAACTTGCGTTGCTTGGAGtaatcatcaaaataatttggATGGAGGAAATATGTGCATTGTCACTTGTTCAGATGATGCTTGTCACAAAGTATGGCGTGTTGGTCCGGAGTTTCTTCCAGAAGACGAAAGACTTTCTTTACGTGGTCATAGTGAACTTggtgaaaaatattatcagtATGAAAAGTCTAAACAAGttttaagaagaaagttaaaaGATTTAAGTCCTCGAACTTCGAATgcacaaaacaaacaaatcagAATGACTCCAACAAAAGCTGAAATCTCATCattgaaaagaagttttcaggAAATGTGCGCCGATGATCCAGAAATTGTTattgaaggaaatgaaagaaaacgacCGAATATTGAAGCTAAAGGAAGAAGACTTTTCCCTTCATCGCCATCTTCATGTATAGATCATTATTCAACTACTTCAGCTTCAAGACCACTTGAGACACTTTTTGAAGAGTTGAGTTCAACACAAAgccaaaattttcaaaatcttgtATCGTCTCCAGTTAAACGTCAAATAAACATCATAAAGTCACCGGAAAATTTACGTGTGAGTAAATCCAAGTCGCTAAATAAAGATCGAATGGAACCTTCCGTGAATTCTCCTACGATGAATCTTCCAAATTTTGTGATTGATGGTGATGCACCACATTTGAGTTTAATGTCACCCCATCGAAAaactaagaaagaaaatgtagATTGGTTGACAAAAATGCGTAAACAAAAATTACTGTCATTAAATAATGCATTGGAAAAAGCGACCACTGCCACAGAAATACAAAATGATCAGAACGATAAACTTCTCAAATctatagaaaataaaagtgaaagtcaagagaaaaagaaaagtcaaaagaaaacagaagCGACTATCTTAAAtaATGCGAttcgcaaaaaaaaactaactTGCGAATCGCGAGTGATGCAAAAGTTCGAAGCACAAAAACAAATGCAGAATTTTGGCTTTCCAACTGGCTCAAGAATTATTCTTTATGGAGGCAAAACCTGCGTTATTGCACCAGAACAAAAGACAAACACATCTACACCGACTGTAATTGGAACTATTGAGAGCCCTCAAATATGTCATTTATGCCAAAAAGAGTTTTCTTCGATAGAGACTCTTCAAAACCACATCAAGGAGCAGCATGTTGATAGTAAATTTTACCGCAATATTATCGCAGTTTCGACTGTAGGTAATCAAGTTACAATGATTCCAACTCCACTTCAACAATATCAAATAGGAACAAGTgcagtgaaaattgaaaaagatttccatCCAATACATGCAAAGTTGATTCCAGAAATTATAAAACCAAGCAATTCCGAGTTTGCCAACTCAGTTACTAATTTAAATATAGCTCATCCTGTAATTCAACATATTCAAATACAACcgagggaaaaagaaaaagcgaaCGTTGTGCAAGTCATAAAACAGAATCCAGTTGAATATCACATACAGCAACAGGAACATGCTGCCATGGTGGTTGCATCGATGAGCCAAAAATCAGGTGTTTGTAATCCATTTTTAAATAGTACCATTAAGTATGAACTTCATGGACAACCAGTTCAACTTGTATCAGAAGTGTATCCTCAAATGTTAGCTGAAGCTCCGAAATCCGACGACTTAAATTCACAGTCATCAGTGTCATCACCAGGATCTTCAGTTAATGTTCAAAATGCAACTGGCCCAATGCTTAGCAATGGTGAAACCATGGAAAAGCAACATAAATGTTTGGTCtgtgataaatttttcacGACTGTTGGAAACCTAAATATTCATCTAAAAATACATGCAGGAGAAAAACCTTACAaATGCACTGTGTGTGGGAAAGGATTCATTCAATCTAATAATCTTGCAACTCATATGAAGATTCATACAGGAGAAAAACCTCATGGTTGCCAGATATGTGGAAAAAGATTCAGTCAatctaataatttaaaaactcaCATAcGAACACACACAGGAGAAAAGCCATTCAAATGTACGCTTTGTGAGAAAAgctttaatcaaaaaaataatctcaCAACACATTTGAGAACTCACAGTGATTATCATCCTTCAAACTGTAGCATGTGCAATCAAACCTTTATGTCATTTAATGAGCTGTTTTCACATATGAGGGATCATGCTGAAGAGAAGCCTCACGTTTGCAGCGTTTGTAATAAAGTTTTCAGTgttcaaaatgatttaaatgatCACATGAAACAGCATTCGAATCCTAAGCCCTATAAATGTGATATTTGCCAAAAGCAATTTACACAATCTAACAATTTAAAAACTCACATCAAAACTCATATTTATCAAGATCCATTTAAATGCAGTATGTGCACAAGATCGTTTCAAGATCAAGAAGAATATCAATTGCACATgAGAGTTCATACTTTTGATAAACCTTACGAATGTACATATTgtggaaagaaattcattcaaagtaataatttaaaaactcaTGTGAGAACACATACTGGAGAGAAACCTTACGctTGTACTGTTTGTGGAAAGTCATTTAATcagaagaataatttaaatacgcaCTTGAGAGTTCACACAGGCGAGAAACCTTTCGAGTGTCATTTATGTGATCGACGATTTAAccaatcaaataatttaaataaacactTAAAGACACATGGACAAGAGAAGGAAATCAGTAAAGCTATGGAAacagaaatggaaaaaatgatgaacaacgtcattcaacaacaataa
Protein Sequence: MTKINNITARLINRQYGKYYEKSYDNALVRLMVRPWDNWRGINPSGIGADFNPDPPIFAAKFANTENYNHILAVANEDGRIALQNTFVKNSTSEDLSLEGDQCHYNAVFDIAWMPYHLKLISASGDHTARLWDVTESKLINIREFCGHSRSVKVAAFRKNDCSVFSTGGRDGAILIWDLRSNTNNEVQKIDNRIYNAHIGGGPTTPSTRRRGNRYATPKNQTNVSNSSVTGLIFQNENTLVSCGPADGVIKMWDLRRCYSTLKKEPVAKHSLPYAGNSTLKGFTNLIVDDSETRLFASCMDSKIYSYNISAYSKEPTMIYSGLQINSFYIKSCLSPDGRYLLSGSSDEKAYIWNIENPHPVASLVGHNFEVTCVAWSNHQNNLDGGNMCIVTCSDDACHKVWRVGPEFLPEDERLSLRGHSELGEKYYQYEKSKQVLRRKLKDLSPRTSNAQNKQIRMTPTKAEISSLKRSFQEMCADDPEIVIEGNERKRPNIEAKGRRLFPSSPSSCIDHYSTTSASRPLETLFEELSSTQSQNFQNLVSSPVKRQINIIKSPENLRVSKSKSLNKDRMEPSVNSPTMNLPNFVIDGDAPHLSLMSPHRKTKKENVDWLTKMRKQKLLSLNNALEKATTATEIQNDQNDKLLKSIENKSESQEKKKSQKKTEATILNNAIRKKKLTCESRVMQKFEAQKQMQNFGFPTGSRIILYGGKTCVIAPEQKTNTSTPTVIGTIESPQICHLCQKEFSSIETLQNHIKEQHVDSKFYRNIIAVSTVGNQVTMIPTPLQQYQIGTSAVKIEKDFHPIHAKLIPEIIKPSNSEFANSVTNLNIAHPVIQHIQIQPREKEKANVVQVIKQNPVEYHIQQQEHAAMVVASMSQKSGVCNPFLNSTIKYELHGQPVQLVSEVYPQMLAEAPKSDDLNSQSSVSSPGSSVNVQNATGPMLSNGETMEKQHKCLVCDKFFTTVGNLNIHLKIHAGEKPYKCTVCGKGFIQSNNLATHMKIHTGEKPHGCQICGKRFSQSNNLKTHIRTHTGEKPFKCTLCEKSFNQKNNLTTHLRTHSDYHPSNCSMCNQTFMSFNELFSHMRDHAEEKPHVCSVCNKVFSVQNDLNDHMKQHSNPKPYKCDICQKQFTQSNNLKTHIKTHIYQDPFKCSMCTRSFQDQEEYQLHMRVHTFDKPYECTYCGKKFIQSNNLKTHVRTHTGEKPYACTVCGKSFNQKNNLNTHLRVHTGEKPFECHLCDRRFNQSNNLNKHLKTHGQEKEISKAMETEMEKMMNNVIQQQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00346909;
90% Identity: iTF_00346909;
80% Identity: iTF_00346909;