Basic Information

Insect: Notocelia uddmanniana
Gene Symbol: -
Assembly: GCA_905163555.1
Location: LR991078.1:14402741-14406154[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.0057 54 5.6 0.0 26 48 65 87 48 91 0.86

2 6 1.3e-05 0.12 14.1 0.0 16 48 121 153 117 156 0.92

3 6 0.00081 7.7 8.3 0.1 23 48 156 181 152 185 0.91

4 6 0.01 99 4.8 0.8 25 52 188 215 183 217 0.88

5 6 0.27 2.6e+03 0.2 0.0 27 48 247 268 240 273 0.87

6 6 0.24 2.3e+03 0.4 0.0 27 48 377 398 352 401 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.0057	54	5.6	0.0	26	48	65	87	48	91	0.86
2	6	1.3e-05	0.12	14.1	0.0	16	48	121	153	117	156	0.92
3	6	0.00081	7.7	8.3	0.1	23	48	156	181	152	185	0.91
4	6	0.01	99	4.8	0.8	25	52	188	215	183	217	0.88
5	6	0.27	2.6e+03	0.2	0.0	27	48	247	268	240	273	0.87
6	6	0.24	2.3e+03	0.4	0.0	27	48	377	398	352	401	0.89

Sequence Information

Coding Sequence: ATGACGCTTGTCCACCCAGCTGAAGACATATCCTTAACTCCTGCACTGCATAGAGAGCCAACAAATCTCCAAACACAAATTCAACTGGGTCCCCCACTAAATGGATATAGCTGTCCggaatgtaaacatattttagcAACCCCGGACAGCTTTAAGGAGCACATGCAAGATGCACACCCGAAGTTCCAAGTTGCTTGTAAATTATGTCACAAAGTATATAAAACTGTCAAAAGTTTGAGACGACATGAGAAGAAAACTCATGCAGATAAAGTGGAAAAAGAGCAGAGAGTAGGAGATTTACCATGTCCCCATTGTTGTAAGAAGTTTAGCAATCAAACAGCATTACACTGGCATATAGAGCGGAATCATACAGACAGTCAAAAGACAAGTACTTGTAAGCTTTGCGGAAAAGAACTATCGGACGCTGCTAATTTGAAACGACATCTAGAAATGATGCATTCATTAGAGAGTGCTAGCTGTTCGATATGTAATAAGACTTTTAAAAGTTTAACTAACTTACAGAGGCATATGAACGTCACACATCCTCCGGAGGACGCCGCACAGACTTGTAGTGTTTGCAACAAAACTTTTAAATGCTCATTGCATTTACGAATACACTTAAGGACCGTTCATGTACCGGAACCTGCCTTCAActgtgatttgtgcaataaagaatttcCATTGAAGAAATACATGATAAAACACAGAAAAACCCATGTTGATGTTAAAACATTCCCTTGCAGTGTTTGTGGCAAAATGTTTAAGAGTTCCGAAGATGTCAGGAAACATACAAAGCGAGTACACATGAAGACAGAACCTCCTAAAACGCCACAGAGAAAACCCAGCATTTGTGATGTCTGTGATAAGAAGTTCTCTCATAGAAAATATATGCTCTTGCATAAAAAAATCCATGTAGACATCAAATCATACAGTTGCGAATTTTGTAGCAAATTATTCAAGTGCACTAGCCATGTCAGAAAGCACACAAGACGACTTCACTTGAACCCTGTAGAATTTCACAATGTGAAATATACAATGTTTACCTGTGATACAtgtaaaaaatcatttaatacaAAGAAAAGTGTGGCTAAACATATTAAAACTCATTTCGCAACAAAAGACCTACCTTGTGGCATTTGCGATAAATTATTCAAATCTAACAGTGATGTTAATAGACATTTAAAACGAGTGCACATGAAAGGAATAATAGTAAGGCAAACAGAAAATGcagaaacaattacaaaaacagTAAATACAGTGAAAGTAAACAGTGAAGATTACACAAATGATGCTCTTAAGAATATTGAGTTTACGGAGAAAGTTCTTGCAAACACAAAATACACAGTTAAAGCTCTTGAGATCACAGAATATACAGATGAAGTCCCTAGAAGCGAGGATTACAGATTGGAGACCCTTGGAAGCTCTGAATACTTATTAGAAATGCTTGAAAATACTGAATATACATTGGAAGCTCTTAAAAGTACAGAGCATATAGATGAAGAGTTATGTAATACAGATTTTATAGAAGAAGCCCTCATTAGCACTGATTACTCAAAAGAAGCCTCTACATGTACAGAGTTCACGCAGGAAGCCCTTAGAAATACAGAGTTTACTGAGGATGCAACTAGTATAGGGAATACGGACAAAACTCTTCAAAATACAAAGCTTGAGACAGTCTTTGGAAGTATAAACAACATAGAGTTAGGTAAGCCCCTTGAAAATATAGCTGCCACTGTTAAAGCCCTAAGAAATACGGATATTCTAAAGGACGCCATGAAGATTTCCGATTTTACTATGGAAGATCTTGGCATTACAGAAGATGCGGTTAAAAGTACGAAATCTGAAGAAGCTGTTGGAAGTACAGATATTGGTGACACTTTTCTCGATATACAGTGCACAACTGAAGCTCCTATAGATATAAAGTTCGCAGATAAAGCCCTTGGAGCTACAGATATCATAAAGGACGCCATAGCAATTTCAGATTTTACAATTGAAGACCTTGCTATAACAGAGGAAGCAGTGGAAACTACAAAATCTAAAGATGCTCTTCATAGTACAGTTATTATAGAAACTCTCAAAAATATGAAATGCGTAAAGGAAGTCACTGAAGAGAAAGAATTCGCAAACATACCCATTCGAGATCCAGAGTTCACTAATAAACTTCGCCATAAAGATATTATAAAAGAAGCCATCGAAATTTCAGATTTCACAATGGAAGACCTTGAGATACCAGAACACGCAGAAAATACTGTTGTAAGTGCAGGATCGGCAAAAGAAGCCATCGAAAGTATCCCAATGAACACCTTCGAATGTCCAGCAGACACAGAGGAAACTATTAAAGATACAGACTTCATGGAGTCCACAGATAAAGTCCATGGTAATACAGATATAATCAAGGAGGCAATCGATTCTGTTTTCACGATGGAAGACCTTAAAATTGCAGAGGAGACTGttgaaaaaattatacctaAGGAAATCCTCGAAAGTACAGAGATCACTGACAAAGCTCTTTCCAGTAGAGATATCATGGAAGCCCTCGGAAGTACAGCAATCGCCAGGGAAGCGCCTGGTGACGAGTTTGCCGATGAAGTCCTGGAAAATATAGAGTTTAGAGAGAATGCCCTGGATAACACAGACATTATAAAAAATGCCATCGAAAACTCCGATTTCTCAATAGAAAACCTCGGGCTTACAAAATATACAGACGATGCTCTCGATCCTACAGGATATACCATGGAAGACCTTGGCATCAACGAATGTCCGGAAGTACTTGGAAGCACAGATTTTGAAGACGCCCTCTGTAGTACAGAGTTCGGAAAGAAAAATGGTGATATAGAGTTTGCAGAAGTCCTTCGAAGTGCAGACTTTACAGACAGCACACTGGGTTTCATAGAAGAAGCCCTCGGAAGTACAATAATCGAAAACGAAGCGCCTGCTGACATAGAGTTTACCGAAAAAGTTTTGGAAAATACAGAGTTGTCAGCAAAAGACCTTGTAAGTACAGATTTCTTAGAAGAAGCTTTAAAGAGGACTGATTTCACGGAAGAAGCTCTTAGAAGTACAGAGTTAGAAGAAGATCTTGGAGGTACAGATTTCATAGAAGCTCTAGCAAATACAGACTGTTTCAAAAACGCTCCAAATTGTACAGACTTTACAGATTCAGTAATTGGAAATGATATTATAAAGGAAGCTGAATTTACTATAGACGATCTCGGTATTACTGGATACACAGGTAATATTCTAAGTACTGATTACAATATGGATGAAATGAAGGTCACGGAATGTCCAGAAGCTCTAGATATTGAGTTGTTGAATTGTCTAAAATGTGGCATTGATTTTAAGAATGATGTCGATTTACACACGCATTTGTGTGGTGGAGAGATGACATTGTTTCTTGATTTTCAAGATATGTAA
Protein Sequence: MTLVHPAEDISLTPALHREPTNLQTQIQLGPPLNGYSCPECKHILATPDSFKEHMQDAHPKFQVACKLCHKVYKTVKSLRRHEKKTHADKVEKEQRVGDLPCPHCCKKFSNQTALHWHIERNHTDSQKTSTCKLCGKELSDAANLKRHLEMMHSLESASCSICNKTFKSLTNLQRHMNVTHPPEDAAQTCSVCNKTFKCSLHLRIHLRTVHVPEPAFNCDLCNKEFPLKKYMIKHRKTHVDVKTFPCSVCGKMFKSSEDVRKHTKRVHMKTEPPKTPQRKPSICDVCDKKFSHRKYMLLHKKIHVDIKSYSCEFCSKLFKCTSHVRKHTRRLHLNPVEFHNVKYTMFTCDTCKKSFNTKKSVAKHIKTHFATKDLPCGICDKLFKSNSDVNRHLKRVHMKGIIVRQTENAETITKTVNTVKVNSEDYTNDALKNIEFTEKVLANTKYTVKALEITEYTDEVPRSEDYRLETLGSSEYLLEMLENTEYTLEALKSTEHIDEELCNTDFIEEALISTDYSKEASTCTEFTQEALRNTEFTEDATSIGNTDKTLQNTKLETVFGSINNIELGKPLENIAATVKALRNTDILKDAMKISDFTMEDLGITEDAVKSTKSEEAVGSTDIGDTFLDIQCTTEAPIDIKFADKALGATDIIKDAIAISDFTIEDLAITEEAVETTKSKDALHSTVIIETLKNMKCVKEVTEEKEFANIPIRDPEFTNKLRHKDIIKEAIEISDFTMEDLEIPEHAENTVVSAGSAKEAIESIPMNTFECPADTEETIKDTDFMESTDKVHGNTDIIKEAIDSVFTMEDLKIAEETVEKIIPKEILESTEITDKALSSRDIMEALGSTAIAREAPGDEFADEVLENIEFRENALDNTDIIKNAIENSDFSIENLGLTKYTDDALDPTGYTMEDLGINECPEVLGSTDFEDALCSTEFGKKNGDIEFAEVLRSADFTDSTLGFIEEALGSTIIENEAPADIEFTEKVLENTELSAKDLVSTDFLEEALKRTDFTEEALRSTELEEDLGGTDFIEALANTDCFKNAPNCTDFTDSVIGNDIIKEAEFTIDDLGITGYTGNILSTDYNMDEMKVTECPEALDIELLNCLKCGIDFKNDVDLHTHLCGGEMTLFLDFQDM*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01072840;
90% Identity: iTF_01072840;
80% Identity: iTF_01072840;