Basic Information

Insect: Nomophila noctuella
Gene Symbol: tfap2e_1
Assembly: GCA_958496325.1
Location: OY292503.1:6771994-6798461[-]

Transcription Factor Domain

TF Family: AP-2
Domain: TF_AP-2 domain
PFAM: PF03299
TF Group: Basic Domians group
Description: Activator protein-2 (AP-2) transcription factors constitute a family of closely related and evolutionarily conserved proteins that bind to the DNA consensus sequence GCCNNNGGC and stimulate target gene transcription [PMID: 2010091, PMID: 1998122]. Four different isoforms of AP-2 have been identified in mammals, termed AP-2 alpha, beta, gamma and delta. Each family member shares a common structure, possessing a proline/glutamine-rich domain in the N-terminal region, which is responsible for transcriptional activation [PMID: 2010091], and a helix-span-helix domain in the C-terminal region, which mediates dimerisation and site-specific DNA binding [PMID: 199812]. http://www.ebi.ac.uk/interpro/entry/IPR013854
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 4.6e-23 1.3e-18 68.2 0.1 1 44 131 174 131 176 0.98

2 8 1.5e-15 4.3e-11 43.7 0.0 14 44 174 204 174 205 0.97

3 8 5.4e-17 1.5e-12 48.4 0.1 14 46 204 236 203 247 0.95

4 8 3.2e-06 0.089 13.3 0.0 29 48 250 269 246 283 0.87

5 8 1e-12 2.8e-08 34.5 0.0 82 136 446 497 431 500 0.86

6 8 1.6e-12 4.4e-08 33.8 0.0 83 136 517 567 500 571 0.86

7 8 3.8e-05 1 9.8 0.0 85 114 575 604 569 621 0.85

8 8 1e-20 2.9e-16 60.5 0.0 83 196 621 718 602 719 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	4.6e-23	1.3e-18	68.2	0.1	1	44	131	174	131	176	0.98
2	8	1.5e-15	4.3e-11	43.7	0.0	14	44	174	204	174	205	0.97
3	8	5.4e-17	1.5e-12	48.4	0.1	14	46	204	236	203	247	0.95
4	8	3.2e-06	0.089	13.3	0.0	29	48	250	269	246	283	0.87
5	8	1e-12	2.8e-08	34.5	0.0	82	136	446	497	431	500	0.86
6	8	1.6e-12	4.4e-08	33.8	0.0	83	136	517	567	500	571	0.86
7	8	3.8e-05	1	9.8	0.0	85	114	575	604	569	621	0.85
8	8	1e-20	2.9e-16	60.5	0.0	83	196	621	718	602	719	0.86

Sequence Information

Coding Sequence: ATGCTGTCACACGGCGGCTTCAGCTATGGCGGCGGAGAGCGACGGGCGGACTACGGCGCGCGCGAGCAGCACGAGCTGGCCCTGCACCACGCGCTGCACTCCGCCGAGGAGGCGCCGGTACGTCTCATCACCGTCACTAgctcatcaccatcaccagcaGCCTGGCTCCTCGCTGAGCGGACTACGGCGCGCGCGAGCAGCACGAGCTGGCCCTGCACCACGCGCTGCACTCCGCCGAGGAGGCGCCgGGTTACCATACAGAAATATTACGAATCACAATGGCGATCAAGCTGCGCGCATGTTTGGGGCGTGGCGCTGATTGTTAAGGCCTATTCAATGAAAGGGCGCGACGGTCTCGGCGGCAGCGGGTCGTGCGCCCCCAACGACGTGTTCTGCTCGGTGCCGGGGCGGCTGTCGCTGCTGTCGTCCACCAGCAAGTACAAGGTCACCGTGGCGGAGGTGCAGCGCCGCCTGTCGCCGCCGGAGTGCCTCAACGCCTCGCTGCTCGGCGGAGTGCTCAGGAGCAAGTACAAGGTCACCGTGGCGGAGGTGCAGCGCCGCCTGTCGCCGCCGGAGTGCCTCAACGCCTCGCTGCTCGGCGGAGTGCTCAGGAGCAAGTACAAGGTCACCGTGGCGGAGGTGCAGCGCCGCCTGTCGCCGCCGGAGTGCCTCAACGCCTCGCTGCTCGGCGGAGTGCTCAGGAGAGCGAGCCCGCACATTGATAGGCAACCGTTTAGATCGACGGAGTCGGAGCCGGAGTGCCTCAACGCGTCGTTGCTCGGAGGAGTGCTCCGGAGAGCGATAACAGCGAACGACCTCAACTTAACACCACTCAACTTACACGACAGAACACCGCAGAAGAATGAAGAACAAATAGACAGACAcactaaaataaatgaatggacTCAGAAGTCACTGCACGGACGACACCGCCAAGATTTGTGCCAGCCCCACGTCGACAAAGATGCGTCGAACGAATGGCTAAATCGTGGAGAGTTGTTCCCAGAGACCGAGGGTTTCATGATGGCAATCCAAGACCAGGTAATTGAAACGAggaactacaaaaaatatataataagaaaCCACAACTTACCGACTGATATGTGCAGGAAGTGCAATAGTGCATCAGAAACGATTCAGCACATAACAGGAGCGTGTCGAGCTATTGTGCAGACCGATTACAAGCACCGGCACGATCAAGTCGCCAGCATCGTCCATCAGAAGCTAGCCGAGATGTACAAGCTTTTAACGCAACCCCCTATAGCATACTACAAGTACAGCCCAGAACCTGTTCTTGAAAATCAAACTCACAAGATGTATTTTGATAGAGCCATACTAACTGACCCTGAAGCAGTGCACCTAGCCCGCGACTTCGGCTACGTGTGCGAGACGGAGTTcccggcgcgcgcgctggcggaGTACCTCGCGCGGCAGTACGCGGAGCAcgacgcgcgccgccgccgcgacctACTCCAGGCCACCAAGCAGGTGCGGCCACTTACTGTCTCTCCTAGCAAAGCAGTGCACCTAGCCCGCGACTTCGGCTGCGTGTGCGACGAAGCAGTGCACCTAGCCCGCGACTTCGGCTACGTGTGCGAGACGGAGTTcccggcgcgcgcgctggcggaGTACCTCGCGCGGCAGTACGCGGAGCAcgacgcgcgccgccgccgcgacctACTCCAGGCCACCAAGCAGGTGCGGCCACTTACTATCTCTCCTAGCGAAGCAGTGCAcctagcccgcgacttcgcctgCGTGCGAGACGGAGAGTACCTCGCGCGGCAGTACGCGGAGCAcgacgcgcgccgccgccgcgacctGCTACAGGCCACCAAGCAGGTGCGGCCACTTACAATCTCTCCTAGCGAAGCAGTGCACCTAGCCCGCGACTTCGGCTGCGTGTGCGAGACGGAGAGTACCTCGCGCGGCAGTAGAGCACGACGTGACTTACTCCAGGCCACCAAGCAGGTGACGAAGGAGCTCATGGACCTGCTGAACCAGGACCGGTCGCCGCTGTGCAACACGCGGCCGCCGCACCTGCTCGAGCCGGCGATACAGAGGCACCTCACACACTTCTCGCTCATCTCGCACGGCTTCGGCGGCCCGGCCATCGTCGCCGCGCTCACTGCCATACAAAATTTCCTCAACGAGTCGCTCAAGCATTTAGACAAATTATATCCTCAAAGTGGAATGGTATCCTCGTCCATGGACAAAACAAAAATGGACCCCGACATCAAGAAGTAA
Protein Sequence: MLSHGGFSYGGGERRADYGAREQHELALHHALHSAEEAPVRLITVTSSSPSPAAWLLAERTTARASSTSWPCTTRCTPPRRRRVTIQKYYESQWRSSCAHVWGVALIVKAYSMKGRDGLGGSGSCAPNDVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRSKYKVTVAEVQRRLSPPECLNASLLGGVLRSKYKVTVAEVQRRLSPPECLNASLLGGVLRRASPHIDRQPFRSTESEPECLNASLLGGVLRRAITANDLNLTPLNLHDRTPQKNEEQIDRHTKINEWTQKSLHGRHRQDLCQPHVDKDASNEWLNRGELFPETEGFMMAIQDQVIETRNYKKYIIRNHNLPTDMCRKCNSASETIQHITGACRAIVQTDYKHRHDQVASIVHQKLAEMYKLLTQPPIAYYKYSPEPVLENQTHKMYFDRAILTDPEAVHLARDFGYVCETEFPARALAEYLARQYAEHDARRRRDLLQATKQVRPLTVSPSKAVHLARDFGCVCDEAVHLARDFGYVCETEFPARALAEYLARQYAEHDARRRRDLLQATKQVRPLTISPSEAVHLARDFACVRDGEYLARQYAEHDARRRRDLLQATKQVRPLTISPSEAVHLARDFGCVCETESTSRGSRARRDLLQATKQVTKELMDLLNQDRSPLCNTRPPHLLEPAIQRHLTHFSLISHGFGGPAIVAALTAIQNFLNESLKHLDKLYPQSGMVSSSMDKTKMDPDIKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -