Basic Information

Insect: Agrotis exclamationis
Gene Symbol: -
Assembly: GCA_950005045.1
Location: OX465446.1:6187997-6216107[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 6.8 9.3e+02 2.1 0.6 1 23 236 258 236 258 0.93

2 32 0.011 1.5 10.9 0.3 2 23 330 352 329 352 0.95

3 32 0.083 11 8.1 3.9 1 23 357 380 357 380 0.94

4 32 0.0073 1 11.5 1.0 1 23 385 408 385 408 0.96

5 32 0.24 33 6.7 0.2 2 23 411 433 410 433 0.93

6 32 0.15 20 7.4 1.2 2 22 440 460 439 460 0.94

7 32 0.46 63 5.8 0.4 1 22 521 542 521 544 0.87

8 32 0.056 7.6 8.7 0.7 1 23 607 629 607 629 0.95

9 32 0.0014 0.19 13.7 0.2 2 23 700 722 699 722 0.96

10 32 0.0086 1.2 11.2 3.8 1 23 727 750 727 750 0.96

11 32 0.00023 0.032 16.2 0.8 1 23 754 777 754 777 0.95

12 32 0.41 57 5.9 0.2 2 23 780 802 779 802 0.95

13 32 0.0076 1 11.4 0.2 2 19 808 825 807 827 0.96

14 32 0.0014 0.19 13.7 0.0 1 23 972 995 972 995 0.92

15 32 5.3e-05 0.0073 18.2 0.9 1 23 1000 1023 1000 1023 0.95

16 32 0.015 2.1 10.4 0.1 3 22 1031 1050 1030 1052 0.84

17 32 0.00023 0.031 16.2 1.4 2 23 1058 1080 1057 1080 0.97

18 32 0.0011 0.15 14.0 2.9 1 23 1117 1139 1117 1139 0.98

19 32 0.15 21 7.3 0.1 3 23 1168 1189 1166 1189 0.94

20 32 0.14 19 7.4 3.3 2 23 1210 1232 1209 1232 0.94

21 32 5.3e-05 0.0072 18.2 0.5 1 23 1237 1260 1237 1260 0.96

22 32 0.0023 0.31 13.0 0.8 1 23 1265 1288 1265 1288 0.96

23 32 0.0014 0.19 13.7 1.6 3 23 1292 1313 1289 1313 0.91

24 32 0.019 2.5 10.2 1.3 2 21 1321 1340 1320 1341 0.94

25 32 0.02 2.7 10.1 2.6 1 22 1395 1416 1395 1418 0.90

26 32 1.4 1.9e+02 4.2 0.0 2 23 1491 1514 1490 1514 0.94

27 32 2.9e-05 0.004 19.0 0.1 3 23 1521 1542 1520 1542 0.94

28 32 0.0052 0.71 11.9 2.8 2 23 1547 1569 1546 1569 0.94

29 32 0.016 2.2 10.4 5.1 1 23 1574 1597 1574 1597 0.96

30 32 3.6e-05 0.0049 18.7 5.0 1 23 1601 1624 1601 1624 0.97

31 32 0.00041 0.057 15.4 0.3 2 23 1631 1652 1630 1652 0.96

32 32 1.5e-05 0.002 19.9 0.6 1 23 1658 1680 1658 1680 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	6.8	9.3e+02	2.1	0.6	1	23	236	258	236	258	0.93
2	32	0.011	1.5	10.9	0.3	2	23	330	352	329	352	0.95
3	32	0.083	11	8.1	3.9	1	23	357	380	357	380	0.94
4	32	0.0073	1	11.5	1.0	1	23	385	408	385	408	0.96
5	32	0.24	33	6.7	0.2	2	23	411	433	410	433	0.93
6	32	0.15	20	7.4	1.2	2	22	440	460	439	460	0.94
7	32	0.46	63	5.8	0.4	1	22	521	542	521	544	0.87
8	32	0.056	7.6	8.7	0.7	1	23	607	629	607	629	0.95
9	32	0.0014	0.19	13.7	0.2	2	23	700	722	699	722	0.96
10	32	0.0086	1.2	11.2	3.8	1	23	727	750	727	750	0.96
11	32	0.00023	0.032	16.2	0.8	1	23	754	777	754	777	0.95
12	32	0.41	57	5.9	0.2	2	23	780	802	779	802	0.95
13	32	0.0076	1	11.4	0.2	2	19	808	825	807	827	0.96
14	32	0.0014	0.19	13.7	0.0	1	23	972	995	972	995	0.92
15	32	5.3e-05	0.0073	18.2	0.9	1	23	1000	1023	1000	1023	0.95
16	32	0.015	2.1	10.4	0.1	3	22	1031	1050	1030	1052	0.84
17	32	0.00023	0.031	16.2	1.4	2	23	1058	1080	1057	1080	0.97
18	32	0.0011	0.15	14.0	2.9	1	23	1117	1139	1117	1139	0.98
19	32	0.15	21	7.3	0.1	3	23	1168	1189	1166	1189	0.94
20	32	0.14	19	7.4	3.3	2	23	1210	1232	1209	1232	0.94
21	32	5.3e-05	0.0072	18.2	0.5	1	23	1237	1260	1237	1260	0.96
22	32	0.0023	0.31	13.0	0.8	1	23	1265	1288	1265	1288	0.96
23	32	0.0014	0.19	13.7	1.6	3	23	1292	1313	1289	1313	0.91
24	32	0.019	2.5	10.2	1.3	2	21	1321	1340	1320	1341	0.94
25	32	0.02	2.7	10.1	2.6	1	22	1395	1416	1395	1418	0.90
26	32	1.4	1.9e+02	4.2	0.0	2	23	1491	1514	1490	1514	0.94
27	32	2.9e-05	0.004	19.0	0.1	3	23	1521	1542	1520	1542	0.94
28	32	0.0052	0.71	11.9	2.8	2	23	1547	1569	1546	1569	0.94
29	32	0.016	2.2	10.4	5.1	1	23	1574	1597	1574	1597	0.96
30	32	3.6e-05	0.0049	18.7	5.0	1	23	1601	1624	1601	1624	0.97
31	32	0.00041	0.057	15.4	0.3	2	23	1631	1652	1630	1652	0.96
32	32	1.5e-05	0.002	19.9	0.6	1	23	1658	1680	1658	1680	0.98

Sequence Information

Coding Sequence: ATGGAGTTTGACGAGATTGTGGTGAAGGAGAGCCCCGGGCTATGCCGGTGCTGCCTTTCCGAAGGATGCTACAAGGATCTGGGGACGGAATACACTTGGATGAATGAAACCGAAGTTTATGCTGATATGCTGCTAGAATGCTTTGATATTAGCATAACGCAACACAATGAAGGTCCAAACGGTCCGAACCGACTCATCTGCGAGGTCTGCATTACTCGGTTACGAGACGCATGTAACTTCAAGAAACAAGTCATGGACTCGGAGAAGAAGTTCATCGATATGATGGGCAGGGGAGAGTTTAGACCAAAGATGCTAATCTACCAGACGCAGCTGAAGTGTGAGGTTCCATCAACAACCGAGGTACCCATTGAAGAGGCTGATGTGGAGTATCTTGAAGATGAAATTGATTTTGGGGATGATGACCTAAAAGAAGAATTAACCCAGCCTTCAGTGTCAGATGTGACAGTATCCACTCTACCCATTAAGGGCAAGCGAGGACGTCCCCGCAAGAATGCACCAGCCAAGCCGGAGAAGCGAGCCAAAGTTGCCAAGTTAGATGACAAGGCAAAGAGTTCCAAAGCTGTTGCTAAAGGTAAAAAACCGAAGATATACAAGAAAACAGAATCTTCCTCGATGAAAAGACGACGGAATCTCCAAATTATTTTCAACCACACGTCTATAATACCTTTTAAGTGGCGCGGGAAGTATCTTTGTTTCTATTGCAGCAAAGATATGGCAGAGTATACAGAGCTAAGAGACCATACTAAAGCGCATGGGAACTGTTCCATAAAAGACCATTCTTTAAAAGTCTTAAAAGGTGGTAAAAACATGGAAATCAAAGTAGATATATCTTCCATTTCTTGCGAAGTTTGCGCAGAAACTTCGCCGACTTTCGAAGGAATTATCACTCATTTATTTGAGAAACATTCTCTTGTATACGATAAAGGAGTAGAAATGGCTATTGAGGAGTATAAACTGGCTAGTCTTAGCTGTACAGCTTGCGATGAAACATTCACGTACTTCGGTTATCTAGTTTCACATGTAAATACGAATCACCCCAAAAATTGCCACATTTGCGAGAGTTGCAATCAAAAATTCAATAAACGCCGTGATCTATTTTCTCATGTCAAAAACTACCATCGTGAAGGTGGTTACAAATGCGAAATGTGTCCTCAAGTCTTCAGCTCAATGAATATTTTGAGAAAACACCGAAATAATAGACATTTGACTAGATGTAACATCTGCAATTTGAAACTACCCTCAGCTTCTATGAGACAAAAGCATATAGATTTGGAACACCCGGACGATGGGTCTTTACAATGCGATGCTTGCTTTAAAGAGTTCCACACGAAACGAGGCCTCAAAATGCATGTGAGAAAATGTAAAGGCGAAGAGATTTTCGGCATCGCGATCAAAGAAGAAAACTCGGTCATGGATTTAGACTTAGACCAAAACTATGAAGAACCGGTTAAAAAACCGTGCGTTAAACAACTCCGGGAAAATATTGTCACAATAATTAACATGTCTACCGCAAtaccttttaatttttataagaataagtTCAACTGCTTTTACTGCTCCAAAGATTTCGGCGATTCAGATGTGATGAGGGAACATACGGTCTTAGAACACCCAGTTTGCGatgttaatgaaaaatgtatcagGAAGTGTAGGGAATCGATATCCTGCGTCAAAATCGATATTTCTTCACTCGCTTATTTGGAAACAAAGGTGCACAGTGCTAGTTATCTAAGGAGGCGAAATCTGCAAATATTACTCAACCACACAACGTTGGTACCGTTTAAATGGCGCGGCAAATACCTCTGCTTTTATTGCGGTGACGATACAGACACGCCCAAAAATCTCCGGAAACATACGAAGGCTCACGGACCTTGCAATGataaagacagagctatacaacaAATAAAATCAGCTGATGTAGAAATCAAAATTGATGTTTCCGATGTTACCTGCGAGATTTGTTCAGAATCTTTACCATTTTTAGACGAAATTATTGATCATTTGATATTTAAACACAAATTGCCATACGATAAAGACGTCGAGATGTGCCTATCAGCTTACAGACTCTCAGATCTCCAATGCCTTCTTTGCGATAAAAGTTACGACTACCTTCGTAAACTTATCACTCATATGAATGTTGCTCATCCGAATAACAGTTATGAGTGCACTAAATGTTCAATGAAGTTCAATAAAAGAAGGGATTTAGAGTCACATAAGAGATTCCGTCATAGGAAATGCTATCCTTGCACTAAATGCGATCAGAAATTTCCAACAAACAACACGCTACAAGTTCATAGGTCTAACGATCATTCTTCAACCTGCAACATCTGTTTTCAAGTATTTCCATCTGATGCGAAAAGGTTAGCCCATCTCAAATCCGAACATGAATCTGAACAAAGCCAATGCGGATTCTGTAATAAAGTCTTCCCAACTAAACAAGCTTTTATAAGACACTCCGGTAAATGCGAGCAAACACCAGCCGAACAGCCCATCTTACTtgatgaagaagaaaaaaagataTCAGTTAAAGAAATAAGGAAAAGTTTAGCAGCCATCTTCAATATGACCACCGCATTACCTTTCAAATTCTTCATGAATAGGCTACGCTGTTTTTATTGCACGAAAGATTTTATCTGTTGTGAAGGTTTAAAGGAACATACGTTGAACGACCACCCTCATTGCGATATAAACTTTAAGTCTATGAAGCTAAAGAACAGATATGATGGTGTTCAAATCAAGGTTGATACTTCTGTTTTGTCCTGTAGACTTTGTCATATCAACTTGCAGGATTTAAACGATGTGGTCGATCATTTGACCAAAGAGCATAAGGTCAAATTCAACTTTACTGTTGAGGGTTATTTACTACAGGCTTACAAACTGGTCAAAGACAACTATCCTTGCCCTATTTGCGGTGAAGTTTTCAGATACTTTGGGGTCTTGCTTAAGCATGTTAGTGCGTCACATACTGGAAATAATCACATATGCATGTACTGCGGAAAAGCTTTTAGAACGGACCCGAATTTAAGAGCTCATATTTCAAGAAGACATAAAATCCCTGACAGTAACAAGTGCATTACTTGCGGTCTTGTTTTTCCGACAAATTCTGCGTTAAAGAGCCATCAGGGAGCCGTACATGGTAAAAAGTTAGTCAAATGCTTCAAATGTAATGAGAAATTCACTTCGCAATATGCTATGCAGAGACATTTGATCACCTCTCATGATGGTCTACCAGGGCCGTATGAAGGCTGTACCTCTGAGAGACGGCGGAAAAACTTGAAAATACTGTTCAACCACACCACGATCATACCTTTTAAATGGCGAGGGAAATATATTTGCTTCTACTGCGGACAAAACTATACAGACTACACAGAATTTAGAAAACATACAAAATCCCACGGACTATGCACTACTAAAGATTACTCCCTCAAACTGATCAAAGGAAAAAACGTTGAGATAAAAATCGATGTCTCTGAGATCGCTTGTGACAACTGCAATGAACCTTTCAACAGATTTGAAGAAATAATTGATCATTTGATCTCGAAACATAACTTGGAGTACAACAAAAACATCGATATACCTTTCCAGGAATATCGCTTAGTCGATTGTCGATGTTTGCATTGTGAAGAACAATTCTCTTACTTCGGTTATTTGGTTAAGCATGTGAATAATGTACATCCGCAGAATTGTTTTATCTGCGACGATTGTGGAGTTACTTTCAACAAGAAGAGGGACTTGTCTGTACATTTGAGGAATTACCATAAACAAGGAGGATATCCTTGCGATTTGTGCCTAAAAAACTTCGAAACTCGACTTATGTTGAGGAGACATCAGAACAATATGCATTTCAGATGCTGCAAGAGCTGTGGTTTGCGTTTCGCCTCCCTTTCTCTCTTACAAAAGCACGTACAAGTTGAACATCTACAAAATGAAAGTAATATGAAGTGTAGTTACTGCTCTAAGGAGTTCCACACGTCTTTAGGCTTACGACAACATATAAGCAAATGCAAAGTGAAAATAATTTCGCAGGTTGAACCACAAACGTCGTTCCTTGATGACAGTAACATAGAGCCTAAGAAAAAACAGAATGTCTTACAAATAAGACAGAACATACAATGTGTATTAAACATGTCGACAGCAGTGCCTTTCAAATTCTTCTCCAAATACTCCTGCTTTTATTGCTCAAAGAAATTCGTAGAATTTGACGAGTTACGCCACCATACCGGCCTTGAACACCCCGTGTGCGATTTGAAGTCCAAAAGCATGAAGAAATGTAAAGGAGAAAGAATAACCGTTAAAATCGACATTTCTGCCTTAGCTTGTAAAGTATGTTGTCTTCCTATGCCTAACTTAGAAGATTTGATCAACCATTTGATAGCAGAACACAAAGCGAATTACGATACGTCAATTTCTGGATGTTTAGAACCATTCCGGGTAATAAAAGACAACATGCCTTGTCCCATATGCCCTGATACAGTCTTCCGATACTTCGGAATTCTGCTTCGTCATATGAACTCGGAACATAGCAACAACAACCGAATTTGTGACTTTTGTGGTCGAAGCTTTCGTAACGCGGCAAATCTAAACGTGCATATAACCTACGCACATACAGGTTCATGCGAATGCGACATTTGTGGAGTTAAATATAAGAACCAATGGTGTTTGGCACGGCATAGGGCGAGGACCCACGATGCTAAGGACCATAAATGTCCAAAATGCCCGGAGCAGTTCCAGTCACAGTACCACAAACAAAAACATCTAATAAAAATGCATAATGTAGGTCACAAGTGTAGTTACTGCGGTAAAATGTTCACCAGAAACTCTTTTATGAAAGATCATGTTAGAAGAACGCATTTGAAAGAGAAGAACATACCTTGCTCGATTTGTAATGAAAAGTTTTTCGATAATTATCTTTTAAGGATGCATATGGTAAAACATGAGGGAGATAGGAAATTCAGTTGTACAGTTTGTGGAAAAGCGTTTTTGAGACGGAGTAACTTGAGCTCACATATGGAGATGCATAAGAAATACGGACATGTGCAGTTGTAG
Protein Sequence: MEFDEIVVKESPGLCRCCLSEGCYKDLGTEYTWMNETEVYADMLLECFDISITQHNEGPNGPNRLICEVCITRLRDACNFKKQVMDSEKKFIDMMGRGEFRPKMLIYQTQLKCEVPSTTEVPIEEADVEYLEDEIDFGDDDLKEELTQPSVSDVTVSTLPIKGKRGRPRKNAPAKPEKRAKVAKLDDKAKSSKAVAKGKKPKIYKKTESSSMKRRRNLQIIFNHTSIIPFKWRGKYLCFYCSKDMAEYTELRDHTKAHGNCSIKDHSLKVLKGGKNMEIKVDISSISCEVCAETSPTFEGIITHLFEKHSLVYDKGVEMAIEEYKLASLSCTACDETFTYFGYLVSHVNTNHPKNCHICESCNQKFNKRRDLFSHVKNYHREGGYKCEMCPQVFSSMNILRKHRNNRHLTRCNICNLKLPSASMRQKHIDLEHPDDGSLQCDACFKEFHTKRGLKMHVRKCKGEEIFGIAIKEENSVMDLDLDQNYEEPVKKPCVKQLRENIVTIINMSTAIPFNFYKNKFNCFYCSKDFGDSDVMREHTVLEHPVCDVNEKCIRKCRESISCVKIDISSLAYLETKVHSASYLRRRNLQILLNHTTLVPFKWRGKYLCFYCGDDTDTPKNLRKHTKAHGPCNDKDRAIQQIKSADVEIKIDVSDVTCEICSESLPFLDEIIDHLIFKHKLPYDKDVEMCLSAYRLSDLQCLLCDKSYDYLRKLITHMNVAHPNNSYECTKCSMKFNKRRDLESHKRFRHRKCYPCTKCDQKFPTNNTLQVHRSNDHSSTCNICFQVFPSDAKRLAHLKSEHESEQSQCGFCNKVFPTKQAFIRHSGKCEQTPAEQPILLDEEEKKISVKEIRKSLAAIFNMTTALPFKFFMNRLRCFYCTKDFICCEGLKEHTLNDHPHCDINFKSMKLKNRYDGVQIKVDTSVLSCRLCHINLQDLNDVVDHLTKEHKVKFNFTVEGYLLQAYKLVKDNYPCPICGEVFRYFGVLLKHVSASHTGNNHICMYCGKAFRTDPNLRAHISRRHKIPDSNKCITCGLVFPTNSALKSHQGAVHGKKLVKCFKCNEKFTSQYAMQRHLITSHDGLPGPYEGCTSERRRKNLKILFNHTTIIPFKWRGKYICFYCGQNYTDYTEFRKHTKSHGLCTTKDYSLKLIKGKNVEIKIDVSEIACDNCNEPFNRFEEIIDHLISKHNLEYNKNIDIPFQEYRLVDCRCLHCEEQFSYFGYLVKHVNNVHPQNCFICDDCGVTFNKKRDLSVHLRNYHKQGGYPCDLCLKNFETRLMLRRHQNNMHFRCCKSCGLRFASLSLLQKHVQVEHLQNESNMKCSYCSKEFHTSLGLRQHISKCKVKIISQVEPQTSFLDDSNIEPKKKQNVLQIRQNIQCVLNMSTAVPFKFFSKYSCFYCSKKFVEFDELRHHTGLEHPVCDLKSKSMKKCKGERITVKIDISALACKVCCLPMPNLEDLINHLIAEHKANYDTSISGCLEPFRVIKDNMPCPICPDTVFRYFGILLRHMNSEHSNNNRICDFCGRSFRNAANLNVHITYAHTGSCECDICGVKYKNQWCLARHRARTHDAKDHKCPKCPEQFQSQYHKQKHLIKMHNVGHKCSYCGKMFTRNSFMKDHVRRTHLKEKNIPCSICNEKFFDNYLLRMHMVKHEGDRKFSCTVCGKAFLRRSNLSSHMEMHKKYGHVQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00302367;
90% Identity: -
80% Identity: -