Basic Information

Insect: Agrochola litura
Gene Symbol: -
Assembly: GCA_949152395.1
Location: OX424493.1:5361638-5370182[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.046 5.8 9.0 1.9 1 23 202 224 202 224 0.97

2 29 0.0055 0.68 11.9 1.0 2 20 253 271 252 273 0.92

3 29 0.00038 0.047 15.6 0.1 2 23 304 326 303 326 0.96

4 29 0.00038 0.047 15.6 1.0 1 23 376 399 376 399 0.96

5 29 0.079 9.8 8.3 0.5 1 23 418 440 418 440 0.95

6 29 0.00019 0.024 16.5 3.6 1 23 480 503 480 503 0.95

7 29 0.002 0.25 13.3 4.1 2 23 543 565 543 565 0.97

8 29 0.0026 0.32 12.9 0.6 1 23 615 638 615 638 0.97

9 29 0.0043 0.53 12.2 0.2 1 23 690 712 690 712 0.97

10 29 0.0052 0.65 12.0 6.7 1 23 723 745 723 745 0.97

11 29 0.062 7.7 8.6 0.6 2 23 757 778 756 778 0.95

12 29 0.0046 0.58 12.1 0.5 1 23 788 810 788 810 0.98

13 29 5.3 6.6e+02 2.5 7.3 1 23 839 861 839 861 0.93

14 29 0.0037 0.46 12.4 2.8 1 23 872 894 872 894 0.97

15 29 2e-05 0.0025 19.6 0.5 1 23 902 924 902 924 0.98

16 29 0.00076 0.095 14.6 0.2 2 23 944 966 943 966 0.97

17 29 1.2 1.5e+02 4.5 0.3 1 23 984 1006 984 1006 0.90

18 29 0.083 10 8.2 3.6 1 23 1013 1035 1013 1035 0.95

19 29 0.0071 0.89 11.5 3.2 2 23 1046 1068 1045 1068 0.95

20 29 0.017 2.1 10.4 0.2 2 23 1091 1112 1090 1112 0.95

21 29 1.6 2e+02 4.2 3.6 2 23 1155 1177 1154 1177 0.95

22 29 0.0067 0.83 11.6 0.2 2 23 1193 1214 1192 1214 0.95

23 29 3.9 4.8e+02 2.9 4.1 5 23 1224 1242 1221 1242 0.94

24 29 0.017 2.1 10.4 0.8 2 23 1253 1275 1252 1275 0.95

25 29 2.4 3e+02 3.6 6.7 2 23 1292 1310 1292 1310 0.90

26 29 0.36 46 6.2 1.9 2 21 1314 1333 1313 1334 0.94

27 29 0.55 69 5.6 0.9 2 23 1383 1404 1382 1404 0.93

28 29 0.0037 0.46 12.4 0.5 2 23 1415 1437 1414 1437 0.95

29 29 8.5 1.1e+03 1.9 1.0 2 19 1475 1492 1475 1495 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.046	5.8	9.0	1.9	1	23	202	224	202	224	0.97
2	29	0.0055	0.68	11.9	1.0	2	20	253	271	252	273	0.92
3	29	0.00038	0.047	15.6	0.1	2	23	304	326	303	326	0.96
4	29	0.00038	0.047	15.6	1.0	1	23	376	399	376	399	0.96
5	29	0.079	9.8	8.3	0.5	1	23	418	440	418	440	0.95
6	29	0.00019	0.024	16.5	3.6	1	23	480	503	480	503	0.95
7	29	0.002	0.25	13.3	4.1	2	23	543	565	543	565	0.97
8	29	0.0026	0.32	12.9	0.6	1	23	615	638	615	638	0.97
9	29	0.0043	0.53	12.2	0.2	1	23	690	712	690	712	0.97
10	29	0.0052	0.65	12.0	6.7	1	23	723	745	723	745	0.97
11	29	0.062	7.7	8.6	0.6	2	23	757	778	756	778	0.95
12	29	0.0046	0.58	12.1	0.5	1	23	788	810	788	810	0.98
13	29	5.3	6.6e+02	2.5	7.3	1	23	839	861	839	861	0.93
14	29	0.0037	0.46	12.4	2.8	1	23	872	894	872	894	0.97
15	29	2e-05	0.0025	19.6	0.5	1	23	902	924	902	924	0.98
16	29	0.00076	0.095	14.6	0.2	2	23	944	966	943	966	0.97
17	29	1.2	1.5e+02	4.5	0.3	1	23	984	1006	984	1006	0.90
18	29	0.083	10	8.2	3.6	1	23	1013	1035	1013	1035	0.95
19	29	0.0071	0.89	11.5	3.2	2	23	1046	1068	1045	1068	0.95
20	29	0.017	2.1	10.4	0.2	2	23	1091	1112	1090	1112	0.95
21	29	1.6	2e+02	4.2	3.6	2	23	1155	1177	1154	1177	0.95
22	29	0.0067	0.83	11.6	0.2	2	23	1193	1214	1192	1214	0.95
23	29	3.9	4.8e+02	2.9	4.1	5	23	1224	1242	1221	1242	0.94
24	29	0.017	2.1	10.4	0.8	2	23	1253	1275	1252	1275	0.95
25	29	2.4	3e+02	3.6	6.7	2	23	1292	1310	1292	1310	0.90
26	29	0.36	46	6.2	1.9	2	21	1314	1333	1313	1334	0.94
27	29	0.55	69	5.6	0.9	2	23	1383	1404	1382	1404	0.93
28	29	0.0037	0.46	12.4	0.5	2	23	1415	1437	1414	1437	0.95
29	29	8.5	1.1e+03	1.9	1.0	2	19	1475	1492	1475	1495	0.89

Sequence Information

Coding Sequence: ATGGCCCTCAAGCTTGGAAAATGCAGGCTCTGCCTCAAGCTTGGCGACTTTTACTCCATCTTCACCGTCGACAATGCTTTGCAGCTCGCGGAGATGGCAATGGAATGCGCCCGGGTGAAAATATACGAAGGCGATGGCCTACCTGACAAGGTGTGCGCGGAGTGCATACAGAAGCTCAGCAGCGCGCACATCTTCAAACAGCAGTGTGAGCGAGCTGACCAGGAGTTACGCCGCAACTATGTGCCTCCTCCCGGATTCAGCATTAGTCCGCCGCCACCCAACAGACAGAGCAGCGATTCAGCCTTTTCAAATCATACGGATACCTCCAACTTGACTAAACCCCCGTCTTCCATCGAAGAGAAAGTAACGCCCGCCACCAGAACCCGGAAACGTAGCGCGGATAGCGTCGACAATGCATCCACTGGTGGCGCGTCCAGCGACTACAGACCCAGCGGCTCCAAACGCGTCGAGGAACTCAGACGCAGCCAAAAGCGACCCAGAAGACTGTCAGGACACATCTCGCAATTAGATTCAGATTACGAAGATAATAGCGCCTCGTACTTACCTGATACTGACTCTGACGAGCCATTACTTAAAAATAGCTTCAATTGTGATCAATGCCCCAAACATTTCCTATCCCAAAGAAGCCTTGGTGTCCACAAGAGGGTACACGATAAAAAAGAAGGTCTTGGCGAAAACGCCGTCGTTGATATACCGCAGAAGACAGAGGACGCGACCGATGAACAAGACAAATTGAACTGCGACAAATGTGGAAAGACATTCAAGTTAAAGATCATGATGAAACGTCACCACGAAATATGCGGGAAGACCACAAGTCCCGCTAAGACTCCACAGAAAGAGTTGCTCGTCTCTTTAGAACCGATTGACGGCATGAAGAACCGGAACATTGTGTGCGAAATGTGCTCAGCTAAGTTCAAGAGTATTGAAAATTTGGCAAAGCATATGAAGGTGGTACATGCTGCAGTCTTGAAAAAAGAAGATCATGTTAAACGGGAAAATGGAAAGATAACAGTTCCGTGCATGTACTGCAAGAAGCAGTTCGACGATTACTATGTTCACAGTGCGCATTTCAACAAGTGTCCGAAAAGGGACGACTCTCTGTCGTTTGAGTGTCCCATTTGCAAGAAGGTGGTGTCGAGAAAGAACTCTTATTTCTTACATCTGAAGAACATGCACTTTGAGCCTCGGATGTCGCTGAAGAGTTCGGTGGAGCCTGAGTCACAGGAATACCACGAGTGTAGGATGTGCTTCAAGAAGCTTCCCTCGCAAGAGTTGCTGATCACGCATCTGGCGGCGCACATGTCGAATATCGATGACAATGATGGTGGAGCCGACAACGAATCTAGAGCAAGCACCATAGACGACACTGCATCTATCCAATCAGTACATAGCCAATCTCACACTCCCACCGCTCAATTTAAGTGTCCAACATGTGACAAAGagttcaaatacaaaaaagcTCTTCAAACGCACGAGGCTAAGTGTCATTCAGAAGTACCTGTGCAAGTGAAGATAGAGCCACCTGATAAGGCATCGACAAGTCTCTTGAGCGAGACGGTCTATAAGCAGACTGAGTCGGAATCTAGTCAAGAAGAGGACGACAACACGTGTGATATCTGTGAGAAACAGTTCTCGTACCGCCGGCTCCTTCTCCACCACAAGCGGACCAAGCACAACATGAGCTCGGGACACAAGCGCGCCAAAATCTACCTCAAAGACTGTTCCGTGCGCTGCCTCATCTGCGATCTCGACATGAAGGTCGGCGCGATCAACGAACACAACCAGACGCATATCTCAAAGAACATGAAGCCTAGGAACCTGTACACCTGCGCCGAGTGCGAGGATACCTTCAAGAGCTGTTCTGCTCTTGCAAACCATATAAAGCTGATTCACAGATTAAAGCAGAAACGGATCGAAGATACCGTAAACCCGTCGGATTTTTGTGAAGTCGTTGTGGCAAAAGCGGAACCTCTGGACTTTATCCAGAGTCACAACGACTTTGGTGAGGTTCCGGGCGAGAACAAGCCTTTAGTAGATCTAAGCGGCTTCAACTGTCCCATCTGTAACAAGAAGATGCCGACTCTCATATCTTTGAAGAGGCACGTCAACTGGCACTCCAATGTAGGCAATAATATTGAGAAGAAGCACGAGTGTGCCGTCTGTAACGAGtcCTTCAAGTTCCAGTGCCACTACAAAATCCACATGCGCGAGCACTACCGCGACACCAACCTCGACCCCAAGCACCTCACGTGCGCCATCTGCGGGCGGCGCAGCAAGCACCTCCGCGCCGCGCAGGCGCACATGACCTACCACAAGCAGACGCGCTTCCAGAACAAAGACTACCAGTGCTCCATCTGCGAGAGAGTCTTCCAATACCGCAAAGTCTACCTCTCGCATATGGCTATACACTACAAGAAAGGCGACAGCGTCATCAACACCATCGTAGGTGACGCCATGCCCAGCAACGCCGACAGAAACGTCTTCGACGGCACGCACACCTGCCACCTCTGCGGCAAGATCTGCGATTCAGAAAACTCCCTCAAATGTCATCTCTCATGGCACACCTCCAAAACTTTCCTGTATGGCGCCCGCCACGAGTGCACCATCTGCAAAGTGAAGTTCACGAACAAACGAAGACTAGAGCTTCACACCCGAGCTCACTACGAAGACGATAACGGTCCCTACAAGTGCACCATTTGCGGGAAAGGGTACACTGACGAGGGCTACTACCAAAGACATGTGAAGGGACACAACTTCGACCATCAGTCCCACAAAAAGAGGATCGACAAAATCAGAAAGGATAAAGTTAAATGTCCAATATGTACGCGATACTACCCTGACTTGGTGAAGCTGATCCGTCACTTGCGGCGCACGCACCCTGAGAGTAAGATGATCAAGTCCGACCCCGATGCGCCGCCACCACTCTACTACTCCTGTAAGTTGTGCGCCAAAGTATTTCTAGACGAGCGGAGACTGCAGTCCCACGAGGAAGCTCATTTAAGGAAGCCAGAGTTCTTTAAATGTAAGTTCTGTGGAAAGAAATACATTTCTCTAAAGAACCACCAGATCCACGTAAAGGGTCACTTGGCGCAGAAACACTACGACAATCCGCTGAAGTGTCCGCACTGTGACGAGAAGTTCGTGAAGGGCTACGGCCTGCACCACCACCTGCGCGACGCGCACAACGTGCTCGAGAACTGGATCGCAGAGCGCACGGAGCAGCCACTCAGCGGCCCACTGAAAGACCTGCAGTGCTCCATCTGTATGAAGGtcctcgccagcaaagggaattACGAGCGACACATTGACTACCACAACTCCTTGAGATGTAACTACTGCTTCGATTACTTCAGCTCTCTCAGGTTCCTAGAAGGACATCTAGCGTTCTCGTGCGATAAGAAAAAGCTCTTAGGCGATACCGAAGTTTACCCTAAGAAAGTAAAATGCAACATTTGTTATAAAGCATTCCATGTTCAAGTGAAATTAGACTGCCACTTGCGCACGCAGCACAGCGTCATCGTAGACAGGGAACAGAGAGCAGGCAAGCAAGAAATTGTCTGCGATTATTGCTTTAGAGTTTTCGAAAACGAGTATGCCCTAAGTACCCACAAGATTTACCATCGCACGGTTGGCTTCTATGGGTGTATTTATTGCAAAAAGAAGTTTAACACGTTGACTGTGTATCGAAAACACAAGAATCACCATATGGCACAGCTCAATGTAGATAACCCGACGAAATGCGAACATTGTGACGAGACGTTCGTCGCTTTCAGGGAAATGATATACCACATGAGGGACGTACACGGAGATGACAAGGAATGGTTCACAGAGCCCAAGGAGTCCATCGAGGAGACGTGCCACATCTGCAACAAACGATTCTACAACCTTCACAAGCATTTGACTTATCACGAACAAAACAAGTGCAAGAAATGCAATGAATATTTCTACTCCCGGGCGGACTTCGATAGTCATCTCTGCGCCATTGAAAGTGACGACGAAGGCACGGGATACATGGGCAACGAGCAGGCATTCCAGTACGAGGAGTGCGGGTTCTGCTTCAAACCTATCACCAAGAAGAGCACCAAGCGGCTACACAACCAGATACACAAGGGCTCTGGCTCTATATCCTGTAGGTTCTGCTCACTTAAATTTAAAACTATGGATGCTTTTAACATACACGCATTCTCTCATCGAAGTAGAAAATACAATAAGAAGCCGATAAAATGTCGGAAATGCGGCGAAAAGTTCGTTAAATACGGACCATTTATAAAGCATATGAAGTTAGTTCACAAATCTACGAAAAAGATTCACTACAGAGCGATCGTGAAGCCTGAGAAATGTGTCGTTTGTGGAGACGACTTTCCGAATCTGCACAACCACTACCGCGCTCATTTGCTAAACCAGTGTCAGAATTGTCTCAAATACTTTACTTCCTACAAAGCGATATCTGCGCACGAGTGCGACAAAGAGGACTCGGACCCGTCGAAGGTGTTCACAAGTGACGCTAACTTGAACGAGCTGATAAACACATACGTTCCTAAAGACGAGAAGGATGATGAGAAGTACTACGGCCACACTGACGACGAGGAAGAAGATGTTGAGCCATTAGTATTTGGCGAAGAAGAGGAAAGTCAGGAGAGTAAAGATATACCGATGCTCCAATCGCCCATCATATCAGATGTTCTGTCGCTGTTCAAGACGGAGATGAATGGGATGGGTGAGGTGGATGGCGTGGTGGATAACATGGATGAAGTGGTCAATATAACTGATGATGACTCTGTGGGTTTCGACGATTCCGTCATTCCAGTTGTTGTCGTTATAGATGACGATTAA
Protein Sequence: MALKLGKCRLCLKLGDFYSIFTVDNALQLAEMAMECARVKIYEGDGLPDKVCAECIQKLSSAHIFKQQCERADQELRRNYVPPPGFSISPPPPNRQSSDSAFSNHTDTSNLTKPPSSIEEKVTPATRTRKRSADSVDNASTGGASSDYRPSGSKRVEELRRSQKRPRRLSGHISQLDSDYEDNSASYLPDTDSDEPLLKNSFNCDQCPKHFLSQRSLGVHKRVHDKKEGLGENAVVDIPQKTEDATDEQDKLNCDKCGKTFKLKIMMKRHHEICGKTTSPAKTPQKELLVSLEPIDGMKNRNIVCEMCSAKFKSIENLAKHMKVVHAAVLKKEDHVKRENGKITVPCMYCKKQFDDYYVHSAHFNKCPKRDDSLSFECPICKKVVSRKNSYFLHLKNMHFEPRMSLKSSVEPESQEYHECRMCFKKLPSQELLITHLAAHMSNIDDNDGGADNESRASTIDDTASIQSVHSQSHTPTAQFKCPTCDKEFKYKKALQTHEAKCHSEVPVQVKIEPPDKASTSLLSETVYKQTESESSQEEDDNTCDICEKQFSYRRLLLHHKRTKHNMSSGHKRAKIYLKDCSVRCLICDLDMKVGAINEHNQTHISKNMKPRNLYTCAECEDTFKSCSALANHIKLIHRLKQKRIEDTVNPSDFCEVVVAKAEPLDFIQSHNDFGEVPGENKPLVDLSGFNCPICNKKMPTLISLKRHVNWHSNVGNNIEKKHECAVCNESFKFQCHYKIHMREHYRDTNLDPKHLTCAICGRRSKHLRAAQAHMTYHKQTRFQNKDYQCSICERVFQYRKVYLSHMAIHYKKGDSVINTIVGDAMPSNADRNVFDGTHTCHLCGKICDSENSLKCHLSWHTSKTFLYGARHECTICKVKFTNKRRLELHTRAHYEDDNGPYKCTICGKGYTDEGYYQRHVKGHNFDHQSHKKRIDKIRKDKVKCPICTRYYPDLVKLIRHLRRTHPESKMIKSDPDAPPPLYYSCKLCAKVFLDERRLQSHEEAHLRKPEFFKCKFCGKKYISLKNHQIHVKGHLAQKHYDNPLKCPHCDEKFVKGYGLHHHLRDAHNVLENWIAERTEQPLSGPLKDLQCSICMKVLASKGNYERHIDYHNSLRCNYCFDYFSSLRFLEGHLAFSCDKKKLLGDTEVYPKKVKCNICYKAFHVQVKLDCHLRTQHSVIVDREQRAGKQEIVCDYCFRVFENEYALSTHKIYHRTVGFYGCIYCKKKFNTLTVYRKHKNHHMAQLNVDNPTKCEHCDETFVAFREMIYHMRDVHGDDKEWFTEPKESIEETCHICNKRFYNLHKHLTYHEQNKCKKCNEYFYSRADFDSHLCAIESDDEGTGYMGNEQAFQYEECGFCFKPITKKSTKRLHNQIHKGSGSISCRFCSLKFKTMDAFNIHAFSHRSRKYNKKPIKCRKCGEKFVKYGPFIKHMKLVHKSTKKIHYRAIVKPEKCVVCGDDFPNLHNHYRAHLLNQCQNCLKYFTSYKAISAHECDKEDSDPSKVFTSDANLNELINTYVPKDEKDDEKYYGHTDDEEEDVEPLVFGEEEESQESKDIPMLQSPIISDVLSLFKTEMNGMGEVDGVVDNMDEVVNITDDDSVGFDDSVIPVVVVIDDD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00785388;
90% Identity: iTF_01532347;
80% Identity: -