Basic Information

Insect: Wyeomyia smithii
Gene Symbol: SCRT1_1
Assembly: GCA_029784165.1
Location: CM056644.1:27976939-27983813[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 44 0.00033 0.036 16.2 0.3 1 23 111 133 111 133 0.99

2 44 0.0003 0.033 16.3 0.0 1 23 149 171 149 171 0.97

3 44 2.6e-07 2.8e-05 26.0 2.6 1 23 177 199 177 199 0.98

4 44 0.0031 0.34 13.1 1.4 1 23 205 227 205 227 0.98

5 44 0.00012 0.013 17.7 3.7 1 23 233 255 233 255 0.99

6 44 4.4e-05 0.0048 19.0 0.1 1 23 261 283 261 283 0.98

7 44 1e-05 0.0011 21.0 0.7 1 23 289 311 289 311 0.98

8 44 6e-05 0.0066 18.5 0.9 1 23 317 339 317 339 0.99

9 44 6.5e-06 0.00071 21.6 1.8 1 23 345 367 345 367 0.99

10 44 0.00041 0.045 15.9 0.7 1 23 373 395 373 395 0.97

11 44 0.0013 0.14 14.3 1.3 1 23 405 427 405 427 0.98

12 44 0.0027 0.29 13.3 0.8 1 23 436 459 436 459 0.93

13 44 2.8e-05 0.0031 19.6 0.8 1 23 464 486 464 486 0.98

14 44 0.0034 0.37 13.0 0.7 2 23 490 511 489 511 0.97

15 44 0.29 32 6.9 1.2 2 23 569 590 568 590 0.88

16 44 0.0091 0.99 11.7 0.4 3 23 599 619 598 619 0.98

17 44 3.5e-05 0.0038 19.3 4.2 1 23 625 647 625 647 0.98

18 44 4e-05 0.0043 19.1 0.5 1 23 653 675 653 675 0.99

19 44 0.00077 0.084 15.1 4.2 1 23 681 703 681 703 0.98

20 44 5.7e-05 0.0062 18.6 0.4 1 23 709 731 709 731 0.98

21 44 0.0051 0.56 12.5 1.9 1 23 739 761 739 761 0.98

22 44 0.026 2.9 10.2 0.3 2 21 768 787 767 788 0.95

23 44 0.00053 0.058 15.6 0.3 2 23 795 816 794 816 0.95

24 44 5.1e-05 0.0056 18.8 1.7 1 23 823 845 823 845 0.98

25 44 1.5 1.6e+02 4.7 4.3 2 20 880 898 879 901 0.88

26 44 0.0004 0.044 15.9 0.7 1 23 907 929 907 929 0.98

27 44 0.00033 0.036 16.2 3.6 3 23 937 956 936 956 0.97

28 44 1.8e-05 0.002 20.2 0.6 1 23 962 984 962 984 0.97

29 44 0.00022 0.024 16.7 0.8 1 23 990 1012 990 1012 0.98

30 44 0.00022 0.025 16.7 1.6 1 23 1018 1040 1018 1040 0.97

31 44 0.012 1.4 11.3 0.4 1 23 1046 1068 1046 1068 0.98

32 44 0.00048 0.053 15.7 0.3 1 23 1076 1098 1076 1098 0.98

33 44 0.044 4.8 9.5 1.7 1 21 1104 1124 1104 1125 0.95

34 44 0.0025 0.27 13.4 1.6 1 23 1132 1154 1132 1154 0.98

35 44 0.00049 0.054 15.7 0.1 3 23 1190 1210 1188 1210 0.97

36 44 0.099 11 8.4 0.4 2 23 1217 1237 1216 1237 0.95

37 44 8e-06 0.00087 21.3 1.5 2 23 1244 1265 1243 1265 0.97

38 44 5.2e-06 0.00057 21.9 0.8 1 23 1271 1293 1271 1293 0.98

39 44 1 1.1e+02 5.3 1.6 1 20 1299 1318 1299 1321 0.93

40 44 0.00036 0.039 16.1 1.3 1 23 1327 1349 1327 1349 0.98

41 44 0.02 2.2 10.6 5.8 1 23 1357 1379 1357 1379 0.98

42 44 1.1e-05 0.0012 20.8 2.2 1 23 1412 1434 1412 1434 0.97

43 44 0.63 69 5.9 3.5 1 23 1441 1463 1441 1463 0.83

44 44 0.031 3.4 10.0 1.7 3 23 1469 1490 1467 1490 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	44	0.00033	0.036	16.2	0.3	1	23	111	133	111	133	0.99
2	44	0.0003	0.033	16.3	0.0	1	23	149	171	149	171	0.97
3	44	2.6e-07	2.8e-05	26.0	2.6	1	23	177	199	177	199	0.98
4	44	0.0031	0.34	13.1	1.4	1	23	205	227	205	227	0.98
5	44	0.00012	0.013	17.7	3.7	1	23	233	255	233	255	0.99
6	44	4.4e-05	0.0048	19.0	0.1	1	23	261	283	261	283	0.98
7	44	1e-05	0.0011	21.0	0.7	1	23	289	311	289	311	0.98
8	44	6e-05	0.0066	18.5	0.9	1	23	317	339	317	339	0.99
9	44	6.5e-06	0.00071	21.6	1.8	1	23	345	367	345	367	0.99
10	44	0.00041	0.045	15.9	0.7	1	23	373	395	373	395	0.97
11	44	0.0013	0.14	14.3	1.3	1	23	405	427	405	427	0.98
12	44	0.0027	0.29	13.3	0.8	1	23	436	459	436	459	0.93
13	44	2.8e-05	0.0031	19.6	0.8	1	23	464	486	464	486	0.98
14	44	0.0034	0.37	13.0	0.7	2	23	490	511	489	511	0.97
15	44	0.29	32	6.9	1.2	2	23	569	590	568	590	0.88
16	44	0.0091	0.99	11.7	0.4	3	23	599	619	598	619	0.98
17	44	3.5e-05	0.0038	19.3	4.2	1	23	625	647	625	647	0.98
18	44	4e-05	0.0043	19.1	0.5	1	23	653	675	653	675	0.99
19	44	0.00077	0.084	15.1	4.2	1	23	681	703	681	703	0.98
20	44	5.7e-05	0.0062	18.6	0.4	1	23	709	731	709	731	0.98
21	44	0.0051	0.56	12.5	1.9	1	23	739	761	739	761	0.98
22	44	0.026	2.9	10.2	0.3	2	21	768	787	767	788	0.95
23	44	0.00053	0.058	15.6	0.3	2	23	795	816	794	816	0.95
24	44	5.1e-05	0.0056	18.8	1.7	1	23	823	845	823	845	0.98
25	44	1.5	1.6e+02	4.7	4.3	2	20	880	898	879	901	0.88
26	44	0.0004	0.044	15.9	0.7	1	23	907	929	907	929	0.98
27	44	0.00033	0.036	16.2	3.6	3	23	937	956	936	956	0.97
28	44	1.8e-05	0.002	20.2	0.6	1	23	962	984	962	984	0.97
29	44	0.00022	0.024	16.7	0.8	1	23	990	1012	990	1012	0.98
30	44	0.00022	0.025	16.7	1.6	1	23	1018	1040	1018	1040	0.97
31	44	0.012	1.4	11.3	0.4	1	23	1046	1068	1046	1068	0.98
32	44	0.00048	0.053	15.7	0.3	1	23	1076	1098	1076	1098	0.98
33	44	0.044	4.8	9.5	1.7	1	21	1104	1124	1104	1125	0.95
34	44	0.0025	0.27	13.4	1.6	1	23	1132	1154	1132	1154	0.98
35	44	0.00049	0.054	15.7	0.1	3	23	1190	1210	1188	1210	0.97
36	44	0.099	11	8.4	0.4	2	23	1217	1237	1216	1237	0.95
37	44	8e-06	0.00087	21.3	1.5	2	23	1244	1265	1243	1265	0.97
38	44	5.2e-06	0.00057	21.9	0.8	1	23	1271	1293	1271	1293	0.98
39	44	1	1.1e+02	5.3	1.6	1	20	1299	1318	1299	1321	0.93
40	44	0.00036	0.039	16.1	1.3	1	23	1327	1349	1327	1349	0.98
41	44	0.02	2.2	10.6	5.8	1	23	1357	1379	1357	1379	0.98
42	44	1.1e-05	0.0012	20.8	2.2	1	23	1412	1434	1412	1434	0.97
43	44	0.63	69	5.9	3.5	1	23	1441	1463	1441	1463	0.83
44	44	0.031	3.4	10.0	1.7	3	23	1469	1490	1467	1490	0.95

Sequence Information

Coding Sequence: ATGGAGCAACCCGTGAGGGTAAAAACGGAACATATACCTATGGTAAAGTTGGAAACAAATATTTCAACGATAAAGGTAGAGGAAGCCATAATAGATGATCCTCTGGAAGAAGAAAACCGGCGTTTGGATGACGTGACAATTACTGCCCCACTGCTCAGCGGTCCAAGTGTTGTGAAGCTAGAACCCGCGGTTGATGTCCTCGCTGACGACGCCAATAAGTCCGGAACGTGTGGAACAGCAGCTTCCAGCTCCAgTAAAACAGATTTTCCGCTGGCCCAATTGGTGCCAACAGAGAGCGATTTATCCCTTGCTAAAAACCAAACCGCTGATTACAAATGCGTCATATGCGACAAACAACTTTCCGGGACAGGATATCTAGAGTTGCATATGCGTACGCACACTGGTGGTGGTCCCAAGCGGAAggtagaaaaggccaaaaagctTTACCAATGTGACATTTGCGGCAAGGAGGTAACCAGGAAAAGCGGTGCCGAACGGCATGCGCTGGTTCATTCCGGAGAACGGCCACACAAATGCAGCGTCTGCGGAAAAACGTTCTCCGGCAAATATTACCTTCAGGCCCATATGCGAATGCACAACGGTGAACAAAAGCACAAATGCGAGACTTGTGGCGAGGGATTCTTCGCGAGGAAATCCCTTGAACAGCACATATATACCCACACGGGCGAGCGGCCCTACAAGTGCGAAACGTGTAACAAATCGTTCAAGCAAGAATTCTACTATAAGTTACACGTCCGTATGCATGCTGGAGACGCGTTGTACAGGTGTGATGTTTGTGGCAAAGCGTTCACCGGTAAGAGTCCTTTGGAGATTCACAAATTAAGTCACACCGGCGAAAGGCCTTATAAATGTGATATTTGTGGGAAGGATTACACTCGCGAGGATACACTAAAGTACCATGTACGTCTGCATTCAAGCGAAGACGTCTTTAAATGCGATGTTTGTGGCAAAGGATTTCAaataagcagacagtatgaaAGGCATATCAAAACTCACTCCCAAGATCGGCCCTTCAAGTGTGAGTTTTGTGGAAAAGGCTTTCGTGACAGTTATTTACTTGTTTATCACAGACGCACTCACACCGGAGAACGACCCCATAAATGTGAGAACTGTGGTAAAGGGTTCATCACGGCCGATCGGCTTAGAATGCATAAAGCGGTTCACGATGTAGAGCTGCCCGGTGAAAAACCGTACAAATGTCTAGTTTGCAAAGCCCAATTCACGCTGAAGAGTAACCTTCAAACGCACGAAAAATTACACCTTGCGGATGAGGATGGACGAAGCTACCGGTGCTACATATGTGGTCAGCAGTGTCCTACCCAAGAGGCCCTTAAGCAGCACCGCGCAGCCACGCATACCGATCGACCGTATAAGTGCGACACCTGCGGTAAAACCTTCGTCCAGCAGGGAATACTGAGGAAACATCTGTTACGCCATACTGCACAGAAATGTCCGCTCTGCGATCTCTTGTGTGCTTCCGCGGACAGTTTGAAACAGCACATGAAGGAGCACACCGGCAAAAGGCGGAAAAAGCAATCAGTCAAGCGGGTGGCGAACGATGCGGTCGATGTGAAACCATTCCTACCGGTTGGTAGCCATCAAAGTACGACGATCTGTTCAGCGGAGGACAACGATGTTAAAGCATGGCCATTAGAGCTACCGAAAGCCAACGAACCGAAGAAGCAGTGCGACATATGCGGCAAGTTCTATTCGGACGATCACTATTTCGCTTTTCACTTGGCCTCACACGCTGGGCAGGTACAGGGGAACATTTGCGAGATTTGCGACAAAGGGTTCCCCTGCAAAAGTGTTCTTGATGCGCACATGCGATCCCACACCGGCAAGCGGCCGTTTCAGTGTGATATATGTAACAAAAAATTCAGCAGAGCAAACTGCTTGAAGAAGCATAGAGCGAGTCACACAGAGGAGAAGAACTTCAAATGTATGATATGTGACAAAGAATTTTTCATCGAAGCACAATTAGTAAGACACATGAGAACGCATACCTCGGATCGTCCGTTTAAGTGCACAGTTTGCGGAAAAGGTTTCCAGCACAGCTATTTGGTTACAAACCATATGCTTCATCACAGTGAATCGCGAACGTTCACATGTGACGTTTGCGGATCATCGTTTAAGTCCGCCAGTGCTCTTGGCTCGCACAGAAGAAAACATACGAGCAGTGGGCAGATTATGTTTAAATGCGACAAGTGCGATGCGCAGTTTACTACCCGTGGTAGTCTTACTTTTCATCGCAAAGTTCACTTGGAGGAACAGTCAGTCAAATGTTTTCATTGTGAAATAGAATTTCCCTCATCGGAGAGCCTACATGCACACGTACGTGACCTGCAAAGTAATCCCCTACGGTGTTTGGTATGTGGGGAAACGTTCCGCTTCAAAAGAAAACTGCGGGCTCATGTAGCTGTTCACGACAGTGAGGAAAAACCATACCAATGTGCGATCTGCAACTGTAGATTCCAAAGGGCTAGTAATCTTAAAATTCACGTCAAAATTCACTACGGTGAGCGTTCGCACGAGTGCGAACTCTATGCAGGAAATTTGAGGACTGAAACTGCGATTGACGAAGGTGGTCCGAGTGGCAGCAGCGGAGCAGCGATCCACTGTGACATTTGCGGCAATAACTATAAGAGCAGGAGAACATTCCGCAAACATTGCGAAATTCATAAACGAACTCATCGGTACCGGTGTGACATTTGCAACAAAGATTACTCAGCGGAGGAAACGTTGACGCGTCATAAAAAAATTCACACCAGCAAGCAGGACAAGCACTGTAATATTTGTGGGAAGTCTTTCACCACCAATAACCTGGCGAGGCACAAAAGGACCCACAGCGCTGAGCGACTTTTCGAGTGTGAAATTTGTGGTAAAAGTTTCAAAACTGTCTACACATTGGAGTACCACAAGTTGGTCCATACAACCGACAAACAGTTCAAATGTGACTTATGTGATAGGGCTTTCTTCAGGAAAATACTACTGATACAGCATGGAAAAACACACAACCCGGAGCGTCCGTATAAATGCCTGatttgtggaaaaggatttgTATTTAAGCAATTGCTTGCAAACCACATGTACCATCACAGCAACGAGCGACCGTTCGTGTGCGACATCTGTGGCTCATCGTACAAGTCCGGTCCCGATCTGCATGTTCACAAAAAAATCCACACGTACCTCGAGCCGAAACCGTTCAAGTGCGATATGTGCGATGCAAAATATGCCTACGAGGGTAATCTGCGGGCTCATAAAAAGGTACACTCGGAAGAACGACCGTACAAATGTAATGATTGTAAGTCGGAATTTGGCTCGCACGAGAATTTAGCAGAACATCTGTGTCAGATGCGCAAAGATCGACCTTACAAGTGTACGATTTGTGAGAAAGCTTTTCTCACGGATAGACATCTGCAGACGCATCAGATCGTGCACAACGATGAGCAACCATTTCAATGCTCGATCTGCGAGCGACGCGATGCGGATGAATCGAAGACGGAGGAAGCTGTAGACGGTCGTGCTCGTAAGCCAAGGTACGGCTGTGAGATTTGCGGAAGGGAATACGCACGTAAGAAAGCGCTATACAGACATCTTGATGTTCATTCTACCGAAAAAAGGCTGCAGTGTGATATTTGCGGAAAGTACTTGGTCAACAAAAACATGGCGAGGCACAAAAGAATACACAGTGAGAAACGGTTATTGGAGTGCGAAATATGTAGCAAAACCTTCTCATCGAAAAGCAAACTGGAAAGCCATAAAAATACTCACACGAAAGAAAAACCATTCGAATGTGAAGTATGTGGAAAAGTTTATTTCAGAAAGGAACACCTAGTGGCTCATGTAAAAACTCATAACCCGGAACGTCCGCATGAATGCTCTACATGCGGGAGAGGGTTCCTAATTTTACAGCAACTAGAGAGACACATGGCTTGTCACAAGACCGAGCGACCGTTTAAGTGCGACGTCTGTGGCTTATCGTACAAAGCAAAAGGTAATCTGTACACTCACAAGAAGAGACACGCGAGTCCCGACCGAAAACGATTCAAGTGCGATGAATGCGGTTTTAGATATCAACATCGATGTAGTCTCAAGGTTCACCTGGAGAAACACTTGAAAGAACGACAATTCGAATGTATTCATTGTAAAGAAGAATTTCTTTCACGTGATAGTCGCAATCACCACAGTCGAACGTGCAAGGATCGACCATTCAATTGTCCGACATGTGGGAAAGCTTTTATGTCCAAGAGAAACCTTCAACATCATGCCAAAATGCACAGTGATTCTAAATTCGTGCACCCGTGTTCGATCTGCGATAAAAGCTTCAAGTGGGAACATACTCTTGCTTGTCACATGGAACTGCACACTGGTTCGTTTGGGTGCGAATTTTGCGATCGTCGCTTCCGGCGGAAGAATGAAGCAGCTAAGCATTTTAATCGTTACCATAAGCAGGGGCAACAACTCTCGATAGCCGAGCCGACTTTGAACTAA
Protein Sequence: MEQPVRVKTEHIPMVKLETNISTIKVEEAIIDDPLEEENRRLDDVTITAPLLSGPSVVKLEPAVDVLADDANKSGTCGTAASSSSKTDFPLAQLVPTESDLSLAKNQTADYKCVICDKQLSGTGYLELHMRTHTGGGPKRKVEKAKKLYQCDICGKEVTRKSGAERHALVHSGERPHKCSVCGKTFSGKYYLQAHMRMHNGEQKHKCETCGEGFFARKSLEQHIYTHTGERPYKCETCNKSFKQEFYYKLHVRMHAGDALYRCDVCGKAFTGKSPLEIHKLSHTGERPYKCDICGKDYTREDTLKYHVRLHSSEDVFKCDVCGKGFQISRQYERHIKTHSQDRPFKCEFCGKGFRDSYLLVYHRRTHTGERPHKCENCGKGFITADRLRMHKAVHDVELPGEKPYKCLVCKAQFTLKSNLQTHEKLHLADEDGRSYRCYICGQQCPTQEALKQHRAATHTDRPYKCDTCGKTFVQQGILRKHLLRHTAQKCPLCDLLCASADSLKQHMKEHTGKRRKKQSVKRVANDAVDVKPFLPVGSHQSTTICSAEDNDVKAWPLELPKANEPKKQCDICGKFYSDDHYFAFHLASHAGQVQGNICEICDKGFPCKSVLDAHMRSHTGKRPFQCDICNKKFSRANCLKKHRASHTEEKNFKCMICDKEFFIEAQLVRHMRTHTSDRPFKCTVCGKGFQHSYLVTNHMLHHSESRTFTCDVCGSSFKSASALGSHRRKHTSSGQIMFKCDKCDAQFTTRGSLTFHRKVHLEEQSVKCFHCEIEFPSSESLHAHVRDLQSNPLRCLVCGETFRFKRKLRAHVAVHDSEEKPYQCAICNCRFQRASNLKIHVKIHYGERSHECELYAGNLRTETAIDEGGPSGSSGAAIHCDICGNNYKSRRTFRKHCEIHKRTHRYRCDICNKDYSAEETLTRHKKIHTSKQDKHCNICGKSFTTNNLARHKRTHSAERLFECEICGKSFKTVYTLEYHKLVHTTDKQFKCDLCDRAFFRKILLIQHGKTHNPERPYKCLICGKGFVFKQLLANHMYHHSNERPFVCDICGSSYKSGPDLHVHKKIHTYLEPKPFKCDMCDAKYAYEGNLRAHKKVHSEERPYKCNDCKSEFGSHENLAEHLCQMRKDRPYKCTICEKAFLTDRHLQTHQIVHNDEQPFQCSICERRDADESKTEEAVDGRARKPRYGCEICGREYARKKALYRHLDVHSTEKRLQCDICGKYLVNKNMARHKRIHSEKRLLECEICSKTFSSKSKLESHKNTHTKEKPFECEVCGKVYFRKEHLVAHVKTHNPERPHECSTCGRGFLILQQLERHMACHKTERPFKCDVCGLSYKAKGNLYTHKKRHASPDRKRFKCDECGFRYQHRCSLKVHLEKHLKERQFECIHCKEEFLSRDSRNHHSRTCKDRPFNCPTCGKAFMSKRNLQHHAKMHSDSKFVHPCSICDKSFKWEHTLACHMELHTGSFGCEFCDRRFRRKNEAAKHFNRYHKQGQQLSIAEPTLN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -