Basic Information

Insect: Marronus borbonicus
Gene Symbol: -
Assembly: GCA_902655005.1
Location: LR737382.1:15271792-15283615[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2.5e-05 0.002 18.5 3.2 1 23 113 135 113 135 0.98

2 28 0.00012 0.0095 16.4 4.6 1 23 141 163 141 163 0.98

3 28 1.8e-06 0.00015 22.1 5.7 1 23 168 190 168 190 0.99

4 28 0.0014 0.12 13.0 0.3 3 23 198 219 196 219 0.96

5 28 0.0005 0.041 14.4 0.2 1 23 224 246 224 246 0.97

6 28 3.9 3.2e+02 2.2 1.3 1 10 256 265 256 265 0.91

7 28 0.0023 0.19 12.4 0.2 2 23 343 364 342 364 0.87

8 28 0.54 45 4.9 4.7 1 23 370 392 370 392 0.97

9 28 0.0043 0.36 11.5 1.8 1 23 398 420 398 420 0.90

10 28 0.00022 0.018 15.5 3.4 1 23 426 449 426 449 0.98

11 28 2.6e-05 0.0022 18.5 3.7 1 23 461 484 461 484 0.96

12 28 0.4 33 5.3 0.4 3 23 496 516 495 516 0.94

13 28 0.00083 0.068 13.7 0.3 1 23 522 544 522 544 0.97

14 28 1.3e-06 0.00011 22.5 0.8 1 23 550 572 550 572 0.99

15 28 5.1 4.2e+02 1.8 0.0 3 10 682 689 681 692 0.87

16 28 0.39 32 5.3 1.3 1 23 763 787 763 787 0.96

17 28 3.2 2.6e+02 2.5 0.8 1 17 814 830 814 836 0.75

18 28 0.27 22 5.8 0.1 1 12 869 880 869 883 0.90

19 28 4.5e-05 0.0037 17.7 2.2 1 23 994 1016 994 1016 0.97

20 28 0.045 3.7 8.3 0.3 1 23 1020 1042 1020 1042 0.91

21 28 3.8 3.1e+02 2.2 1.3 1 23 1048 1071 1048 1071 0.92

22 28 0.1 8.6 7.1 0.7 1 19 1077 1095 1077 1099 0.92

23 28 0.00075 0.062 13.9 1.7 1 23 1105 1128 1105 1128 0.97

24 28 0.004 0.33 11.6 6.2 1 23 1139 1161 1139 1161 0.97

25 28 0.0036 0.3 11.7 0.6 3 23 1168 1188 1167 1188 0.97

26 28 0.0023 0.19 12.3 2.6 1 23 1194 1216 1194 1216 0.97

27 28 3.3e-07 2.7e-05 24.4 1.6 1 23 1222 1244 1222 1244 0.98

28 28 0.002 0.16 12.5 0.2 1 22 1250 1271 1250 1271 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2.5e-05	0.002	18.5	3.2	1	23	113	135	113	135	0.98
2	28	0.00012	0.0095	16.4	4.6	1	23	141	163	141	163	0.98
3	28	1.8e-06	0.00015	22.1	5.7	1	23	168	190	168	190	0.99
4	28	0.0014	0.12	13.0	0.3	3	23	198	219	196	219	0.96
5	28	0.0005	0.041	14.4	0.2	1	23	224	246	224	246	0.97
6	28	3.9	3.2e+02	2.2	1.3	1	10	256	265	256	265	0.91
7	28	0.0023	0.19	12.4	0.2	2	23	343	364	342	364	0.87
8	28	0.54	45	4.9	4.7	1	23	370	392	370	392	0.97
9	28	0.0043	0.36	11.5	1.8	1	23	398	420	398	420	0.90
10	28	0.00022	0.018	15.5	3.4	1	23	426	449	426	449	0.98
11	28	2.6e-05	0.0022	18.5	3.7	1	23	461	484	461	484	0.96
12	28	0.4	33	5.3	0.4	3	23	496	516	495	516	0.94
13	28	0.00083	0.068	13.7	0.3	1	23	522	544	522	544	0.97
14	28	1.3e-06	0.00011	22.5	0.8	1	23	550	572	550	572	0.99
15	28	5.1	4.2e+02	1.8	0.0	3	10	682	689	681	692	0.87
16	28	0.39	32	5.3	1.3	1	23	763	787	763	787	0.96
17	28	3.2	2.6e+02	2.5	0.8	1	17	814	830	814	836	0.75
18	28	0.27	22	5.8	0.1	1	12	869	880	869	883	0.90
19	28	4.5e-05	0.0037	17.7	2.2	1	23	994	1016	994	1016	0.97
20	28	0.045	3.7	8.3	0.3	1	23	1020	1042	1020	1042	0.91
21	28	3.8	3.1e+02	2.2	1.3	1	23	1048	1071	1048	1071	0.92
22	28	0.1	8.6	7.1	0.7	1	19	1077	1095	1077	1099	0.92
23	28	0.00075	0.062	13.9	1.7	1	23	1105	1128	1105	1128	0.97
24	28	0.004	0.33	11.6	6.2	1	23	1139	1161	1139	1161	0.97
25	28	0.0036	0.3	11.7	0.6	3	23	1168	1188	1167	1188	0.97
26	28	0.0023	0.19	12.3	2.6	1	23	1194	1216	1194	1216	0.97
27	28	3.3e-07	2.7e-05	24.4	1.6	1	23	1222	1244	1222	1244	0.98
28	28	0.002	0.16	12.5	0.2	1	22	1250	1271	1250	1271	0.94

Sequence Information

Coding Sequence: ATGATGAAGAACGCTCCAGATCTACCCGATAATAACCTCTTGGAAAACGCCGTGGCTCAATTGAACGACTCCGATGCTGACCTATTAAACCTGCTGGCTGCAGAAGAAGATATTTTACGAGATATAACGGAAAACGAGCAATTTGAGCAGCTAATCAACAATACGGTGATAGGAAATGGCGCTGAGTACAATATGGAAGGTGCTAATTTAACGGAAAATATCGGGGAATTGATCAAAATCAAGGAGAATGATCTATCGCAGCTCTGCGATGAAGTTAAGAATCTCGATACGATAGAACAGGTTGATAATTCACTGAAAATTGAGAATTTCGACGAATTTAAGTGTACCTATTGCGAGAAGGTATGTCCCAcgaagaaattgttgaaaaatcaCTTGATGATTCATACAGGATTGAGACCCTTCTCCTGCGATATTTGCAAGAAGACTTTCCGGCATAATTACGAAGTTAAAGTACATAAAAAGTCCCACAATCAGCCTTCATTTCAATgtgatatctgttctaagatgTTCATCCACAAATCGCATCTGACGGCCCATAGAAGGAAACATCTCGGAGATTTCGCTGTGATATGCGATCTCTGCGATAAAGGCTTCCTAACGCAATCCAGTTATAATCAACATATTAAGGTTAAGCATGACAAAATTATGCATGTTTGCGAAATCTGCGGGGCTAAATTGAGCACCTTATCCGCCCTCAACGAACACAAGTTAACCCATCAGCCCCATTATCACGAAAAACGCAGCCACGTCTGCGAGTTCTGCGGGAAAAGTTATCTTAGCGTAAGattaaaATGCGACAGGCAGAAGCAAACAAACGCAAGTAATAGTAATGCCACCAACGATTGGGATGTTCAGATCAAATTCGAACCTCCCGAGAATTATCAAGATTACAACGATGACGCCTCGTTAAATAGTTACGATCCTGAGGATGATGAAGCTCTATTGACGAGATTGAAACGTGTGAGGGATAAAGAGAAAGCGCTGAAGATGAAATCAACCGCTATTCAGTGCGAAGTTTGCGATAAAACGTTTAAGAACAGCATGGACTTCGGACTGCATTCTATAGCGCATAGTACCGATAAGAAATATCATTGTTTCATGTGTAAGTATAGCAGCGGTTCCTTGTATCACTTCGAGATGCATATCAAAGCCCACGAAGGTAATACCAAGTACAAATGCGAGATCTGCAACAAGGCGTTCACAGTGAGCACCCATGCCGCCGAGCATAAATATTTCCACAGCGGGGAGAAGCCTTTCCAATGCGAGATCTGCGGAAAACACTTCATGTTCTCGTGGTTCCTAACGTCGCATCGTAGATCTCAACATTGGGAGATCATGACCGGCACTCCCTTGATCAAATACGATTGTACGATATGCAATAAGCATTATACCTCATCTTCGGGCTTGAAAAGGCATCAAACCAGCAAGCATTTCGATACGGAAAAGGCCGAAGTGTCGGTTTTATGTGATATCTGCGGGAAAAGACTTGCCAGCATGGAGAAGTTAAAGTTCCACAATCGGATTCACACCGGCTATAAGCCTTTCGCTTGTGCGTTCTGCGCCAAAGCATTCTCCAGGAAGGAACAAGTTAAAGAACATGAAAGGGTTCACACGGGCGAGAAGCCTTACGTTTGCAAGTTTTGCGGGAAGGGCTTTACGCAAAGGAGTCCTTTGAGGATACACGAAAGGACCCATACAGGTGAACGGCCTTATACGTGCAGGTCCCTTTCTCGATGCTATAAACCGGTCTTAAACCCCAAGGAAGTCCCGATTACACCTTCACAATCTAAAAGATCAACACGAAATTCCCCCAAAGTACAAAAAGTGGAGAAAAACGCAATTGATCCCAAAACAAGCAACTCTGAACCCGCATTGCAACCGGTCGAAATAAAAGTGGAAGCGATAGACGTCGAAGCTACTGAAGTTATAACCGAAACCTTCACGGAAGAGAACgcgaagaagaaaagaaatccaTCGAGGAAATTAACCGATAAGCAGTTGGCCATGGATGTTAGGGTACTGTGCGATATCTGCGGGAAAAGCCTCGCTAGCATCGAGAGGCAGATGTTAACAAGAAAAAGTGATAGAAAATTCGACGTCTCCGCGAAGGAAGCTAACAATTTCGCTCAATCTACAACAGACAATACCTCAAGACCCCTATTAGAACATATAGAAGTAAAACTTGAATCGGCTGATGAGGATTCCGACGAAGATACGCAGATCAAAGCGGagataataaacaacaaattaggAGAACGACGAACTTTCGTCTGCcacatttgcaaaaattacGCCCTGATGACCTTAAGCGAGTTCCAAAATCACCAGGAAACTCTGCATAAAAGTATGAACCTCGCGAAACAAGAGATCGCCTTCAAAAGCTCCCCGAATCAGCGCGTCATATCTCGTGGGAGTAAGTACCATTGCCAGCAATGCGGCGCAAATTTTCAGCAGGCTCTACAGTACGTTTTCCACGAGAGAGCGCATTCTCCTAGCAATGCTCTCCGCTGTTTGGATTGCGATTTCACCACGCAATATGTgatcgaaattaaaaatcatttgagGGCGACGACCGCGGTGAAATACATCTGTGAGATATGTGATATGACCTTTAGGTACCTCCCTGAATGTTTTACACCAATCGTCACCATTAAGGAAGGGACAGCCGGTACCTCTTCGAAGACGCGAGGTAGAAAGTCGAAACCTACCCGTaacattggaaataaaaaggagaCCGAGGAAAATGTACCGAAATCCAATGAGAAAACCGAACCAGAAGATCTCCTGGTTGAAATCAAAACAGAGGTTGTAGATGACGATCAAATCGAAGAGCCAACCTTTAAATGTCGCGTCTGCAAGAATAACAAACAAATGTGTTTGGACGAGTTCAAAGCCCATTATAAAACCTTTCATAAGGATAAGAGGTTGCCTAGGGCTGCCAGGACACCGTTGGTGATGCATTCGTGCGATGTCTGTTCGAAGAATTTCAAATCTGTAAAGAACCTGAACGAGCATATGGACACTCATAATAATCAGTACGATTGCGAGGACTGCAATGAGAGTTTTAAGAAAATCCTACCGTACGTTTTGCATAAACGGATCCATTCTATAGACGATTTATTCAGATGTATGTTCTGCGATTATGCCACGGAGCATGTGAACGATATCACCAGCCATTTGAGCCTTAAGCACGAGACTAATCATCGCTACATATGCAAGGTGTGCAATAAGGGATTTGACGTGCTTACGTGGTTCAAGGAACATGATAATTTCCACAGTGGAACGAAGCCGTTTAAATGCGGATATTGCGGAAAAAGTTTTTTATACTCCAGATATCTTTCTGCCCATAAAAATAGCATGCACAAAGAAGAAATGACCGGGGTCTCTAGCATTCACGAATGCGTTATCTGTCATAAGCAGTACCAACACAAGAATAGTCTTAAATTACACATGAATGTTCATACGGGAAATTTCGCCATTTGCGACATCTGCGGAAAGCAGCTTTCCAGCAAGGAGAAGCTGAAATTCCATCTAAGGATCCATACGGGTTACAAGCCTTTTAAGTGCAGTTACTGCGAGAAATGCTTCACCAAGAAGCCGATATTAGTGGAACATGAAAGGATCCACACCGGAGAGAGGCCTTACGATTGCGAATATTGCCATAAGGCGTTCTCGCAGCGTTCTAGTTTGGTGATTCATATCCGTAGCCACACTGGGGAGAAACCGTACGTTTGCCACGTCTGTAACAAAGGATTCGTGGCTAGGGCAATGTTGAATATCCATTTTAAAACTTGCAAAGGTTACTAG
Protein Sequence: MMKNAPDLPDNNLLENAVAQLNDSDADLLNLLAAEEDILRDITENEQFEQLINNTVIGNGAEYNMEGANLTENIGELIKIKENDLSQLCDEVKNLDTIEQVDNSLKIENFDEFKCTYCEKVCPTKKLLKNHLMIHTGLRPFSCDICKKTFRHNYEVKVHKKSHNQPSFQCDICSKMFIHKSHLTAHRRKHLGDFAVICDLCDKGFLTQSSYNQHIKVKHDKIMHVCEICGAKLSTLSALNEHKLTHQPHYHEKRSHVCEFCGKSYLSVRLKCDRQKQTNASNSNATNDWDVQIKFEPPENYQDYNDDASLNSYDPEDDEALLTRLKRVRDKEKALKMKSTAIQCEVCDKTFKNSMDFGLHSIAHSTDKKYHCFMCKYSSGSLYHFEMHIKAHEGNTKYKCEICNKAFTVSTHAAEHKYFHSGEKPFQCEICGKHFMFSWFLTSHRRSQHWEIMTGTPLIKYDCTICNKHYTSSSGLKRHQTSKHFDTEKAEVSVLCDICGKRLASMEKLKFHNRIHTGYKPFACAFCAKAFSRKEQVKEHERVHTGEKPYVCKFCGKGFTQRSPLRIHERTHTGERPYTCRSLSRCYKPVLNPKEVPITPSQSKRSTRNSPKVQKVEKNAIDPKTSNSEPALQPVEIKVEAIDVEATEVITETFTEENAKKKRNPSRKLTDKQLAMDVRVLCDICGKSLASIERQMLTRKSDRKFDVSAKEANNFAQSTTDNTSRPLLEHIEVKLESADEDSDEDTQIKAEIINNKLGERRTFVCHICKNYALMTLSEFQNHQETLHKSMNLAKQEIAFKSSPNQRVISRGSKYHCQQCGANFQQALQYVFHERAHSPSNALRCLDCDFTTQYVIEIKNHLRATTAVKYICEICDMTFRYLPECFTPIVTIKEGTAGTSSKTRGRKSKPTRNIGNKKETEENVPKSNEKTEPEDLLVEIKTEVVDDDQIEEPTFKCRVCKNNKQMCLDEFKAHYKTFHKDKRLPRAARTPLVMHSCDVCSKNFKSVKNLNEHMDTHNNQYDCEDCNESFKKILPYVLHKRIHSIDDLFRCMFCDYATEHVNDITSHLSLKHETNHRYICKVCNKGFDVLTWFKEHDNFHSGTKPFKCGYCGKSFLYSRYLSAHKNSMHKEEMTGVSSIHECVICHKQYQHKNSLKLHMNVHTGNFAICDICGKQLSSKEKLKFHLRIHTGYKPFKCSYCEKCFTKKPILVEHERIHTGERPYDCEYCHKAFSQRSSLVIHIRSHTGEKPYVCHVCNKGFVARAMLNIHFKTCKGY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -