Basic Information

Insect: Bhutanitis thaidina
Gene Symbol: -
Assembly: GCA_029286595.1
Location: JAGSMS010000040.1:1590323-1597386[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.62 40 5.1 0.6 1 23 83 106 83 106 0.89

2 29 0.16 11 6.9 0.6 2 23 133 154 132 155 0.94

3 29 1.3 86 4.1 5.4 2 23 178 199 177 199 0.96

4 29 6.1 3.9e+02 2.0 3.5 1 23 203 225 203 225 0.96

5 29 0.21 13 6.6 2.8 1 23 230 253 230 253 0.91

6 29 0.0031 0.2 12.4 3.4 2 23 261 283 260 283 0.94

7 29 0.0014 0.09 13.5 1.6 2 23 291 313 290 313 0.96

8 29 0.028 1.8 9.4 4.5 1 23 319 341 319 341 0.91

9 29 0.0032 0.21 12.3 1.2 1 23 347 369 347 369 0.98

10 29 6.3e-05 0.0041 17.7 0.1 1 23 375 398 375 398 0.97

11 29 0.38 24 5.8 1.4 1 23 471 494 471 494 0.95

12 29 0.014 0.9 10.3 0.1 2 23 521 543 520 543 0.95

13 29 2.3 1.5e+02 3.3 5.2 2 23 566 587 565 587 0.96

14 29 0.18 12 6.8 1.0 1 19 591 609 591 613 0.88

15 29 0.0082 0.53 11.0 1.0 1 23 618 641 618 641 0.96

16 29 0.0088 0.57 10.9 1.6 1 23 647 670 647 670 0.95

17 29 0.0073 0.47 11.2 0.7 2 23 678 700 677 700 0.96

18 29 0.0045 0.29 11.9 1.7 1 23 706 728 706 728 0.97

19 29 2.4e-05 0.0015 19.0 0.9 1 23 734 757 734 757 0.98

20 29 0.0015 0.098 13.3 0.3 3 23 832 853 830 853 0.89

21 29 0.023 1.5 9.6 0.9 2 23 879 901 877 901 0.92

22 29 0.0026 0.17 12.6 0.8 2 23 924 945 923 945 0.96

23 29 0.008 0.52 11.1 2.3 1 23 949 971 949 971 0.98

24 29 0.043 2.8 8.8 5.5 1 23 976 999 976 999 0.92

25 29 0.84 54 4.7 1.4 2 23 1007 1029 1006 1029 0.82

26 29 0.001 0.066 13.9 1.2 2 23 1037 1059 1036 1059 0.95

27 29 0.031 2 9.2 8.0 1 23 1065 1087 1065 1087 0.96

28 29 5.9e-06 0.00038 20.9 1.3 1 23 1093 1115 1093 1115 0.99

29 29 0.00029 0.019 15.6 4.4 1 23 1121 1144 1121 1144 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.62	40	5.1	0.6	1	23	83	106	83	106	0.89
2	29	0.16	11	6.9	0.6	2	23	133	154	132	155	0.94
3	29	1.3	86	4.1	5.4	2	23	178	199	177	199	0.96
4	29	6.1	3.9e+02	2.0	3.5	1	23	203	225	203	225	0.96
5	29	0.21	13	6.6	2.8	1	23	230	253	230	253	0.91
6	29	0.0031	0.2	12.4	3.4	2	23	261	283	260	283	0.94
7	29	0.0014	0.09	13.5	1.6	2	23	291	313	290	313	0.96
8	29	0.028	1.8	9.4	4.5	1	23	319	341	319	341	0.91
9	29	0.0032	0.21	12.3	1.2	1	23	347	369	347	369	0.98
10	29	6.3e-05	0.0041	17.7	0.1	1	23	375	398	375	398	0.97
11	29	0.38	24	5.8	1.4	1	23	471	494	471	494	0.95
12	29	0.014	0.9	10.3	0.1	2	23	521	543	520	543	0.95
13	29	2.3	1.5e+02	3.3	5.2	2	23	566	587	565	587	0.96
14	29	0.18	12	6.8	1.0	1	19	591	609	591	613	0.88
15	29	0.0082	0.53	11.0	1.0	1	23	618	641	618	641	0.96
16	29	0.0088	0.57	10.9	1.6	1	23	647	670	647	670	0.95
17	29	0.0073	0.47	11.2	0.7	2	23	678	700	677	700	0.96
18	29	0.0045	0.29	11.9	1.7	1	23	706	728	706	728	0.97
19	29	2.4e-05	0.0015	19.0	0.9	1	23	734	757	734	757	0.98
20	29	0.0015	0.098	13.3	0.3	3	23	832	853	830	853	0.89
21	29	0.023	1.5	9.6	0.9	2	23	879	901	877	901	0.92
22	29	0.0026	0.17	12.6	0.8	2	23	924	945	923	945	0.96
23	29	0.008	0.52	11.1	2.3	1	23	949	971	949	971	0.98
24	29	0.043	2.8	8.8	5.5	1	23	976	999	976	999	0.92
25	29	0.84	54	4.7	1.4	2	23	1007	1029	1006	1029	0.82
26	29	0.001	0.066	13.9	1.2	2	23	1037	1059	1036	1059	0.95
27	29	0.031	2	9.2	8.0	1	23	1065	1087	1065	1087	0.96
28	29	5.9e-06	0.00038	20.9	1.3	1	23	1093	1115	1093	1115	0.99
29	29	0.00029	0.019	15.6	4.4	1	23	1121	1144	1121	1144	0.98

Sequence Information

Coding Sequence: ATGGGTTCCATGTCTTTGGAATCAACAAGATGTAATGGTGTAGGTGTTTCAAGATCAATATTAGAAACAGTggaaaatatagataaaattaacCCTGTGAAGGAAACGGAAATTAAACGAGAACAGCGAGTTCCTAAAGAACAGGTACTTAGAAGAGGAACAGAAATCGAGAAGCATCGAGCGAATATAGACCAGATATTGAATAATTCGAATGCTACGCCGATCAGGCGTCGAGGTAGCATCGGTTACGCGTGCTGTTTCTGCAGCAATCAATATGCCAACCCCGCGGAACTAAAACAACACAGTATAGAAGAGCACGAGAATATTAACGAAACGATATACATGAAACGTAAAGATATGCACAAGTTCAACATTAAAATGGACATCACAGATCTTCGTTGCAAATTGTGCGATATGAACATAGAGACAATAGAACTCTTGTTGCAGCACTTGAGAGAACATCATAAGAAGAAAGTGTTCACCGATATCAAGATTCAGCTGATACCGTTCAAATTTGAAAGCGACGTTCTGAAGTGTTGCGTTTGTTGTAAAGTCTACTCCAAATTCCAATCTCTTCAGCTACATATGAATGAGCATTACAGTAACTATACATGCAACGAGTGCGCAGCGGGCTTCGTGTGTCAGGCGCAGCTCCACGAGCACTCTCACACCCACAAATTGGGAACTTTCAGCTGCGACTTCTGCACGAAAGTGTTCAATACGTTCCGTAAAAAACGAAGTCACGAAAAGGGCGTTCATTCGCAAACCGAACTGAAGAATAAATGTTCCTACTGTGAGAAGAAATTCAAACACTACAGACAGAAGGAGAGGCATATGGCCGAGGCGCACAAGAAGTCTTTCCCGCCACAGAAGTGTCAAGCGTGCGATAAGACATTCTTCACCCAGAACAGTTTAAGCATACACGTGAAGAGATACCACTTGGTTCAGCGACCGCACAAATGTCCACATTGTGATAAGCATTTCTTCTCCATGGCCGAGGTCAGAACACACTTACCGACACACACGGGATTGAGAAATTTCGAATGCGATATATGTCATAAGACGTACGGCTTGAGGAAAATTCTTAACGAGCACATGCGCATACACACGAATGACAGACGTTATAAATGCGAGCTCTGCGGACAGGCCTTCATACAGTGGAACACGTGGCGCGGGCATATGCGCGCGAAGCATGGTTTACCGCGTACCAAAATAACTAAACTCAAAAGTCAGAACGCAAACGAAACAAAACTCGCGGACAAGGAGCACGTGTGTCAAAAAACTCCTGTAAAGAAATCCGATGAACCCAAAACGAAACACGGTGAAGAATTGGAAAAACATCGTATAAATATTAGAGAGATATTGTTGTGGTCGAACGCTACTCCCATCAGATGCAAAGGCGGTATAGGTTACGCGTGCTGCTTCTGTACTGATCAATATCCAGACCCAAATGACTTGAAGAGGCATACCTTAAAAGATCACGACAGCATTGCCACATCCACATTCATGAAAGGGAGAGACCTACACGGCTATTTTGTAAAGCTTGACATAACGGCACTCAGCTGCAACATTTGCAATATATCCATCGAAACCTTGGAACAATTAATGGTACATCTAAAGAATATTCATGACAAAAACATAGATCTCAATATAAAGAATCATATAATACCGTTTAAATTCGATACGCAAACTCTTCAGTGCTGCATTTGCCTAAACGCTTTCCACAAGTTCCACGCGCTTCAAGTACACATGAACAATCATTGCAGGAACTATGTGTGTGACGTGTGTGACGCGGGGTTTGTGAACAGGCATATGTTGCGTTGCCACAACGACGGGCATAAGATCGGAAGCTTCTCCTGCGAGCAGTGCACCAAAGTATTCAAAACGATCCGCTTGAGGAAACTGCACGAGCGGATCGTGCACTGTTCAACGATGCCGCACAAGTGCGGTTACTGCAACGAAAGGTTTAAAGAGAACTGGAATAAGAATGAGCATCTGGCTAGGGTGCACGGTGTACGCGGGCCGGGGGTGAAGTGTCAAGCTTGCGACAAGACCTTCGAATCTCAGCAGAGGTGGTTGCTACATATGAAAAGGGATCACTTAATGCAAAGACAGCACAAATGCGTTAGATGTGAAAAGTCGTTTTATGCGAAACGTGAACTCGCAGATCATATGGTGAAACACACCGGTTCGAGAGAGTTTCAGTGCGAAGTATGTACAAAGGCGTACGGGCGTTTGAAGACGTTGAAAGAACACATGCGACGGTTGCACCCCAATGACGACAGATTCAAGTGCCTTCATTGCGGTGTGAGAAGAGTAATCAAAATAGAAACGAGACAGGCTAAACCAGTGGAATTGAAGTTTATATCCAAGACAAAGGCTCGAAGTAGCACGATCCTCTCTGAGGCCAAGAAAAACCAACACAATCTGAGCATCATCTTACTCAATTCCAACGCAAATCCAATTAGATGTAAAGACAGCCTTGGATACGGCTGCGCCTTCTGTCCAAAACAATTCCCACAACCGACCAATCTTAAGAAACACTTTCTAGACGAGCACAACAGCGATCGACTTATTAAATTCATGTCAAACAAACTATTCGAGAACGTCGTCAAACTTGACATCACGTACTTGTGCTGTGCGCTCTGCGACACAGACTTCTCGCAACTCGACGATTTCGTTCTCCATTTAAAAAATAGCCACGGCAAAGATCTGCACATTGATGTCAAAAGTCAAATCCTACCATTTAGGTTTGACACGCCGGAATTGAAATGCGCCATTTGCTCAGCTGAATACACcacatttaaacatttacagGAACACATGAATGCCCATTTTGGGAATTATCACTGCACTATCTGCGGGGGGTGCTATGTGACAGAGCGACTACTGCAAGGGCACGTCAAACGCCACGGTAACGGAGAACACAAATGTCCACAATGCGATAAAATGTTTACGAGCGAACGCAAGAGACGCGAACACGAACATAGGACTCACCTCGGGTTTAACAAGAGAAATAAATGTCATTACTGCGACGAGAGATTCCTTGATTATTGGAAGAAGATCAGTCACATGGTGAAAGTACACGGTGCACCTGAAGTGGTGCTGAGATGTCAAGCGTGCGAGCGAACGTTCAATAATCAGAGAGCTCTAGCGAGACATAAAAAGAAGGACCACTTGTTAGAGAGGAGGCACAACTGTTCCGAATGCGAGATGAAATTTTTTAGCAGTAGTTGCCTGCACAAACATATGGCGAAACATACGGGGCTAAGGCAATATACTTGCGACGTGTGTCGCAAGTCGTACGGTAGGAAGAACACATTAAGAGAGCACATGCGTATACACGCAGACGATAGACGTTTCAAATGCGAACATTGTGGGCAGGGGTTCGTGCAGAAGTGTAGTTGGCGTGGTCATATGCGCTCGAAGCACGGCGAGAACGTTTAG
Protein Sequence: MGSMSLESTRCNGVGVSRSILETVENIDKINPVKETEIKREQRVPKEQVLRRGTEIEKHRANIDQILNNSNATPIRRRGSIGYACCFCSNQYANPAELKQHSIEEHENINETIYMKRKDMHKFNIKMDITDLRCKLCDMNIETIELLLQHLREHHKKKVFTDIKIQLIPFKFESDVLKCCVCCKVYSKFQSLQLHMNEHYSNYTCNECAAGFVCQAQLHEHSHTHKLGTFSCDFCTKVFNTFRKKRSHEKGVHSQTELKNKCSYCEKKFKHYRQKERHMAEAHKKSFPPQKCQACDKTFFTQNSLSIHVKRYHLVQRPHKCPHCDKHFFSMAEVRTHLPTHTGLRNFECDICHKTYGLRKILNEHMRIHTNDRRYKCELCGQAFIQWNTWRGHMRAKHGLPRTKITKLKSQNANETKLADKEHVCQKTPVKKSDEPKTKHGEELEKHRINIREILLWSNATPIRCKGGIGYACCFCTDQYPDPNDLKRHTLKDHDSIATSTFMKGRDLHGYFVKLDITALSCNICNISIETLEQLMVHLKNIHDKNIDLNIKNHIIPFKFDTQTLQCCICLNAFHKFHALQVHMNNHCRNYVCDVCDAGFVNRHMLRCHNDGHKIGSFSCEQCTKVFKTIRLRKLHERIVHCSTMPHKCGYCNERFKENWNKNEHLARVHGVRGPGVKCQACDKTFESQQRWLLHMKRDHLMQRQHKCVRCEKSFYAKRELADHMVKHTGSREFQCEVCTKAYGRLKTLKEHMRRLHPNDDRFKCLHCGVRRVIKIETRQAKPVELKFISKTKARSSTILSEAKKNQHNLSIILLNSNANPIRCKDSLGYGCAFCPKQFPQPTNLKKHFLDEHNSDRLIKFMSNKLFENVVKLDITYLCCALCDTDFSQLDDFVLHLKNSHGKDLHIDVKSQILPFRFDTPELKCAICSAEYTTFKHLQEHMNAHFGNYHCTICGGCYVTERLLQGHVKRHGNGEHKCPQCDKMFTSERKRREHEHRTHLGFNKRNKCHYCDERFLDYWKKISHMVKVHGAPEVVLRCQACERTFNNQRALARHKKKDHLLERRHNCSECEMKFFSSSCLHKHMAKHTGLRQYTCDVCRKSYGRKNTLREHMRIHADDRRFKCEHCGQGFVQKCSWRGHMRSKHGENV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -