Basic Information

Insect: Glossina palpalis
Gene Symbol: -
Assembly: GCA_000818775.1
Location: Scaffold49:556337-567743[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 0.25 20 6.1 3.4 1 23 48 70 48 70 0.96

2 32 2.8e-05 0.0022 18.5 0.6 2 23 390 411 389 411 0.97

3 32 0.0013 0.1 13.2 1.2 1 23 423 446 423 446 0.97

4 32 7.9e-06 0.00063 20.2 0.8 1 23 451 474 451 474 0.97

5 32 0.0071 0.56 10.9 0.7 1 23 479 501 479 501 0.95

6 32 7.2e-06 0.00057 20.3 2.5 1 23 507 529 507 529 0.99

7 32 0.00021 0.017 15.7 1.3 2 23 563 585 562 585 0.95

8 32 2.9 2.3e+02 2.7 0.2 2 23 757 779 756 779 0.88

9 32 0.017 1.3 9.8 3.9 2 23 889 914 888 914 0.90

10 32 0.00012 0.0095 16.5 1.4 1 23 996 1019 996 1019 0.96

11 32 0.65 51 4.7 5.3 1 23 1059 1081 1059 1081 0.94

12 32 0.00039 0.031 14.9 2.5 1 23 1087 1111 1087 1111 0.95

13 32 0.019 1.5 9.6 1.7 1 23 1117 1141 1117 1141 0.96

14 32 0.00016 0.013 16.1 1.3 1 23 1147 1169 1147 1169 0.98

15 32 4.9e-06 0.00039 20.9 0.3 1 23 1175 1197 1175 1197 0.98

16 32 0.54 43 5.0 0.3 2 23 1234 1256 1233 1256 0.90

17 32 4.1e-06 0.00032 21.1 1.2 1 23 1363 1386 1363 1386 0.96

18 32 0.00078 0.062 13.9 0.2 1 23 1467 1490 1467 1490 0.97

19 32 3 2.4e+02 2.7 0.7 2 19 1505 1522 1504 1527 0.92

20 32 0.16 12 6.7 7.5 1 23 1530 1552 1530 1552 0.97

21 32 3.9e-05 0.0031 18.0 0.5 1 23 1558 1582 1558 1582 0.97

22 32 0.00044 0.035 14.7 2.3 1 23 1588 1612 1588 1612 0.98

23 32 2.2e-05 0.0018 18.8 1.7 1 23 1618 1640 1618 1640 0.98

24 32 1.1e-05 0.0009 19.7 0.3 1 23 1646 1668 1646 1668 0.97

25 32 0.033 2.6 8.8 3.3 1 23 1674 1696 1674 1696 0.91

26 32 0.00024 0.019 15.5 0.1 1 23 1702 1724 1702 1724 0.99

27 32 1.9e-05 0.0015 19.0 2.7 1 23 1763 1785 1763 1785 0.97

28 32 0.0059 0.47 11.2 3.6 1 23 1793 1818 1793 1818 0.98

29 32 0.0075 0.59 10.8 3.4 1 23 1824 1846 1824 1846 0.98

30 32 3.6e-05 0.0029 18.1 2.2 1 23 1852 1874 1852 1874 0.97

31 32 0.0022 0.17 12.5 3.6 1 23 1880 1902 1880 1902 0.94

32 32 0.00028 0.022 15.4 4.3 1 23 1908 1930 1908 1930 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	0.25	20	6.1	3.4	1	23	48	70	48	70	0.96
2	32	2.8e-05	0.0022	18.5	0.6	2	23	390	411	389	411	0.97
3	32	0.0013	0.1	13.2	1.2	1	23	423	446	423	446	0.97
4	32	7.9e-06	0.00063	20.2	0.8	1	23	451	474	451	474	0.97
5	32	0.0071	0.56	10.9	0.7	1	23	479	501	479	501	0.95
6	32	7.2e-06	0.00057	20.3	2.5	1	23	507	529	507	529	0.99
7	32	0.00021	0.017	15.7	1.3	2	23	563	585	562	585	0.95
8	32	2.9	2.3e+02	2.7	0.2	2	23	757	779	756	779	0.88
9	32	0.017	1.3	9.8	3.9	2	23	889	914	888	914	0.90
10	32	0.00012	0.0095	16.5	1.4	1	23	996	1019	996	1019	0.96
11	32	0.65	51	4.7	5.3	1	23	1059	1081	1059	1081	0.94
12	32	0.00039	0.031	14.9	2.5	1	23	1087	1111	1087	1111	0.95
13	32	0.019	1.5	9.6	1.7	1	23	1117	1141	1117	1141	0.96
14	32	0.00016	0.013	16.1	1.3	1	23	1147	1169	1147	1169	0.98
15	32	4.9e-06	0.00039	20.9	0.3	1	23	1175	1197	1175	1197	0.98
16	32	0.54	43	5.0	0.3	2	23	1234	1256	1233	1256	0.90
17	32	4.1e-06	0.00032	21.1	1.2	1	23	1363	1386	1363	1386	0.96
18	32	0.00078	0.062	13.9	0.2	1	23	1467	1490	1467	1490	0.97
19	32	3	2.4e+02	2.7	0.7	2	19	1505	1522	1504	1527	0.92
20	32	0.16	12	6.7	7.5	1	23	1530	1552	1530	1552	0.97
21	32	3.9e-05	0.0031	18.0	0.5	1	23	1558	1582	1558	1582	0.97
22	32	0.00044	0.035	14.7	2.3	1	23	1588	1612	1588	1612	0.98
23	32	2.2e-05	0.0018	18.8	1.7	1	23	1618	1640	1618	1640	0.98
24	32	1.1e-05	0.0009	19.7	0.3	1	23	1646	1668	1646	1668	0.97
25	32	0.033	2.6	8.8	3.3	1	23	1674	1696	1674	1696	0.91
26	32	0.00024	0.019	15.5	0.1	1	23	1702	1724	1702	1724	0.99
27	32	1.9e-05	0.0015	19.0	2.7	1	23	1763	1785	1763	1785	0.97
28	32	0.0059	0.47	11.2	3.6	1	23	1793	1818	1793	1818	0.98
29	32	0.0075	0.59	10.8	3.4	1	23	1824	1846	1824	1846	0.98
30	32	3.6e-05	0.0029	18.1	2.2	1	23	1852	1874	1852	1874	0.97
31	32	0.0022	0.17	12.5	3.6	1	23	1880	1902	1880	1902	0.94
32	32	0.00028	0.022	15.4	4.3	1	23	1908	1930	1908	1930	0.97

Sequence Information

Coding Sequence: ATGGATACGTCAAGTTTGCAAGAATGTAGCTTTTCGTGTTCTAATTATAATTGTGATTCTGGGGAGTTACCTTGCCTTTTGGAGGAGGAGGATACACAATGTGGTCATGTATTCTATAACGAAATAACGCGCTTATTAAAATTTTATTGTACATTTTGTCAAGAAACCTACGATAATATAGATTACTTTTGTCAACATTTAAGTGGACATATACGTGAAGTTCAGGAACACCAAGGAGGAGAAGAAGAGAATGGTAAAGCATTACCAAAAATTGAGGAGGTTCATCCAGAAGTCTTTGATGAGCAGACCAACATTAGCGATTGCAATATCGATGTTATGAGAATAGAAGAATGTGAACAACTCGATGATAATGAAATGATTATCGAAGAATTAGATGAGACTGAAGCTTATAAGGCTGATGAAGAAGAAGAAGATATATGTGAACCTACAAATGGATGCGTTTACTTGGACGACGATGATAACAATTCGAGTATATGTCAATATCAAAATTTAACAAATAAATCGACTGAAGTTCAAGTTGAGAAAAATGAAACGGCAAGTAAAAGCTTTGAGGAATGCTTTTTAAAGGAGATGAATGTTGAGAAATTACGATTTGATCGGGTATGTGTTATACAGGAGGATAAAGCGCAACAACGAATAAAGCCaaaaaaaaaaCCCACAATGCAAGAGCTGTTGCGTTTTAAAGGAAAACGCAAAAAGGTGACCACTGTTAAAGTTATTGCCGTTAAAAATCGTATTGCCGAGCTTTATGAACGCATAAAGATCGAAGAACAAAAGCGATCACAAGATTCTTTGGCTCTCAATCAGGAATTTGCATCTGAAAATGCTTTAATAGAACAGGAGACGAATGAAGCTATAAAAGTCCTTATTAATGAAAATTCTCAGTACGGAGAAGAAAAAGTTATTACCAATCAGTTCAATAATAATAACCTTGAAAATAGTAAATTGTCAGGCAAAGACGTTACTCGAAAGATTATAGGTGAAACGGTTATAACTTTGATACCTGAAGGTTCAAAAATTCCTAATACGTTACCTTCGCAAGTAGACAATATCGTTGATCCAAAAATTTTAAGAGAGAATTTACAAAATTCCATAAGTTCTGACGACTCGGGCTTAGTTTCTGCTGGCTCTGAGACCGAAAACACTGTCTGCCCCGCATGTGGTAAACGTTTTCGAAGCTCGTTTAGTTTAACTATACATAAACGTATACATTACTTGGAATCGGACAGTGCTGTTAAATTAGCGCATAAATGTTCTGATTGCGACCAGCTTTTCAATAAGATTAGTCAGTTAAAGGAACACGTTGAAACTGTTCATTATCCAGAGGGCTTCATTTGCAAAATATGCAATCGTAAATTAAGTAGTCTTTCGTTACTTGAGCGACATATGCGTAAGGTGCACCTAGATCGTCCCTTTAATTGTAAGCAATGCGGAAAAAATTTTGCAAACCGTCTTACTTACGACGAACATGTAATATCGCACATTTCGGGTAAGTTGTTTAAATGTCACATTTGCGGCCGTAAATACCCAACTCAGTACTTTCTTGCGGAGCATATGCGAAATCACAAAGAACAAGTACCACACACTTGTGTCGTATGCGGTAAGATTACTTTACGCATAACGCAACATATGAAAATTCATACACCCAGACCCAAACGCTTACTTAGCTGCTCGGTGTGCGGAAAAGTGTTTAATTTTAGTTCCGGTCTCAGTCATCATTTTAAAATCATGCATAAATCACCACGGCCACCACAAAAGACTAAAAGAGACTTAGCCACAAATTCAACAAAACGTCGAAAACAGTTGCACACAGCTTACGATGAAGAGCAAAATGTTACAAGCGAAAATCAAATTGTAGAAGAAAATATAACACCAATTAATTCACCAGACGTACACAAGCCTATGACAAATTATATTCTCCAAGAACAGAATTTTGTTAATCAGAAAGAAGAAGAGGCAAAACGTGTTATTGTTGAGCTCATACAGAATTCAACTTATACCTCATTTTTACCCGCTAATGCTTCAAATATATTAGAAATTACTCCACCGATCGCCAGAGAAGAAACTATTTCGGCGGTTGATAGTATCGTCAACGAGAGCACATCAAAAACTTTTAATTTGCAAAATTGCTTCTCGTATTTGTTAAACGAAATTATGTTAAAAACTTTACCGATAATTAAATTCAATGACGTTTCTAAAGAGAAATGCGGTGAAATTTTCTGCCACCGTTCAAAGGAATTCACAATATATTGTACACTTTGCGACATGAAATCCTTTGATTTTACTGATTTTTTAATTCATATTGAAAATGTGCACTTTAATGACAATCTATTGAAATTGGAAAATCCTAGCATGGGTTATGCGAATTTGTTGGGAATGAATGTTAAAAAGGAGAACGTCTTTGCAGAACACGAAGCTCCAGGGGAAGAGATATGCTGCGACAATAGATTAGATATTTTAAATGACACCAGTAGTGTTGAAAGTGGCAATGAAGATAGTGAAGAAGTGCTAACTGTATTAAAGAGAACTGAAGGGAGATCAAGAGTAACAAGTAGTAAAAGGAAACATAATAAAGCTAAAGCGAATTGCAGTCGTTCAGATACGGATAAAAATAGTAAGCCAGCGAATATGACCAAGGGTTTAAAGTGTCATCAGTGCATTCATTGTAGTAAAACTTTCGTTAACTATGGCCTGCTAAAAATACACGTCGCTAGAGTTCACAAAACTTTAGGTAAAAAGAAGGAGAGCGTTGCCCGGCTAAAACTGATAAATGTTGAAACACCTGTAGATGATCCAGTCGTAGAAAACAAGAAGTTGTTAGACGAGTTAGTGATTGCTGAAAATTCGAATGAAAAATATAATAAAGATGTTGATAATATTAATTCAGAGGAGCGTGATGATAACCAGGCTTCAGATGGTGATTATGAACCCGATTTAGACAATACTGTCGATAACAAGAGGAGCTTCCAATGCGAAGATTGCGACAAAACATTAAGTAGCTGCGCTTCTCTAAGAGCACATACTGCTAGATATCATGAGACAAGGAGTAAAAAACCAAAGGAATCAAACAATGAAATGCCATGTATTGAATGCGAGGAGATGTTTGCAAATCAAAAGCTTTACGATCGCCATTGCGTTGAGGTACACGACGGTTTCAAATGTTCCTTGTGTGAGAAAAGGTTCAAAATACGTTATAGCTGTAAACGTCACGAACTGCTGCATAATAAGATAAAAGAATTCATTTGCTCCTTTGAAGGTTGCAATAAAAGTTTCACGGAACACTATTACCTAAGGCGCCATCAAGACGTACATCAAACTGAACGTAACTTTATATGTAATTTTGAAAATTGTGGTAAGGCATTCCATGCTAAACGTCGCTTATGGCAACATCAGAAAATACATACCAAACCCAAAAATTTTATTTGCGATATGTGCGGCTATAGTTGCCGCGAAAGAGTCACATTACGCGTCCATCAACGCATACATACGGGTGAGAGACCGTACGTTTGTAAGGTCTGCAATAAAACATTCATATCCAGCTCGTCGCTAGGTGATCATATGGCATCACATGCAACCAGTAAAGCTATGTTGAAGACTTTACCAACAATAAAATTTAACGAAGCCCCTAAAGCGAAATGTGGTGAAATTTTCTGCCACAGTTCCAGGGACTTTACAATATATTGCACACTCTGCGACATGAAATCTTTTAATTTTTCCGATTTTATAATGCATATTGAGAATGTGCACTTCGATGGGGATTTGTTAAAGTTGGAAGCTTCAAAAATAGATTATGCGCAGTTTTTGGAATTGAATGTTAAAGATGAAAACAGCTGCCACGAGCAAGAAGTTTCAGTTGATGAAATGTCCTGGGAGGATATGCCAGATATTTTGAATAGGAGGAGCAGTAGTGCAGAAAGTAGCAAAGAAGATGTTGAAGAGGTCCTAACGGTTCTaaagagaaataggggaaaaacaaaagaaaggaacaataaaaaagCACGTCATAGCCTGGGCAGTCTGGGCAGAGATAGTAAGGAAACAAATGCAACAGAGATGTTGAAATGCCATCAATGCGAGCATTGTAATAAGACTTTCGTTAATCCTGGTCTATTGAAAATACACATAGCAAGGATTCACAAAACGTTTGTAAATGAAAAGAAGAATGACAGGGAGCAAGAAGACATACTCGTTGAAGAACGTGGTGATGTTAAAACGTCTGAAAATCTGGAAACATTAGAAGAATTAATGGTCACAAAAGACACATTTAAAAGATACAATAAATATGCAAATATTATTATATCGGAAGGCGATGAAAGTCAGGATTCAGATGAGAACTATGAACCTGAGTCAGAAAATAAGACCAACAATAAGAAGAGTTATCAATGCGAAAACTGCGATAGAAACTTAAGCAGTGTTGGTTCTCTAAAAGCGCATATTGCTAGATTTCATAAAACAAGCATTAAAAAGCCAAAAGAATTGGATATCGAAACGCCATGCGGCGAATGTAATGAACTATTCGAAAATCAAAAGTTATACGATCGCCATTGCATTGACGTGCACGACGGCTTTAAATGCTCAATGTGTGACAAAAGATTCAAATTACGCCATCAGTGTAAACGTCACGAACTAATACATAAGGAGGCGAAACAGTTTGTTTGCCCATTTGAGGGTTGCAATAAAGGTTTTACGGAGCAGTATTACCTGAAAAGACATCAAGATATACATCAAACTGAGCGTAACTTCAAATGTGATTTTGAGAATTGCGGTAAAGCATTTCATACGAAGCGTCGCTTATGGGCTCATCAGAAAATACACACTAAACCGAAAAATTTTATTTGCGATATTTGTGGATATAGTTGTCGCGAAAGGGAAACGTTGCGCGTTCATCAGCGCACCCATACAGGAGAAAGACCGTATGCTTGCAAAATATGTAATAAACGTTTTATATCGAGCTCGTCGTTAGGTGAACATATGGCCTCTCATGCTAGCAGTCGAACGCATGTTTGTAAAGTTTGCAATGCGCGCTTTGCCCGCCAAAAGGCTTTGTACCATCATAGTTTTTTACATTTGGATACAAAGAAATTCAAATGTAGAATATGCGGTAGCGCATATAAACAAGCAGCAGGATTGGCCGGTCATATGCGAAAACATCGCGAAGAAGACATGATAAAGGTGATGCCACTCGAATCGGAAATACCTTTATCATCGGTTCAAACTATTCAAATGCAGCAATTAAATTTAGAATCGCCTAAGAACAGCAGCGCGTATGTGTGCGTGGAATGTAATAAATCCTTTACATCTAAATACAATTTACATTATCATCTAATGGATCATCAAAATGATATTAAGGCAGATTATCGATGTCCTTTTAAACAATGTCAAAAACAATTTAAAAATCCTAAACGTCTCAGCGATCATAAGAGACGCTATCACATCATATCGGAAAGCTATATATGCGAATATTGCGGTTATCGGACAAAAATGAATTGCAATTTCATTGTGCATAGACGGCAACATACCGGCGAGAAACCATATTGCTGCGAAATATGTGGTCTATCGTTCGCCTCAAGGTATCAATTGACAACGCATAAGGACACGCATACCATGCATAGGCAATATTTATGCGATGAATGCAATATGAGCTTTAAGCAGAAGAAAACTTTATTACACCACAAATCGTTGCATACGAAAGAAGGCAAACACGTTTGTCATCTATGCAATGCTTCGTTTAAGCAATCATCCGGTTTATCGCAGCATAAACGCAGCCACAAAGAACAAATACAACGTAGCACATCAATTATAACCATTATTGAGAAATGA
Protein Sequence: MDTSSLQECSFSCSNYNCDSGELPCLLEEEDTQCGHVFYNEITRLLKFYCTFCQETYDNIDYFCQHLSGHIREVQEHQGGEEENGKALPKIEEVHPEVFDEQTNISDCNIDVMRIEECEQLDDNEMIIEELDETEAYKADEEEEDICEPTNGCVYLDDDDNNSSICQYQNLTNKSTEVQVEKNETASKSFEECFLKEMNVEKLRFDRVCVIQEDKAQQRIKPKKKPTMQELLRFKGKRKKVTTVKVIAVKNRIAELYERIKIEEQKRSQDSLALNQEFASENALIEQETNEAIKVLINENSQYGEEKVITNQFNNNNLENSKLSGKDVTRKIIGETVITLIPEGSKIPNTLPSQVDNIVDPKILRENLQNSISSDDSGLVSAGSETENTVCPACGKRFRSSFSLTIHKRIHYLESDSAVKLAHKCSDCDQLFNKISQLKEHVETVHYPEGFICKICNRKLSSLSLLERHMRKVHLDRPFNCKQCGKNFANRLTYDEHVISHISGKLFKCHICGRKYPTQYFLAEHMRNHKEQVPHTCVVCGKITLRITQHMKIHTPRPKRLLSCSVCGKVFNFSSGLSHHFKIMHKSPRPPQKTKRDLATNSTKRRKQLHTAYDEEQNVTSENQIVEENITPINSPDVHKPMTNYILQEQNFVNQKEEEAKRVIVELIQNSTYTSFLPANASNILEITPPIAREETISAVDSIVNESTSKTFNLQNCFSYLLNEIMLKTLPIIKFNDVSKEKCGEIFCHRSKEFTIYCTLCDMKSFDFTDFLIHIENVHFNDNLLKLENPSMGYANLLGMNVKKENVFAEHEAPGEEICCDNRLDILNDTSSVESGNEDSEEVLTVLKRTEGRSRVTSSKRKHNKAKANCSRSDTDKNSKPANMTKGLKCHQCIHCSKTFVNYGLLKIHVARVHKTLGKKKESVARLKLINVETPVDDPVVENKKLLDELVIAENSNEKYNKDVDNINSEERDDNQASDGDYEPDLDNTVDNKRSFQCEDCDKTLSSCASLRAHTARYHETRSKKPKESNNEMPCIECEEMFANQKLYDRHCVEVHDGFKCSLCEKRFKIRYSCKRHELLHNKIKEFICSFEGCNKSFTEHYYLRRHQDVHQTERNFICNFENCGKAFHAKRRLWQHQKIHTKPKNFICDMCGYSCRERVTLRVHQRIHTGERPYVCKVCNKTFISSSSLGDHMASHATSKAMLKTLPTIKFNEAPKAKCGEIFCHSSRDFTIYCTLCDMKSFNFSDFIMHIENVHFDGDLLKLEASKIDYAQFLELNVKDENSCHEQEVSVDEMSWEDMPDILNRRSSSAESSKEDVEEVLTVLKRNRGKTKERNNKKARHSLGSLGRDSKETNATEMLKCHQCEHCNKTFVNPGLLKIHIARIHKTFVNEKKNDREQEDILVEERGDVKTSENLETLEELMVTKDTFKRYNKYANIIISEGDESQDSDENYEPESENKTNNKKSYQCENCDRNLSSVGSLKAHIARFHKTSIKKPKELDIETPCGECNELFENQKLYDRHCIDVHDGFKCSMCDKRFKLRHQCKRHELIHKEAKQFVCPFEGCNKGFTEQYYLKRHQDIHQTERNFKCDFENCGKAFHTKRRLWAHQKIHTKPKNFICDICGYSCRERETLRVHQRTHTGERPYACKICNKRFISSSSLGEHMASHASSRTHVCKVCNARFARQKALYHHSFLHLDTKKFKCRICGSAYKQAAGLAGHMRKHREEDMIKVMPLESEIPLSSVQTIQMQQLNLESPKNSSAYVCVECNKSFTSKYNLHYHLMDHQNDIKADYRCPFKQCQKQFKNPKRLSDHKRRYHIISESYICEYCGYRTKMNCNFIVHRRQHTGEKPYCCEICGLSFASRYQLTTHKDTHTMHRQYLCDECNMSFKQKKTLLHHKSLHTKEGKHVCHLCNASFKQSSGLSQHKRSHKEQIQRSTSIITIIEK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -