Basic Information

Insect: Stomoxys calcitrans
Gene Symbol: -
Assembly: GCA_001015335.1
Location: NW:105565-127414[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 1.5 70 3.8 1.0 2 23 362 384 361 384 0.90

2 24 2.3e-06 0.00011 22.1 4.6 2 23 418 440 417 440 0.96

3 24 1.5 71 3.8 1.0 2 23 519 541 518 541 0.90

4 24 0.00011 0.0049 16.9 4.8 1 23 573 596 573 596 0.94

5 24 0.72 33 4.8 2.2 2 23 646 668 645 668 0.90

6 24 0.00056 0.026 14.6 0.4 3 23 710 731 708 731 0.93

7 24 0.0015 0.068 13.3 0.3 1 19 748 766 748 767 0.97

8 24 9e-05 0.0041 17.1 0.6 1 23 857 880 857 880 0.96

9 24 0.053 2.5 8.4 2.6 1 23 903 926 903 926 0.93

10 24 0.0055 0.25 11.5 2.9 1 23 973 996 973 996 0.96

11 24 0.0074 0.34 11.1 4.4 1 23 1006 1029 1006 1029 0.96

12 24 1.5 70 3.8 2.6 2 23 1103 1125 1102 1125 0.94

13 24 0.11 5.2 7.4 1.8 6 23 1135 1152 1135 1152 0.98

14 24 0.0018 0.082 13.1 1.5 1 23 1158 1181 1158 1181 0.98

15 24 8.3e-05 0.0038 17.2 1.7 1 23 1189 1212 1189 1212 0.95

16 24 3.3e-05 0.0015 18.5 1.1 1 23 1223 1246 1223 1246 0.97

17 24 0.04 1.9 8.8 0.6 2 23 1356 1378 1355 1378 0.93

18 24 0.00027 0.012 15.6 1.0 1 23 1411 1434 1411 1434 0.98

19 24 0.032 1.5 9.1 0.1 1 20 1443 1462 1443 1466 0.83

20 24 0.0031 0.14 12.3 1.8 1 23 1516 1539 1516 1539 0.95

21 24 0.0016 0.074 13.2 4.7 1 19 1588 1606 1588 1611 0.94

22 24 0.0023 0.1 12.7 1.8 1 19 1653 1671 1653 1672 0.96

23 24 2.5e-05 0.0011 18.9 0.7 1 23 1681 1703 1681 1703 0.96

24 24 0.27 12 6.2 1.2 3 23 1711 1732 1709 1732 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	1.5	70	3.8	1.0	2	23	362	384	361	384	0.90
2	24	2.3e-06	0.00011	22.1	4.6	2	23	418	440	417	440	0.96
3	24	1.5	71	3.8	1.0	2	23	519	541	518	541	0.90
4	24	0.00011	0.0049	16.9	4.8	1	23	573	596	573	596	0.94
5	24	0.72	33	4.8	2.2	2	23	646	668	645	668	0.90
6	24	0.00056	0.026	14.6	0.4	3	23	710	731	708	731	0.93
7	24	0.0015	0.068	13.3	0.3	1	19	748	766	748	767	0.97
8	24	9e-05	0.0041	17.1	0.6	1	23	857	880	857	880	0.96
9	24	0.053	2.5	8.4	2.6	1	23	903	926	903	926	0.93
10	24	0.0055	0.25	11.5	2.9	1	23	973	996	973	996	0.96
11	24	0.0074	0.34	11.1	4.4	1	23	1006	1029	1006	1029	0.96
12	24	1.5	70	3.8	2.6	2	23	1103	1125	1102	1125	0.94
13	24	0.11	5.2	7.4	1.8	6	23	1135	1152	1135	1152	0.98
14	24	0.0018	0.082	13.1	1.5	1	23	1158	1181	1158	1181	0.98
15	24	8.3e-05	0.0038	17.2	1.7	1	23	1189	1212	1189	1212	0.95
16	24	3.3e-05	0.0015	18.5	1.1	1	23	1223	1246	1223	1246	0.97
17	24	0.04	1.9	8.8	0.6	2	23	1356	1378	1355	1378	0.93
18	24	0.00027	0.012	15.6	1.0	1	23	1411	1434	1411	1434	0.98
19	24	0.032	1.5	9.1	0.1	1	20	1443	1462	1443	1466	0.83
20	24	0.0031	0.14	12.3	1.8	1	23	1516	1539	1516	1539	0.95
21	24	0.0016	0.074	13.2	4.7	1	19	1588	1606	1588	1611	0.94
22	24	0.0023	0.1	12.7	1.8	1	19	1653	1671	1653	1672	0.96
23	24	2.5e-05	0.0011	18.9	0.7	1	23	1681	1703	1681	1703	0.96
24	24	0.27	12	6.2	1.2	3	23	1711	1732	1709	1732	0.95

Sequence Information

Coding Sequence: ATGTCACAAATATGCCGTTTATGTGTGAATACTTGCAATGATTCGAAAAGGCTTTACGATGAGAATGGCCGTGTTACGGAGTTGTATGATATCGTCCACAATTATTTCCATCCTAGGATTTTGAATTTGAGACAATGGAGAAATCTGAATAGCATTTGCATGATATGTTGGATACGCATATGCGATTTTCATAGCTTCGAGACCACGGTGACATTGGCTCAACTGAAATTGCTAGATCTGGATCAGAATTATGCAGCGGAAGCAGGTGGAGGAGGATGTGGGGGTGGCGAAGTGGAAGTAGGAGTAGGGGAGAGAATGGCAGTTGCCTCATCATCCCATGCTAACCAACAAGTGGAGCTGTTACCCTTGCATGCCATTAAAGAAGAACCTCCTTTAGTTACAAATGACTGGCATTCTGAGGTTTCACAATATTCTTTGGATACCGATGAACCTCAAATAATGACTGTTGTTACTCAGCAGCAGCTGCAGCAGTCTTTAATACGACCCTTGCATAGTGGGCCCAATTATGAGTTAGATAATTTTCCCTATCTACCAGAGCATCAGGCCACAAGACCAGTTGAAGAAGTATTGACTTTACCAAACTATCCAAGTCTAAGGAACAGTTTGCCAAAGCCTGTAGACATAAGAGAAAGACAAATAATGGTATTAGATTCctccgatgatgatgatggtgaagaAGAAGATTCCCAGGATATTAAAATAACTTCGGTTATGTCTCTAGCCCATCCCATAGTCTTTAAGCCCTTTGAGAGCAAAGAACCACCTAGAGTAAACAGAAATGAAGAAGTAACAGAGGCGCACCAAGCAAATTCAAATAGGGAAGAAAGGCAATTACAGGCAAATGCCAGGGTGTTGATAACAGATTGTAATATttccaataacaacaacaaacaagccCAGCAGCAGCATAAGAAGGAGCAACAGCAGCAGTATCGTCTCGAAAGCGCCTCTCTGGAATCTGATCGTGAATTCGCAACCCCAGAACCCTTAGAATCTCAACCTCGCTTGAGAAAAACCCAAGAGGATCAAAACTATATCATATCCCAATGGAGGCCTACGCTAAAATGTGAATTATGCTCGGAGTCTTTTAACCTTTTCTCAGTCTTCGAAGAACATTTCCGTTTTAGCCATCCCAAAAATATTTGTCATGTCTTTTGCTGTGATCGCAAATACGTGGGGGCCATAGAAATGAGGCAACATGCCCGCAAACATCTCAATCCCAAATCCTGCGTTTGTGATTTATGTGGCAAATGCTTTGCCCAACGGTCTTCGCTTAAGAAACACATGCTCACGCAACATTTGCGATTTAAGATACCCCAAGGTAAGATGCCCATGCAACGTAAACGCCAAAAGAAGagatttaaaaagaaattggcctacaccaaaaagaaaatttccaaaaatcccTTAATAAGAAGAAAGAAGAATTTGTCGGAGGAcccagaagtcattgtgccacaGTCATCAGAAGCTCTGGAGCCTTTGAACAATGTCCTGGATGACCTTATGACCCAATGGCAGCCCCTTGGCATAAAATGTGAATTATGCTCTAAGATTTGTGGCAAATATTCCCTACTTTCTGAACATTTTCTGGAACTACACCCCCAAGAGGCTTGCCATATTTTTTGTTGTGGTCGTAGAATCTTTAGATCACAATTGGAGAGTCATGCCCGCAAGCATCTCAATCCCAATGTCTTCTATTGCGATTATTGTGATAGCTGTTTCACCCAGTTAAGCAATTTGAAGCGTCACATATTTAATAGGCATACCAAGCGTAAGGATTGTTCCAAGAGAAGGGAAAAACCCTTGgctattgaaaaaaataaaccagAAAAGCCAGCTGAAGTAGAGCAGAAGCAGTTATCAAGCGCCCGTAACATAGACGATCTCATAGACAAATGGAAGCCCATCCTCAAATGTGAGCTGTGTACTGAAATATGTCCCAAATTCTCTCATCTGGAGCAGCATTTTATACAGGCGCACTCCTCCCAGGAGCTGTTCATTAGCTGTTGCAAACGAAAATTCTCAATACGCTCAAAGATTGAGCGGCATGCCAAGCATCATTTGAGTGCATCGGGTAAAGGAGGCGTTCGCTCTCATCAGAACTGTGAAATATGCTCCAAGAGTTTTTCCACCAGAAGAGGTTTGCTCATACactacaatgccatgcattttGGTCATGGCGGCGATGAGGCGAATCATGCCCAGGCCTTGGCCCTTTACAACTGCAAGTTATGCGGCAAAGCCTATAGGGATGCCAAAGCCTTGTATCGACACAATTGGCTGATGCACAAAAAggatttgaaattgaaaatcatAGGACGCAAGCTGATACAAAAGGTTAAAACAAAAAGgagaaagaaaattaaaaagaccaacaaaagaaaaaagcgAGAGGTGGAGGATGAGGAGGAAGATGATAGTGAGGATAATCTGCCTTTGAAAAAGCCCAAAGAGAAAGAACAGCTTAACCACCAGCAAGCAGAAGCCATAGATATTGAGCCAGAGCCTGAGCAAAGGGAAGAGGAAGACGAGCAGCCCCAATTCTTTGAATGTCAAAAATGCCCCAAAAAATTCATCACCAAAAAGGGTCTGCTCATACACATATCAGTCAAGCACTTGCAGGCAGAAGACCAAAAGTCCTCATCAGCCCTGCCCGAGGAGGATGAAAGCAATATCGAAAACTATGAATGTGAAAAATGCAGCAAAAAATTTCTCACCAGGAAGGGGCTGCTGAAACATTTGAGCTTTAAACATTTACACAATACAGTAGATGAATCAGCAGTAGAAGaaggacaacaacaacaaagcccAAGTTCCCTTAAGGAAAATTCAGCGGATGTGTCATCCTTGGCCGAAAATGGGGATGAAAGTGTGGTAGCAGAAAATGAGGTCTTTGAGTGTGAAATATGCCATAAAAAGTTTTTCACCAACAAAGGCATGATCATACACACCAAATTGAAGCATTTGGATGCCTTTAGATCCTCGGCCCTTTACAAATGCAATCTATGTGACAAGACCTGTAGAAGTGCCCGTAAGCTGTACCTGCATAAACTTAAACTACACAAGCTAAGGCTGAAAATCAACAATGGCCAAGTGTTAAAGAAAAATCTCAAGGCCCCCAAAATGGCAGAATCTATAACCCCCAAATCCCCCATCGAAGAAGGCCTAGACAACGACAACATTTCAAAAGCAACTCCTTTCAATATCAGCGATAAACacattggcaaaaaaaaatggcgTCAACTATTTGATGATCTGGTGGCCAAATGGCGACCCCAACTACATTGTGAGCTATGTTCGCAGGCCTGTGATAATTTTTCCCTTTTGGAATTGCATTACCAGCAACAGCATATTGGCGAAACCGCCTACGTTATGTGCTGcaatcgtaaatttgtctcccGAACTCACCTGCGGGAGCATGTCATGTATCATCTGCAACCCAGTGTATTCCAGTGCAACGTATGTGGGGCCAGCTGCAGTAGTCATGGAGTCCTTATACAACATCAGCAAAAATGGCATCCTGAATTTGTGGAGTTTTCACACAACTGCCAGTTGTGTGGCAAAACTTTTGAGACCCAAAAAGGTTTGTCCACCCACATGACGGTGATGCATAATGGTGAAATCAGTAACAAGAAGTCCAAATACAAATGCAGCATATGCCATCGAGTATATGGCACCTGGGAGTCTTTGTGGAAACATAAAAGACTTGTTCACAAGAAGGATTTGAAATTGAAGATTGTGAATGGGCAGGTggtgaaaaagagaaaaatgaaaaacaaaatcaagaaaatggaggaaacagaagaagaagaagaaaaagaaccaCAAAATTCGCAGCAAGCACCGCAATCGGAGGATGAAGAAGACACCAGTTGGCTAGTGCCTGAAACTGAAACTGTAGAGCCCCCGTTTGACAATGAATTTGATGATGATCATGACTTGTCAACCACCAGCTCTACCACCAATAGTGTCCCTTATGTGGGTCTCAAGCAATGGTTAGAAAATCTAGATGATCTAATTATCAAATGGAAACCCTTGCTCAAATGTGAGCTATGCTTGGAGTCATTTCCCAAATTTAGCCAATTGCAGGAGCATTTCCAACTACAACATGGCgaagagaaattttttatgaattgcTGCAAtcgcaaatttttgaaaaggcCTCGCATACGCGATCATGCCATGTTTCATCTGGATCCCTCTACCTTCAAATGTGAAACATGTGGCTTGTGTTTCGAAGCTAGGGAAACTCTAGCAAATCACATGAATGTTAAGCATCCGAAAGTGGTTGATCATCCCGCCTATGCCTGTGCTAAATGTGGCAAGGGTTTCACCACCTCCAAGGGGGCGCTGATACATGAAGCCTTATCCCATTGTCATTTGATGGAGAGTCCTCAAGCACCAAACACTGGTAAAAGCATCATTCCAAACCCATCAACTgctgcagctgctgctgctgctcctcTCCCACCTCCACTTCCAGCAGCAGGGGCTAGCCCTGTCGCCACTTCTCCAGTGTTGTATCCTTGCAAACAATGTGACAAAGTTTATGAGAATTACAAATCCTTATATACCCACAAATATCGAATACACAACAAGCCTGCCACCTCCTCTGCTACGAGCAGCGAACTGGAAACTGAAGCCAGTCCTAGAGaagcaaatttcaataaaatcaataCTACGCCACCACCAACACCTTCACCTTCGGCTGCTGCCAGCATTGACTCAACTGAGCTACATCAGTGCCCGCATTGCGATAAATCTTATACCAATAGCAACTCTTTGGCTGTACACAAATGGCGTTGCCATAGAACGACCACAGTGCCTGGTATCAATAGGGGGACAAATGAAAGTGCAACTCAGCAACCGCCGTTAGAGCAACAGCCCCAGCAGCAGCAACCACTTCCCGAAAAGCAACAGCAGCCGCCTCTCTTCAAATGCACCGAATGTGGAAAAGTttgtgacacttccaaatccTTATACAGCCACGTCTGGTATTATCACTCGCATAACGAATTCAAATGCAAGGTCTGTGGCAAAATCTTTAGACGGTTTGCCCAACTCAAAGAGCACAGTGCTGTGCATACTGGCAAAAACGCCTATGGCTGTATGTTCTGTCCAAAGACTTTTAAATATTACACTGCCGTATACCTGCATCGCAAGAAACAACATCCCCATGAGATGTCAAAGGAGTactatagaaaatATTGtcgttttaattttcattttataattttttgttttatttttaaccctttacaatttattccaaaattattttttttttttgaagtaaaaTTCACCATGTCATCTTTTAAAATCTGTTGCTTGTGCCTTGCTGAGTGCTCGGAATACGAAAGCCTTTATCAAAAGGGTGGCAAGGAAACGCGCCTCTATGAAATGGCCTACAACATCTTTCATCCATATATTTTAAATATGGAAGTATTGCAGAAACTCGATGTCATATGTTTAGAATGCTGGTATCATATTCTGGATTTTGAGGACTTTCGTATGAACATCATCAAGGCTCAATTTGGTGGCCAAGAAACCAACGATGTGATCTACGAGAAGAAACTTGAGGATATCTATGGAATATGTAATGAGGATAACAATGATTATAATGTTAGTAATAATAATAACGAACAATGCCTAATGGAAATGCGTATCAATGTCATAAAAGAGGCCAATAATCCAAttgatttggaaaattttcaaatcggCAATATCGAAGATAAGCATGAAAAAGTGCCACAATTAAGATGGCATAATCCTACGCCAAAGAAAGATAAAATCTACCCATCGATACCGCTTGAGCCAGGATGCCTTGCTAAAAAAACCATAGAGTTTCTGCAAAGTCTTTGTGACGAAATGAATGAACCTCAAACCCCAGCGGAAACTTCTAGTAATAAACTCGCCAGAACTTCTAATAATAAGCCCGCCATTAGCAATAAGAGTAAAACAAAAGAGAAATCCTCGGATCAAAAAGGCAACAACGTCTTTCCCGATGAGCATCCGGAATATGAGCACATAAAAAATCGTTGTAAGGAAATAAGGCAATTGAATGATCACTTAAAAGCCGAAGGAGTTCTTTTTCTGGAAAGTTTACTACTAAAttctgatgatgacgatgatggaaACTCATCTATGACACCATGGCCTTCAAATGTTTCATGTAAAACTCATAATGatctggagaagattataattattgacgatgatgatgaagaaaaTGATATAGTTGTTGATGATATCAAGGAAGAAACTGACCAGGATCTGGAAATAATTAGCATATATTCCAATTTAGAACCCTTTGAAGGAAATGACTGCCCTTCGCCAAAAGTTTTAGCTTCTGGTATATATCAAGTTTCTCAGTAA
Protein Sequence: MSQICRLCVNTCNDSKRLYDENGRVTELYDIVHNYFHPRILNLRQWRNLNSICMICWIRICDFHSFETTVTLAQLKLLDLDQNYAAEAGGGGCGGGEVEVGVGERMAVASSSHANQQVELLPLHAIKEEPPLVTNDWHSEVSQYSLDTDEPQIMTVVTQQQLQQSLIRPLHSGPNYELDNFPYLPEHQATRPVEEVLTLPNYPSLRNSLPKPVDIRERQIMVLDSSDDDDGEEEDSQDIKITSVMSLAHPIVFKPFESKEPPRVNRNEEVTEAHQANSNREERQLQANARVLITDCNISNNNNKQAQQQHKKEQQQQYRLESASLESDREFATPEPLESQPRLRKTQEDQNYIISQWRPTLKCELCSESFNLFSVFEEHFRFSHPKNICHVFCCDRKYVGAIEMRQHARKHLNPKSCVCDLCGKCFAQRSSLKKHMLTQHLRFKIPQGKMPMQRKRQKKRFKKKLAYTKKKISKNPLIRRKKNLSEDPEVIVPQSSEALEPLNNVLDDLMTQWQPLGIKCELCSKICGKYSLLSEHFLELHPQEACHIFCCGRRIFRSQLESHARKHLNPNVFYCDYCDSCFTQLSNLKRHIFNRHTKRKDCSKRREKPLAIEKNKPEKPAEVEQKQLSSARNIDDLIDKWKPILKCELCTEICPKFSHLEQHFIQAHSSQELFISCCKRKFSIRSKIERHAKHHLSASGKGGVRSHQNCEICSKSFSTRRGLLIHYNAMHFGHGGDEANHAQALALYNCKLCGKAYRDAKALYRHNWLMHKKDLKLKIIGRKLIQKVKTKRRKKIKKTNKRKKREVEDEEEDDSEDNLPLKKPKEKEQLNHQQAEAIDIEPEPEQREEEDEQPQFFECQKCPKKFITKKGLLIHISVKHLQAEDQKSSSALPEEDESNIENYECEKCSKKFLTRKGLLKHLSFKHLHNTVDESAVEEGQQQQSPSSLKENSADVSSLAENGDESVVAENEVFECEICHKKFFTNKGMIIHTKLKHLDAFRSSALYKCNLCDKTCRSARKLYLHKLKLHKLRLKINNGQVLKKNLKAPKMAESITPKSPIEEGLDNDNISKATPFNISDKHIGKKKWRQLFDDLVAKWRPQLHCELCSQACDNFSLLELHYQQQHIGETAYVMCCNRKFVSRTHLREHVMYHLQPSVFQCNVCGASCSSHGVLIQHQQKWHPEFVEFSHNCQLCGKTFETQKGLSTHMTVMHNGEISNKKSKYKCSICHRVYGTWESLWKHKRLVHKKDLKLKIVNGQVVKKRKMKNKIKKMEETEEEEEKEPQNSQQAPQSEDEEDTSWLVPETETVEPPFDNEFDDDHDLSTTSSTTNSVPYVGLKQWLENLDDLIIKWKPLLKCELCLESFPKFSQLQEHFQLQHGEEKFFMNCCNRKFLKRPRIRDHAMFHLDPSTFKCETCGLCFEARETLANHMNVKHPKVVDHPAYACAKCGKGFTTSKGALIHEALSHCHLMESPQAPNTGKSIIPNPSTAAAAAAAPLPPPLPAAGASPVATSPVLYPCKQCDKVYENYKSLYTHKYRIHNKPATSSATSSELETEASPREANFNKINTTPPPTPSPSAAASIDSTELHQCPHCDKSYTNSNSLAVHKWRCHRTTTVPGINRGTNESATQQPPLEQQPQQQQPLPEKQQQPPLFKCTECGKVCDTSKSLYSHVWYYHSHNEFKCKVCGKIFRRFAQLKEHSAVHTGKNAYGCMFCPKTFKYYTAVYLHRKKQHPHEMSKEYYRKYCRFNFHFIIFCFIFNPLQFIPKLFFFFEVKFTMSSFKICCLCLAECSEYESLYQKGGKETRLYEMAYNIFHPYILNMEVLQKLDVICLECWYHILDFEDFRMNIIKAQFGGQETNDVIYEKKLEDIYGICNEDNNDYNVSNNNNEQCLMEMRINVIKEANNPIDLENFQIGNIEDKHEKVPQLRWHNPTPKKDKIYPSIPLEPGCLAKKTIEFLQSLCDEMNEPQTPAETSSNKLARTSNNKPAISNKSKTKEKSSDQKGNNVFPDEHPEYEHIKNRCKEIRQLNDHLKAEGVLFLESLLLNSDDDDDGNSSMTPWPSNVSCKTHNDLEKIIIIDDDDEENDIVVDDIKEETDQDLEIISIYSNLEPFEGNDCPSPKVLASGIYQVSQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -