Basic Information

Insect: Ceratitis capitata
Gene Symbol: hang_1
Assembly: GCA_000347755.4
Location: NW:2519800-2539516[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 20 0.048 2.4 8.3 0.8 3 23 228 249 227 249 0.93

2 20 0.03 1.5 8.9 3.5 3 22 355 374 353 374 0.90

3 20 0.038 1.9 8.6 1.2 1 22 449 470 449 472 0.90

4 20 1.3 64 3.8 0.6 2 21 484 503 483 504 0.93

5 20 2.7 1.4e+02 2.7 1.6 2 23 512 534 511 534 0.88

6 20 0.002 0.1 12.6 0.2 3 23 599 620 598 620 0.96

7 20 7.8e-05 0.0039 17.0 0.1 1 23 628 651 628 651 0.94

8 20 1.4e-05 0.00068 19.4 0.1 2 23 743 764 742 764 0.97

9 20 0.13 6.7 6.9 3.2 2 23 831 853 830 853 0.94

10 20 0.0034 0.17 11.9 0.2 2 23 862 884 861 884 0.95

11 20 0.0008 0.041 13.8 0.2 1 23 897 920 897 920 0.97

12 20 0.0001 0.0053 16.6 1.1 1 23 984 1006 984 1006 0.99

13 20 0.0016 0.082 12.9 0.9 1 23 1014 1037 1014 1037 0.96

14 20 0.023 1.2 9.2 0.1 2 20 1045 1063 1044 1063 0.95

15 20 1e-05 0.00051 19.8 0.5 2 23 1135 1156 1134 1156 0.97

16 20 4.3e-05 0.0022 17.8 0.7 1 23 1191 1213 1191 1213 0.97

17 20 0.00011 0.0055 16.6 0.5 2 23 1273 1295 1272 1295 0.92

18 20 1.4 70 3.7 0.2 2 19 1315 1332 1314 1334 0.92

19 20 0.015 0.75 9.9 0.2 3 23 1350 1370 1350 1370 0.98

20 20 0.00054 0.027 14.4 1.3 1 23 1628 1650 1628 1650 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	20	0.048	2.4	8.3	0.8	3	23	228	249	227	249	0.93
2	20	0.03	1.5	8.9	3.5	3	22	355	374	353	374	0.90
3	20	0.038	1.9	8.6	1.2	1	22	449	470	449	472	0.90
4	20	1.3	64	3.8	0.6	2	21	484	503	483	504	0.93
5	20	2.7	1.4e+02	2.7	1.6	2	23	512	534	511	534	0.88
6	20	0.002	0.1	12.6	0.2	3	23	599	620	598	620	0.96
7	20	7.8e-05	0.0039	17.0	0.1	1	23	628	651	628	651	0.94
8	20	1.4e-05	0.00068	19.4	0.1	2	23	743	764	742	764	0.97
9	20	0.13	6.7	6.9	3.2	2	23	831	853	830	853	0.94
10	20	0.0034	0.17	11.9	0.2	2	23	862	884	861	884	0.95
11	20	0.0008	0.041	13.8	0.2	1	23	897	920	897	920	0.97
12	20	0.0001	0.0053	16.6	1.1	1	23	984	1006	984	1006	0.99
13	20	0.0016	0.082	12.9	0.9	1	23	1014	1037	1014	1037	0.96
14	20	0.023	1.2	9.2	0.1	2	20	1045	1063	1044	1063	0.95
15	20	1e-05	0.00051	19.8	0.5	2	23	1135	1156	1134	1156	0.97
16	20	4.3e-05	0.0022	17.8	0.7	1	23	1191	1213	1191	1213	0.97
17	20	0.00011	0.0055	16.6	0.5	2	23	1273	1295	1272	1295	0.92
18	20	1.4	70	3.7	0.2	2	19	1315	1332	1314	1334	0.92
19	20	0.015	0.75	9.9	0.2	3	23	1350	1370	1350	1370	0.98
20	20	0.00054	0.027	14.4	1.3	1	23	1628	1650	1628	1650	0.98

Sequence Information

Coding Sequence: ATGTCGGAAGGTAGCCCAGTGCGTGCGCGACAAAATTGCTGTCGCCTCTGCTTGGCACCGGGCAGTGAATGTATATCCATATTAAACAGCTATGCGGCGGACAAGGAACCGTTGGCTACTAAGATACAGAACTGCGTCAGCATCAAGATAAATCCCGATGATCAATTATCCCTACGCATATGTCATGCGTGTATCAGTTACCTGAATTCCTGGCAGAGCTTCAAAAACCGTTGCATCGGCTCACAGAATAAACAACGCAATTGGTTGGATACAAATAAGCGGCAGCAATTGCTCGATAACAATGTGAGCATATCAACGATTGGTGCAGATGGCACCacacaacatcaacaacacacCGAAGAGAATGAAGCAGCGACAAGTTTGGCATCGTCGATTTTGGATGGAATTTCATCGTTGAAGAAACGAAAATCTTTAACTGTTTATCCTCTACCAGCAGTCGACATTAAGGACGAACCAATAGATCCCGATGATGATTACAATAATAAACAGCATGATGAGTCCGATGATATGGTTGATCCCACACTTTTCTTAGAGCGCACCGAAGAGGAGGGCGATGAGGCACTTATGGAGCACATGGCGTACCCATATGAACCgtcaccaccgccaccgccacgtCCACCTATCGAACTTGCCGCACTCGTCGACACTAAGGAAGCCGCCTGTCGTGCTTGCAATTTGAAGTTCTCTACACGCGCCAATGCACGCCGACACGAGCGGAATTTACATCCCAATCTCTTTGAACtgtcaacatcaacaacaaataatatgcCTGTAACAAAACCTACACCTGCGCTAGCTGCCGCTTTGGAACTACAACGTGCCTCAGCTGCTGCAGTTGCCGCTGCGGAGGCGAAGAAAGCCGCTTCGGGTTTGATAACGCCGCTCAAGTACCGCCAGGAGGTGGTGAATGCCTTCAACAAATGTGAAATCGGCGGTTTCGATTATGAGCATCCCGAGAAGTATCAGCATCATTTGACAGATGAGAAAATCGTTTTCCTACAACAGAACGATGAGTTCCTGCGTCAATATCAAAGTATGACCTGTCGCTGCTGCAATAAAACCTATTCGACTTACAAGAATTTCATGGCACATATGCGTAAAAAATATCTAACATTGCCGCGTAATCTTTGCTTTAACTGCCTGAAATTGAACGACTCGAAAGCATTGTTCATATCGCATTTGAAACGACGCAATTGTATAAATCTCTACAAAGTATTGCATGCGTTAATGGCGAAGGATCAGAATTTCGCCGCTGCAGTGACAGCCACGACAGCTGCGGTGCCTGATAAGTTGCGCGCCAAAGAATTGCTCGTGAATAAAATGTACGAATGCAAATTGTGTCCGAAGAAATACCGTCTCAAGTTGGAGTTTCGCTCGCATGTCTACGATGAGCATGCCGATATGCAACGCAAGGACACAATGCAGAAACAATGCTGCTATTGTGGGCTGGAATTAGATGATCCAGCTGAACGTAAACGTCATTACAACAATATGGATTGTATTGTTTCGTTGCGTTGTGTTACATGCGATGCCAAATTCGATAATCATCAGAAATTCCTCGATCATGTGTATGAAAAGCATTTGGCCGGCTTTGGTGAGCAACCGGCAACAACTACATATACCATTAATACCGACAATTCGCCGGGTAAAATATCAAAAGGCTTGCGCACACTCCTAGATACTGCCTCCACCGATGAGTCGCGTAGTAGTCATCATGCTAGTTTCACATCCTCACAACCGAAGTCAACATATTTTTCACGTATGCCACAAGCGTGTCCGATATGTGATCAACAGTACAATAACTACAATAATGTGCTGCGTCACATGGAATCCAAACATCCCGATCAATTGCCACAAACATATAAGTGTGTAAAATGTGGCATTGGCTATCCACGGCTATCTAATTTGCGTGAGCATATGGTGAACGCCCATTCTGCGGATAAAGCACGTCATACTGGTTTTGAGTATATCGTAAATGCGGATGCGGTGAAAATTGCCTATGGACCACAGCAGAATGTCTACACGGGTCGTTATGATTATGTGATGAAGGATTTAATGTCGATAACCAATGGCGGTTCAATTGCCGACGACGATGAGAACTCCAGTGAAAATGTAGCGAAAAAAATGCGCACGGACAATGGCGCGGCAGTGACAACCAGTACAGGCTCTGCGGGCGGCAGTGGCAACATGTATAGCAGCCTGAAGGAATGTCCCATTTGCAATGCGGTCTTTAGCAATAACATCGGTTTGTCCAATCATATGCGCTCGCACAGCGCCGCTGCACAAAATAGCATATTGTCGTCAGGTGGCTTGAATACTAGCAAATCTACGCCCAGCGGCCTCACTATAACACCAACACCACCTACAAAATCCTCCACGCCACCAGCTATGCAACATCAGACAGCCGTACAAAAGGCGATATTTAAGCGTAGCCTAGAACAAGCAGCCGATCGTCGTTTCCGACGCATGCGTTGTCGGCTCTGTCAACGTCGCTTTTCTTCGAAGAAATCCTATCGTTTCCATATGCTTAACGATCATCAAATACGCAATGTACAGTTTATTAAGTGTAAGCTATGTGATGCCGAATTCGCCTATGAGAAGGGACTGAAGGTGCATATGTTTAAAATACACAATACGCTGTTGAAGGATGAGATGATCGTTAAGCAATTTGAATGTGATATTTGTTCGATTGTGTATCGCAGTGAGGAACAGTTGTTGCAGCATAAAAAGAGTGTACATGGTAGCGCAACAGCAAATGCTGCACAGGCTGATGAGACCTTTGGTGATGATACTTTCGGTGCCGCTGGTGGTGCTGATACAAGTTCAACTGCAAATCCAGCCGATCGTTCGAGCATATCGACGCCGGTGAGTGGTGTGGGCGCTGAGCGCAGTACGTTGGATACGTCTACGAGTGGTCCGTTGTATTGGTATCAATGTAAATATTGTCCATCGaactttaatacaaataaaaagttagctatacatataaattcacaTGACGAATTCGATTCAAATGATTATTCGTGCAAGGATTGCGGCAATGTGTATAGTGGACGCAAGAGTTTATGGGTGCACCGTTACAAAAAGCATCCACAATATCCCGAACCTTCCGAGTGTGTACTTTGCAAGAAGGTCTTCTTCGACAACCAGATGTTAGAGAATCATATACCGACATGCAATCGTAAACCCATTACAGCCACTGGTGCTATGGCCGAAAACGCTGGACCACCACCCGTTTACAAGCATAAGACGggcgatgatgatgacgacgcGTCACACGATGCCAGTGGTGTAATAACGACAAGCGCATTGGGTGGTGGGGAACTGGAGATAACACCCATACCGGCTAGCGGCGGTCTGAAGATTAAGTTACCCGAAGTATCGTGTACAATATGTGGGCAACGTTTCACTGATCAAGAGTTATTCTccaaacatatacaaatgcatgaAATGGAATTGTATACGGATAATCCGTTGGCGGCCATGTTTGATACTGGTCCAGCGGATCCGAATCAATTCTATTTGGATCGGGTGAATGATAATGGCGAATACGCCTGCGATTTGTGTAATAAAACGTTTACGCAAATGACTGCACTTAAAGTGCATCGTAAATGGCATTTCAGAGGTGATAGCAAACAGAGCCAAGCCGACGGGGATCATTTAGCCAATGCAGCAACGAGCCACTCCTCACAGATCCAgaccaaccatcgacatccactgGGATTACAAGCAGTGGGCCTTATGCCCAACCCCCATCAACACTCTTCAAAATCCCTGAAACGCAAACGCGAACTTAAATGTGAATATTGCCCCTCCACATTCATTAGTAACAACAACCTGCGTCGTCATATCTATGAATTGCATAAAGATGAAATTGGCAATTTGCCGGTGCCGCCGAAAATCGAAATTGATCCGTACTTGCAATGCCGTCGCTGCCAAGAGCAATTCGAAACAAAGAACGAATGGATTGATCATAAGGTGGCCGATGCACGTGTAACGAAACCCTTTGGACCCTTCCAATGGGGTTGTGATCTGTGCGGTGCATATGTTTCACGCAAAGAGAAATTGATTAATCACATCAACAATCACTTGAAGGAGAAGGAAATTGTGCCGGTAGACGACCCGCAGGAGGTCCATGATCAAAATCAGAATCATGCAAAGGCCACAGTGACAGCGACGGATGCAGGTACAGTTGCTGGGGATGGTGGTGAAGTGAAGGTGAAGCGAGAATTGGATGTTGATAATAATGAACAGTACAATGATGTAGATAAGGAGGGAGAGGAGGATTCCGAAGAGGAAGCTGGTGAGTTAGATGGTGAAGCAGAGGAGGgagaggaggaggaggaagtTGAGGAGCAGCAAAAGGCGGTAAGTGAGGTACGTAAGCCCGAAGAAGATTCGGACATGGAAGAAGTCGATGAAGAGGCTTCTGAAGAAGAAGCAGATGATGAAGAATACGAGGATATGGGCAGCATGATGCAGGTCAATATGACTGAACGCGCTAGTAATGAAGCGGCAGTAGAGCAGgatgatgaggatgatgatgatgatggcgatGGCGAAGGCGAAGGCGAAGAAGACGCAGACGCGGATGATGCTGATGACATCGATGAAGATATAAATGATAATGTTGCCACAACAAATGGTCCGACTTATGGTCGTGTGCCACCGGCGACAACAAAAGCGCAACCAAATCGCATATCAACAGATACAACAACTTCATATGAAGATGACGAcgatgatgacgacgacgaagatgatgatgaggatgatAACGATTCGGATGCCGATAGTGATGTGGACACTGGCGATAGCTCATCGCAAGCGTCTAAAGCGCCAGCGCCGGCGCCCAAAGCACGCTTCTCTTGTGATCTATGCCGTTTGTTCTTCGATTCGCAGCAGGAGCTGCAGAAGCATGTGAAAATGCATTTCCTTAATGGTCCCGGCTCGGTGTCACTAACCGAAATCAAGCCAAAGACGGGCAATAAGTCGAGCCGTAGCAGTAGTAGTGACGTTTTGGCGGTGTAG
Protein Sequence: MSEGSPVRARQNCCRLCLAPGSECISILNSYAADKEPLATKIQNCVSIKINPDDQLSLRICHACISYLNSWQSFKNRCIGSQNKQRNWLDTNKRQQLLDNNVSISTIGADGTTQHQQHTEENEAATSLASSILDGISSLKKRKSLTVYPLPAVDIKDEPIDPDDDYNNKQHDESDDMVDPTLFLERTEEEGDEALMEHMAYPYEPSPPPPPRPPIELAALVDTKEAACRACNLKFSTRANARRHERNLHPNLFELSTSTTNNMPVTKPTPALAAALELQRASAAAVAAAEAKKAASGLITPLKYRQEVVNAFNKCEIGGFDYEHPEKYQHHLTDEKIVFLQQNDEFLRQYQSMTCRCCNKTYSTYKNFMAHMRKKYLTLPRNLCFNCLKLNDSKALFISHLKRRNCINLYKVLHALMAKDQNFAAAVTATTAAVPDKLRAKELLVNKMYECKLCPKKYRLKLEFRSHVYDEHADMQRKDTMQKQCCYCGLELDDPAERKRHYNNMDCIVSLRCVTCDAKFDNHQKFLDHVYEKHLAGFGEQPATTTYTINTDNSPGKISKGLRTLLDTASTDESRSSHHASFTSSQPKSTYFSRMPQACPICDQQYNNYNNVLRHMESKHPDQLPQTYKCVKCGIGYPRLSNLREHMVNAHSADKARHTGFEYIVNADAVKIAYGPQQNVYTGRYDYVMKDLMSITNGGSIADDDENSSENVAKKMRTDNGAAVTTSTGSAGGSGNMYSSLKECPICNAVFSNNIGLSNHMRSHSAAAQNSILSSGGLNTSKSTPSGLTITPTPPTKSSTPPAMQHQTAVQKAIFKRSLEQAADRRFRRMRCRLCQRRFSSKKSYRFHMLNDHQIRNVQFIKCKLCDAEFAYEKGLKVHMFKIHNTLLKDEMIVKQFECDICSIVYRSEEQLLQHKKSVHGSATANAAQADETFGDDTFGAAGGADTSSTANPADRSSISTPVSGVGAERSTLDTSTSGPLYWYQCKYCPSNFNTNKKLAIHINSHDEFDSNDYSCKDCGNVYSGRKSLWVHRYKKHPQYPEPSECVLCKKVFFDNQMLENHIPTCNRKPITATGAMAENAGPPPVYKHKTGDDDDDASHDASGVITTSALGGGELEITPIPASGGLKIKLPEVSCTICGQRFTDQELFSKHIQMHEMELYTDNPLAAMFDTGPADPNQFYLDRVNDNGEYACDLCNKTFTQMTALKVHRKWHFRGDSKQSQADGDHLANAATSHSSQIQTNHRHPLGLQAVGLMPNPHQHSSKSLKRKRELKCEYCPSTFISNNNLRRHIYELHKDEIGNLPVPPKIEIDPYLQCRRCQEQFETKNEWIDHKVADARVTKPFGPFQWGCDLCGAYVSRKEKLINHINNHLKEKEIVPVDDPQEVHDQNQNHAKATVTATDAGTVAGDGGEVKVKRELDVDNNEQYNDVDKEGEEDSEEEAGELDGEAEEGEEEEEVEEQQKAVSEVRKPEEDSDMEEVDEEASEEEADDEEYEDMGSMMQVNMTERASNEAAVEQDDEDDDDDGDGEGEGEEDADADDADDIDEDINDNVATTNGPTYGRVPPATTKAQPNRISTDTTTSYEDDDDDDDDEDDDEDDNDSDADSDVDTGDSSSQASKAPAPAPKARFSCDLCRLFFDSQQELQKHVKMHFLNGPGSVSLTEIKPKTGNKSSRSSSSDVLAV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00192225; iTF_00190811;
90% Identity: -
80% Identity: -