Basic Information

Insect: Drosophila differens
Gene Symbol: hang_1
Assembly: GCA_037043665.1
Location: JBAMAZ010000130.1:276289-292758[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.38 25 5.6 1.0 3 23 514 535 513 535 0.93

2 18 1.1 71 4.1 3.2 3 22 642 661 640 661 0.89

3 18 0.00082 0.053 14.0 3.3 1 22 772 793 772 795 0.90

4 18 0.094 6.1 7.5 0.1 2 21 807 826 806 827 0.93

5 18 0.00095 0.062 13.8 0.2 2 23 975 997 974 997 0.95

6 18 0.0027 0.18 12.3 0.1 1 23 1005 1028 1005 1028 0.96

7 18 0.00021 0.014 15.8 0.2 2 23 1119 1140 1118 1140 0.97

8 18 0.00039 0.025 15.0 2.9 2 23 1240 1262 1239 1262 0.97

9 18 0.031 2 9.0 0.2 2 23 1271 1293 1270 1293 0.95

10 18 0.00069 0.045 14.2 0.3 1 23 1306 1329 1306 1329 0.97

11 18 0.00017 0.011 16.1 1.1 1 23 1388 1410 1388 1410 0.99

12 18 0.0026 0.17 12.4 0.9 1 23 1418 1441 1418 1441 0.96

13 18 0.093 6 7.5 0.4 2 19 1449 1466 1449 1467 0.94

14 18 0.0021 0.14 12.7 0.3 3 23 1575 1595 1574 1595 0.98

15 18 0.0014 0.093 13.2 0.1 1 23 1630 1652 1630 1652 0.97

16 18 0.00081 0.053 14.0 0.6 2 23 1746 1768 1745 1768 0.93

17 18 0.0087 0.57 10.7 0.3 3 23 1824 1844 1824 1844 0.98

18 18 9.2e-05 0.006 16.9 2.1 1 23 2296 2318 2296 2318 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.38	25	5.6	1.0	3	23	514	535	513	535	0.93
2	18	1.1	71	4.1	3.2	3	22	642	661	640	661	0.89
3	18	0.00082	0.053	14.0	3.3	1	22	772	793	772	795	0.90
4	18	0.094	6.1	7.5	0.1	2	21	807	826	806	827	0.93
5	18	0.00095	0.062	13.8	0.2	2	23	975	997	974	997	0.95
6	18	0.0027	0.18	12.3	0.1	1	23	1005	1028	1005	1028	0.96
7	18	0.00021	0.014	15.8	0.2	2	23	1119	1140	1118	1140	0.97
8	18	0.00039	0.025	15.0	2.9	2	23	1240	1262	1239	1262	0.97
9	18	0.031	2	9.0	0.2	2	23	1271	1293	1270	1293	0.95
10	18	0.00069	0.045	14.2	0.3	1	23	1306	1329	1306	1329	0.97
11	18	0.00017	0.011	16.1	1.1	1	23	1388	1410	1388	1410	0.99
12	18	0.0026	0.17	12.4	0.9	1	23	1418	1441	1418	1441	0.96
13	18	0.093	6	7.5	0.4	2	19	1449	1466	1449	1467	0.94
14	18	0.0021	0.14	12.7	0.3	3	23	1575	1595	1574	1595	0.98
15	18	0.0014	0.093	13.2	0.1	1	23	1630	1652	1630	1652	0.97
16	18	0.00081	0.053	14.0	0.6	2	23	1746	1768	1745	1768	0.93
17	18	0.0087	0.57	10.7	0.3	3	23	1824	1844	1824	1844	0.98
18	18	9.2e-05	0.006	16.9	2.1	1	23	2296	2318	2296	2318	0.99

Sequence Information

Coding Sequence: ATGTGCGACgctgccacaaaaacaacaacaacagcagcagcaacgacaacaacaactgcagcagcagtagcacaaggaacaggaacaggagcTGCTGGCGATACAGCGATGGaagaacaacatcaacgaGAGCGACAAAGCTGCTGTCGCCTATGCATAGCGCCCGCCAGCGAATGCATTTCGATCATTAACAGTTATGCGGCCGATAAGGAGCCGCTGGCCACTAAAATACACAACTGCGTAAATATCAAGATCACATCGGTGGATCGTCTGTCGTTGCATATTTGCCATGCCTGCATCAGTTATTTGAACTCGTGGCAGAGCTTCAAGAATCGCTGCCTCAGCTCACAGTCGAAGCAGCGCCAATGGCTGGAGACGGACAAAACCAAGCAGCAGACGCTACTCGGATACTTGGATTTGAACAGGGCCGAGAATGGCAATACCattgagcaacaacagcagcagcagcagcacgaatTGAAAATGGATTCAGCGACGGCTGCAGCTGAAAAGGTGTCCGCTGCCAACATTTTGGATGGCATACCTCAGCTGAAGAAACGAAAATCGTTAACAGTCTATGTGAGTCCGAGTcataagcaacagcagcaagcacagcaacaacagtcgcaGCAACATTCTCAGCAACAGCATGCAACAGGGGCAAGATCAACAACGAAAACatcagcggcggcggcagcggtggcagAGTCGCAACAAACATTGCAAACCCTTTTATTGCAGGTgcccacagcagcagcagcagcagcgacattgGCAACGTCGtcaacacagcaacagcaacagcagcgcaagtatcaacagcagcagcagcagcagcaacgtggcaagcagcagcaacatcagtatcatcaacagcagcagcgacagagTCGCGTTCGTCAACCGCGACGACAGCATCAAGCCGCAACGGGCAAATTCAGGAGCAAGTTGTATGTGCCATTGGATATATCGGTGCCAGCACTACCAGCGCTgttgccgccaccgccgccagctgttgctgatgcagcgtcgttgccattgccgctgtcgctgccacTTGATTTCAGCCAGAATCcgaatccaaatccaaatcccaatccaaatccaaaataTACAAGTAGCGTTTTAGtgtcgcagccgcagccgccgccgctgccgctgcccccGCCAGTTGCAACAATGAGCAGCAACGAGGCTGCcattgccgctgccactggctgtggtgcaactgcaactgcaactgcaaccgcaGTCACGACTCCATTACTCATGCCGCCGCTGCCTGCCGTGCCCATCAAGGATGAGCCCCTGGACGATACGGATGATGACTTTCAAATGAAGTGCATAGACGAATCCGATGATATGATGGATCCCACAATGTTCCTAGAGCGCTCCGAGCACGAAGGCGATGTGCCACTAAATACCTCCGACTATGATTATACGGCTCAGCATGGCGTGACCGCTGTTGTGGCGGCTGCATCGCTGCCGGCCAGCGCCGTTGCCAATGTGGCCGCCGCTGGCGACTCAAAGGTGGCCAGCTGCCGGGCGTGCAGTCTGCAGTTCTCGACGCGGGCGAATGCGCGTCGCCACGAGCGCAATCTGCATCCGAATCTGTTTCAATTGTCGACAGACTCACCAAATAATACGCCAATCACCAAACCGACACCGGCCCTCGCCGCCGCCTTGGAGATACAGCgtgcagcggcggcggcagcggcaaccGCTGAGGCAACGCGTGCCGCTGCCGGTGGCAATATATCGGCGCAAAAGTATCGACAGGTGGTGATGAACACGTTCATCAAATGCGAAAACGGTGGCTTCGACTACGACAATCCCGAACAGTATCAGCAGCTGTTGTCGCACGACAAGGTCGACTTCATACAGGAGAACAGCGAGTTTCTCGAACAGTACCAGACGATGACGTGTCGCTGTTGCAACAAGTACTTCAACACGTACAAAAACTTTATGGCGCACGTACGCAAAAAGTATCCATTGTTGCCGCGCAACCTGTGCTTCAACTGCCTCAAGATGAACGACTCGAAGGCGCTGTTCATATCGCATCTGAAGAAGCGCAACTGCATCAATTTGTATCGTGTGCTCAACGCACTGCGCACCAAACAGCCAAACTTTGTccatgccaatgccaatgcctcATCCACTTCCACTCCAGCCGCAACGACTGCTgtacaccagcagcagcagcagcagcaacagttggtgACAGCAAacgaaacagcagcaacaacaacagcaacaacatcaacggaTCGTCCGGAGAAGTTGCGTGCCAAGGAGCTCCTGGTTAACAAGCTGTACGAGTGCAAGCTGTGCCCAAAGGGTTTTCGCACAAAGCACGAGTTCCGCACCCATGTCTACGACAAGCATGCGGATGTCCAGCGCAAGGATAACAATTCGATACAGTGCAGCTTCTGTGGCCTGGACTTTGCCGATCCCGTAGATCGGCGAAGGCACTACAATAACATGGATTGCATTGTCCGGCTGCGCTGCATGACCTGCGATGCGAAACTGGAGACGCATCAGCGATTCCTCGACCATGTCTATCAGGATCATTTGGGTGGGGTGAGCAGTGATAATGCATCGTCCACGGCGACGACCAGCGGCATGGATCATTCGCCCGGGAAGCGCAGTTTGCTGGGCGCCCTTGGCATCGGCGTTGTCAGTCAATCATCCAATGATGAGtcgcgcagcagcaacaaccacaacaacaacaataataacaacagcaacaacaacaacaacaataatacacCTCTAACCTCGACACCTAAACTACCAACCgtagcaggagcagcaacagttgttggaggaggaggaggagcagcagcagcaaccagtgGCGGATCGACAACATCGGGCAGTCGAGATGCACCCAAATCACAGTATTTCTCACGAATGCCACAGGTCTGTCCGATCTGTGGCCAGCAgtacaacaactataacaatGTGTTGCGCCACATGGAATCGAAGCATCCCAACAAATTGCCCGAGACATACAAGTGTGTCCGTTGCGGATTGGGCTATCCGCGGATCTCCTATCTGCGGGAGCACATGATCAATGTGCATGGCGTTGACAAGAATCGGCATTCGGGCGGCTTTGAATATATTGTGAATGCCGATGCGGTTAAATTGGCGGATGGCAGCACGCCCAATGTCTATACGGGACGATATGATTATGTGATGAAGGATCTGATGTCTATAACAAATGGTGGGACACTCgatgatgatgacgatgatggcGGCAACGGCGGCAACATTGCCAAAAAGATGAGACTCGAtgatagcagcaacaacagcagcagcatcaacatgAGCAGCATTGCCAACCAGCAGAAGGAGTGCCTCATCTGCAATGCGGTGTTTAGCAACAATATTGGTCTATCGAATCATATGCGTTCCCATTACACAGCATCGATAACGACAAGTGCTGCTCTGGCGGCTGCCAATCGCATGACGCCCAAATCGCTGACAATAACAGCGACGCCACCGCTGGAGacaacgacagcaacaacaactgcatctGGAgttgcagcagtggcagcatcatcatcaggagCAGTCgcctcaacagcaacagcatcaggaTCAGGCTCATCATCCGGCAACTTGCCGCCAGCAATGGTCCATCAGACGGCACAGGAGCAGGCGGTATTCCGTCGCAGTCTGGATCAGGCGGCCGATCGACGCTTCCGTCGAATGCGCTGTCGCATCTGTCAGCGCAGATTCAGTTCGAAGAAATCGTATCGCTACCACATGCTCACCGACCACCAGGTGCAGAATGTGCAGTTCATCAAGTGCAAGCTGTGCAATGCGGAGTTCGCCTACGAGAAGGGGCTAAAGGTGCATCTGTTCAAGGTGCACGGCCGGGCCATCAAGGACGAGATGATTATCAAGCAGTTCGAGTGCGATGTCTGCTCCACGGTCTACAGTTCCGAGATGGaattgcagcagcacaagcgCAGCGTACACAAGTCACACGCCAGTgattcatcatcatcagcagctggtggtgctggtgctgctgctggcaaatcATCATTGAAATCTGCTACTGCTACTATCTCATCGACGGCTGAGCTGGTCGCAGACACATCATCCTCGTCGGGCACGGCGGGTGCGGCAATTCTGCTGCCACTCTACTGGTACCAGTGCAAATATTGTCCATCCAATTTCAACACCAACAAGAAACTGGCCATCCACATCAACTCGCACGACGAGTTCGACTCGAATGATTACTCGTGCAAGGACTGCGGCAATGTCTACAGCGGCCGCAAGAGCCTCTGGGTGCATCGCTACAAGAAGCATCCGCAGGTGCCGGATCCCGCCGAGTGCACGCTCTGCCGCAAGATGTTCTTCGATCGCCAGATGCTGGAGAATCATACGCCCACCTGCAATCGCAAGCCAATCACTGCCACCGGCGCCCATCAGcaggatcaacagcagcagcagcagcaacaacaacagcagcaacaacagctgcagctgcaacatcaTCAGCGACGCATCTTCAAGCACAAAAcgggcgatgatgatgacgaggaggaggacgatgaTCAGTTGCTGCTAATGGACGAtggcggtggcggcagcaATGATAGCAATGCTGGCAATGCCAttgcgtcagcagcagcagcagcagcggcagcagcagcagcagtcacaatAAATACGAGCACAATGAAGATACGCATTCCGGAGGTTGCATGCACCATTTGCGGTGCCCGTTTCACCGATCAGGAAATATTCACCAAGCATATACAGAAACACGAACAGGAACTGTATGTGGACAATCCGTTGGCGGCGATGTTCGATGATGGGCCAGCGGATGCCGGACAATTTCAGGTTGAGCACCAAAACGAGAATGGGGAATACGCGTGCGATTTGTGCACCAAGACGTTCCCGCAGGTGATAGCGCTCAAGGTGCATCGCAAGTGGCATTTCAGAGGTGATAGCAAGCAGATCCCAATCAACGACGGCGAAGCGACAACGctgaacaacagcagcaacaacagcagcagcagcaacaacaacaacaacaacaacaacaattcgctGAGCTCATCATCGATGCTGCATCTACGCGAACTGCATGCGGTGGGTCTGATGcccaatcagcagcaacaccaaaaacaacaacagcaacaacaacagcagcagcaacagcagcagcagcagcaacaacggacGAGCAAATCAATGAAACGGAAACGTGAACTGAAATGCGAATATTGCGCCTCCACATtcattagcaacaacaacctgcGACGCCACATGTACGAGCTGCACAAGCACGAGGTCAGCAACCTGCCAGAGCCGCCCGTGATTGAGGTGGATGAGCCGTTGGCGTGTCGCCGTTGCGGCGATCTACAATTTGATACCAAAGAGCAGTGGATCGAACATAAGCTGGCCGATGCGCGAGTGGTGCGTCCATTCTGTCCATTCCAATGGGGCTGTGATCTGTGCGGCGAGTATTTGTCGCGCAAGGAGAAGCTCATCAATCACATTAACAATCATCTCAAGGAGGATGTGATTGTGCCGGTCGCCACCAAGCCACCAGCACCGGCAGCAGCCCATAAaactgcagcggcagcagcagcagcaacaacaacaacagcggcaacaacaacaacaattgccgccgcagcaacagttgcagctgctacatcagcagcagcagcaacggcggcgACGAAGTcagcgtcaacagcagcaaaagaacaTAAGGctaaacaacagcagcaggaggatgAGGACCTGCAGCTGGATGATGAGAAGCTagcgaagcagcagcaacaggaggaggaggaggatgataGTGATATGGATGATGGTAGCGATAGTGGcaatgatgatgaggagggCAGCACCAGtgctgacgatgatgatgatgatgacgatgatgatgaggagggcgacggcgatgacgacgacgatgatgatgacgaagaagaagacaacgacaatggcgaaaatgttgttgcacagcagcaaatgctgcaacaacagcctcaaaatacaaacagcaacaccaacaacaacaacagcagcgcaatTGAAAATGACGATGATCTCATTGAGGAGGTGATCGAGGATGATGGCATTGTCGAGCAGCTGGacgtcgatgatgatgaggaagacgatgatgatgatgacgacgatgatgatgatgatggcgaagacgatgacgatatcgatgaggatgaggacgaggacgatgagCAACATCAGCCGAGGCGCCTCAATTTCGACTACTCGCGCACCGACAGCGCCAAGCTAAATGGCAACGGTGGCAAACAGTCTGTGGCAAAATCAAAGACACAGCCACAGTTGCAgccacagttgcagcaacagttgcagacACAGCCAATGCTGGTCATGCACAGTAGTAGTAGTCGCCACGTGGATGATGGCGAGGAGGAGGTGGATGATAtggatgatgatgttgatgacgatgatgttgTGGGTGAAGCGATGACCATTGATGATATTATTGAAGAGGATGATGGTGTGGATGATGACGATGTGGTTGGTGTcggtggtggtgttgttgaggatgatgatgatgatgacgaagaagatgatgatgacgacgatgatgatgacgatgatgttgAGGAGGAcatggatgatgatgatgatgatgatggggaCGACGACGATGCCGATGTCAACAACACCAATATTGGCAACGGTGTTGGCCGTGTGGGTCGAGAAGatgctgatggtgatggtgatggggatggtgatggtgatggtgatgttGATGGTGGTTCATCATCATCTGAGAGCgagtcgacaacaacaacatcgcaTTCAACTGttgCATCAGCGGCACATGGCGCTGCCGCTGATCAGTCTAATTCCAGCTATACGTGTGATCTATGTCAACTTTGTTTCGATTCCCAGGAGCTACTGCAGACACATATTAAAAGTCATTTTCTCAATGGGCCATCGGcggggagcagcagcaacagcaacaagagcaacggCGCCAGCAGGagcaccaataacaacagcaacaacaacagtagcaacagcaacagcagtaacaaaatCAATACCAAAAAGTCCGGCTTGGATGCAacgaagacaacaacaacaacaacaacagttaagGCTGCTGCAGTAGCGGACGCTGTAACGGGCTTCAACTGA
Protein Sequence: MCDAATKTTTTAAATTTTTAAAVAQGTGTGAAGDTAMEEQHQRERQSCCRLCIAPASECISIINSYAADKEPLATKIHNCVNIKITSVDRLSLHICHACISYLNSWQSFKNRCLSSQSKQRQWLETDKTKQQTLLGYLDLNRAENGNTIEQQQQQQQHELKMDSATAAAEKVSAANILDGIPQLKKRKSLTVYVSPSHKQQQQAQQQQSQQHSQQQHATGARSTTKTSAAAAAVAESQQTLQTLLLQVPTAAAAAATLATSSTQQQQQQRKYQQQQQQQQRGKQQQHQYHQQQQRQSRVRQPRRQHQAATGKFRSKLYVPLDISVPALPALLPPPPPAVADAASLPLPLSLPLDFSQNPNPNPNPNPNPKYTSSVLVSQPQPPPLPLPPPVATMSSNEAAIAAATGCGATATATATAVTTPLLMPPLPAVPIKDEPLDDTDDDFQMKCIDESDDMMDPTMFLERSEHEGDVPLNTSDYDYTAQHGVTAVVAAASLPASAVANVAAAGDSKVASCRACSLQFSTRANARRHERNLHPNLFQLSTDSPNNTPITKPTPALAAALEIQRAAAAAAATAEATRAAAGGNISAQKYRQVVMNTFIKCENGGFDYDNPEQYQQLLSHDKVDFIQENSEFLEQYQTMTCRCCNKYFNTYKNFMAHVRKKYPLLPRNLCFNCLKMNDSKALFISHLKKRNCINLYRVLNALRTKQPNFVHANANASSTSTPAATTAVHQQQQQQQQLVTANETAATTTATTSTDRPEKLRAKELLVNKLYECKLCPKGFRTKHEFRTHVYDKHADVQRKDNNSIQCSFCGLDFADPVDRRRHYNNMDCIVRLRCMTCDAKLETHQRFLDHVYQDHLGGVSSDNASSTATTSGMDHSPGKRSLLGALGIGVVSQSSNDESRSSNNHNNNNNNNSNNNNNNNTPLTSTPKLPTVAGAATVVGGGGGAAAATSGGSTTSGSRDAPKSQYFSRMPQVCPICGQQYNNYNNVLRHMESKHPNKLPETYKCVRCGLGYPRISYLREHMINVHGVDKNRHSGGFEYIVNADAVKLADGSTPNVYTGRYDYVMKDLMSITNGGTLDDDDDDGGNGGNIAKKMRLDDSSNNSSSINMSSIANQQKECLICNAVFSNNIGLSNHMRSHYTASITTSAALAAANRMTPKSLTITATPPLETTTATTTASGVAAVAASSSGAVASTATASGSGSSSGNLPPAMVHQTAQEQAVFRRSLDQAADRRFRRMRCRICQRRFSSKKSYRYHMLTDHQVQNVQFIKCKLCNAEFAYEKGLKVHLFKVHGRAIKDEMIIKQFECDVCSTVYSSEMELQQHKRSVHKSHASDSSSSAAGGAGAAAGKSSLKSATATISSTAELVADTSSSSGTAGAAILLPLYWYQCKYCPSNFNTNKKLAIHINSHDEFDSNDYSCKDCGNVYSGRKSLWVHRYKKHPQVPDPAECTLCRKMFFDRQMLENHTPTCNRKPITATGAHQQDQQQQQQQQQQQQQQLQLQHHQRRIFKHKTGDDDDEEEDDDQLLLMDDGGGGSNDSNAGNAIASAAAAAAAAAAAVTINTSTMKIRIPEVACTICGARFTDQEIFTKHIQKHEQELYVDNPLAAMFDDGPADAGQFQVEHQNENGEYACDLCTKTFPQVIALKVHRKWHFRGDSKQIPINDGEATTLNNSSNNSSSSNNNNNNNNNSLSSSSMLHLRELHAVGLMPNQQQHQKQQQQQQQQQQQQQQQQQRTSKSMKRKRELKCEYCASTFISNNNLRRHMYELHKHEVSNLPEPPVIEVDEPLACRRCGDLQFDTKEQWIEHKLADARVVRPFCPFQWGCDLCGEYLSRKEKLINHINNHLKEDVIVPVATKPPAPAAAHKTAAAAAAATTTTAATTTTIAAAATVAAATSAAAATAATKSASTAAKEHKAKQQQQEDEDLQLDDEKLAKQQQQEEEEDDSDMDDGSDSGNDDEEGSTSADDDDDDDDDDEEGDGDDDDDDDDEEEDNDNGENVVAQQQMLQQQPQNTNSNTNNNNSSAIENDDDLIEEVIEDDGIVEQLDVDDDEEDDDDDDDDDDDDGEDDDDIDEDEDEDDEQHQPRRLNFDYSRTDSAKLNGNGGKQSVAKSKTQPQLQPQLQQQLQTQPMLVMHSSSSRHVDDGEEEVDDMDDDVDDDDVVGEAMTIDDIIEEDDGVDDDDVVGVGGGVVEDDDDDDEEDDDDDDDDDDDVEEDMDDDDDDDGDDDDADVNNTNIGNGVGRVGREDADGDGDGDGDGDGDVDGGSSSSESESTTTTSHSTVASAAHGAAADQSNSSYTCDLCQLCFDSQELLQTHIKSHFLNGPSAGSSSNSNKSNGASRSTNNNSNNNSSNSNSSNKINTKKSGLDATKTTTTTTTVKAAAVADAVTGFN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00596083;
90% Identity: iTF_00486003;
80% Identity: -