Basic Information

Insect: Drosophila micromelanica
Gene Symbol: hang_1
Assembly: GCA_004143905.1
Location: SCDX01000559.1:44658-57655[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 0.26 18 5.8 1.0 3 23 304 325 303 325 0.93

2 17 1.9 1.3e+02 3.1 3.2 3 22 432 451 430 451 0.89

3 17 0.00055 0.039 14.2 3.3 1 22 550 571 550 573 0.90

4 17 0.063 4.4 7.7 0.1 2 21 585 604 584 605 0.93

5 17 0.00064 0.045 14.0 0.2 2 23 739 761 738 761 0.95

6 17 0.0018 0.13 12.6 0.1 1 23 769 792 769 792 0.96

7 17 0.00014 0.0098 16.1 0.2 2 23 878 899 877 899 0.97

8 17 0.00026 0.018 15.2 2.9 2 23 1000 1022 999 1022 0.97

9 17 0.021 1.4 9.3 0.2 2 23 1031 1053 1030 1053 0.95

10 17 0.00081 0.057 13.7 0.2 1 23 1066 1089 1066 1089 0.97

11 17 0.00011 0.008 16.4 1.1 1 23 1134 1156 1134 1156 0.99

12 17 0.0018 0.12 12.6 0.9 1 23 1164 1187 1164 1187 0.96

13 17 0.062 4.4 7.8 0.4 2 19 1195 1212 1195 1213 0.94

14 17 1.5e-05 0.0011 19.1 0.4 3 23 1306 1326 1305 1326 0.98

15 17 0.0046 0.32 11.3 0.1 1 23 1361 1383 1361 1383 0.97

16 17 0.00055 0.039 14.2 0.7 2 23 1477 1499 1476 1499 0.93

17 17 0.0059 0.41 11.0 0.3 3 23 1555 1575 1555 1575 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	0.26	18	5.8	1.0	3	23	304	325	303	325	0.93
2	17	1.9	1.3e+02	3.1	3.2	3	22	432	451	430	451	0.89
3	17	0.00055	0.039	14.2	3.3	1	22	550	571	550	573	0.90
4	17	0.063	4.4	7.7	0.1	2	21	585	604	584	605	0.93
5	17	0.00064	0.045	14.0	0.2	2	23	739	761	738	761	0.95
6	17	0.0018	0.13	12.6	0.1	1	23	769	792	769	792	0.96
7	17	0.00014	0.0098	16.1	0.2	2	23	878	899	877	899	0.97
8	17	0.00026	0.018	15.2	2.9	2	23	1000	1022	999	1022	0.97
9	17	0.021	1.4	9.3	0.2	2	23	1031	1053	1030	1053	0.95
10	17	0.00081	0.057	13.7	0.2	1	23	1066	1089	1066	1089	0.97
11	17	0.00011	0.008	16.4	1.1	1	23	1134	1156	1134	1156	0.99
12	17	0.0018	0.12	12.6	0.9	1	23	1164	1187	1164	1187	0.96
13	17	0.062	4.4	7.8	0.4	2	19	1195	1212	1195	1213	0.94
14	17	1.5e-05	0.0011	19.1	0.4	3	23	1306	1326	1305	1326	0.98
15	17	0.0046	0.32	11.3	0.1	1	23	1361	1383	1361	1383	0.97
16	17	0.00055	0.039	14.2	0.7	2	23	1477	1499	1476	1499	0.93
17	17	0.0059	0.41	11.0	0.3	3	23	1555	1575	1555	1575	0.98

Sequence Information

Coding Sequence: atgttacaGATCACGCCATTGGATCGGCTATCGCTGCACATTTGCCACGCCTGCATCAGCTATTTGAACTCGTGGCAGAGCTTCAAGAATCGCTGCCTCAGCTCGCAGACAAAGCAACGACAATGGCTGGAGACGGACAAGAGCAAGCAGCAGACGCTACTCGGCTATTTGGATTTAAACAAAACGGAGAACGGCAGCTCCACggaccatcagcagcagcaacagcagcacgaATTGAAAAACGATTTGgcgacagctgcagctgaaaagGCGTCCGCCAACATTTTGGATGGCATACCCTCGCTGAAGAAACGCAAATCGCccaaattgtatttgccattgGATATCTCGGTGCcatcgctgccgctgccaccgccgcAGCCAGTGTTGTCAAATGTTGCTAGTGCCAGtgttggtgctggtgctgttgctgagCTGGCGCCGTTGTCGTTGCCACTCGATTTCGGCCAGAATCAGTGTCAGAATCAAAATCTGAATCAGAGTCAGAAACTTGGCGGCAttttgccgccgccgccgccgctgccgctgccgttgccgccgcaTCCGCCGCCAGTTGCAGCaatgagcagcaacagcgctgCCGTTGGCTCTGCCGCAGTCACGACTCCGCTGCTCATGCCGCCGCTGCCTGCTGTGCCCATCAAGGATGAGCCCCTGGACGATACGGACGATGACTTTCAGATGAAGTGCATAGACGAGTCCGATGACATGATGGATCCCACAATGTTCCTAGAGCGCTCCGAGCACGAGGGCGATGTGCCACTAATGACCTCCGACTATGATTACACGGCGCAGCACGGCGTgacggcggcggtggcggcggcggcaacgttGCCCGCCAGCGCCGTGGCGAACGTGGCCGCCGCCGGGGACTCGAAGGTGGCCAGCTGCCGGGCGTGCAGTCTGCAGTTTTCGACGCGGGCGAATGCGCGACGCCACGAGCGCAATCTGCATCCAAATCTGTTCCAATTGTCGACAGACTCGCCAAATAATACGCCGATCACGAAACCGACGCCGGCCCTGGCCGCCGCCTTGGAGATCCAGCGGGCGGCCGCTGCGGCCGCGGCGACCGCGGAGGCAACAAAGGCCGCCGCCGGCGGCAACATCTCGGCGCAAAAATACCGCCAGGTGGTGATGAACACGTTCATCAAGTGCGAGAACGGCGGCTACGACTACGAGACACCGGAGCAGTACCAGCAGCTGCTCACCCGCGACAAGGTGGAGTTCATCCAGGAGAACAGCGAGTTCCTCGAACAGTACCAGACGATGacgtgccgctgctgcagcaagtaCTTCAACACCTACAAGAACTTTATGGCGCACGTCCGGAAAAAGTATCCGCTGCTGCCGCGCAATCTCTGCTTCAACTGCCTCAAGATGAACGACTCCAAGGCGCTGTTCATCTCGCATCTCAAGAAGCGCAACTGCATCAATTTGTATCGGGTGCTAAATGCGTTGCGCATCAAGCAGCCAAACTTTGCCCATGCCAATGCAGCCGGACTGGCTGTCACGGCGGacggacaacagcagcagcagcagcagcagcagcagcatcagccacTGATTGAAACGTCAACGGAACGTCCGGAGAAGCTGCGCGCCAAGGAGCTGCTGGTGAACAAATTGTACGAGTGCAAACTGTGCCCCAAAGGATTTCGCACCAAGCACGAGTTTCGCACCCATGTCTATGACAAGCATGCGGATGTGCAGCGCAAGGATAACAATTCGATACAGTGCAGCTTCTGTGGTCTGGACTTTGCCGATCCGGTGGATCGGCGTCGCCACTACAACAACATGGACTGCATTGTCCGGCTGCGCTGCATGACCTGCGATGCCAAATTGGAGACGCATCAGCGATTCCTGGATCACGTCTATCAGGATCATTTGGGCGGCGTGGGCAGCGACAATGCCTCGACGGCGAACAGCGGCGGATTGGATCATTCCCCCGGCAAACGGAGCCTGCTGGGCGCCCTCGGCATCGGTGTCAGTCAGTCCTCCAACGAGGAGTCGCGCAGCAGCGGCcatcacaacaacaatgcctcCGAGGCGCCGCTCACCTCGACCCCAAAACCAgtcggaggaggaggaggagcagctgcagctgcagctgcagcagcaacgggaACCAGCGGCGGTTCCACATCCGGGAATCGTGATGCGCCCAAATCGCAGTATTTTTCGCGCATGCCCCAGGTTTGCCCGATCTGTGGACAACAgtacaacaactacaacaatgtGCTGCGCCACATGGAATCGAAGCATCCCAACAAACTGCCGGAGACGTACAAGTGCGTCCGATGCGGATTGGGCTATCCGCGCATCTCGTACCTGCGCGAGCACATGATCAATGTCCATGGCGTCGACAAGAATCGGCACTCGGGCGGCTTTGAATATATTGTCAATGCCGATGCGGTTAAGCTGGCCGATGGCAGCACGCCGAATGTTTATACCGGACGCTATGACTATGTGATGAAGGATCTGATGTCAATAACAAATGGTGGGACACTcgATGACGACGAGGAGGAGGGCGGCAGCATTGCCAAGAAGATGCGACTggacgacagcagcaacaacagtagcatCAACATGAGCCTGGCCAACCAGCAGAAGGAGTGCCTCATCTGCAATGCGGTGTTCAGCAACAACATCGGCCTCTCCAATCACATGCGTTCCCATTACACGGCATCGACGGCGACGAGCGCCGCTCTGGCGGCGGCCAATCGGATGACGCCCAAATCGCTGACAATCACAGCAACGCCGCCGCTGGAGGCGGCTGTCGTGTCGTCCACGGCATCAGCACctgccacaacagcagcagcagcaacagttgcagcaacaactgcaacagcagctgctgcaacaacaacagcagctggaggaAGCTTGCCTCCTGCAATGGCAAATCAAACGCCGCAGGAGCAGGCGGTATTCCGGCGCAGTCTCGATCAGGCGGCCGATCGTCGCTTCCGGCGGATGCGTTGCCGGATCTGTCAGCGCAGATTCAGCTCGAAGAAATCGTATCGCTATCACATGCTGACCGACCATCAGGTGCAGAACGTGCAGTTCATCAAGTGCAAGCTGTGCAATGCGGAATTCGCCTACGAGAAGGGCCTCAAGGTGCATCTGTTCAAGGTGCACGGACGCGCCATCAAGGACGAGATGATCGTCAAACAGTTCGAGTGCGATATCTGCTCCATTGTCTACAGCAACGAACTggaactgcagcagcacaagCGCAGCGTCCACAAATCCCATTCCGGCTCCGATTCCAACAAATCGATGAAATCGGCCACAGCTACCGCGACCTCAGCCGAACTGGCCGAGACATCCGGCCATCCGGCGACGGCTGTAACCACAACAACATTGCCCCTGTACTGGTACCAGTGCAAGTACTGTCCATCCAATTTcaataccaacaaaaaactggCCATACACATCAATTCGCACGACGAGTTCGACTCCAACGACTACTCCTGCAAGGACTGCGGTAATGTCTACAGTGGCCGCAAGAGCCTCTGGGTGCATCGCTATAAGAAGCATCCTCAGGTGCCCGATCCCGCTGAGTGCACGTTGTGCCGTAAGATGTTCTTTGATCGCCAGATGCTGGAGAATCACACGCCCACCTGCAATCGCAAGCCCATTACTGCCACCGGCGCCCATCAGCAggatcagcaacagcagcagcagcaacaacagcagcagcagcaacagttgcagcagcatcagcgcgGCATCTTCAAGCACAAGACGGGCGACgatgatgaggaggaggacgatgatcagctgctgctgctggacgaTGGCGTCGGCGGCGACAGCAATGGCGGTGCAGCCACTGGCAATCCGAGcacgatcagcagcagcacactGAAGATTCGGATACCGGAGGTGGCGTGCACCATTTGTGGTGCCCGGTTCACCGATCAGGACATGTTCACCAAGCACATCCAGAAGCACGAACAGGATCTCTATGTGGACAATCCGCTGGCCGCGATGTTCGATGATGGACCGGCGGACGCCGGCCAATTTCAGGTGGAGCGCCAAAACGAGAACGGGGAATACGCGTGCGATCTGTGCGCCAAGACGTTCCCCCAGGTGATTGCGCTCAAGGTGCATCGCAAGTGGCATTTCAGAGGTGATAGCAAGCAGAATCCAATCATCGACGGCGAAGCGACAACGctgaacaacagcagcagcaacagcaacaacaacaacagcagcagcagcaacaacaacaacaattcaatgCTGCATCTGCGCGAACTGCATGCGGTGGGTCTGATGCCCAACCAACAGcaccagaaacaacaacagcaacagttgcaactgcaacagcagcagcagcagcagcagcagcaacagcggaaCAACACGTCGAGCAAATCGCTGAAACGGAAACGTGAACTGAAATGCGATTACTGCGCCTCCACAttcatcagcaacaacaatctgcGTCGCCACATGTACGAGCTGCACAAGCACGAGGTGAGCCACCTCCCGGAGCCGCCGGTGATCCAAGTGGATGAGCCTCTGACCTGCCGGCGTTGCGGTGACTTGCAGTTCGAGACGAAGGAGCTGTGGATCGAGCATAAGCTGGCCGATGCGAAGGTGGTCCGGCCGTTCTGTCCGTTTCAATGGGGCTGCGATCTGTGCGGCGAGTATTTGTCGCGCAAGGAGAAGCTCATCAATCACATCAACAATCACCTCAAGGAGGATGTGATTGTGCCCGTTGCCAAAGCGACGAcaaacaaaacagcagcagcgacaacaacagcaacagcagcagcagcaacaacatcagcagcaacaacagctgctgcagcaacaacaaccacaaagacaacaatcaaaacaaaGATTAAACAGCAACAGGAGGAGGAagcggagacggagacggaggcgCAGTTGGAATTAAATGCTGGCAAGCTGGCCAAGCAGGAGGATGTGGATAGTGATATGGATGATAGCGATAGTGGCGATGATGAGGATAGCACAAGTGCtggcgatgatgatgacgacgaggatgacgatgacgatgaggaTGGCGAGgtcgatgatgacgatgacgatgaggatgacgacgatgaagatgatgatgatgacgatgacgaagacgaagatgttgtgcagcaacagcagcagctgctgcagcagaaacaacagcaacaacaacagccactgaacagcaacaacaacaacaacaacaacaacaacacgagtGTTGTGGCCAATGAAGATATCGATGATCTCATTGAGGAGGTGATCGAGGTGGATGGCATTGTCGAGGAAATAGAggatgatgaggatgatgacgatgacgatgacgacgacgacgatgatgacgatgtgGATGAAGTCGATGAGGATGATGGCAACACCACAGATGAACACCAACAGCTGTCCACAGCCAAtgagaaacaacagcagcaacaacagcagccggcgGAGCAGCGGGAAGCACATCAGCCGCGGCGACTCAACTTTGATTACAGCCGGACAACGGACAGCGCCAAGCTGAATGGCACCGGTAATGGTAAAAAATCGAAGTCGGTGCTGGTCATGCACAGCTCCGAGGAGGATGAAGAGGAAGATgttgatgaggatgaggatgaggatgcgGGCGGTGAGCCCATGAACATCGATGATATTATTGAAGAGGACGATGGTGTCGATgtcgatgatgacgatgacgatgatgacgtCGGCGGTGCTGTCGTTGAGGATGATGATGTTGACGAGGACATGGACGAGGACGATGTCGACGAGGACGAtgtcgacgacgacgtcgacgatgACGGGCACATTAACAACGGCAACGATGCCAAGATTgctgatgcagatgcagatccggatgcagatgcagatgcagatggtGGCatgacatcatcatcatcctcatCCGAGAGCGAGTCGacggcgacaacagcaacaacatcgcAGTCAATTGGGGCGAATCGCAGCTCCGAGCTGGGGGCCAGAAATAAGTAA
Protein Sequence: MLQITPLDRLSLHICHACISYLNSWQSFKNRCLSSQTKQRQWLETDKSKQQTLLGYLDLNKTENGSSTDHQQQQQQHELKNDLATAAAEKASANILDGIPSLKKRKSPKLYLPLDISVPSLPLPPPQPVLSNVASASVGAGAVAELAPLSLPLDFGQNQCQNQNLNQSQKLGGILPPPPPLPLPLPPHPPPVAAMSSNSAAVGSAAVTTPLLMPPLPAVPIKDEPLDDTDDDFQMKCIDESDDMMDPTMFLERSEHEGDVPLMTSDYDYTAQHGVTAAVAAAATLPASAVANVAAAGDSKVASCRACSLQFSTRANARRHERNLHPNLFQLSTDSPNNTPITKPTPALAAALEIQRAAAAAAATAEATKAAAGGNISAQKYRQVVMNTFIKCENGGYDYETPEQYQQLLTRDKVEFIQENSEFLEQYQTMTCRCCSKYFNTYKNFMAHVRKKYPLLPRNLCFNCLKMNDSKALFISHLKKRNCINLYRVLNALRIKQPNFAHANAAGLAVTADGQQQQQQQQQQHQPLIETSTERPEKLRAKELLVNKLYECKLCPKGFRTKHEFRTHVYDKHADVQRKDNNSIQCSFCGLDFADPVDRRRHYNNMDCIVRLRCMTCDAKLETHQRFLDHVYQDHLGGVGSDNASTANSGGLDHSPGKRSLLGALGIGVSQSSNEESRSSGHHNNNASEAPLTSTPKPVGGGGGAAAAAAAAATGTSGGSTSGNRDAPKSQYFSRMPQVCPICGQQYNNYNNVLRHMESKHPNKLPETYKCVRCGLGYPRISYLREHMINVHGVDKNRHSGGFEYIVNADAVKLADGSTPNVYTGRYDYVMKDLMSITNGGTLDDDEEEGGSIAKKMRLDDSSNNSSINMSLANQQKECLICNAVFSNNIGLSNHMRSHYTASTATSAALAAANRMTPKSLTITATPPLEAAVVSSTASAPATTAAAATVAATTATAAAATTTAAGGSLPPAMANQTPQEQAVFRRSLDQAADRRFRRMRCRICQRRFSSKKSYRYHMLTDHQVQNVQFIKCKLCNAEFAYEKGLKVHLFKVHGRAIKDEMIVKQFECDICSIVYSNELELQQHKRSVHKSHSGSDSNKSMKSATATATSAELAETSGHPATAVTTTTLPLYWYQCKYCPSNFNTNKKLAIHINSHDEFDSNDYSCKDCGNVYSGRKSLWVHRYKKHPQVPDPAECTLCRKMFFDRQMLENHTPTCNRKPITATGAHQQDQQQQQQQQQQQQQQLQQHQRGIFKHKTGDDDEEEDDDQLLLLDDGVGGDSNGGAATGNPSTISSSTLKIRIPEVACTICGARFTDQDMFTKHIQKHEQDLYVDNPLAAMFDDGPADAGQFQVERQNENGEYACDLCAKTFPQVIALKVHRKWHFRGDSKQNPIIDGEATTLNNSSSNSNNNNSSSSNNNNNSMLHLRELHAVGLMPNQQHQKQQQQQLQLQQQQQQQQQQQRNNTSSKSLKRKRELKCDYCASTFISNNNLRRHMYELHKHEVSHLPEPPVIQVDEPLTCRRCGDLQFETKELWIEHKLADAKVVRPFCPFQWGCDLCGEYLSRKEKLINHINNHLKEDVIVPVAKATTNKTAAATTTATAAAATTSAATTAAAATTTTKTTIKTKIKQQQEEEAETETEAQLELNAGKLAKQEDVDSDMDDSDSGDDEDSTSAGDDDDDEDDDDDEDGEVDDDDDDEDDDDEDDDDDDDEDEDVVQQQQQLLQQKQQQQQQPLNSNNNNNNNNNTSVVANEDIDDLIEEVIEVDGIVEEIEDDEDDDDDDDDDDDDDDVDEVDEDDGNTTDEHQQLSTANEKQQQQQQQPAEQREAHQPRRLNFDYSRTTDSAKLNGTGNGKKSKSVLVMHSSEEDEEEDVDEDEDEDAGGEPMNIDDIIEEDDGVDVDDDDDDDDVGGAVVEDDDVDEDMDEDDVDEDDVDDDVDDDGHINNGNDAKIADADADPDADADADGGMTSSSSSSESESTATTATTSQSIGANRSSELGARNK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00541894;
90% Identity: -
80% Identity: -