Basic Information

Insect: Scaptomyza tumidula
Gene Symbol: hang_1
Assembly: GCA_035044465.1
Location: JAWNNW010000801.1:28462-45939[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.35 25 5.6 1.0 3 23 575 596 574 596 0.93

2 18 0.59 42 4.9 3.6 3 22 703 722 701 722 0.89

3 18 0.00076 0.054 13.9 3.3 1 22 826 847 826 849 0.90

4 18 0.088 6.2 7.5 0.1 2 21 861 880 860 881 0.93

5 18 0.00088 0.063 13.7 0.2 2 23 1024 1046 1023 1046 0.95

6 18 0.0025 0.18 12.3 0.1 1 23 1054 1077 1054 1077 0.96

7 18 0.0032 0.23 12.0 0.1 3 23 1165 1185 1164 1185 0.93

8 18 0.00036 0.026 15.0 2.9 2 23 1296 1318 1295 1318 0.97

9 18 0.029 2 9.0 0.2 2 23 1327 1349 1326 1349 0.95

10 18 0.0017 0.12 12.8 0.3 1 23 1362 1385 1362 1385 0.97

11 18 0.00016 0.011 16.1 1.1 1 23 1445 1467 1445 1467 0.99

12 18 0.0025 0.18 12.3 0.9 1 23 1475 1498 1475 1498 0.96

13 18 0.086 6.1 7.5 0.4 2 19 1506 1523 1506 1524 0.94

14 18 0.00019 0.014 15.8 0.3 3 23 1623 1643 1622 1643 0.97

15 18 0.0064 0.46 11.0 0.1 1 23 1678 1700 1678 1700 0.97

16 18 0.00075 0.054 14.0 0.6 2 23 1787 1809 1786 1809 0.93

17 18 0.061 4.4 8.0 1.4 3 23 1865 1885 1865 1885 0.98

18 18 4.7e-05 0.0033 17.8 2.5 1 23 2332 2354 2332 2354 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.35	25	5.6	1.0	3	23	575	596	574	596	0.93
2	18	0.59	42	4.9	3.6	3	22	703	722	701	722	0.89
3	18	0.00076	0.054	13.9	3.3	1	22	826	847	826	849	0.90
4	18	0.088	6.2	7.5	0.1	2	21	861	880	860	881	0.93
5	18	0.00088	0.063	13.7	0.2	2	23	1024	1046	1023	1046	0.95
6	18	0.0025	0.18	12.3	0.1	1	23	1054	1077	1054	1077	0.96
7	18	0.0032	0.23	12.0	0.1	3	23	1165	1185	1164	1185	0.93
8	18	0.00036	0.026	15.0	2.9	2	23	1296	1318	1295	1318	0.97
9	18	0.029	2	9.0	0.2	2	23	1327	1349	1326	1349	0.95
10	18	0.0017	0.12	12.8	0.3	1	23	1362	1385	1362	1385	0.97
11	18	0.00016	0.011	16.1	1.1	1	23	1445	1467	1445	1467	0.99
12	18	0.0025	0.18	12.3	0.9	1	23	1475	1498	1475	1498	0.96
13	18	0.086	6.1	7.5	0.4	2	19	1506	1523	1506	1524	0.94
14	18	0.00019	0.014	15.8	0.3	3	23	1623	1643	1622	1643	0.97
15	18	0.0064	0.46	11.0	0.1	1	23	1678	1700	1678	1700	0.97
16	18	0.00075	0.054	14.0	0.6	2	23	1787	1809	1786	1809	0.93
17	18	0.061	4.4	8.0	1.4	3	23	1865	1885	1865	1885	0.98
18	18	4.7e-05	0.0033	17.8	2.5	1	23	2332	2354	2332	2354	0.99

Sequence Information

Coding Sequence: ATGTGCGACGCtgtcgcaacaacaatatcggCAGTAACAGGAACAGGAGCTAGCATAGCGGGTGATACAATGACAGCGATGGAAGAACAAAATCAGAGACAGCGACAAAGTTGCTGTCGTTTATGCATTGCTCCCGCTAGCGAATGCATCTCGATTATTAACAGTTATGCCGCCGATAAGGAGCCGCTGGCCACTAAAATATACAACTGCGTAAATATCAAGATCACATCCGTGGATCGTCTATCGTTGCATATTTGCCATGCCTGCATCAGTTATTTGAACTCGTGGCAAAGCTTCAAGAATCGCTGCCTCAGCTCACAAACCAAGCAGCGTCAATGGCTGGAGAACGATAAGACCAAACAGCAGACGCTACTCGGATACTTGGATTTGAACAGAGCCGAGAATGGCagtgctgccgccgccgccattgagaaacaacaacaacagcagcagcagcacgaaTCGAAAATCGATACAGCGACGACGAGTGCTGCGGAAAAGGCgtctgctgccgccgccgccgccgccaacaTATTGGATGGCATACCTCAACTGAAGAAACGCAAATCGTTAACAGTCTATGTGAGtccaaagcaacagcaaaaacaatcgcaacagcttcagcagcagcagcaacaacaatcgcaacaacaacagcttcagcagcaacaaacacagcaacagcaacagcacgcaacaacaacagcaataacagcgacagcagcatcAGAAAGAACAACAAGCGCAACGGCAGCGGCGACGGCGCCGGAGTCACAACTAACATTACAAACCCTTTTGTTGCAGGTGCCGCCCATAGcgacaacacaacagcaacagcagcgcaaatatcaacaccaacaacagctacagcagcagcagcagcagcaacaacgtgGCAAGCAgcaatatcatcatcatcagcagcaacaacaacaacagcaacattatcaccatcatcaacagcagcgaTTGACTCGGATTCGTCAACCGcgacgccaacaacaacatcagcaccaacatcagcagcaacagctacatacatcaacagcaacatccgTACAGCGTTTATCCGGCAAATTGAAGCCAAAAGTGTATTTGCCATTGGATATAACAGTGCCGCCATTGCCACCATTattgccgccgctgctgcagtCAACTGCTGCCACGTtgtcaactgttgttgctaatgCAGCAGCgccattgccgttgccattgccattgccgttgtcgttgtcgttgccgcTGCCAATTGATTTTAGCCAGAATctaaatccaaatccaaataatattcaaaggCAAGCGCCGCCGTTGCCGCCGTCGCTGCCTCCAGTTGCTGCAACAATGACCAGCAATATTGCAGCCACTGTTACTTCCTCAACCGCCGCTGCCTCGGCCACGGCCACATTTGGCTCTGGCTGTGGCAATGTTGGTGCTGTCACGACTCCATTGCTTATGCCACCGCTGCCTGCCGTGCCCATCAAGGATGAGCCACTGGACGATACGGATGATGATTTTCAAATGAAGTGCATCGATGAATCGGATGACATGATGGATCCAACAATGTTCCTAGAACGCTCCGAGCATGAGGGCGATGTGCCACTAAatACCTCCGACTATGATTATACGGCTCAACATTGCGTGACGGCTGTTGCGGCGGCGGCATCATTGCCCGCCAGCGCTGTTGCAAATGTGGCCGCCGCTGGCGATTCGAAGGTGGCCAGTTGTCGTGCCTGCAGTCTACAATTCTCGACGCGGGCAAATGCGCGACGCCACGAACGCAATCTGCATCCGAATCTGTTTCAATTGTCGACAGACTCGCCCAATAATACGCCCATTACAAAACCGACACCAGCATTGGCGGCCGCATTAGAGATACAGCGTGCTGCTGCCGCAGCTGCAGCGACTGCCGAAGCAACAAAAGCCGCTGCCGGTGGCAATATATCGGCACAAAAATATCGCCAGGTGGTGATGAATACGTTCATCAAGTGCGAAAACGGTGGCTTCGACTACGACAATCCCGAACAGTATCAGCAACTGATGTCGCGCGACAAGGTCGACTTCATCAATGAGAACAATGAGTTTCTGGAGCAATATCAGACAATGACATGTCGCTGTTGCAACAAGTTCTTCAATACCTATAAGAACTTTATGGCACATGTGCGCAAAAAGTATCCATTGCTGCCGCGTAATCTCTGCTTCAATTGTCTCAAGATGAACGATTCCAAGGCGCTCTTCATATCGCATCTGAAGAAGCGCAATTGCATCAATTTGTATCGTGTGCTCAACGCTTTGCGTACGAAGCAACCAAACTTTGTccatgccaatgccaatgcagAAGCAAGTGTTGCAAGTGATGCAAGCGGTGTTGTGGCAACaccagtaacagtaacagcgGCAACGCCAGCACACgaaacatcaacatcaacggATCGTCCGGAGAAGTTGCGTGCCAAGGAGCTGCTGGTCAATAAACTGTACGAATGCAAATTGTGCCCAAAAGGTTTTCGCACCAAGCACGAGTTTCGCACCCATGTCTACGATAAGCATGCGGATGTGCAGCGCAAGGATAACAATTCGATACAGTGCAGCTTCTGTGGCTTGGACTTTGCCGATCCGGTTGATCGACGTCGACATTATAACAATATGGATTGCATTGTCCGTTTGCGCTGCATGACCTGTGATGCCAAGTTGGAGACGCATCAGCGTTTCCTTGATCATGTCTATCAGGATCATTTGGGTGGTGTGAGCAGCGATAATGCGTCGACGGCGACAAGTGGCTTGGATCATTCGCCACCCGGCAAGCGTAGCCTATTGGGTGCCCTTGGCATTGGATCGAATGATGAATCGCGCAGCAGTCGCaccaatcacaacaacaacaaagacaacaatccaacagcagcagcagccgcagccggTGGTGGAGCTGGAACGCCATTAACCTCAACACCCaaagtaacagcagcagcagcaacaacaataacaaccacagcagtagcagcatcaAGTGGCGGATCTACATCGGGCGGACGCGATGCACCAAAATCGCAGTATTTTTCACGAATGCCACAGGTCTGTCCGATCTGTGGCCAGCAGTACAATAACTATAACAATGTGCTGCGACATATGGAATCGAAGCATCCCAACAAACTGCCCGAGACATATAAATGTGTACGCTGTGGCCTGGGTTATCCGCGCATCTCCTATCTCCGCGAGCACATGATCAATATTCATGGCGTGGACAAGAATCGTCATTCGGGCGGCTTTGAGTATATTGTGAATGCCGATGCAGTTAAATTGGCGGATGGCAGCACGCCCAATGTCTATACGGGACGTTACGATTATGTGATGAAGGATTTAATATCTATAAACAATGGTGGGACACTCGatgatgatgatgaggaaaGCGGCAGCATTGCAAAAAAGATGCGTTTGGAtgatagcagcaacaacagcagcattgcCAACATGAGCATTGCCAACCAGCAAAAAGAGTGCATCATCTGCAATGCAGTTTTTAGCAACAATATTGGTCTTTCGAATCATATGCGTTCGCATTATACGGCCTCAACAACGACAAGTGCAGCATTAGCGGCGGCCAATCGCATGACGCCCAAATCATTGACAATAACGGCAACGCCACCGTTGGAAACGGCTGCGTCAACAGTATCCACAGTGGCAACACCATCAGCTACACTCAAAACAACACTCACATCGACGACTACACCAAAAATaacaggagcaacaacaacaacagctgtagcaggagcaggagcaaaaACAACTGGCGGAAATTTGCCGCCAGCGATGGTACATCAGACGGCACAGGAACAAGCGGTATTCCGTCGTAGTTTGGATCAGGCAGCTGATCGACGATTCCGACGGATGCGTTGTCGCATCTGTCAGCGAAGATTTAGCTCAAAGAAATCCTATCGATATCACATGCTCACCGATCATCAGGTGCAGAATGTTCAGTTCATCAAGTGCAAGCTATGTAATGCCGAATTTGCGTACGAAAAGGGTCTGAAGGTGCATCTGTTCAAGGTGCACGGTCGAGCCATTAAGGATGAGATGATTATCAAACAATTCGAATGCGATGTCTGCTCCACTGTCTACAGTTCCGAACTAGAATTGCAGCAGCACAAACGCAGCGTGCATAAGTCAACGCATTCGATAGCCAGTGATTCGGTTGCTGGCAAATCAACATcgacatcgtcatcatcaacatcgaAATCTGCTACGACTACCTCAGCTGAACtggccgccgccgccgccgcggACACATCTGGCATcacagcggcggcagcagcagcagcagttctgCCACTTTACTGGTACCAGTGCAAGTATTGTCCATCTAACTTCAACACCAACAAGAAATTGGCCATACACATCAATTCGCACGATGAGTTCGATTCGAATGATTATTCGTGCAAGGATTGTGGCAATGTTTACAGTGGTCGCAAAAGTCTATGGGTTCATCGGTATAAGAAACATCCGCAGGTGCCGGATCCGGCCGAGTGTACGCTGTGCCGCAAGATGTTCTTTGATCGCCAAATGCTGGAGAATCATACACCAACCTGCAATCGCAAGCCAATCACTGCCACTGGCGCCCATCAGCAGCaggatcagcagcagcagcaactacaaacGCAACACCAACGTGTCATCTTCAAGCACAAAACgggcgatgatgatgacgacgagggtgatgatgatgatcagtTACTTCTGCTGGAcgatggtggtggtgttggtggtggtggtggtggaggcaGTGAGAGTAATGGTTGTGGTGGTgcatcaacagctgctgcagctgccacaataaaaacaagcacaATGAAGATACGCATTCCCGAGGTGGCATGCACAATATGTGGTGCACGTTTCACCGACCAGGAAATGTTCAGCAAACACATCGAGAAGCACGAAAAAGATCTCTATGTTGACGATCCATTGGCGGCCATGTTCGATGATGGCCCAGCCGATGCTGGACAATTTCAGGTTGAGCGTCAAAATGAGAATGGCGAATATGCGTGCGATTTGTGCGCCAAGACGTTCCCCCAGGTGATAGCGCTCAAGGTGCATCGCAAGTGGCATTTCAGAGGTGATAGCAAGCAGaatccAATCATCGATGGCGAAGCGACAACattgaacagcagcagcaacaacaacaacaacaacaattcgctGAGCTCATCATCGATGCTGCATCTGCGCGAATTGCATGCTGTGGGTCTGATGCCcaaccagcaacagcatcagaaacagcagcagcaactgcaactgcaacaacaacatcagcagcagcagcagcagcgatcgAGCAACAAATCAATGAAACGTAAACGTGAATTGAAATGCGAATATTGCGCCTCCACAttcataagcaacaacaatctgcGTCGCCACATGTACGAGCTGCACAAACATGAGGTCAGCAATCTGCCAGAGCCGCCCGTTATTGAGGTGGATGAGCCGTTAAAGTGTCGCCGTTGCGATAATCTAGAGTTTGAGACCAAAGAACTGTGGATCGAACACAAAATGGCCGATGCGAAAGTTGTGCGTCCATTCTGTCCATTCCAATGGGGCTGTGATTTGTGTGGCGAATATTTGTCGCGCAAAGAGAAGCTGCTCAATCACATACACAATCATCTCAAGGAGGATGTGATTGTGCCGGTGGCGACTACTACTACAAAGCCACCACCAAaagcaccaccagcagcaacaacaaccaccgcAACAGCAAAGGAAACAGTCCccgcaccagcaacagcagcaacatcaacatcaacagcagcagcgaaggttaaaactacaacaactgcagcaacagcagcgacgaAAAATCTTAAGGGtaataaacaacagcagcggcagcgggatcaggcagaggcagaggcggAGGCTAATGATGATGTAAAGCTAGTAGCAAAGGCTAGCACACATAGTGATATGGATGATGATGAgagcgatgatgatgaaggtGCCAGCACTAGTGCTGacgatgatgctgatgctgatgatgatgaggaagacgatgatgatgatgacgacgatgatgacgatgatgatgaagatgacgatgatgatgatgatgatgatgatgatgaaggcGACAtcgatgatgaagatgatggcGACGACGAAGACGTTGGTGAAAATGTTGTGGcacagcaaatgcaattgcaacagccacaaagtgcaaacacaaacaaaaataatagcacaattgttgataatgatgatgatgacgacctCATTGAGGAGGTTATCGATGAGGATGGCATTGTTGTCGAGCAGCTGGACgttgacgacgatgatgatgatgatgacgacgacgacgacaacaacaacgatggcggtgataatgatgatgatgacgatgacgacgatgatgatgatatcgATGAGGATgacgttgatgttgatgatgatgatcgtgAACATGATCATGATGTTAACTCAATGGAGGGCCAACAACCGCAGCCAAGACGtctcaattttaattactcgcgcaccaacaacaacaacaacaacaccaacagcgaTCGGCTAAATGGCGATAGCAGTGGTAACGGTGCTAAACAGGAAACAGGGGGGGAGGAGGCAGATGAAATGAatactgatgatgatgacgatgacgaagGTGATACTGTGGGTGAAGCGATGACCATTGATGATATTATTGAAGAAGATGATGGtgtggatgatgatgatgatgatgtcgtTGGTGtcggtggtggtgttgttgagGATGAcgacgataacgataacgatgaAGATGTTGGTGATGTtcgtgatggtgatggtgatggtgaggGCAtggatgaggatgatgatgatcatgatcatgatcatgaaCATGGAAATGTCGTGGGCAATGGTATTGATCGTGATGATCATCgtacaacatcatcaacatcggAAAGcgaatcgacaacaacaacaatatcgcATTCAACAACTGCGGCGGCAGACGCTTATTCCAGCTATACGTGTGATCTATGTCAACTTTGTTTCGATTCTCAGGAACAACTGCAGACACATATTAAAAGCCATTTTCTCAATGGACCATCATCTTCGGCAGGAAgtagcaccagcaacagcaacagcacctccagcagcagcaaaagcaatagcagcagtggcaaaagcacaaataacaacaacaacaacagtaacagcaacaaaacaaaaaccaaaaagtccAGCTTGGAAGCAACGAAGACAACATTAGCGAATGCTGCAACGGGCTCAAACTGA
Protein Sequence: MCDAVATTISAVTGTGASIAGDTMTAMEEQNQRQRQSCCRLCIAPASECISIINSYAADKEPLATKIYNCVNIKITSVDRLSLHICHACISYLNSWQSFKNRCLSSQTKQRQWLENDKTKQQTLLGYLDLNRAENGSAAAAAIEKQQQQQQQHESKIDTATTSAAEKASAAAAAAANILDGIPQLKKRKSLTVYVSPKQQQKQSQQLQQQQQQQSQQQQLQQQQTQQQQQHATTTAITATAASERTTSATAAATAPESQLTLQTLLLQVPPIATTQQQQQRKYQHQQQLQQQQQQQQRGKQQYHHHQQQQQQQQHYHHHQQQRLTRIRQPRRQQQHQHQHQQQQLHTSTATSVQRLSGKLKPKVYLPLDITVPPLPPLLPPLLQSTAATLSTVVANAAAPLPLPLPLPLSLSLPLPIDFSQNLNPNPNNIQRQAPPLPPSLPPVAATMTSNIAATVTSSTAAASATATFGSGCGNVGAVTTPLLMPPLPAVPIKDEPLDDTDDDFQMKCIDESDDMMDPTMFLERSEHEGDVPLNTSDYDYTAQHCVTAVAAAASLPASAVANVAAAGDSKVASCRACSLQFSTRANARRHERNLHPNLFQLSTDSPNNTPITKPTPALAAALEIQRAAAAAAATAEATKAAAGGNISAQKYRQVVMNTFIKCENGGFDYDNPEQYQQLMSRDKVDFINENNEFLEQYQTMTCRCCNKFFNTYKNFMAHVRKKYPLLPRNLCFNCLKMNDSKALFISHLKKRNCINLYRVLNALRTKQPNFVHANANAEASVASDASGVVATPVTVTAATPAHETSTSTDRPEKLRAKELLVNKLYECKLCPKGFRTKHEFRTHVYDKHADVQRKDNNSIQCSFCGLDFADPVDRRRHYNNMDCIVRLRCMTCDAKLETHQRFLDHVYQDHLGGVSSDNASTATSGLDHSPPGKRSLLGALGIGSNDESRSSRTNHNNNKDNNPTAAAAAAGGGAGTPLTSTPKVTAAAATTITTTAVAASSGGSTSGGRDAPKSQYFSRMPQVCPICGQQYNNYNNVLRHMESKHPNKLPETYKCVRCGLGYPRISYLREHMINIHGVDKNRHSGGFEYIVNADAVKLADGSTPNVYTGRYDYVMKDLISINNGGTLDDDDEESGSIAKKMRLDDSSNNSSIANMSIANQQKECIICNAVFSNNIGLSNHMRSHYTASTTTSAALAAANRMTPKSLTITATPPLETAASTVSTVATPSATLKTTLTSTTTPKITGATTTTAVAGAGAKTTGGNLPPAMVHQTAQEQAVFRRSLDQAADRRFRRMRCRICQRRFSSKKSYRYHMLTDHQVQNVQFIKCKLCNAEFAYEKGLKVHLFKVHGRAIKDEMIIKQFECDVCSTVYSSELELQQHKRSVHKSTHSIASDSVAGKSTSTSSSSTSKSATTTSAELAAAAAADTSGITAAAAAAAVLPLYWYQCKYCPSNFNTNKKLAIHINSHDEFDSNDYSCKDCGNVYSGRKSLWVHRYKKHPQVPDPAECTLCRKMFFDRQMLENHTPTCNRKPITATGAHQQQDQQQQQLQTQHQRVIFKHKTGDDDDDEGDDDDQLLLLDDGGGVGGGGGGGSESNGCGGASTAAAAATIKTSTMKIRIPEVACTICGARFTDQEMFSKHIEKHEKDLYVDDPLAAMFDDGPADAGQFQVERQNENGEYACDLCAKTFPQVIALKVHRKWHFRGDSKQNPIIDGEATTLNSSSNNNNNNNSLSSSSMLHLRELHAVGLMPNQQQHQKQQQQLQLQQQHQQQQQQRSSNKSMKRKRELKCEYCASTFISNNNLRRHMYELHKHEVSNLPEPPVIEVDEPLKCRRCDNLEFETKELWIEHKMADAKVVRPFCPFQWGCDLCGEYLSRKEKLLNHIHNHLKEDVIVPVATTTTKPPPKAPPAATTTTATAKETVPAPATAATSTSTAAAKVKTTTTAATAATKNLKGNKQQQRQRDQAEAEAEANDDVKLVAKASTHSDMDDDESDDDEGASTSADDDADADDDEEDDDDDDDDDDDDDEDDDDDDDDDDDEGDIDDEDDGDDEDVGENVVAQQMQLQQPQSANTNKNNSTIVDNDDDDDLIEEVIDEDGIVVEQLDVDDDDDDDDDDDDNNNDGGDNDDDDDDDDDDDIDEDDVDVDDDDREHDHDVNSMEGQQPQPRRLNFNYSRTNNNNNNTNSDRLNGDSSGNGAKQETGGEEADEMNTDDDDDDEGDTVGEAMTIDDIIEEDDGVDDDDDDVVGVGGGVVEDDDDNDNDEDVGDVRDGDGDGEGMDEDDDDHDHDHEHGNVVGNGIDRDDHRTTSSTSESESTTTTISHSTTAAADAYSSYTCDLCQLCFDSQEQLQTHIKSHFLNGPSSSAGSSTSNSNSTSSSSKSNSSSGKSTNNNNNNSNSNKTKTKKSSLEATKTTLANAATGSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01325809;
90% Identity: -
80% Identity: -