Basic Information

Insect: Drosophila pseudoobscura
Gene Symbol: zfh2_4
Assembly: GCA_009870125.2
Location: CM020871.1:1297532-1316134[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 0.4 30 5.5 0.5 3 23 2 23 1 23 0.96

2 13 0.00014 0.01 16.4 1.4 2 23 266 288 265 288 0.96

3 13 3.4e-05 0.0026 18.3 0.7 1 23 320 344 320 344 0.92

4 13 0.006 0.45 11.2 0.4 1 22 431 452 431 455 0.91

5 13 2.8 2.1e+02 2.8 0.1 1 21 596 617 596 618 0.92

6 13 1.3 1e+02 3.8 1.9 1 23 639 663 639 663 0.91

7 13 0.065 4.9 8.0 0.5 1 23 910 933 910 933 0.98

8 13 4.7 3.5e+02 2.1 0.1 3 23 1035 1057 1033 1057 0.81

9 13 0.049 3.7 8.4 0.9 2 21 1138 1157 1137 1161 0.89

10 13 6.5e-05 0.0049 17.4 2.3 1 23 1212 1234 1212 1234 0.98

11 13 0.0013 0.099 13.3 2.0 2 23 1241 1263 1240 1263 0.94

12 13 0.00033 0.025 15.2 1.7 1 23 1631 1653 1631 1653 0.97

13 13 0.0012 0.087 13.5 1.4 1 23 1768 1790 1768 1790 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	0.4	30	5.5	0.5	3	23	2	23	1	23	0.96
2	13	0.00014	0.01	16.4	1.4	2	23	266	288	265	288	0.96
3	13	3.4e-05	0.0026	18.3	0.7	1	23	320	344	320	344	0.92
4	13	0.006	0.45	11.2	0.4	1	22	431	452	431	455	0.91
5	13	2.8	2.1e+02	2.8	0.1	1	21	596	617	596	618	0.92
6	13	1.3	1e+02	3.8	1.9	1	23	639	663	639	663	0.91
7	13	0.065	4.9	8.0	0.5	1	23	910	933	910	933	0.98
8	13	4.7	3.5e+02	2.1	0.1	3	23	1035	1057	1033	1057	0.81
9	13	0.049	3.7	8.4	0.9	2	21	1138	1157	1137	1161	0.89
10	13	6.5e-05	0.0049	17.4	2.3	1	23	1212	1234	1212	1234	0.98
11	13	0.0013	0.099	13.3	2.0	2	23	1241	1263	1240	1263	0.94
12	13	0.00033	0.025	15.2	1.7	1	23	1631	1653	1631	1653	0.97
13	13	0.0012	0.087	13.5	1.4	1	23	1768	1790	1768	1790	0.97

Sequence Information

Coding Sequence: ATGTGCTTTATATGCAAACTATCCTTTGGCAACGTGAAGTCATTTAGCCTGCATGCGAACACAGAGCACAGACTCAACCTGGAAGAGCTCGAGCAGCAGCTACTGAATCGCGAATACTCCAGTGCCATTATTCAGCGTAATATGGATGAGAAACCGCAGATATCCTTCCTGCAGCCCCTGGACATAAATGCCACTTGTGCTGTCGAGAAGCTTATACTGGCTCCTGATGAAATTTGTACTCCACTGTCTTCTGAGCCAGAGCTCGAACATGATAATTATGAGGACGAAGAAGATCGGGCGCTGGCCGCCAACGAACCAAATGCCAATAGGGTCAAGCTTCTCACGGAGTTTcttcaacagcagctgcagcagcagcagcagcaacagagtTCCTTGTTCCCCAGCTTATGTTCCGAGCATCCCGACTTCAAAGGGGTCGATTGCAAAACTTGTGAGCTCATTGATATCCAACAACGGTCTAAATCACCGCCTCCATTGCACCAGCACCTTGGTCTGgctcaatctcaatctcagGCCATGCCTTTGTCGCAGCCTCAGCCACATCGCTCTCCTAACAGCAGTAGTGGGGGTCTGGCAATATCGCCCAGCTCCTCATCGGTGACCAGCGTAGGAAATGCGTCTGGTACGGCTTCCAGCTTTACAATCGGCGCGTGCTCCGAACACATCAATGGCCGACCCCAAGGAATAGACTGTGCCCGCTGCGAAATGCTGCTGAACTCGGCTCGACTCAATAGCGGCGTCCAGATGTCAACCCGCAACTCATGCAAGACTCTTAAATGTCCCCAATGCAATTGGCACTACAAATATCAGGAGACGCTGGAGATCCATATGCGTGAAAAGCATCCTGATGGGGAAAGCGCCTGTGGCTATTGCCTAGCAGGACAACAGCATCCGCGGCTGGCCCGTGGCGAGTCGTACTCATGCGGCTATAAGCCATACAGATGCGAGATATGCAACTACTCCACGACCACAAAAGGTAACCTTTCCATACATATGCAGTCTGACAAACACTTGAACAACATGCAGGAGCTAAATAGCTCACAAAATATGGTTgccgctgcggcggcagcagctgcaagtGGGAAATTGTTGCTGTCCAGCCCATCGCCACAAGGTGCCGGCCAACCAACTGTGGCCCAACTGGGCtcgagcgggagcgggagcacCGCTGTCGTCTCTAGCAGCGTTGGGAGCAATGCCGCTATGGGTGTACCGCCAACGTCTGGTGGCACGGGGGTAGTAGTAGCCAGCATCAAACCGAAGCCCTCGTTTCGGTGCGACATCTGCAGCTACGAGACTTCCGTTGCTCGCAATCTGCGAATTCACATGACCAGTGAGAAGCATACGCATAACATGGCTGTGCTACAAAACAATATAAAGCACATTCAGGCGCTAAATTTcttacaacagcaacagcaaggcGCTAGTGGCAGTACTTCAGGCTCCAGTGCTAGTAGCTTCATGCCGGAGGTGGCATTGGCTGATCTGGCCTACAACCAGGCGCTCATGATTCAACTTctgcaccaacagcagcagcagcagcagcagcagcagtcatcTAATACCAAAATGTCGCCCACATCATCCTCGCCAGTAAGTGCAACGGATCAGTTTTCATTTTCCCCAAAGCCCATGAAGCTTGGCcatggaatgggaatgggtttGGGGATGCCAATGGGAATTGGCCATTCAAATGAAGCATCCGGCGAATCGGGGAGCGATGCTCATCCACTGGCGAAGCCTGATATGTGGCCCACGGCGCTCTACAGTTGCCTAATCTGCGACTCCTTCAGCACAAACAATTTGGACGATCTTAACCAGCATCTGTTGGTAGATCGATCCCGACAATCCTCAAGCGCATCCGCCGATATAATGGTCatacacaacaacaactacataTGCCGGCTCTGCAACTACAAGACGAACCTAAAGGCCAACTTCCAACTGCACAGTAAGACGGACAAGCATTTGCAGAAACTAAACTTTATAAATCACATCAGGGAGGGCGGAGCCCGTAATGAGTATAAACTCCAGTATCAGCCTCAGCTCACTGCCAATGTGGTGCAACTAACTTGCAACTGTTGCGACTTTCACACCAATTCCATACAGAAGCTTTCCATGCACACTCAGCAAATGCGACATGACACGATGCGTATGATTTTCCAGCATTTGTTATACATTACGCAGCAGAGTCGTATGCACAAGGAGTCGCCTTGCACGGCAGCAGACGATGCTCAATGTCCTTGTCCGGACGATGATCAACAATCGATTGCAACGATCGAAAAGGTTCTCATTTGCCAGCTGTGCAGCTTTGCCGCCAAAAATCTGTATGAAATGGTTCAGCATGTGAAGGGCATAAGACACTTGCAAGTCGAGCAATTCATTTGTCTACAGCGTCGTAGTGAAAACCAGGAGATGCCCGGATTAAATGAGGTATACAAAGTGACTGAACGGATCCGTGGTAGCGAAGATATCATTTTTGAAGCTGGCTTCAATATGGCAACAAACACACCAGTTGGTGGATCGTCGGAGGTCGGCTTtgccgcagcaacagcgggATCCTCCGCCGCTGCAGATGGCAATATATTATCTCCAAAGTCGACCTCTAGTTGCTCGACATCTTGTGGCAAGAGTGTAGGTCGCATCGCGTCTCCAAGCATGAATGATTTTAGTTTGAGTGCTTCAAACAGCATACCCACCACAGTTTTCAAGTGCAATTTGTGCGAGTACTTTGTGCAATCGAAGAAGGACATGGCCAGCCACATTGAAACCGTGCACCCAGGGGCAGAGAGTGACGACTTCATGAGTATACCAACAAACACGGCGGCTCTGCAAGCCTTCCAAACTGCGGTTGCAGCCGCAGCCATAGCAGCGGTCCAACAACGCTGTAGTGCCATCAACATGCCTAGAGAAGCAGATACGGAAATCGGTCCTTGCATTAGCGACTGCCCTATAGATATTAAGCGTGAGCGTCTCGAAGAGGAGGACGGTCCAATGACGGGTATAGAGGAAAGAAAACCAACAGCTAATCTAGATGCGGAGATGTCAGACGCGAAGGCTACAAAACCATCGGGTGTGCAGTGTCCCCTATGTCTAGAAAATGGCTTCCGAGAGAAGTCATTGCTTGAGACCCATTTGACGAGCGTGCACAGCGTCACCAAAGATGGCCTAGCTAGGCTATTGCAACTGGTCGATAGTAAGGCCTGGAGTTCACCCGGAACTGATTCACCATCCGTAACCGCAACTACGAGTACAGCATCCAATTGCAATTCCAATGCAGAGGACTGTGCGATAACCATAGGGAGTGTAATTACCGAAGACTGTGTGTCGAGCTTCCCCGTTGTTGCAGCAGCCAGTTCCACCGCAAGCTCAGCAGGATTGCAAGGACTCTCTTGCCAGCAGTGTGAGGCGAGCTTCAAGCACGAGGAACAGCTGTTACAGCATGCACAGCAGACGCAACACTTTCCAGAGCAAAATGGAGAGTACATTTGCCTCGCGACAAGTCACATCAGCCGTCCCTGCTCTATGAGCTTCAGCTCACTCCCGTCAATGATCAGCCACTTCAAAGACTCGCACATGAGTTTGGTTATCTCAGAGCGCCACGTCTACAAATATCGTTGCAAGCAGTGCTCACTGGCATTCAAAACACAGGAGAAACTTACCACACATATGCTCTATCATACAATGCGCGATGCTACCAAGTGTTCTTTATGTCAGCGGAACTTTCGTAGCACACAGGCCCTGCAGAAGCACATGGAACAGACGCACTCCAATGAGGCAGCTGGAGCTGCGGCTGGCAGTGCAATGACCAATAGTCCCCGACCGCCGACACCAAACTACGGCGAGATAGAAAAATTGCCATCGGGCGAACGAGAACCCCCGATTGGCAGTGACGCAGGGCCCAAGTCGAATAACACCTCAAGACGTTCACTATCACCGCTGCGATCAGAGTTGCAATATACTAAGGAGGCGGCGCAACTGTCGCCCAGCCCGCACGCTCTTGATACAAACCAaactcagcagcagcaacagcacttGGCCACACTGACGGCTGCGTtgctcaagcagcagcagtgtcACCCAGATGCAAATGTCCTGTCGGCAGATCCTTTATCGTTGTCCGCTGCCGACTTTTCTCAACAGCTGCACGGCCTACAGAATCTCCAAAATCTGCAGCATATGCAGCAGCAATTTAGTGCAGTTGCTGCATCTTCGGGAATGCCCATTAACCCGGTGGATATGCTCAACCTAATGCAATTCCATCATTTGATGTCTCTTAACTTTATGAATCTGGCCCCACCACTGATATTTGGGGGAAATACTGCCACCGGCAATGCAGCTTCAACAGCCGCTGCCCAAAATAACGGCATGCCCCCCTCTTCCTTATCAGCACCAGCTTCCCAAACAACGGACATGCAGATTGTGAGCGGAGCAAGTAACTTTACGGGAGAATCTACCAACGCGAACAATCCCACGGCACAGCACAGTATCAATAGTAACTCTCAGATGAACAACAACCAAAAGCGAGCTCGCACGCGCATCACGGACGATCAGTTGAAAATATTGCGTGCACATTTCGACATAAATAACTCGCCCAGCGAGGAGAGCATTATGgagatgtcacaaaaggcgaATTTGCCAATGAAGGTGGTTAAGCACTGGTTCCGAAACACGCTGTTTAAAGAACGACAACGAAACAAGGATTCACCCTACAACTTTAATAACCCACCGTCAACTACCCTAAACTTGGAGGAGTACGAGCGCACAGGTCAGACCAAGAATGCCAGACAAAAGCAACGCAAAATCTACGAAAATCAACCAAATAATTCACTCTTCGAGAACGAAGAGACCAAGAAGCAAAACATTAACTACGCTTGCAAGAAGTGCAGTCTAGTGTTCCAGCGCTATTACGAGCTAATACGTCACCAGAAGAATCACTGTTTCAAGGAggagaacaacaaaaagtcAGCCAAAGCTCAAATTGCTGCTGCGCAAATTGCCCAAAATCTTAGTTCGGAAGACTCGAACTCTTCAATGGATATACATCACTCTGGCATCTGTCCTCCTGGTCCTCTGGTTGCACAGACTATTTCAGCCCCTGTGTCTATCGTAACATCATCCGGACACGCGGCGTCCCAGCCATTTGGCGCTTCGCCCTCGCCACAGCATATATTTAGCAAGTCGTCTTCACTCACTGACTTCAGCCCATCCACGACTCCAACGCCTCCACAGCGGGAACGTAGCAACAGTTTGGACCAGCCGAATCGAAGCGCATCGAAGTTTGACTGCGATAAATGTGAACTGCAGTTTAGCCACCTGGAGTTATTGCGTGAACATCAAATGATGCATTTGATGAATCCAGCAGCACTCTTGGCCGCCGCCGGTCAACACTCCAATCCAGATGCCAGCTATGGTCCTTTCGGTAGCATATTGCAGAGTCTGCAACATGCAGCGgctcaacagcagcagcatcaacagcctCCAACAAAAAAGCGGAAATATTCGGATAGCTCTTCCAACGCAGATGATTTAACGTCTGTGGGGGAAATGGAGACCCCCCAGAAGAAATATGAATTTCTATATCAATACTTTTTGCAGCATGAGACGAACTCCGAGCTGAAACAGCAGTTCCtgatgcagcaacagcagcagcatcagcaaggAAATGAAACGGATTTTGAGTTGGAGTTCTTAACTAATTTCTATCAACAGAGCGAGCTGAAGAAAGTCAGCAACTACGACTTTTTATTACAATATTATCGCAAAAGTGAAGCAATATCCTTGAACACAAAGCCGCTTCAGCAAACTTTCAGCTCAAGCAAGAAGCCTACGATTGAGTTCCTCTTGCAGTACTATCAGCTTAATGAGTCAAAAAAGTTTTTTCAGTTAGTTGCCTCGCCCCAAACGATGCCTGATGGTCAAGGGTACCAACCGTCGTCGCAGTTGCCGAACGCGACGGCGGATGAAACCATGAACGTTATCGGCGAACCAGAAGAGGGGCAGCAATTGCCAGACCAATTACAGAATCATCCGGACTCCAACGTCGACAAGAAGGAACAGGAAAGGCTGAATAACAACAGTATTAACGTCAACTCGAGTTCATCTGAATCACCTCAGTTTAATTCAGCTAGAACTCTTACTTTTAACGATGACGACACTGCTAGCCAGAAAGATGAAGTCAAAGTTTCCTCAACGCTCAAGGTCCATGAAGTGGAAAATGTAACATCAGTGTCTCCGGTCAATGCCCCATCGAAGCAGAACAAGCGCCTACGCACGACAATACTTCCAGagcaattgaattttttgtaCGAATGCTATCAATCCGAGTCGAATCCAAGCCGAAAAATGCTTGAAGAGATATCAAAGAAAGTAAACCTCAAGAAACGTGTAGTACAGGTTTGGTTTCAAAATTCACGTGCCAAAGACAAAAAATCTCGAAATCAGCGGCATTACTCGCATATTTCGGATGACAACAGCTACGACGGCTCTAGCGGCAAAGAGGTTGGCAATGAGCTGAAAGTGAAGTGCGTTTCTGTCGCTCAGGACCACGATATGGATCTGCAGGACTGTCAGCTTTGCCAAGTCACACAGGTCAACATGCAAAAGCACGCTTTTAGCGTAGAGCATATATGCAAAATGAAGGAGCTTCTTGAACAAACCACCGAGCTATACGCTAACAGCAATGGCAGCGGTAGTGATGATAACGATTCCGACAGAGAAAAGCGCTTCTACAGCCTGTCAAAGGCTTTTCTATTACAGCACGTTGTTTCTAATTCTGCTAACATATCTACACAACtgcatacgcatacgccgaGTGCTGGCCCAGACACAGATGTTCTCCCAGAAGAGAACTGTCTGCTTAAGTTTGACGCTACTACTTGCGAGGACAAAGGGCATAAGCGTCATTCGGCTGCCGACGTTGGAAATAAGGATGTGAAAAATGTCGGTGGCAATCAGGATCTCATGCATCAGTTATTCAATCGAAATCATATCACCGTTATAGGTGGAAAATGA
Protein Sequence: MCFICKLSFGNVKSFSLHANTEHRLNLEELEQQLLNREYSSAIIQRNMDEKPQISFLQPLDINATCAVEKLILAPDEICTPLSSEPELEHDNYEDEEDRALAANEPNANRVKLLTEFLQQQLQQQQQQQSSLFPSLCSEHPDFKGVDCKTCELIDIQQRSKSPPPLHQHLGLAQSQSQAMPLSQPQPHRSPNSSSGGLAISPSSSSVTSVGNASGTASSFTIGACSEHINGRPQGIDCARCEMLLNSARLNSGVQMSTRNSCKTLKCPQCNWHYKYQETLEIHMREKHPDGESACGYCLAGQQHPRLARGESYSCGYKPYRCEICNYSTTTKGNLSIHMQSDKHLNNMQELNSSQNMVAAAAAAAASGKLLLSSPSPQGAGQPTVAQLGSSGSGSTAVVSSSVGSNAAMGVPPTSGGTGVVVASIKPKPSFRCDICSYETSVARNLRIHMTSEKHTHNMAVLQNNIKHIQALNFLQQQQQGASGSTSGSSASSFMPEVALADLAYNQALMIQLLHQQQQQQQQQQSSNTKMSPTSSSPVSATDQFSFSPKPMKLGHGMGMGLGMPMGIGHSNEASGESGSDAHPLAKPDMWPTALYSCLICDSFSTNNLDDLNQHLLVDRSRQSSSASADIMVIHNNNYICRLCNYKTNLKANFQLHSKTDKHLQKLNFINHIREGGARNEYKLQYQPQLTANVVQLTCNCCDFHTNSIQKLSMHTQQMRHDTMRMIFQHLLYITQQSRMHKESPCTAADDAQCPCPDDDQQSIATIEKVLICQLCSFAAKNLYEMVQHVKGIRHLQVEQFICLQRRSENQEMPGLNEVYKVTERIRGSEDIIFEAGFNMATNTPVGGSSEVGFAAATAGSSAAADGNILSPKSTSSCSTSCGKSVGRIASPSMNDFSLSASNSIPTTVFKCNLCEYFVQSKKDMASHIETVHPGAESDDFMSIPTNTAALQAFQTAVAAAAIAAVQQRCSAINMPREADTEIGPCISDCPIDIKRERLEEEDGPMTGIEERKPTANLDAEMSDAKATKPSGVQCPLCLENGFREKSLLETHLTSVHSVTKDGLARLLQLVDSKAWSSPGTDSPSVTATTSTASNCNSNAEDCAITIGSVITEDCVSSFPVVAAASSTASSAGLQGLSCQQCEASFKHEEQLLQHAQQTQHFPEQNGEYICLATSHISRPCSMSFSSLPSMISHFKDSHMSLVISERHVYKYRCKQCSLAFKTQEKLTTHMLYHTMRDATKCSLCQRNFRSTQALQKHMEQTHSNEAAGAAAGSAMTNSPRPPTPNYGEIEKLPSGEREPPIGSDAGPKSNNTSRRSLSPLRSELQYTKEAAQLSPSPHALDTNQTQQQQQHLATLTAALLKQQQCHPDANVLSADPLSLSAADFSQQLHGLQNLQNLQHMQQQFSAVAASSGMPINPVDMLNLMQFHHLMSLNFMNLAPPLIFGGNTATGNAASTAAAQNNGMPPSSLSAPASQTTDMQIVSGASNFTGESTNANNPTAQHSINSNSQMNNNQKRARTRITDDQLKILRAHFDINNSPSEESIMEMSQKANLPMKVVKHWFRNTLFKERQRNKDSPYNFNNPPSTTLNLEEYERTGQTKNARQKQRKIYENQPNNSLFENEETKKQNINYACKKCSLVFQRYYELIRHQKNHCFKEENNKKSAKAQIAAAQIAQNLSSEDSNSSMDIHHSGICPPGPLVAQTISAPVSIVTSSGHAASQPFGASPSPQHIFSKSSSLTDFSPSTTPTPPQRERSNSLDQPNRSASKFDCDKCELQFSHLELLREHQMMHLMNPAALLAAAGQHSNPDASYGPFGSILQSLQHAAAQQQQHQQPPTKKRKYSDSSSNADDLTSVGEMETPQKKYEFLYQYFLQHETNSELKQQFLMQQQQQHQQGNETDFELEFLTNFYQQSELKKVSNYDFLLQYYRKSEAISLNTKPLQQTFSSSKKPTIEFLLQYYQLNESKKFFQLVASPQTMPDGQGYQPSSQLPNATADETMNVIGEPEEGQQLPDQLQNHPDSNVDKKEQERLNNNSINVNSSSSESPQFNSARTLTFNDDDTASQKDEVKVSSTLKVHEVENVTSVSPVNAPSKQNKRLRTTILPEQLNFLYECYQSESNPSRKMLEEISKKVNLKKRVVQVWFQNSRAKDKKSRNQRHYSHISDDNSYDGSSGKEVGNELKVKCVSVAQDHDMDLQDCQLCQVTQVNMQKHAFSVEHICKMKELLEQTTELYANSNGSGSDDNDSDREKRFYSLSKAFLLQHVVSNSANISTQLHTHTPSAGPDTDVLPEENCLLKFDATTCEDKGHKRHSAADVGNKDVKNVGGNQDLMHQLFNRNHITVIGGK*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00580525;
90% Identity: iTF_00581046;
80% Identity: iTF_00580526;