Basic Information

Insect: Neoceratitis asiatica
Gene Symbol: -
Assembly: GCA_030068015.2
Location: CM061528.1:43631509-43639230[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 0.026 1.8 9.4 1.8 1 23 1781 1804 1781 1804 0.96

2 13 0.6 41 5.1 1.1 1 23 1983 2005 1983 2005 0.94

3 13 0.00027 0.019 15.6 2.5 2 23 2008 2029 2008 2029 0.97

4 13 1.3e-05 0.00091 19.8 0.1 3 23 2037 2057 2035 2057 0.98

5 13 4.3e-06 0.00029 21.3 3.7 2 23 2064 2085 2063 2085 0.97

6 13 8.1 5.6e+02 1.6 0.4 5 23 2098 2116 2096 2116 0.96

7 13 2 1.4e+02 3.5 5.4 3 23 2123 2144 2121 2144 0.93

8 13 0.052 3.6 8.5 0.1 2 23 2155 2175 2154 2175 0.96

9 13 8.1e-05 0.0056 17.3 1.2 1 19 2181 2199 2181 2203 0.94

10 13 8.5e-06 0.00059 20.4 1.2 1 23 2211 2233 2211 2233 0.98

11 13 0.00015 0.011 16.4 7.6 1 23 2239 2261 2239 2262 0.96

12 13 0.0014 0.098 13.4 6.5 1 23 2267 2289 2267 2289 0.98

13 13 0.0026 0.18 12.6 5.8 1 23 2295 2317 2295 2318 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	0.026	1.8	9.4	1.8	1	23	1781	1804	1781	1804	0.96
2	13	0.6	41	5.1	1.1	1	23	1983	2005	1983	2005	0.94
3	13	0.00027	0.019	15.6	2.5	2	23	2008	2029	2008	2029	0.97
4	13	1.3e-05	0.00091	19.8	0.1	3	23	2037	2057	2035	2057	0.98
5	13	4.3e-06	0.00029	21.3	3.7	2	23	2064	2085	2063	2085	0.97
6	13	8.1	5.6e+02	1.6	0.4	5	23	2098	2116	2096	2116	0.96
7	13	2	1.4e+02	3.5	5.4	3	23	2123	2144	2121	2144	0.93
8	13	0.052	3.6	8.5	0.1	2	23	2155	2175	2154	2175	0.96
9	13	8.1e-05	0.0056	17.3	1.2	1	19	2181	2199	2181	2203	0.94
10	13	8.5e-06	0.00059	20.4	1.2	1	23	2211	2233	2211	2233	0.98
11	13	0.00015	0.011	16.4	7.6	1	23	2239	2261	2239	2262	0.96
12	13	0.0014	0.098	13.4	6.5	1	23	2267	2289	2267	2289	0.98
13	13	0.0026	0.18	12.6	5.8	1	23	2295	2317	2295	2318	0.96

Sequence Information

Coding Sequence: atggGGGAGAATGTACAATGTCCAGTATGCACACTATTTCTGCATGCTGGCATGAATCTATCCGATCATTTGGAGACACATCCTAAAGAGCAAGTAATTAAAGCACTTGTACAAATGACCATTTCGGGGGGCGGTGGCAGTGCTGCAAGTACCGCGCTTGCGGCATCACTCAGTGGAGTTAGCACAACGAAAACTGATAAGGATGAGAAACCCGTCATGGCACGACCTGCTACAGATTCCGATACAATCAGCAGTACAGCATCATCTTTTACAGGACAAACCGCAATAAATAGTCAAAACTTTGCAGCTGCATTTAGTGGAATATCAGCAATCACTAAACCATCGTCGTCAATTTCTGCAAGTACTGTGACAAATTCAGCAACTACTAGAGCTCCGGTCGACGTTGTGGCTGTGCCAACAAAACCTGCAGCTCTGGCGGAGGATAGAGCTATGGTTAAGTCGAATGGTGTTAGTGGGAGCAAGAGCAAAATGTTGCCTTCTGCAACAGTGCCGGTAAGCGATACTGGGCCATCACAGGTGCAAGGTCAATTTGACAATTACACAGCGAACAGATGCCACCAACCACATCAAAAACAAATTGCACCAACTCAATTGGAACAGCGGCAGCTTCATCAACCgactgcacaacaacaacagcaacaactactaCAGCAGCAAAAGCATCttcagctacaacaacaacaaaagcaaagacAACATACTGTTGATAATACAACCACAAGTATTGGAGTTACTCAGCCACGGAACATATTGCCACCTCCACCCCCACCAACAATGACTTCAATTCCGCTGGTGGTCGGACAAGTGCCAAATAAACTATTACATCCTACGCATACAACTACTACAATATTTGCAAGTAATGTTGCTTCAAATCGCCATGTTCAAATACATCCGCTCCAGCAACAACCACACCCACAGCTTCAACATCAGtaccaacagcagcaacaaacacACAATCAATCACAACAGCAGCAGaatcttaaaatatattattcaactGCAATACCTGCACCACCGCCTTCTCTACAGctGTTTCCATTCCACCCATCAGCGCAAATGCAACATCAAAAACCACCGCCTGCTTATGGTACTGCGATAAGTCAAATTCGATCTCAAaataaccaaaaccaaaataaacatGTGAGTGTGGAGAAAAGCCTCATACAATCACAatcgcaacaacatcatcagcaccagcagcaccaccaccaacaacaacaacaacaactacaacaaagtCAACAGCCACAACTAACACGTCAAATTCAACAGCGTTCCTCAATGCCGTCAACACAGTCACAAGGAAAAAACAATCCCTCAACATCGCTACTGCTaaatcagcatcaacaacaacatactaTTGGCAACGTACCAAGCCTGAGTGTAAAATCTATGAATGAATCCAAACCAACTGAATTGCTtccaccaccgccgccacctACACGTACatcaaataatttacaacaacTTCATCAGCAATTACCACTTTCGTTACAACATTTTGGTATACCAATCAAATCCATCCCAACCGTACAACGCATTGCAACAACTGGCACCGACACTATTGCCTCAACAACAAATCCAACAATAGCTTGTCCTTCTGCTAGTATTGCTGCAACATCTACATCCTCGACTCCAGCTAATATGCAAATGACAACTGTAAGACAAATATCTTCTCCATACAATTCATTACTATTATCGGCGGCCCAATCAACTTCATCCAGTTCAGTATTACGTTATGCTGAATCGCCGGTGGCGCATTATTTGGAACGGGACAATGGCGATTTCATAGTACAAGAGACTCCAAAACATATTGTTGAATGCGTTGAAAAGGATAATGGCGAATTTTCGGTGATTGAACGCATATATCAATCCCCACTAAGTGTATTACATATACATGAGGACGACGAGAgggatgatgacgatgatgatgacgatggtgGTGAGAATAGTGATACGAAAGACAACGACAAAAAGAAGGTTTCTACAACAGCcgatgaaaaagcaaaaacaaatgacGTTGTTGTACCTATGGATATTGAAAGCGATGGAAGCTCCCAATCTAATGTAGATGAAAAAAATGAGCTACCGCGCTCGAATTTGAAGAATACTGAATTATGTAACAATAAGAGTATTGTAGCAGCTGATGGCAAGGTACAAACGAAGGTGTATGGTAGTGATAAGTCAGAAGTGACAAATCTAAATAGTAGCGATAATAGCGATAAGCCCACACCATTAAATAATACATCTATGCGTTCAAACAGTGAGCCCACCTCTGCATCAAATTCTCattcaacaaataataatagcgACCTCAACGCACCCAGCTGCTCAACAACCAGTTCCAGTTCTAGTTCAGCAGGTACGTCGCGCAAACGCAGttctaaaaatacaataactgTATTGAGTGATGTACAATTGAATTTGGATGAATATCTAGATTTAGTTGGAAATATAATAGCATCTAGTAAAATAACAGAGAAAATGAGTACATTATCAGGCGCAATGCCTATACCTTtgttaaaagttgaaaaagaagAGCCACCTGATGATTACGAGATGCCGCAAAATGAGGAGGAACAACAAGAATTTGacgaacaaaaagaaaaatactttgaatCATCCGAAAAGTATAACGAGTTTCATGCGCCAACTGTAATTGAACCACCTACAATCGCCAACAAAAATGAGActgaaaatatagttgaaaataaTTGTAGTAGCAATAAGGTTAGATTAAATGACACTGACATTGATGAAAAGGATGCCAGCACTGCCGTGCCTGCAACGACGTCTGCGAAAGCTGCGGCAAAATGTTCGAGTCACGTGACCAGTGTTATACGCATGGCTACAACTagtcaacaacagcaaaaacaacaatcgcAAAAGGACTTGACGCATCCTGCCACACTTGCTCCAGAGTCAAAAAGAACACaatcacaaaatatatttaccgATGACTCTACAACATCATCACAACCACAAGTGACATCAATTATCATACAAGATTTATCGCGCCAGCATATTATACAATTGCAGGAGGAGCAACATTCGCAGAGCGAtcgacaacagcagcaacaacagcaagaacaacatGTAGCACAAAGTGGTTcgtcgcagcagcagcagcagcagcagcagcagcaacagcagcaaataGAGACGAGGGTGGCGGAGACGCAACCGCCACTAACGACATCACTGCCAGTGCAAAAGAGGGGCCCCAAGAAGCTGATTATCAAGCCAAAATTAACAAAGACTGATGCAAATGCTAacctcaacaacaaaaacaacaataacaacaacattagaaACAACATTAATTCCAATAATAATAGAGACACGTCCCAATCAATTACGAAAGAAGCACTATGCGAACAACCTACAACATCATCCAAAGCACAACTGGAATTACcagagaaaatatacaaaaaacaacaacagccagaAGATAAACTCACGCATAATGCAATTGTacagaaattgataaaaaccgAACCGACAACATCAGCTTACGACACCAATACCAATAGAATGGGCATGAATGGGAATAATTTGAGCCTCAGTATACTGGAAAATCATTTAACAGCTAACACTGAGAATAGTGTACCCATTATACAGTGCAAAACCGAAAAGGAACCTCAACAAACAGCAACCTATATGCAACCATTCAAGGAAGAAGTTAAAGATATTAGCAATTCCAACGATAATGCGGCTGCGACTGATGACGCGCGTGTTTTATTAGACTTTGCCAATTCAAAGAAACACAATGCGCTTAATACTGGTGGTGCTAATTTTCTCTCCGCTACTTCGATATTCTCAAACACGATGAAAATAGCGAAAGATTATTCGAAGCCATCATCGAGTCTAGCTAATACGACTACAAATAGTGATGAGTCACATGCAGCATTACGTTGCGAAGATGAATTTATTGCACAGGATGATGTGCAAGAGATCGTAATTTCATCCTCATATTCACAATCACAATCAGCCTCTGATATTCCCACTACAGCCACCAATAGTACCACCGCCACCAGCATATCTCACGCTAAAGATATAAATGTtattcagcaacaacaacagcatcagcagcaacaacaacatcaccaccatcatcaacaacaaccacaactgaGTCACAATTTCACCGATTATCCATTCAGTTTTCTTTATGGTCATGGTGGAACTATCGGAGGCGCAGGTGCCAGTAATAGTGTACAACAAACGGATACCAAAAGTGGTAACTTCTCTGCCATATATCAACAAGCAGCACAAGATGCCACCACCGCTGCAACACTTGCTTCTGGCAGTAATACGATTCACACAGATGAGTCCACCAGTTCAACTCAACAGCAGCAAACGCATACGAATCACTTTGGCGGTGTACATAGCGCAGGCGCTGGTGAAATGGGTGCATCACATGCATCGCATTGGTATCATCATGCTTTGGGTACGGCAAATGCAGATTTTGATGCAGCTTTGGCTGTTGATTGTAATGCTGCCGTTGATGGCGCTGATGTCGGCAAATACTTGGATTTGGATTCTTGTAAACGGGAAGTTTTAGTTGGCATGCCTGCAGCGCCATCTTCGACATCGTCATCCTTTGCTGCAGTCACGGAGAGTAGCTTGGCTGGCGGCTGTACGGCGGACGCACTTAATATACGTACGGATGAAAAGATGCCAGCAAAGGGGGAGATTTCGGGGCAAGAGAGCAATTGCGATATTGAAAATTCATGGAGTCAACCGatGTATGGCGAAATTTCTGCGCGTTTCTTTAAAACAACTTTCCCTGGTATATTTCAACATGAAAATGGTTGGAATCATGACGAGTATTTCACAGTACAAGACTTGAGTGCTTCGGCTGCTGCAACTGGTACGGGTCGAACAGGCAAAAGcTTTGATTTTCGTCTTCCCTTGGAAGCCACCACCTCAGCCGCAGCAAATGGTGCCAATAGCAACTTCCAACTTTTTGCACGCAATACAGATGCATTGCCATCCACTTCATCTGCTAACAAAACTAAGAAACGAAAGCGGGACAATCATGGTGGGAATGCCGGCAACATGAGCAGAATGGAAAAAACGCCGTCACGCATGCAACCAACTGCTACAATTACATCACAACAGCTATTATTGCATCAAACCCAACAAAATCAAGCGCAAAATACGCAAGGACAATTGCAACAATCGCAGCAAAGCACCGATTCAGCAACTTCGGCAACATTCCTGGCTGGCAGCACACCCAACACCGCTACTTCGGCAATTCTCAATCCTGTCAACGCTGCACTGAGTGCGGAACACAGACGTCCTCGCAAGAAAGTCTATCAGTGCACACATTGCACAGCCGAATTTTCTAAGCTTAAGGATcgtaattcccatatgattttgGAGCACAACTATGTGCGTCAGAATCGACGTCTGATATGTGTTCAGCGCTCGGATGCGAGTGCAATTACACCATCAACATCGAACACAGCTAACCCCGCTGACGTTGACAATGTAGTGGTGGTGAATATGGCCGATGGTTGTAGTAGTTCGCTCGTACGTTCAGATAGCATGGAATTCATTGAAGATTCCAAGCATGGCATTGTAAAAATTGAGGTTGATCATGCTTACCATTCATTAGGTGCTGCGGCTACGGCATCAGCAAGTGGTAGCAGTGAAGGCGTTGATGCCAAGCCAGAACTGATGGACGACAAACAAAGCATGGCATTAGTGCCTGTAAGTGGTGCAAACGTAGATCGTGAAGGTGAAGGCGGCATTGGTGAGGCGGTAGATACAAAACCGTTAATCCAACCGCTCGCGCTATCTACACCAGCCACAAAATTGGCTGCACTCTACCGCATGTTGGTCTCCTATAATATATCCACGCTGAAAGATAGCCATAATCTTAGCGAAATGGAACAGAAACTCATTGAACAATCCATATTTTTCTGTTACGTTTGTCGACGAAACTTTACATCGGTCAAATTATACGATGCACACTTGAGTGAACATCCTGCTGAATGTTTTACATGTGGCAAAACGTTTCAGCGTTGGAAGAATTTTTCACTACATTTGAAACGGCACTTGGGTTGGAAAGAATTTGGTTGTAATGTTTGTGGCAAGAAATTTGTTGTGCGTAGCGCATTGGTGGAGCACATGCGTATGCATACTGGGCACACGCCATTGAAGTGCAAAGTATGCGGCAAATATTTCAAACGCTATTCGAATTTAACACAACATCGTAAACGACACGGTAAACAGATTATAAGGAAAAAAGAATATGTTTGCCATTGTGGTGAGGTATTGCCATCGAAGGCGCGTTTCCTTTGGCATAAAGAAACCCACGACGCCAAACCCAAATGTTGTCCATATTGTTGTGATCGTTTCGTGCATGCCAACTCTTTGCGTCGTCACATACGTTTAGCCCATTCCGATAAGTTTGACTATGCCGAACCGGTGGAGTGTCCCTTGTGCAAGCAAACCTTTGCCAAATCGTCAATCAAAGCACACATAGCAACACATTCGATGGATACCCAACACGACTGTACGATTTGCAATAAATCTTTCTCTACAAAATGGAATTTGAAAATACATTCATGGGTACATGCTAATCGCACATCGAAACCATTCAAATGTGAACACTGCCCAAAAGCGTTTGTTCGTGAGGTGGATTTCAAGAATCACATGAATGCACACAAACAAATTAAACCGTATACATGTGAGTATTGTGGTTGTAAATTCATAAGGAAATACAATTATATGCGTCATCGACGCGAACATCATGGCAACAAAAAGTTCACCTGTGACCTGTGTAAAAAGTCCTTCCATCGGCACTATTATCTCATCGAACATCGACGTATACATACAGGCGAACGGCCATTCCAGTGTAGCATATGCGGCAAAAGTTCCACAACAAAAACTAATCAtaataagcatttaaaaatacatcattcacgTGATCCGTTTACGGTTGAGGCGTAA
Protein Sequence: MGENVQCPVCTLFLHAGMNLSDHLETHPKEQVIKALVQMTISGGGGSAASTALAASLSGVSTTKTDKDEKPVMARPATDSDTISSTASSFTGQTAINSQNFAAAFSGISAITKPSSSISASTVTNSATTRAPVDVVAVPTKPAALAEDRAMVKSNGVSGSKSKMLPSATVPVSDTGPSQVQGQFDNYTANRCHQPHQKQIAPTQLEQRQLHQPTAQQQQQQLLQQQKHLQLQQQQKQRQHTVDNTTTSIGVTQPRNILPPPPPPTMTSIPLVVGQVPNKLLHPTHTTTTIFASNVASNRHVQIHPLQQQPHPQLQHQYQQQQQTHNQSQQQQNLKIYYSTAIPAPPPSLQLFPFHPSAQMQHQKPPPAYGTAISQIRSQNNQNQNKHVSVEKSLIQSQSQQHHQHQQHHHQQQQQQLQQSQQPQLTRQIQQRSSMPSTQSQGKNNPSTSLLLNQHQQQHTIGNVPSLSVKSMNESKPTELLPPPPPPTRTSNNLQQLHQQLPLSLQHFGIPIKSIPTVQRIATTGTDTIASTTNPTIACPSASIAATSTSSTPANMQMTTVRQISSPYNSLLLSAAQSTSSSSVLRYAESPVAHYLERDNGDFIVQETPKHIVECVEKDNGEFSVIERIYQSPLSVLHIHEDDERDDDDDDDDGGENSDTKDNDKKKVSTTADEKAKTNDVVVPMDIESDGSSQSNVDEKNELPRSNLKNTELCNNKSIVAADGKVQTKVYGSDKSEVTNLNSSDNSDKPTPLNNTSMRSNSEPTSASNSHSTNNNSDLNAPSCSTTSSSSSSAGTSRKRSSKNTITVLSDVQLNLDEYLDLVGNIIASSKITEKMSTLSGAMPIPLLKVEKEEPPDDYEMPQNEEEQQEFDEQKEKYFESSEKYNEFHAPTVIEPPTIANKNETENIVENNCSSNKVRLNDTDIDEKDASTAVPATTSAKAAAKCSSHVTSVIRMATTSQQQQKQQSQKDLTHPATLAPESKRTQSQNIFTDDSTTSSQPQVTSIIIQDLSRQHIIQLQEEQHSQSDRQQQQQQQEQHVAQSGSSQQQQQQQQQQQQQIETRVAETQPPLTTSLPVQKRGPKKLIIKPKLTKTDANANLNNKNNNNNNIRNNINSNNNRDTSQSITKEALCEQPTTSSKAQLELPEKIYKKQQQPEDKLTHNAIVQKLIKTEPTTSAYDTNTNRMGMNGNNLSLSILENHLTANTENSVPIIQCKTEKEPQQTATYMQPFKEEVKDISNSNDNAAATDDARVLLDFANSKKHNALNTGGANFLSATSIFSNTMKIAKDYSKPSSSLANTTTNSDESHAALRCEDEFIAQDDVQEIVISSSYSQSQSASDIPTTATNSTTATSISHAKDINVIQQQQQHQQQQQHHHHHQQQPQLSHNFTDYPFSFLYGHGGTIGGAGASNSVQQTDTKSGNFSAIYQQAAQDATTAATLASGSNTIHTDESTSSTQQQQTHTNHFGGVHSAGAGEMGASHASHWYHHALGTANADFDAALAVDCNAAVDGADVGKYLDLDSCKREVLVGMPAAPSSTSSSFAAVTESSLAGGCTADALNIRTDEKMPAKGEISGQESNCDIENSWSQPMYGEISARFFKTTFPGIFQHENGWNHDEYFTVQDLSASAAATGTGRTGKSFDFRLPLEATTSAAANGANSNFQLFARNTDALPSTSSANKTKKRKRDNHGGNAGNMSRMEKTPSRMQPTATITSQQLLLHQTQQNQAQNTQGQLQQSQQSTDSATSATFLAGSTPNTATSAILNPVNAALSAEHRRPRKKVYQCTHCTAEFSKLKDRNSHMILEHNYVRQNRRLICVQRSDASAITPSTSNTANPADVDNVVVVNMADGCSSSLVRSDSMEFIEDSKHGIVKIEVDHAYHSLGAAATASASGSSEGVDAKPELMDDKQSMALVPVSGANVDREGEGGIGEAVDTKPLIQPLALSTPATKLAALYRMLVSYNISTLKDSHNLSEMEQKLIEQSIFFCYVCRRNFTSVKLYDAHLSEHPAECFTCGKTFQRWKNFSLHLKRHLGWKEFGCNVCGKKFVVRSALVEHMRMHTGHTPLKCKVCGKYFKRYSNLTQHRKRHGKQIIRKKEYVCHCGEVLPSKARFLWHKETHDAKPKCCPYCCDRFVHANSLRRHIRLAHSDKFDYAEPVECPLCKQTFAKSSIKAHIATHSMDTQHDCTICNKSFSTKWNLKIHSWVHANRTSKPFKCEHCPKAFVREVDFKNHMNAHKQIKPYTCEYCGCKFIRKYNYMRHRREHHGNKKFTCDLCKKSFHRHYYLIEHRRIHTGERPFQCSICGKSSTTKTNHNKHLKIHHSRDPFTVEA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00304006;
90% Identity: -
80% Identity: -