Basic Information

Insect: Hypomecis punctinalis
Gene Symbol: MTA1_2
Assembly: GCA_949316475.1
Location: OX438815.1:17373584-17398722[-]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 1.4 6.7e+03 -1.8 0.1 21 31 314 324 311 326 0.72

2 9 1.4 6.7e+03 -1.8 0.1 21 31 370 380 367 382 0.72

3 9 1.4 6.7e+03 -1.8 0.1 21 31 426 436 423 438 0.72

4 9 1.4 6.7e+03 -1.8 0.1 21 31 482 492 479 494 0.72

5 9 1.4 6.7e+03 -1.8 0.1 21 31 538 548 535 550 0.72

6 9 1.4 6.7e+03 -1.8 0.1 21 31 594 604 591 606 0.72

7 9 1.4 6.7e+03 -1.8 0.1 21 31 650 660 647 662 0.72

8 9 1.4 6.7e+03 -1.8 0.1 21 31 706 716 703 718 0.72

9 9 2.9e-09 1.4e-05 25.9 7.5 1 35 764 800 764 801 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	1.4	6.7e+03	-1.8	0.1	21	31	314	324	311	326	0.72
2	9	1.4	6.7e+03	-1.8	0.1	21	31	370	380	367	382	0.72
3	9	1.4	6.7e+03	-1.8	0.1	21	31	426	436	423	438	0.72
4	9	1.4	6.7e+03	-1.8	0.1	21	31	482	492	479	494	0.72
5	9	1.4	6.7e+03	-1.8	0.1	21	31	538	548	535	550	0.72
6	9	1.4	6.7e+03	-1.8	0.1	21	31	594	604	591	606	0.72
7	9	1.4	6.7e+03	-1.8	0.1	21	31	650	660	647	662	0.72
8	9	1.4	6.7e+03	-1.8	0.1	21	31	706	716	703	718	0.72
9	9	2.9e-09	1.4e-05	25.9	7.5	1	35	764	800	764	801	0.94

Sequence Information

Coding Sequence: ATGGAGGAGGAATCTTCAGAGTTGCCGGGCACAGACGGGCTGGCGCCGAAGCAGCGGCACCAGGCCAAGCACCGCGAGCTGTTCCTCTCGCGCAACGTGGAGACCCTGCCCGCCACACACATCCGCGGCAAGTGCTCTGTCACGCTCCTCAACGAGACAGAGTCGCTGCTCAGCTATCTCAATAAGGATGacgcatttttttattgtttagtaTTTGATCCTTCACAAAAGACTTTATTAGCAGATAAGGGAGAAATCAGAGTTGGAAGTAGATATCAGACTGAAGTAACTAATTTATTAAAAGAAGGCGAGGAAGACGCGCGGTCGGGCGAGGAGCTGGAGACGCTGGTGTGGACGCCGGAGCACGGGCTCACGGACCGACAGATCGACCAGTTCCTGGTGGTCTCTCGGTCGGTGGGCACGTTCGCGCGCGCGCTCGACTGCTCCTCCAGCGTCAAACAGCCCAGTCTACACATGTCGGCCGCCGCCGCCAGCCGGGACATCACACTGTTCCATGCAATGGACACCCTGCACAAATCCGGGTACAGCATAGAAGCCGCGCTGTCGTCGCTCGTGCCCGCCTCGGGGCCCGTGCTCTGTCGCGACGAGATGGAGGAGTGGTCGGCCTCGGAGGCCAACCTCTTCGAGGAGGCCCTCGACAAATACGGCAAGGACTTCGCTGACATACGGCAAGACTTTTTGCCGTGGAAGACGCTAAAGAACCTGGTGGAGTACTACTACATGTGGAAGACGACCGACCGCTACGTGCAACAGAAGCGCGTCAAGGCGGTCGAGGCCGAGTCCAAGCTGAAACAAGTGTACATTCCCAACTACAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGACATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGACGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGGTCAGTATCGACATGATATAAAGAGGATCCGCCATTGCAGCAACAAGCCGAACCCGGCGCTCATCACAAGCAACAACAACAGCGGCGGCAAGACGCCCGCCGTGCTCAACGGCGGGACCAACGGCACTTCCGCCATGACCGCCGGCATGCTCTGCGCGTCTTGTCAGGTGACAAACTCAACCCAGTGGTACACATGGGGACCGCAGCATTTACAGTACAGATTGTGCGGCTCCTGTTGGTCATATTGGAAGAAATATGGTGGACTAAAAACCGCCGGCGTGTTCGGCGAGACCGAGGTGGAGGCGGCGAAGGGCCCGCGCGAAGGGGAGGACGCGGCGCTCTCCGTCTCGCACAGACCGCACCGCTGCACCGTGCTCAACTGCGCCAAGGAGTTCAAGCTGCGCGCGCACCTGGCGCGGCACGTGGCGACGGCGCACGGCGGCGGCGAGGGCGCGCGGCCCGTGATGAAGACGCGCGCCGCCTTCTACCTGCGCGCCTCGCCCTTCACGCGCCTGGCGCGGCGGCTGGCGCGCGCGCTGCGCCGCCCCCGGCACTTCGCGCGCTCGCCCTTCTCGCCCATCAACCTCGCGCAGGTCAAGCACGAGTGTTCCATAGCGATGGCGGGCCTGGGCGCCGCGGAGctggcggcggcgggcgcggcgggcggcggcgcggggcgcgtgcgcggcgcgctcggcgGCGTGGCGGCGCGCCTGGCCGCCGCCCGCGGCGCGCCGCTGCCCGCGCGACACCACGAGTGGCTGCAGCTCACGCCGCGCGACCGCATGCCCGTGCCCCACCACCAAGCCTTCCCCAAGCCGCCCAAGGCACCCGACGGCAGCCTGATCTACGAGCGCGTGCTGTCGCGCGCGGAGCAGGAGGCGCGCCGTGCCGAGCtggcgcccgcgcccgcgccgccgccggcccTCAAGCGCCGCGCGCCCGACGATGTCAACGGACTCGACAGAGGGCGCGGCGCCCCGCCCGCCAAGCGGCCCAACAAGCACCCGGCGCCGATGCAGCGGCCGAGCCGCGAGCAGTACGCCGCCATGTGCGCGCGCGCGCAGGCCACCGGCCAGCCGCTGCCCGCGCACGTCTTCGCACACGTAAACGGCAAGCCGACGAATATAAGCGGCCGCGGCGGGCGCCGGCACGTCATCTCCTGGATGGACGCGCCCGATGACCTCTACTTCCGGGCCACAGAAGCTGCCAAGCGGTCGCGACGAACGCTGTCGTGCGGCGAGCTGCGGCGTGGCGCGCGCGCGCCGTGGCGGGCGCTGCGCGGcgcggtggcggtggcggcggcggcgggcggcgcggccaaggcggcgcccgccgcgcccgcgcccgcgcccatGCACCTCGTCATCCTCGACTGA
Protein Sequence: MEEESSELPGTDGLAPKQRHQAKHRELFLSRNVETLPATHIRGKCSVTLLNETESLLSYLNKDDAFFYCLVFDPSQKTLLADKGEIRVGSRYQTEVTNLLKEGEEDARSGEELETLVWTPEHGLTDRQIDQFLVVSRSVGTFARALDCSSSVKQPSLHMSAAAASRDITLFHAMDTLHKSGYSIEAALSSLVPASGPVLCRDEMEEWSASEANLFEEALDKYGKDFADIRQDFLPWKTLKNLVEYYYMWKTTDRYVQQKRVKAVEAESKLKQVYIPNYNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSDGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQGQYRHDIKRIRHCSNKPNPALITSNNNSGGKTPAVLNGGTNGTSAMTAGMLCASCQVTNSTQWYTWGPQHLQYRLCGSCWSYWKKYGGLKTAGVFGETEVEAAKGPREGEDAALSVSHRPHRCTVLNCAKEFKLRAHLARHVATAHGGGEGARPVMKTRAAFYLRASPFTRLARRLARALRRPRHFARSPFSPINLAQVKHECSIAMAGLGAAELAAAGAAGGGAGRVRGALGGVAARLAAARGAPLPARHHEWLQLTPRDRMPVPHHQAFPKPPKAPDGSLIYERVLSRAEQEARRAELAPAPAPPPALKRRAPDDVNGLDRGRGAPPAKRPNKHPAPMQRPSREQYAAMCARAQATGQPLPAHVFAHVNGKPTNISGRGGRRHVISWMDAPDDLYFRATEAAKRSRRTLSCGELRRGARAPWRALRGAVAVAAAAGGAAKAAPAAPAPAPMHLVILD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00826925;
90% Identity: iTF_00826925;
80% Identity: iTF_00826925;