Basic Information

Insect: Bactrocera dorsalis
Gene Symbol: Mta1_2
Assembly: GCA_000789215.2
Location: NW:457612-469272[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 3.8e-09 7.9e-06 24.9 5.7 1 35 428 465 428 466 0.97

2 3 0.38 7.8e+02 -0.7 0.3 7 16 753 762 751 767 0.76

3 3 1.3 2.8e+03 -2.5 0.2 6 14 849 857 848 860 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	3.8e-09	7.9e-06	24.9	5.7	1	35	428	465	428	466	0.97
2	3	0.38	7.8e+02	-0.7	0.3	7	16	753	762	751	767	0.76
3	3	1.3	2.8e+03	-2.5	0.2	6	14	849	857	848	860	0.85

Sequence Information

Coding Sequence: atggCCACAAATATGTATCGGGTTGGagATTATGTCTATGTCGAGACAAATCCGAATAGCCCATTTTTAATACGTCGTATAGAAGagttaaataaaaaccaatcCGGAAATGTGGAAGCCAAAGTTATGTGCTTTTATAGAAGGCGCGATCTGCCGAATCCACTGGTGCAACTAGCCGATAAACATCAGCTGGCGACCGCTGAAGACTCCCCACTGGCTACGAAGCTGAAGAAAACATGGCTTAGAACACCAGTAGGCGAAGAGCAAGCCGCACAAGCCGTATTAGATCCTTCGATAGCAGCGTTGGATGAGGGACTGAATAGTCCCATACATCATGGCCCTGGTGGCGGTGGGGCTAACTCGGAAAAAGGTGAATCACTTACGGCCAAACAACGCTATCAGATCAAACATCGCGAATTGTTCTTGTCACGCCAAGTCGAGGCACTGCCCGCCACACAGATACGTGgcaaatgttcggttacactgCTGAACGAGACGGAGTCCCTGCAAAGCTATCTCAGTAAAGACGACACATTCTTCTATTGCTTGGTTTTCGATCCTAACCAGAAGACGCTACTCGCCGACAAAGGCGAAATTCGTGTAGGCAGTCGCTATCAAAGCGAAATTCCTGCGAAACTTAAAGATGTTACGAGTGATGAGCGCAAGTTAGAGGATCTCGAAACATTGGTGTGGACGCCACAGCATAGCCTAAACGATCGTAAAATCGATCAGTTTTTGGTGGTGTCGCGTTCGATAGGAACATTCGCACGCGCTCTAGACTGTAGCAGTTCGGTGAAGCAGCCGTCATTGCATATGTCGGCCGCAGCAGCCAGTCGTGACATAACACTGTTTCATGCCATGGATACGCTGCATAAGCACAAATACTCTATCGAGGAGGCAATGTGTTCGTTAGTTCCTTCCACTGGGCCAGTACTCTGCCGTGACGAAATTGAAGATTGGAGTGCCTCGGAGGCGAATTTATTCGAAGAGGCTTTGGACAAATATGGCAAAGATTTTAATGACATTCGACAGGATTTTCTTCCTTGGAAAACTCTTAAACAGATAATTGAATACTATTACATGTGGAAGACGACCGATCGTTATGTGCAACAGAAACGCGTGAAGGCCGTAGAGGCGGAGCTTAAACTGAAACAAGTGTACGTTCCGCAATATAATCAAGTGAATAAGAGCGGAAGTGGCAGTGTCTCAATAAAAGGAGGTGCCAATATATATAACGGTACAACAAATGGTGGTGCGGATCTTTCCAACAATGGCAAACCATGTGAATCTTGCTCAACTGTTAAATCCACACAGtgGTATCCATGGACTGGCAGTGGCCACGGTAACAGTCGTCTTTGTCAAAATTGTTTTGACTATTGGAAAAAGTACGGGGGTTTGAAAAATGCCGGCAAACACGAAATCGATCACGAGCCCAAAAAGAAAGTAGCGCCAGTCGTTGTGGAAGTGATTGATACCGAGAAAGTGAGCGATTTGTCTAATCGCCAAATGCACAAATGCCCTATGGTTAATTGTGATaaagaattcaaattaaaaactcatttaGCGCGTCACTTCGATCAGGCGCATGGCATCGCTCTTATGTCGGGTTCACCACGCCCCATTATGAAAACTCGCACCGCCTTCTATCTGCACACGAACGCAATGACGCGTCTGGCACGCGTTCTCTGTCGAAATTACATAAAACCCAAAAAGGCAGCGCGTCAAACGTCGTTTGCGATTAACACGCAGCTAGTGAAGCAAGAATTTACAAATCGAATAAATGACAAAACCGCAGCcgatataaagaaaattttattgatgaaaagaaaaaagcgTGAACGTGGCAGTGTTACTAAAATTGCAAATCGTTTGGGCTGCCCTGGCATTGGACCGCATGAATGGTTAGTGTTGACACCAAAGGATAAAATACCAAAACCCGATGTTGTCTCATTTCCCAAACCGCCAAAGGCCGCCGATGGTAGTTTATTGTATGATCGCGTGCCCAACAAGGTTTTAGAGCTCGACAAAGATTTAACCATTATACCCGCTCCAGCGCCGGTAGTTACAGCTCCAATAGCTGCTGCAGTATTACCTGCGGTAGTACCTGCAATTTCGCCTGCGTCAGTGCCAGTTACAAAGGTGGCAACAGTCAATGCGGGGACACCAGCACCCAAGGTGGCAGCAGAGCGTTCAAGGGCAGTTAAAGATTTGCCCCCCGCCGCGGCACCGAATAGTAGCAGTGGATCAGCAGCAGCGCGACGTACTGATTGTTGGCGCAAACGTGGTCGCGATCGGAACGAGGAAGCTGCGGATGgTATGCTTTATCCAGTATATCCGCCCACTAAGCGCCCGAATAAGGATCCCATGCCTTCGCATCGTCCAAGCAATGAGCAATTTGCCGCAATGATGGCTGCGGCGGGTCATACCTTAACGAGACATcatCTCAACGGCAAACCGAAACTAGCACAAATGGGACGCACCGGTAATGGGCGCAAGCAGGTTATAAGTTGGGTAGACGCACCAgatgattattattttagagCCACGGATAGCAGCAAAAAATGGCGCAAAACACTTTCACCTGCCGATCTTCGACGAGTTGCACGCAAACCTTGGCGAGAACTACCAATCAAAGCACATCAAATTGCACAGATGGCACATGTTGTAGCGACACCAGCTGTGACGGTGAGCAGACAAATCGAACCGCAAGTTGTAATACTCGACTGA
Protein Sequence: MATNMYRVGDYVYVETNPNSPFLIRRIEELNKNQSGNVEAKVMCFYRRRDLPNPLVQLADKHQLATAEDSPLATKLKKTWLRTPVGEEQAAQAVLDPSIAALDEGLNSPIHHGPGGGGANSEKGESLTAKQRYQIKHRELFLSRQVEALPATQIRGKCSVTLLNETESLQSYLSKDDTFFYCLVFDPNQKTLLADKGEIRVGSRYQSEIPAKLKDVTSDERKLEDLETLVWTPQHSLNDRKIDQFLVVSRSIGTFARALDCSSSVKQPSLHMSAAAASRDITLFHAMDTLHKHKYSIEEAMCSLVPSTGPVLCRDEIEDWSASEANLFEEALDKYGKDFNDIRQDFLPWKTLKQIIEYYYMWKTTDRYVQQKRVKAVEAELKLKQVYVPQYNQVNKSGSGSVSIKGGANIYNGTTNGGADLSNNGKPCESCSTVKSTQWYPWTGSGHGNSRLCQNCFDYWKKYGGLKNAGKHEIDHEPKKKVAPVVVEVIDTEKVSDLSNRQMHKCPMVNCDKEFKLKTHLARHFDQAHGIALMSGSPRPIMKTRTAFYLHTNAMTRLARVLCRNYIKPKKAARQTSFAINTQLVKQEFTNRINDKTAADIKKILLMKRKKRERGSVTKIANRLGCPGIGPHEWLVLTPKDKIPKPDVVSFPKPPKAADGSLLYDRVPNKVLELDKDLTIIPAPAPVVTAPIAAAVLPAVVPAISPASVPVTKVATVNAGTPAPKVAAERSRAVKDLPPAAAPNSSSGSAAARRTDCWRKRGRDRNEEAADGMLYPVYPPTKRPNKDPMPSHRPSNEQFAAMMAAAGHTLTRHHLNGKPKLAQMGRTGNGRKQVISWVDAPDDYYFRATDSSKKWRKTLSPADLRRVARKPWRELPIKAHQIAQMAHVVATPAVTVSRQIEPQVVILD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00091168;
90% Identity: iTF_00082584;
80% Identity: iTF_00190609;