Basic Information

Insect: Anastrepha ludens
Gene Symbol: Mta1_2
Assembly: GCA_028408465.1
Location: JAPVRI010023724.1:1-10012[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.1e-09 1.9e-05 25.6 8.7 1 35 364 401 364 402 0.97

2 4 0.48 8.1e+03 -2.0 0.2 1 5 498 502 495 506 0.64

3 4 0.17 2.9e+03 -0.6 0.3 7 16 687 696 685 701 0.76

4 4 2.3 3.9e+04 -4.2 0.2 6 14 783 791 783 792 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.1e-09	1.9e-05	25.6	8.7	1	35	364	401	364	402	0.97
2	4	0.48	8.1e+03	-2.0	0.2	1	5	498	502	495	506	0.64
3	4	0.17	2.9e+03	-0.6	0.3	7	16	687	696	685	701	0.76
4	4	2.3	3.9e+04	-4.2	0.2	6	14	783	791	783	792	0.76

Sequence Information

Coding Sequence: GCAACCGCTGAAGATTCTCCACTGGCTACGAAGCTGAAGAAAACATGGCTTAGAACACCAGTAGGCGAAGAGCAGGCCGCACAAGCAGTACTAGATCCTTCGATAGCAGCGCTGGATGAGGGACTGAATAGTCCTATACATCATGGCCCTGGCGGTGGCACAGCATCTGCGGATAAAGGTGAACCACTAACAGCCAAACAACGCTACCAGATCAAACATCGTGAATTGTTTTTGTCACGTCAAGTCGAGGCACTGCCCGCCACACAAATTCGTGGCAAATGCTCGGTTACGTTGCTGAACGAGACGGAGTCCCTGCAAAGCTATCTCAGTAAAGACGACACATTCTTTTACTGCTTGGTCTTCGATCCTAACCAGAAGACACTGCTCGCCGACAAAGGTGAAATACGTGTAGGTAGTCGCTACCAGAGTGAAATCCCTGCGAAACTCAAAGATGTCTCGAGCGATGAGCGCAAGTTAGAAGATCTCGAAACATTGGTGTGGAAAACACAGCATAGCCTGAATGATCGAAAAATTGATCAGTTTTTGGTGGTATCGCGCTCGATAGGCACATTCGCACGCGCACTGGACTGCAGTAGTTCGGTGAAGCAACCGTCTTTGCATATGTCTGCCGCAGCAGCTAGCCGTGATATAACACTGttCCATGCCATGGATACGCTGCACAAGCACAATTACTCTATTGAAGAGGCGATGTGTTCGTTAGTTCCTTCCACTGGGCCAGTACTCTGCCGCGACGAAATTGAAGATTGGAGTGCCGCAGAGGCAAATCTATTCGAAGAAGCGTTGGACAAATATGGCAAAGATTTCAATGACATTCGACAGGACTTTCTTCCTTGGAAAACCCTAAAACAGATAATAGAATATTATTATATGTGGAAGACAACCGATCGCTATGTGCAACAGAAACGTGTGAAGGCTGTTGAGGCGGAACTAAAGTTGAAACAGGTTTATGTGCCGCAATATAATCAAGTAAATAAGAGTGGCAGTGGTGGGGTTTCAATAAAGGGAGGTGCCAATATTTATAATGGCACTACAAATGGTGGTGCTGATCTTTCCAATAATGGCAAACCATGTGAATCTTGCTCAACAGTTAAATCGTCACagTGGTATCCATGGACTAGTAGTGGTCACGGTGCATGCCGTCTTTGTCAAAGTTGTTGggactattggaaaaagtatggCGGTTTAAGAAATGCCGCAAAAACTGAAGTCGAGCATGAACCCAAAAAGAAAGCTCCAGTTGTAGTCGAAGTTATCGACACCGAAAAAGTAAGCGATTTGTCCAATCGCCAAATGCAAAAATGCCCGATGGTTAATTGTGGcaaagaatttaaattaaaaactcattTGGCGCGTCACTTCGATCAAGCGCATGGAATCGCTATAAGTTCGGGTTCCCCACGTCCCATCATGAAAACTCGCACCGCCTTTTATCTGCACACGAATGCAATGACGCGACTGGCACGTATTCTTTGTCGAAACTGTATAAAAACCAAGAAAGCAGCACGCCAAACATCGTTTGCGATCAACACGCAATTGGTGAAGCAGGAatTTACCAATCGAATAAATGACAAAACTGCTGCCGACATCAAGAAAATTTTGCTGATAAAGAGAAAAAAGCGAGAACGCGGCAGTGTTACAAAAATAGCAAATCGTCTGGGTTCACCAGGCAATGGACCACATGAATGGTTAGTGTTGACACCAAAGGACAAAATACCAAAACCCGATGTGGTCTCATTTCCCAAACCACCAAAGGCACCCGATGGCAGTTTGTTGTATGAGCGCGTACCTAACAAAATTGTGGAGATCGAGAAAGATTTAACCATTATACCAACTCCAGCGCCGGTAGTAACAACTCCTGTTGCTGCTGCAGTACTACCTGCGGCAGTACCTGCTATTTCGCCAGTACCAGCTTCAAaggtaacaacaacaaccaatacAGCGGCATCAGCGCCAAAACCAGCAGCAGATCGTCCTAGGGTGACCAAGGATTTGCAGCCAGTTCCAGTACCAGCTACAGGCGGCGGAGCTGCAGCAGCGCGCCGTACTGATTGTTGGCGCAAGCGCGGTCGTGACCGGAATGAGGAAACCGTGGATGGGATGCTTTACCCTGTATATCCGCCAACGAAGCGTCCCAATAAGGATCCCATGCCATCACATCGTCCAAGCAATGAACAATTTGCCGCAATGATGGCCGCTGCGGGTCATACCTTAACGAGACATCACtTAAACGGCAAACCAAAACTAGCACAAATGGGACGTACCGGTAATGGACGAAAGCAAGTCATAAGCTGGGTCGATGCACCAGATGATTATTATTTTAGAGCTACCGATGGCAGCAAaaaatggCGCAAGACACTTTCCCCTGCCGACCTGCGACGTGTTGCACGCAAACCATGGCGAGATCTACCATTCAAGGCACAACAAATTGCACAGATGGCACATGTTGTTACAGCACCGGCCGTGCCGGTGAGCAGACAAATCGAATCGCAAGTTGTAATACTCGACTGA
Protein Sequence: ATAEDSPLATKLKKTWLRTPVGEEQAAQAVLDPSIAALDEGLNSPIHHGPGGGTASADKGEPLTAKQRYQIKHRELFLSRQVEALPATQIRGKCSVTLLNETESLQSYLSKDDTFFYCLVFDPNQKTLLADKGEIRVGSRYQSEIPAKLKDVSSDERKLEDLETLVWKTQHSLNDRKIDQFLVVSRSIGTFARALDCSSSVKQPSLHMSAAAASRDITLFHAMDTLHKHNYSIEEAMCSLVPSTGPVLCRDEIEDWSAAEANLFEEALDKYGKDFNDIRQDFLPWKTLKQIIEYYYMWKTTDRYVQQKRVKAVEAELKLKQVYVPQYNQVNKSGSGGVSIKGGANIYNGTTNGGADLSNNGKPCESCSTVKSSQWYPWTSSGHGACRLCQSCWDYWKKYGGLRNAAKTEVEHEPKKKAPVVVEVIDTEKVSDLSNRQMQKCPMVNCGKEFKLKTHLARHFDQAHGIAISSGSPRPIMKTRTAFYLHTNAMTRLARILCRNCIKTKKAARQTSFAINTQLVKQEFTNRINDKTAADIKKILLIKRKKRERGSVTKIANRLGSPGNGPHEWLVLTPKDKIPKPDVVSFPKPPKAPDGSLLYERVPNKIVEIEKDLTIIPTPAPVVTTPVAAAVLPAAVPAISPVPASKVTTTTNTAASAPKPAADRPRVTKDLQPVPVPATGGGAAAARRTDCWRKRGRDRNEETVDGMLYPVYPPTKRPNKDPMPSHRPSNEQFAAMMAAAGHTLTRHHLNGKPKLAQMGRTGNGRKQVISWVDAPDDYYFRATDGSKKWRKTLSPADLRRVARKPWRDLPFKAQQIAQMAHVVTAPAVPVSRQIESQVVILD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00091168;
90% Identity: iTF_00082069; iTF_00189891; iTF_00191299; iTF_00190609; iTF_00193974; iTF_00191735; iTF_00193497; iTF_00190363; iTF_00191039; iTF_01563349; iTF_01562832; iTF_00082872; iTF_00083574; iTF_01189368; iTF_00081145; iTF_00081800; iTF_00192473; iTF_00192024; iTF_01563709; iTF_01564206; iTF_00193214; iTF_00192755; iTF_00303752; iTF_00304200; iTF_01045902; iTF_01045404; iTF_00091168; iTF_00091855;
80% Identity: iTF_00082069;