Basic Information

Insect: Anania fuscalis
Gene Symbol: GATA4_1
Assembly: GCA_950371115.1
Location: OX493334.1:6204136-6216393[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 2e-16 6.9e-13 49.0 3.7 1 35 392 425 392 426 0.98

2 13 0.22 7.4e+02 0.9 0.1 13 35 444 464 444 465 0.75

3 13 0.22 7.4e+02 0.9 0.1 13 35 483 503 483 504 0.75

4 13 0.22 7.4e+02 0.9 0.1 13 35 522 542 522 543 0.75

5 13 0.22 7.4e+02 0.9 0.1 13 35 561 581 561 582 0.75

6 13 0.22 7.4e+02 0.9 0.1 13 35 600 620 600 621 0.75

7 13 0.22 7.4e+02 0.9 0.1 13 35 639 659 639 660 0.75

8 13 0.22 7.4e+02 0.9 0.1 13 35 678 698 678 699 0.75

9 13 0.22 7.4e+02 0.9 0.1 13 35 717 737 717 738 0.75

10 13 0.22 7.4e+02 0.9 0.1 13 35 756 776 756 777 0.75

11 13 0.22 7.4e+02 0.9 0.1 13 35 795 815 795 816 0.75

12 13 0.22 7.4e+02 0.9 0.1 13 35 834 854 834 855 0.75

13 13 0.22 7.4e+02 0.9 0.1 13 35 873 893 873 894 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	2e-16	6.9e-13	49.0	3.7	1	35	392	425	392	426	0.98
2	13	0.22	7.4e+02	0.9	0.1	13	35	444	464	444	465	0.75
3	13	0.22	7.4e+02	0.9	0.1	13	35	483	503	483	504	0.75
4	13	0.22	7.4e+02	0.9	0.1	13	35	522	542	522	543	0.75
5	13	0.22	7.4e+02	0.9	0.1	13	35	561	581	561	582	0.75
6	13	0.22	7.4e+02	0.9	0.1	13	35	600	620	600	621	0.75
7	13	0.22	7.4e+02	0.9	0.1	13	35	639	659	639	660	0.75
8	13	0.22	7.4e+02	0.9	0.1	13	35	678	698	678	699	0.75
9	13	0.22	7.4e+02	0.9	0.1	13	35	717	737	717	738	0.75
10	13	0.22	7.4e+02	0.9	0.1	13	35	756	776	756	777	0.75
11	13	0.22	7.4e+02	0.9	0.1	13	35	795	815	795	816	0.75
12	13	0.22	7.4e+02	0.9	0.1	13	35	834	854	834	855	0.75
13	13	0.22	7.4e+02	0.9	0.1	13	35	873	893	873	894	0.75

Sequence Information

Coding Sequence: atgaaatatgaagaGATCGGTTCACCGGATTCTACAGAGGAAATGAAGAATTCCGAGAGCAGACAGGCGGCAGTGGCGTTGCTCTCTATAAAACATAACGACCCCACGAAGTACGTGGTGAAGCCGGAGGACGAGCCGCACATAATGTTCAAGAGCGTGTCGGGCGTGCCGCCGCCCGAGCGCGCGCACGAAGTCATGCACTGCAACGCGATGCTCGACATCATTTCCAAGGCGGTGGCGGTCGCGCAGCGCGAGAACGAGGACTCGCAGAAGTTCCCGCCGAACTACACCAGCGTCATCGACAGAACGCACGCACTCAGCACCAGCGAAATAAGATACTCACACGACTACCCGGAAGATCAGTACAATTTGTACAACGCGTCACAAAACGCCGCGAGCCCTTGTAGCAATAACGAACATGACAATAAAGAAATGGATCTCTCACTTTACAGTTCTGTTAAAAATGAACCTTCAGAGCAAAATGAAAACGTTGATCGCGAACACTCAGATTCATTTTATCATGGAAtattaaatcataataattcGTCAAATTACCCTGAAGAATACAAACAGTCGGTTTTTGGAAGATCTTCTAGTAAGAAAACGTCGAAAGACAACTCTTCTGTTTACGAAGAATGCAGTCAGAGTAGTAGCGGGTCAGATCCCGACCGACTACAAATGGACATCTCACAAATGTCGCAGGACGACCCTGAAGAGACGCAGTCAGCGCGGTCTACCCAGTCATCACCGCCGCCGCCCCTCGAGAACGAGGCCGACAAGGAGTCCCTATGGCAGGCCCTTCACAGGCAAAACGGCCGCGGGGGTGAAGCGACGCAGCTACTGAAGCGGTTGATCAACAGCAAGCACCTCGGCATGACGGTCTCGCCACTGCGGGCCAGCACCTCGCCGCAGTCGGCGTCGTCACAGCCGGTCAACGGCGCTGTCTCACCGAACGGCGAGTGGCAGATGTCTAGAGGCGGCGGGGCCGCGGGTACGGCGCGCAGGAAACAAAGCTTCCCGGTGCGAGCGCAGCCGGTCGCGACGCAGGACGCGCCGGCTACTACGCAGCCGTGGCCACAGCCGCAGGCAGACAATCAGGATGCAACCGACGCGTCTTCAATGAGCAACACGGGCGGCGGTAACGGGCGCTCGGCGCCGCGCGTCGAGCTCTCGTGCAACAACTGCGGAACCCACACTACCACAATCTGGCGCCGCGACGCGCGCGGGGAGATGGTCTGCAACGCGTGCGGCCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCTCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCTCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACACCATCCACACGCGCCGGCGGCGCCCGCGCCACGACCCCAAGCACGCGCGCACTCAGTGTAACACTCTCTACTACAAGCTGCACGGCGTCCCGCGCCCCACCGCCATGCGCCGCGACGCCATCCACACGCGCCGGCGGCGCCCGCGCCACGATCCCAAGCACGCGCGCAAGTCCCGGCGGAGCGGCGGCAACGCGTGTCCCGAGCCCGTGGAGGCGAGCCCGGCAGCCAGCGCTgcggccggcgccggcgccgcgccCGCCTCGCCCGGCGCCGAGGAGGCCGTGCTCGCCGCGCTGCGCCGCCAGCTGCAGCCGCACCTGCTGGCCGCGCTGCACGCGCACACGCACCGCCACCCGCGCCCGCaggtacacacgcacacacacacgcgctccCGCCCGCCTCGCCCGGCGCCGAGGAGGCCGTGCTCGCCGCGCTGCGCCGCCAGCTGCAGCCGCACCTGCTGGCCGCGCTGCACGCGCACACGCACCGCCACCCGCGCCCGCaggtacacacgcacacacacacgcgctccCGCCCGCCTCGCCCGGCGCCGAGGAGGCCGTGCTCGCCGCGCTGCGCCGCCAGCTGCAGCCGCACCTGCTGGCCGCGCTGCACGCGCACACGCACCGCCACCCGCGCCCGCaggtacacacgcacacacacacgcgctccCGCCCGCCTCGCCCGGCGCCGAGGAGGCCGTGCTCGCCGCGCTGCGCCGCCAGCTGCAGCCGCACCTGCTGGCCGCGCTGCACGCGCACACGCACCGCCACCCGCGCCCGCagGTCGGGCTAAACGCGCCGGAATACGACGAGGCGCCGCTCAACCTGGTCGCATCCCACGTGGCCGCCGAGGAAACGCACTGA
Protein Sequence: MKYEEIGSPDSTEEMKNSESRQAAVALLSIKHNDPTKYVVKPEDEPHIMFKSVSGVPPPERAHEVMHCNAMLDIISKAVAVAQRENEDSQKFPPNYTSVIDRTHALSTSEIRYSHDYPEDQYNLYNASQNAASPCSNNEHDNKEMDLSLYSSVKNEPSEQNENVDREHSDSFYHGILNHNNSSNYPEEYKQSVFGRSSSKKTSKDNSSVYEECSQSSSGSDPDRLQMDISQMSQDDPEETQSARSTQSSPPPPLENEADKESLWQALHRQNGRGGEATQLLKRLINSKHLGMTVSPLRASTSPQSASSQPVNGAVSPNGEWQMSRGGGAAGTARRKQSFPVRAQPVATQDAPATTQPWPQPQADNQDATDASSMSNTGGGNGRSAPRVELSCNNCGTHTTTIWRRDARGEMVCNACGLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRLTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRLTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDTIHTRRRRPRHDPKHARTQCNTLYYKLHGVPRPTAMRRDAIHTRRRRPRHDPKHARKSRRSGGNACPEPVEASPAASAAAGAGAAPASPGAEEAVLAALRRQLQPHLLAALHAHTHRHPRPQVHTHTHTRSRPPRPAPRRPCSPRCAASCSRTCWPRCTRTRTATRARRYTRTHTRAPARLARRRGGRARRAAPPAAAAPAGRAARAHAPPPAPAGTHAHTHALPPASPGAEEAVLAALRRQLQPHLLAALHAHTHRHPRPQVGLNAPEYDEAPLNLVASHVAAEETH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -