Basic Information

Insect: Drosophila maculinotata
Gene Symbol: grn_1
Assembly: GCA_035045305.1
Location: JAWNPD010000335.1:12680570-12721959[-]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 3.5e-19 8.1e-16 57.4 4.7 1 35 471 504 471 505 0.98

2 3 1.2e-18 2.8e-15 55.7 6.3 1 35 531 564 531 565 0.97

3 3 0.25 6e+02 0.2 0.1 18 31 764 775 760 777 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	3.5e-19	8.1e-16	57.4	4.7	1	35	471	504	471	505	0.98
2	3	1.2e-18	2.8e-15	55.7	6.3	1	35	531	564	531	565	0.97
3	3	0.25	6e+02	0.2	0.1	18	31	764	775	760	777	0.74

Sequence Information

Coding Sequence: ATGGATATGACCTCAACAGCGGAGGCTGCCGCTCGCAGCTGGTACGACAGTCCGCGCTtaggcggcggtggtggcggcggggGTTCACCACAGACAAACGGATTGGGCAGCGCCGGAAGTAGCCTGGCCCACAGCCATCACAGCCTGTCCAGCGGCGCCTCATCGGCGGGCAGCAGCGTCGGCACCGCCCTCGGTGGCGGTGCTGGCGGCGCTGGCGCCGGTTTGGGACTGGATACCAGCGATATGAGCGCCTTCTATGCGCTGGAAAGCAATGGACATCATCGACGCTACTATCCCAGCTATCATCAGCACACATCCCGCATGCCCTCCTCACATGCCACGCCCCAAGTGTGCCGGCCGCACTTTCATACGCCGCTCAGTCCCTGGCTGACCAGCGAGCACAAATCGTTTGCACCCGCCAGCGCCTGGGGCATGGGTCAGTTCGCCTGCCCCCAGGAGCCGCAGGTGGAGCACAAACTGGGCCAGGTGGGCCAGAGCCATCAGACAACGGCGGCCGGCCAGCACTCGTTCCCATTCCCACCGACACCGCCAAAGGACTCCACGCCCGACTCAGTACAAACCGGTCCATCCGAGTACCAGGCTGTAATGAACGCTTTTATGCACCAGCAGGCCACGGGCTCTACCTCACTGACGGACGCCAGCTGTGCGCTGGACATCAAGCCCTCCATACAGAATGGTGGCGCATCCGTTGCGCATGCCGGCAGCGTTGGACCTCCACAATCCTCAGCGCCCAAGCAGCGTGAAGGTAgtactaacaacaacagcaacaacaacaataccaatagctcaaatagcagcagcagcagcggcggcaatcaagcgccgcaacagcagcagcagcagcaacaacagcaacaacagcagcagcagcagcagcagcaaaatagcaacaacaacaacagcaatgcctCCTCATCCGCCACCGCATCCACATCAAATGGGCTATTCGATGGCACTGCCCAGGCACACTATGCGGCCAACAATGCCAACAGCTACGACAGCAGCTATGCCTCCTATCACCATGCGGCGGCGCAGCATCAGGCGGCCGTTGCTGCCGCCAACATGTTCCAAAGTTCCTCCGTGGCAGCGGCCGCTGTGCGGCATAGCATGggtgctgctgcggcggcggcagcgcaccaccatcaccatcacagTCATAGTCATCATCATGGTGCGTCCGTCTCCGCCGGCTCCGGCACGGGCTCCATCTCGGGCCTGCATGGCGGCGGCGTCGGTGGCGCTGGCGGTGTTGGTGGCATGAGCAGCATGGGCGCCATGAGCAGCGGCGGTCATAGTAGCTCCAGTGGTGcaggtggcggcggcggtggtgttGGTCTCGATGTGAAGCCCGTGCGCACAAAGCCCAGGACCAGTGCTGAGGGTCGCGAGTGCGTCAACTGTGGTGCCACCTCGACACCGCTGTGGCGACGCGATGGAACTGGACATTATCTGTGCAATGCGTGTGGACTCTACTATAAAATGAATGGACAGAATCGGCCCTTGATCAAGCCAAAGCGAAGACTGACACTACAGTCGCTGCAGAGCGCGGCCAAGCGGGCGGGCACATCCTGCGCCAATTGCAAGACCACAACCACAACCCTTTGGCGGCGCAATGCCAGCGGCGAGCCCGTTTGCAATGCCTGCGGATTGTACTACAAGCTGCACAATgtCAATCGTCCACTTACCATGAAAAAGGAGGGCATTCAGACGCGTAATCGCAAGCTCAGCTCCAAGTCGAAGAAGAAAAAGGGATTGGGCGGCGGCTGTATGCCAATGGGCGGCCATTTGGGCATGGGCGATTTCAAGCCGCTCGATCCGTCCAAGGGCTTTGGAGGCGGCTTCTCCGCATCCATGGCACAACATGGACACCTTTCCAGCGGGCTGCATCCGGCACATGCGCATATGCATGGCAGTTGGTATACCGGCGGCATGGGCGCATTGGGCGCCTCCGGTGGACTGCAGGGTGGCTTCTCCACGGCCGGCTCGCTGGGTGGCGGCGTTGTGCCCCACTCTCAGCCCTATCACTTGGGTCTCAGTTCAATGATCGGGTCGACTGGCAGTCGAGGCCAGTCGAggctggagttggagttggagtctcGGGGCCAAGAGCCAGAAATTCACACATCGCTGTCGCTGCGGCGCGACTGGACGCTGTGCAGCACTCGACGCCACAGCGGGGAGGAGCTCAGCTGGGATGATTCATTTGAGCCAGCCACACTGTTATCCTCCTGCCTCTACCGCCTGCTCCTGCCCACCCCCAAGGGCCGGGGTCCCAGTTGCAATTCTTGCGCGGTTGCATTGCGCGATTCCATTTCCTCTTCGCATGATTTCGCTGCGCCTGCGCGCTGTGTGCGCCCACAATTCAgtcacagcagccacagcaaccacagcagcagtggcGGTCGCCACCACGACGActacgacgacaacgacgaagaTGATGACGGTGACGATGCGGTTGATTTCGAGCTTATCACGTTCACAGGAGACTCTTAG
Protein Sequence: MDMTSTAEAAARSWYDSPRLGGGGGGGGSPQTNGLGSAGSSLAHSHHSLSSGASSAGSSVGTALGGGAGGAGAGLGLDTSDMSAFYALESNGHHRRYYPSYHQHTSRMPSSHATPQVCRPHFHTPLSPWLTSEHKSFAPASAWGMGQFACPQEPQVEHKLGQVGQSHQTTAAGQHSFPFPPTPPKDSTPDSVQTGPSEYQAVMNAFMHQQATGSTSLTDASCALDIKPSIQNGGASVAHAGSVGPPQSSAPKQREGSTNNNSNNNNTNSSNSSSSSGGNQAPQQQQQQQQQQQQQQQQQQQNSNNNNSNASSSATASTSNGLFDGTAQAHYAANNANSYDSSYASYHHAAAQHQAAVAAANMFQSSSVAAAAVRHSMGAAAAAAAHHHHHHSHSHHHGASVSAGSGTGSISGLHGGGVGGAGGVGGMSSMGAMSSGGHSSSSGAGGGGGGVGLDVKPVRTKPRTSAEGRECVNCGATSTPLWRRDGTGHYLCNACGLYYKMNGQNRPLIKPKRRLTLQSLQSAAKRAGTSCANCKTTTTTLWRRNASGEPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKLSSKSKKKKGLGGGCMPMGGHLGMGDFKPLDPSKGFGGGFSASMAQHGHLSSGLHPAHAHMHGSWYTGGMGALGASGGLQGGFSTAGSLGGGVVPHSQPYHLGLSSMIGSTGSRGQSRLELELESRGQEPEIHTSLSLRRDWTLCSTRRHSGEELSWDDSFEPATLLSSCLYRLLLPTPKGRGPSCNSCAVALRDSISSSHDFAAPARCVRPQFSHSSHSNHSSSGGRHHDDYDDNDEDDDGDDAVDFELITFTGDS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00569367;
90% Identity: iTF_00496245;
80% Identity: -