Basic Information

Insect: Cimex lectularius
Gene Symbol: GATA4_1
Assembly: GCA_000648675.3
Location: NW:170608-221384[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 3.2 7.4e+03 -4.0 0.1 12 18 21 27 20 29 0.74

2 3 3.1e-18 7.1e-15 53.7 3.2 1 34 279 311 279 313 0.97

3 3 3.2e-19 7.4e-16 56.8 3.3 1 34 333 365 333 367 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	3.2	7.4e+03	-4.0	0.1	12	18	21	27	20	29	0.74
2	3	3.1e-18	7.1e-15	53.7	3.2	1	34	279	311	279	313	0.97
3	3	3.2e-19	7.4e-16	56.8	3.3	1	34	333	365	333	367	0.98

Sequence Information

Coding Sequence: ATGTCGGAGCAGATAATGACGGAGGATTTGTCGAAAAGAGGGCTGCAGATGGGCGAGAACTGGAGGGGTGGCGAAGAGGAAGAGACCGTCGTGAAAGAGGAGGATGCCCAAGCCCAGGAGGACAACGCGGCGGCTGCCAGGATCGTCGGCTCTCCATCCCCTCATCAGCAGTTTATACATTATGAAGCTCAAGACCCAGCAGTCGGTTACAGCATCAGGAACCAGACCAACCTGTTCAACCTGAAAACTGGCTACGGCGAAGATCTTAACTATTACCCATCGATGCCGCTGACCGCCTCCGGAGCTCAAGTGTTCGAGGCGCAGCAGGGCGAAGTCTCCGAAGGCAGTGGGCACAGTTCACCTGCCTTGGTACGTGATCCATCCCCGCAGCACGAATTCTGCCCAAGCACGGGTGCAGAGTTACACGCCCTCCAGCCTGGTTACTCGGCCTCTAACACCAACGACTACACAACCGCGATGTACAGGACGAGCAACACCAGCTACAATGGCGCCCTAGGTAACTACTACAGCGGCGCCATATCCAGCTCGCCGGACCCAAACGAAAACGCAGCTCCTACGCCTCACATCTGGCCTCACGTTCCAGGAGACGACTTCAGCACTTCAGCTGGTATCAAGTTCAACAACCCTCTTCCAGCGTTCACGAACAAGTTCAGGAATCCGTACCCGACGGCTACCAACTATATGCCTACCCACCAGGAGATCTGGGCCGCTCCCACCACCGCCTCCGGGCACAACCAGTTCCCTGCCGCCACCTCGCTCTCCGCCTGCGGTGGTTCAGAACAAGAAGTAGAGTGCTATTCGGAGGGTAGAGAGTGCGTGAACTGCGGTGCCATCAGCACCCCTCTCTGGAGGAGGGATGGGACGGGGCACTACCTCTGTAACGCCTGCGGTCTCTATCACAAAATGAACGGGATGAACAGGCCTTTGGTGAGGCAGCCGCGGCGTTTGAACGCTTCAAGGAGAGTTGGATTGGCCTGCTCCAACTGCGGCACTTCAATGACTTCTTTATGGCGCAGGAATGCAAGTGGTGAGCCAGTCTGCAACGCCTGCGGACTCTACTACAAACTACATGGCATCAACCGTCCACTCACGATGAAGAAAGACAGCATACAGACGAGGAAGCGCAAACCGAAGGGCAGCAACAAAACAGACACCAGTCAACCCCCTACAAAACTCATCAAGCTAGAACATGCGCACCACAACGGTTATGACTTTCGTACAGTCAACACTGCAGCGAATAACATGAACTACTCGAGCCTGTATCCGTCGTATGCCTTGCCGCAGCCATTCGAGATGGCGGCTAGCAAGCATGACCAAGAAACGCCGCATATAGTGACAAGTCagaataacaacaatattagcAACACTAACAACAATAGCAACAAGCAGGATCGTCCTTCTGTTCTTGTATGA
Protein Sequence: MSEQIMTEDLSKRGLQMGENWRGGEEEETVVKEEDAQAQEDNAAAARIVGSPSPHQQFIHYEAQDPAVGYSIRNQTNLFNLKTGYGEDLNYYPSMPLTASGAQVFEAQQGEVSEGSGHSSPALVRDPSPQHEFCPSTGAELHALQPGYSASNTNDYTTAMYRTSNTSYNGALGNYYSGAISSSPDPNENAAPTPHIWPHVPGDDFSTSAGIKFNNPLPAFTNKFRNPYPTATNYMPTHQEIWAAPTTASGHNQFPAATSLSACGGSEQEVECYSEGRECVNCGAISTPLWRRDGTGHYLCNACGLYHKMNGMNRPLVRQPRRLNASRRVGLACSNCGTSMTSLWRRNASGEPVCNACGLYYKLHGINRPLTMKKDSIQTRKRKPKGSNKTDTSQPPTKLIKLEHAHHNGYDFRTVNTAANNMNYSSLYPSYALPQPFEMAASKHDQETPHIVTSQNNNNISNTNNNSNKQDRPSVLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -