Basic Information

Insect: Ricinus marginatus
Gene Symbol: gata4_2
Assembly: GCA_028565995.1
Location: JAOWBB010006164.1:36503-42634[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 5.2 2.1e+04 -3.8 0.3 1 6 234 239 233 243 0.65

2 3 6.5e-16 2.6e-12 47.1 0.9 1 35 973 1006 973 1007 0.97

3 3 2.4e-18 9.6e-15 54.9 5.7 1 35 1032 1065 1032 1066 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	5.2	2.1e+04	-3.8	0.3	1	6	234	239	233	243	0.65
2	3	6.5e-16	2.6e-12	47.1	0.9	1	35	973	1006	973	1007	0.97
3	3	2.4e-18	9.6e-15	54.9	5.7	1	35	1032	1065	1032	1066	0.98

Sequence Information

Coding Sequence: ATGGCAATAATCAGGGGCGGATTGCGGCGCTTAATTCGCCTTTCGGTTGAGTGGAAAAAGGCCGGGGGGGGTGGCTTTTATCCGTCGAAACGGAAAATCGGGCGAGTCGAAGCCGACGCGAAGCCATTCGACGGGAGGCGGAGAAATCGGGCTCTTTCCCGGGCCGACGttaaaaaggaggaaaagtcGCAACCGGGTACCTGCGAGCATTCGACGGCGAGTAGTCAGGCTCGAGTGCCGCGTTCGCTCTGGACGGAGCACCTTCCACCGGAACCGTGGCCGCAGCGACTCGTGCAATCCGCCATtgCTCCACGCCGATTGGACCGACGGCCGCCGATGCGCGACAGTTCGCGACCGGGATGGACGATGCCCGCAGGTATTCGCTGCAGGACGTGGATGGCGCAGGTTTTGGGGGCACTTCGCGGTTGGGGTTTTCCCGGGCACCTCGCGGATGGAGGGCGGATTTTGGTAACCCGGCTACGCCCACTGGGATGGGGCCTGTGCCCCGACGCTTCCCCCTCCCCGCGTCAGCATCCAGCGTCTAGTAGACGCCGCTCCTGTGTCAGTCGCGCAAGTCCCGATAAGAGTCCGACGCCGGAACTAGCTCCAGTGCTCCAGGCGAGGACCGGCGAAATTTCGGAAAGGTCGGGTCTCTGCCGATCTTGCTTTCCAGCCTTTCCTTTCGACGACTTCATGGAATGCGACAGTTGTCGAACGCAGGCCGCTAAAGCATCGCACGACCCAGCGCCatCTGATACCGAGAAATGGGGCCCCTTTAAGGACCCGGGACCGGGTCGGTCGAGCGCAACGGGGAAAAccccgaaaagggaaaattttccgaaaagagGGCCCCGTTTGCGCGAACGAACCCCCAGGGGCGGAGACGGGCCCTTCGACCGCCCGTGCGAGATGGTCCGATGGGCCCGCGAGCTGCGGAGGGCCCGAGCCGGCCGCCGTGCGTCATTGTTTGCCGACGGGGAGAGGACGCGGTTGTTGCGTGTTTGCACAGCAAGTCGGTGCGGCTGCGTCTTTGCCGTCATTGAGACTTCCTCTCCCGAAATGCGCGAGATGGATAAGGAAAAGAGTAAAATGATGACGGACATGGAAAAAAGCGGTGCGCTGCAGAATTACAAACCGAGCGAACAAACGTACAGGCTGCAAAACGCGGATCTCGTATATAAGGAACAAGAAAAACAATCAGTTATAACGTACCAGGGTTCTTTAAAACAAGGGATCGCGGCGGAGGAGAGACAGGATCCCATCGCGAAGGATgaaaaggaagaggaggaaagcGGAGATGCGAGCAAGGAGGGCGATCCGATAGGAtacaaaagaggaaaaagggagAACGAAGCCGGGAACATCATCAGGACGCTGCAGGTGGACAAACCCAGGACCGAGGTTCATTTAGTCAATTACGAGCATCAATACTCGAAAGAACCGAACAGGATACTGAAAGCGGACGGCTACGACTGCAGCTGGAACGAGAGAATGCACGGCGACGTTCCGGAAGAAAGTCAGAGGAGATCTAGTCACAGGGAAGGAAGCCTAAACCAAAGCGATTTGAACGTGTTCGGAGTTGAAGTATTGGGACAGAAGAAGAGAGTCGGAAAAGCGGACTGCGACAAGAAAGGCGATCATCCACTAAGGGGTTACGAGCGATATCCATCGGAAGGTATCAAGAAAGAACAGAGTGACGTTAAAAATGCGGAGAAGGTCTACGAGGAGCAGTCCCGGCACGACATGAACCCTCTGCCGGATTTTCAACAGAGCTACGGAAGGGAAAGGCACAGGGAACGTCTTTTGCAAAACTCGGATCTAGATAATAATTCAGAGGGTCAATCGGATAAAGTCAGATATCAAGAGAGGGATTTGTACCAAATGCCCCTCATGCAGAACGTGGAAAACGTAGTGCACGGGAGAATGTACGAGGTGCAGGAGAGGACCGGGGAATACAGAAAGTTGAGCTATGCCACATCGGAAGGCGAAAGTCCCAAACCAACCCAAATCAAGTACAGCGTTATGACGCATGCAGACAGGGATCCGATGCTGGCGGATTCCTTCCCGAACTCCCACAAGGTTGCCTATCCCGTGAACATACAAAGGTTCGCCGCGGAATATCGCATTAAATACGAGGACAACACCGATCCCATGGCCAACAGACAAGAGATAGAGCACCACAACCTCATAATCAAAAACTCGGCCATTCAGGAGCATATACAGACGAGCATGGCAGTGGAAACGTCAACGACGACCTACGCCACCTTGCAGACGGTCGCGCAACCCAACACCAACGTCTACAACAATCTCTATCCGATTAACGAGTATCACGAGGGCGGCTACATGCACAAGCAGCAGGGAAATTCGGATTTGTACGATATGAGCAGGAGCGGAGAGGATATTCCTAACTACAGGGCCACCAACGGGGAAGTTCCTCGCGAATACGGACACAAAATGGAGCACGAAGTCATCAACTTTCAGATTCCGTATGCCTTCGCCGACGGCAACCATCGCCTGCAGCAACTGCCGGCATCGGGTGAGATACATCAGCAGTACGTGGCAAAACAAGATTCgcaaatcggaaaaattcaGGaattggGTCTCAGTTACGATCAACCTCACAACAGCACCGCCAGCTCACAGATCATCACCCTTTACGGGCACCCCAATTCACAGTACCAATGCGCCTCAGGCTCCAACTTCATCCCGACTTCCGCTATCGAATACGAGTATTCCGGTGGAAATCACAACCCTGGAGGTAACCAAATAGTCGGTTCTTACTCCGATTACGTGCCCAACGCGGCCTCCACCTCTTGGGGCAACGAAAATTTCCGAAACGGTAAGCGAGAATCCTCGGCAGGAATTTGCTGCGGAGATTTCACCCTCGAAGGAAATCCCATTTCGGATGTGAAAGAGTGCGTAAACTGCGCTGCAGGAATAACTCCATTATGGAGGAGAGATGAAGAAGGTCACTACCTGTGCAATGCCTGCGGAATCTATAACAAAGTTAACGGGGTGAATCGACCACCGGTGAAGACGAGCAGCAAAAAGTACAGCAACGTGCCGCCGAACAACAGGAGGACAGGAGTGGAATGCGCCAACTGCCGGACGACGACGACCACTCTCTGGAGGAGGAATAACGCCGGAGAACCCGTCTGCAACGCCTGCGGACTTTACTTCAAGCTGCATGGGGTGAACAGGCCCCAAACCATGAAGAAAGACGGGATCCAGACGCGAAAGCGCAAGCCGAAGAGCTCGGCAATGCACCACCAGTTGAAGCAGGACAGGAGTCACCACGGTAGGGTTCTGGGACAAAAACTGGAAGCTCAGGGCACCGGATCCGCCTACCATCTCGACCAACGGGACATCCAGCAGTCTCTTCTGCTTGCCCAGGGAGAAATGCAGATGTTACCCGCCGAAGAACTGCTGCACACTCCCGACAGCCCGGTAATACCTTCCTCCTCGCATCTCAACCGGCACATATCTCAGCTTCCCCCGATAGAGCCCACTCCTGTGATACTTGACGAGAACGTTTTGCGGCACTGA
Protein Sequence: MAIIRGGLRRLIRLSVEWKKAGGGGFYPSKRKIGRVEADAKPFDGRRRNRALSRADVKKEEKSQPGTCEHSTASSQARVPRSLWTEHLPPEPWPQRLVQSAIAPRRLDRRPPMRDSSRPGWTMPAGIRCRTWMAQVLGALRGWGFPGHLADGGRILVTRLRPLGWGLCPDASPSPRQHPASSRRRSCVSRASPDKSPTPELAPVLQARTGEISERSGLCRSCFPAFPFDDFMECDSCRTQAAKASHDPAPSDTEKWGPFKDPGPGRSSATGKTPKRENFPKRGPRLRERTPRGGDGPFDRPCEMVRWARELRRARAGRRASLFADGERTRLLRVCTASRCGCVFAVIETSSPEMREMDKEKSKMMTDMEKSGALQNYKPSEQTYRLQNADLVYKEQEKQSVITYQGSLKQGIAAEERQDPIAKDEKEEEESGDASKEGDPIGYKRGKRENEAGNIIRTLQVDKPRTEVHLVNYEHQYSKEPNRILKADGYDCSWNERMHGDVPEESQRRSSHREGSLNQSDLNVFGVEVLGQKKRVGKADCDKKGDHPLRGYERYPSEGIKKEQSDVKNAEKVYEEQSRHDMNPLPDFQQSYGRERHRERLLQNSDLDNNSEGQSDKVRYQERDLYQMPLMQNVENVVHGRMYEVQERTGEYRKLSYATSEGESPKPTQIKYSVMTHADRDPMLADSFPNSHKVAYPVNIQRFAAEYRIKYEDNTDPMANRQEIEHHNLIIKNSAIQEHIQTSMAVETSTTTYATLQTVAQPNTNVYNNLYPINEYHEGGYMHKQQGNSDLYDMSRSGEDIPNYRATNGEVPREYGHKMEHEVINFQIPYAFADGNHRLQQLPASGEIHQQYVAKQDSQIGKIQELGLSYDQPHNSTASSQIITLYGHPNSQYQCASGSNFIPTSAIEYEYSGGNHNPGGNQIVGSYSDYVPNAASTSWGNENFRNGKRESSAGICCGDFTLEGNPISDVKECVNCAAGITPLWRRDEEGHYLCNACGIYNKVNGVNRPPVKTSSKKYSNVPPNNRRTGVECANCRTTTTTLWRRNNAGEPVCNACGLYFKLHGVNRPQTMKKDGIQTRKRKPKSSAMHHQLKQDRSHHGRVLGQKLEAQGTGSAYHLDQRDIQQSLLLAQGEMQMLPAEELLHTPDSPVIPSSSHLNRHISQLPPIEPTPVILDENVLRH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -