Basic Information

Insect: Dromius quadrimaculatus
Gene Symbol: ATP7A_2
Assembly: GCA_963989225.1
Location: OZ022325.1:66877262-66899878[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 2.4 7.3e+03 -0.9 0.1 27 43 1356 1372 1350 1377 0.88

2 6 7.4e-06 0.023 16.7 0.3 21 43 1378 1400 1373 1405 0.90

3 6 0.0036 11 8.1 0.0 21 48 1406 1432 1403 1434 0.91

4 6 0.00011 0.33 13.0 0.1 18 44 1431 1457 1430 1461 0.88

5 6 0.00035 1.1 11.4 0.2 21 48 1462 1488 1460 1490 0.91

6 6 0.0024 7.4 8.7 0.4 18 46 1487 1515 1485 1521 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	2.4	7.3e+03	-0.9	0.1	27	43	1356	1372	1350	1377	0.88
2	6	7.4e-06	0.023	16.7	0.3	21	43	1378	1400	1373	1405	0.90
3	6	0.0036	11	8.1	0.0	21	48	1406	1432	1403	1434	0.91
4	6	0.00011	0.33	13.0	0.1	18	44	1431	1457	1430	1461	0.88
5	6	0.00035	1.1	11.4	0.2	21	48	1462	1488	1460	1490	0.91
6	6	0.0024	7.4	8.7	0.4	18	46	1487	1515	1485	1521	0.87

Sequence Information

Coding Sequence: ATGGATTCAAATGTTCTCGTATTCAAATTAAAAGATGGGGTCACAAAAACGGCTCAAGAGTGGGTGGACACCAAAAAtgtattacaaaaaattgatgGGACCGTTTTGACTGATTTGAAAGATGGGCTGGAAATCAGGACAACTGAAGCAAACATGAACCTCGTCACggaAACTGCCGATTCTTTGGATCTCCACCAAATCTCAAAACCTTCTCCAGTGGGAACCATGTCGCCCTTATCCCCAACCGGTGATTATTCTTCAGTAACAACGCCCCTTTTATCAAATCAAAACAATTGCGCCACTGTAAGGATCCAAATAGAAGGAATGACTTGTCAGTCATGTGTTCGGaacattgaaaaaacaattgctGAAAAATCAGGCGTCAGTGGCATTAAAGtcaatttagaacaaaaattaggaaCAGTTGATTATGACTCAAGAGTTGTTACGCcggaaaaaattgttgattataTTGAAGAAATGGGGTTCGAGGCTGCTTTGCCCCTTTTAAATGGGGAGGAGGATGTTAGCAGCTGTGTGGTTGGAATTGAAGGGATGACGTGTAATTCTTGTGTCAGAAATATTGAAGGCATGATATCAACAAAAACAGGCATTAAAACAATTAAAGTTagtttggaaaacaaaaaagcAGACGTTTTGTTCTTTAGTGACGTCATTTCCGCAGAAAAAATTGCCGAATTAATAGATGATATGGGTTTTGATACTAATTTATTATCAGTAAATGGACGGGCAATTCAAAATGGCTCACCTTTAAGTTCAGAAATCATAAATAAAGAAAAAGGAAAAGGCAAAGCCTTGGACAAATCAGTTCCTAATAATCTTGGGGGCGGAGATGCGGGTAACTTTTCGCGTTGTGTTGTTCATATAAAAGGAATGACTTGTGGAAGTTGCGTAGCTGCTATTGAAAAACATTGTTTGAAGCTTTATGGCGTCCATGGCGTTTTAGTTGGGCTACTGGCCGCCAGGGCGGAAATCAAATATGATTCAGAGGTTATTCAGCCCCGAGATATTGCTTTAAGTATTACTGAATTGGGCTTTCCGGCTGAAATTATTGATGAACCCGGTACTGGCGAAACAGAGGTGGAGTTACATGTTAGTGGAATGACGTGTAGTTCATGCGTAAATAAAATCGAAACAACTTTATTGAAAATTCCTGGCGTTTTGACAGCTGCTGTCGCTTTAAGCACGCAAAAAGCTCGAATTAAATATGACGCGGAATTGACAGGAGTTAGGGATATTTGTGAAACGGTTAGGAAACTTGGATTTGGCGCCGAACTGTCAAATAATCGTGATAAAGACAATAGAAGTTATTTGGAACAAAAGGAAGAAATTCAGCGCTGGAGGACTGCCTTTTTAGTGTCACTGATTTTTGGTGGGCCCTGTATGTTGGCAATGGTTTATTTTATGATGCAAATGTCAGTTGGAGGTTTAAGTCACCATGATATGTGCTGTGTTGTCCCGGGTTTGAGTCTGGAGAATTTATTAATGTTTGCTTTAAGCACGCCGGTTTTGTTTTTTGGGGGGCGGCATttttatgtacaaGCATGGCGGGCATTACGTCACGGAACAACAAACATGGACCTCCTCATAACCATGACAACCACAGTATCCTACATTTATTCCCTAGGTGTATTATCAGCTGCAATGATAATGCAGCAGCCAACTTCACCCCAAACATTTTTCGATACTCCCCCAATGTTATTAGTGTTCATTTCGCTTGGTCGGTGGTTGGAACACGTTGCTAAGGGAAAAACAAGTGAAGCTCTAagcaaattattgaaattaaagccGACTGAAGCGCTCCTGGTGGAGAAAAACGGAAGTGAAAGTGTCGTTAGTGTGGATTTAGTTCAAAGAGGAGacgttttgaaaatattgcccGGAGCAAAGGTTCCGGTTGATGGCAGGGTCACTTCCGGAACTTCAACCTGCGATGAATCTTTAATAACTGGAGAATCAATGCCAGTAGCTAAACATCCTTCCAGCCTTGTGATTGGAGGCTCAATTAATCAAAATGGCGTACTTTTAATCACCGCCACTCACACAGGTGAAGCTACAACTTTGGCGCAAATTGTTCGATTAGTAGAAGAAGCACAAACCTCCAAAGCGCCTATTCAGCAACTGGCGGACCGAATTGCAGGATATTTTGTGCCTATTGTAGTGGCACTAAGTCTTACCACACTTATTGTATGGATAATTGTCGGATATGTCGACATAAATCTTCTTCCAATATCTGATCTCGCCGAGCAACAATCCGAAGGCTTCAATTCTCACGAAATAATCTTCCAATTCGTTTTTCGTTGTTCTTTATCAGTCCTAGCCATAGCTTGCCCCTGCGCACTTGGTTTAGCGACCCCAACGGCCGTTATGGTTGGTACCGGAGTTGGAGCCATAAATGGTATATTAATTAAAGGGGCGGAGCCCCTGGAAAATGCGCACAAAGTGCGGGCTGTGATGTTTGACAAGACTGGAACCATAACTCAAGGTCAGCCTTCAGTTTCCCGCATTTCTTTTATCCGTGGGCGTGGCCTAATAAACTTAGAGCTCCTATTGGCTCTTGTCGGCGTAGCCGAAACGTCATCCGAACATCCGATAGCCGCCGCAATCGTTAAATTCGTTAAAGAAGTCTTCCGGAATGATATTTTAACTAAATGTCAAGACTTTCAAGCTGTTCCTGGTTGTGGATTGAAATGTAAAGTGGATAATGTTGATGCGTTGGTAACACTGGCTCAAAAAAGTGAGGTTATGGTTAATTTCAATAATCAGACTCAAAATGAAGCGGCAGGgactttttttttgaataatgttCCGGTGGAAATTATCAGCGAAGAAAATCAGCAACAAAAGTTGGAAGAATTATTAGGAATTAATGATTTAAACACAAAATCATCCACTTCCGGTTATTCGATTCTAATCGGAAATCGGGAATGGATGCACCGGAATGGTTTGTTTTTACGGGCCGATTTAGAACACCGAATGATTAGTGAAGAAGAATTAGGACGGACGGCAGTTCTGTGCGCTATTAATGGCTGCGTGGCGGCTGTTATTTCCGTTGCGGATACAGTAAAACCGGAAGCACATTTGGCTGTATACACACTTAAAAGAATGGGGCTAGAAGTTATTCTTTTGACAGGAGATAACAGAAAAACAGCTGCCAGTATCGCCAGACAGgttGGTATTTCTCGTGTTTTTGCGGAAGTACTCCCGTCTCATAAAGTGGCGTGTGTTCAGCGACTGCAACAAACTGGAATTCGAGTTTGTATGGTCGGAGATGGAGTGAATGATTCTCCAGCTTTAGCGCAAGCTGATGTTGGTATGGCTATTGCCACCGGAACTGACGTGGCTGTTGAGGCTGCCAACGTTGTTCTTATGAGAaaTGATTTGCTGGACGTTGTGGCCTGCCTGGATCTCAGTAAAAGGACAGTCCGCCGAATCCgtatgaattttctttttgccAGCATGTACAACTTATTAGGTATTCCTTTGGCTGCGGGGGTGTTTAGCCCCTTGGGGCTGATGCTCCAGCCGTGGATGGCCTCAGCTGCGATGGCTCTGAGCAGCGTTTCTGTTGTGGGGAGCTCCCTCATGCTTAAATTATATAAAAAACCCACTAGGGAGACCCTCCAAACGCCAGAATATGTATCAGCAATTGAAGCAAGGAGACAAGCAATGGAAGAATTGGATACAATTAGTATACACCGAGGATTGGACGACATTGACCCGCCAATGATCAGAGCGAACTCCACCAGCTTATCTAGGTTTTTCACccgaaataaatcagaaaaagaAAACCATCTCTTGGGAAGTTACGACGACAATGACGAAgaattatcaatcaaatattcaaaaggcAAAATTGTGAAAAGTTTTGTGTGTAAAGAAGAGATATCGGACGAAACTCCGCAAACAGAATTAGAATTTGTGAATATAGCTGAAGATGAATTAATTATTAAGGAAGAACCATTAGACGAATTGGAAACTTTTAAGGAAGAAAATGTGCAAGTGTCAACTGAAAATGAAAATAGCGctataaaaatgtatgaatGTGAGATATGCAACAGATCATTTCGACAATTTCAGCATTTGAAAGATCACAAATTAATACACACCGGCGAAAGACCCTACACTTGTAAAGTTTGCAACAAAACATTCCGACAGTCGAGTAATCTAAAACGGCACCATTTAACGCACACTGATGAAAAACCATATAAGTGTGACGTTTGCAATGAATCATTCAGGGATGTAGGTAATTTAAAACGGCACCATTTGAGACATACTGGCGAgaaaccattcacttgtgacATTTGCAACAATTCATTTCGACAATTGAGAACTTTGAAGCAAcataaacttctacacactggcgaaaaaccacacacttgtgaagtttgtaatgaaTCGTTTAGGGATTTGAGCAATTTGAAACGGCACCATTTGAGGCACACTGGAGAAAAACCTTTTACTTGTGATGTTTGCAACGAATCGTTTAGACATTCGCGTACTCGCAAGCAACATAAAGCTCTACACACTCgtgaaaaaacaaacaaaactgGAGCGAAATGA
Protein Sequence: MDSNVLVFKLKDGVTKTAQEWVDTKNVLQKIDGTVLTDLKDGLEIRTTEANMNLVTETADSLDLHQISKPSPVGTMSPLSPTGDYSSVTTPLLSNQNNCATVRIQIEGMTCQSCVRNIEKTIAEKSGVSGIKVNLEQKLGTVDYDSRVVTPEKIVDYIEEMGFEAALPLLNGEEDVSSCVVGIEGMTCNSCVRNIEGMISTKTGIKTIKVSLENKKADVLFFSDVISAEKIAELIDDMGFDTNLLSVNGRAIQNGSPLSSEIINKEKGKGKALDKSVPNNLGGGDAGNFSRCVVHIKGMTCGSCVAAIEKHCLKLYGVHGVLVGLLAARAEIKYDSEVIQPRDIALSITELGFPAEIIDEPGTGETEVELHVSGMTCSSCVNKIETTLLKIPGVLTAAVALSTQKARIKYDAELTGVRDICETVRKLGFGAELSNNRDKDNRSYLEQKEEIQRWRTAFLVSLIFGGPCMLAMVYFMMQMSVGGLSHHDMCCVVPGLSLENLLMFALSTPVLFFGGRHFYVQAWRALRHGTTNMDLLITMTTTVSYIYSLGVLSAAMIMQQPTSPQTFFDTPPMLLVFISLGRWLEHVAKGKTSEALSKLLKLKPTEALLVEKNGSESVVSVDLVQRGDVLKILPGAKVPVDGRVTSGTSTCDESLITGESMPVAKHPSSLVIGGSINQNGVLLITATHTGEATTLAQIVRLVEEAQTSKAPIQQLADRIAGYFVPIVVALSLTTLIVWIIVGYVDINLLPISDLAEQQSEGFNSHEIIFQFVFRCSLSVLAIACPCALGLATPTAVMVGTGVGAINGILIKGAEPLENAHKVRAVMFDKTGTITQGQPSVSRISFIRGRGLINLELLLALVGVAETSSEHPIAAAIVKFVKEVFRNDILTKCQDFQAVPGCGLKCKVDNVDALVTLAQKSEVMVNFNNQTQNEAAGTFFLNNVPVEIISEENQQQKLEELLGINDLNTKSSTSGYSILIGNREWMHRNGLFLRADLEHRMISEEELGRTAVLCAINGCVAAVISVADTVKPEAHLAVYTLKRMGLEVILLTGDNRKTAASIARQVGISRVFAEVLPSHKVACVQRLQQTGIRVCMVGDGVNDSPALAQADVGMAIATGTDVAVEAANVVLMRNDLLDVVACLDLSKRTVRRIRMNFLFASMYNLLGIPLAAGVFSPLGLMLQPWMASAAMALSSVSVVGSSLMLKLYKKPTRETLQTPEYVSAIEARRQAMEELDTISIHRGLDDIDPPMIRANSTSLSRFFTRNKSEKENHLLGSYDDNDEELSIKYSKGKIVKSFVCKEEISDETPQTELEFVNIAEDELIIKEEPLDELETFKEENVQVSTENENSAIKMYECEICNRSFRQFQHLKDHKLIHTGERPYTCKVCNKTFRQSSNLKRHHLTHTDEKPYKCDVCNESFRDVGNLKRHHLRHTGEKPFTCDICNNSFRQLRTLKQHKLLHTGEKPHTCEVCNESFRDLSNLKRHHLRHTGEKPFTCDVCNESFRHSRTRKQHKALHTREKTNKTGAK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00470339;
90% Identity: iTF_00470339;
80% Identity: iTF_00470339;