Basic Information

Insect: Anopheles arabiensis
Gene Symbol: KAT7_1
Assembly: GCA_016920715.1
Location: NC:37521422-37583765[+]

Transcription Factor Domain

TF Family: zf-C2HC
Domain: zf-C2HC domain
PFAM: PF01530
TF Group: Zinc-Coordinating Group
Description: This is a DNA binding zinc finger domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 4.6e-15 1.9e-11 43.3 0.2 1 29 546 574 546 574 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	4.6e-15	1.9e-11	43.3	0.2	1	29	546	574	546	574	0.97

Sequence Information

Coding Sequence: atgccACAACGGAAAAAGTCCACCAGCACCGAATCCAGTAGCGGCAGTTCGTCTGACTCTAGCTCCAGTGGGTCCGATTCGGGAAGCTCGGGCGGATCTGATTCGGGAAGCTCGAGCAGTGAAAGTGATTCCTCCAGCTCGAGGGAACCATCGCCGCGTTCCTCTACCAGTAATAATGCCGCCGTTTCCGGGGGAACCAGTGGAAATGCTGCAGTACCAAAAGCGAACGACAAAATCGTAAGACGACGAAGCTCTGAGATTGGGAATGCGGCAAACAAAGCGAACAGCAAACCGGACGCCTCGAAGGACAAATCATCCCTTGCactgaaacaacaaaaactctcAAAAAGCTCCATCTCGTCCAGTGACGATGATGACTCGGAGCCGGAAACGGGCAAAGGGACAGCTGCTGCATCGGCATCTGCCACTACTGCGGCTAGCAAAAAGGCTCCAACAGCCGACACCACCAAGAAAAAGCCCATCGCATCGGTGCAGGGCAAGGAGCGGGTtcccgcaccaccaccgatcAGTGGAGGAAAGGTGCCCCCGTCCGTGatcaagcagcagcaccaacagcatcatcatcaaaacTCTGCCCCGGCCACGAAAGGGGCGGTGAAGGCTAGCACGGTGGTAAAAAGTTTGCACAAGACCAACAATAATGGGGCCGGTACGGCAACGGGTGCTGTAAAGAAACCTACCCCAGGCACCGCTCAGTCATCCTCGGCACCTGCTACCAAGGGTAAAAAGAAGAGCATCTTCTCACCGGTCAATTCGTCCGAATCGGAGGTGGAAACAACGCCGGAAAAGTCCGACATGCAGGACAGACGTACGTCCAGCTCGAGCTCCACGAGCGGGAACGCCGTGTCGGGTGGTGGGACGGGCCCAGCGTCGTCCGATTTGTCTGACAAAAATCAACCTGCAGCAACGGGGAGTACCGCAACCAACAGCACCACCTCATCAGCAGCCACCGCCGCACTACAACGTGGTCGAGGCCGGCCACGGAAAGCATCACAGGTGGGAACGTTGAACAACGTTGGATCGAAACCGATCGGACAGGTGAAACCACAGACCAGTGGCACAAGCAGTGCTGCTAGCAAAGTGGCCAGTCCAACCGTTGCTCCACCGTTGGCCAAATCAATGAAATCCCCCATTCGAGCGCTGTCGTCCGCCACGTCCAGCTCGAGCGAATCGTCCTCCAGCGGATCGTCCGACTCGGAAACAGAATCATCGGACGATTCCTCACCATCGATCAGTGCAGCGGCCGCTCAAAGCTACAAAAAGTCCAACAGCACCATGAAACGTGCGCTCGAACGAACGCCCCAAAAGAACGATGCAAAGGATGGcggtgcggcggcggcggccggttCGGACTCGGACCGGCAGACGCGAAAGCTGACCCGTTCCGCAAGCACGCGCAAATCCAAACACCTGCTCGGCAAGAACGCCTCCGAGACGGACTCCGACGCGGACAGTGTGAAGCGGTCCGCGTCGAAAAGTCCGGCCAAGAAAGCGCCCACCGTACCGTCGAAGGGTAAGGCGAAAAACAACATTGCCAACGCGCTGGCCAGCAAACGCTCCGGCGACAAACCGCTTGCCAAGGAGCTGCCTATCGAGGAGGCGCCGGTCGAGCGGCGCTGTCCGCTGGAAAGGTGTGACTCGCTCGGCCACATGGGCGGACAGTTTGAGAAGCACTTTACGCTGGAGGCTTGCCCGCTCTACCACAACATGACGGTCGATCAAACGAAGCAGCTGCTGGTGGAGCGCAAGCAGCGCGAAGACGAACGGCGCCGGTCGATTCCGGTGTACGAAAATTCGAAAAAGATCCAAACGCCCGAACAGAAGCTGTACGCGCAGAAGATACGCGATCTGCGGGCGCGCTTTAAACCCTCCTCGCCGACGCCGAGTGCCGAGCGGCCGAAACCGTTGCTCGATCGGGACTGTAACGAAATTAAGCCCGAACCTAACCTCGAGGGCATCGTGCCGGACTACGATCTGCAGCTGTTCCGCGAGGCGCAGGCACTGGCGAGCGAAAGTATCGAGAAGGAGCTGGGCGATATGGTAACCGGGAAGGGCACGAAGTACATTTCGATGGGCCGGCACTGTATGCAGGTGTGGTATCAGTCGCCCTATCCGGACGATGCGACCCGGCTGCCGAAGCTGTATCTGTGCGAGTTCTGTCTGCGGTATCAAAAGTCCGAGGTGGGAATGAAGCGCCATGCGGCCAAATGTGTCTGGCGGCATCCGCCGGGCGATGAGATCTATCGCAAGGGAAAGCTTGGCGTGTGGCAAGTGGATGGCAAGCGACACAAACAGTACTGTCAGCATCTGTGCTTGCTGGCCAAATTCTTCCTCGACCATAAAACGTTGTACTACGACGTGGAACCGTTCCTGTTTTACGTGATGACTCTGGCGGATAGTGACGGCTGCCATACGGTGGGGTATTTCAGTAAGGAGAAAAACTCGTTCCTCAACTACAACGTGTCGTGTATCCTTACGCTACCGCCGTACCAGCGTAAGGGCTATGGACGGTTGCTGATCGACTTCAGTTATTTGCTAACACGAGTGGAAGGCAAAATAGGCTCCCCCGAAAAACCGCTTTCCGATTTGGGTTTGATATCGTATCGATCGTATTGGAAAGATGTGTTGCTTGCCTATTTATGCTCCCGGCCTGGTACTACACTTAGCATCAAAGATATCTCACAGGAAATGGCGATCAACTCTTATGATATTGTCAGTACGCTTCAGGCTCTCGGTATGATGAAATACTGGAAGGGAAAGCATATCATACTAAAAAAGCTGgACGTTCTGGATGAGTACGAGGAGCGTGTAAAGCGCCGCGGCAATATGCCTAAGATCGATCAATCCTGCCTAAAGTGGACACCGTTCGTTGCTCCTACCccatcaacaccatcatccTAG
Protein Sequence: MPQRKKSTSTESSSGSSSDSSSSGSDSGSSGGSDSGSSSSESDSSSSREPSPRSSTSNNAAVSGGTSGNAAVPKANDKIVRRRSSEIGNAANKANSKPDASKDKSSLALKQQKLSKSSISSSDDDDSEPETGKGTAAASASATTAASKKAPTADTTKKKPIASVQGKERVPAPPPISGGKVPPSVIKQQHQQHHHQNSAPATKGAVKASTVVKSLHKTNNNGAGTATGAVKKPTPGTAQSSSAPATKGKKKSIFSPVNSSESEVETTPEKSDMQDRRTSSSSSTSGNAVSGGGTGPASSDLSDKNQPAATGSTATNSTTSSAATAALQRGRGRPRKASQVGTLNNVGSKPIGQVKPQTSGTSSAASKVASPTVAPPLAKSMKSPIRALSSATSSSSESSSSGSSDSETESSDDSSPSISAAAAQSYKKSNSTMKRALERTPQKNDAKDGGAAAAAGSDSDRQTRKLTRSASTRKSKHLLGKNASETDSDADSVKRSASKSPAKKAPTVPSKGKAKNNIANALASKRSGDKPLAKELPIEEAPVERRCPLERCDSLGHMGGQFEKHFTLEACPLYHNMTVDQTKQLLVERKQREDERRRSIPVYENSKKIQTPEQKLYAQKIRDLRARFKPSSPTPSAERPKPLLDRDCNEIKPEPNLEGIVPDYDLQLFREAQALASESIEKELGDMVTGKGTKYISMGRHCMQVWYQSPYPDDATRLPKLYLCEFCLRYQKSEVGMKRHAAKCVWRHPPGDEIYRKGKLGVWQVDGKRHKQYCQHLCLLAKFFLDHKTLYYDVEPFLFYVMTLADSDGCHTVGYFSKEKNSFLNYNVSCILTLPPYQRKGYGRLLIDFSYLLTRVEGKIGSPEKPLSDLGLISYRSYWKDVLLAYLCSRPGTTLSIKDISQEMAINSYDIVSTLQALGMMKYWKGKHIILKKLDVLDEYEERVKRRGNMPKIDQSCLKWTPFVAPTPSTPSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00101349;
90% Identity: iTF_00101349;
80% Identity: -