Basic Information

Insect: Anopheles minimus
Gene Symbol: -
Assembly: GCA_000349025.1
Location: KB663610.1:2432759-2438686[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.49 4.2e+02 0.7 0.1 19 46 222 256 220 256 0.76

2 5 7.7e-13 6.6e-10 38.5 0.0 4 45 265 307 262 308 0.95

3 5 2.4e-11 2e-08 33.7 0.1 1 44 316 363 316 365 0.94

4 5 5.7e-07 0.00049 19.7 0.0 4 46 374 417 372 417 0.90

5 5 1.3e-07 0.00011 21.8 0.1 4 44 426 473 423 475 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.49	4.2e+02	0.7	0.1	19	46	222	256	220	256	0.76
2	5	7.7e-13	6.6e-10	38.5	0.0	4	45	265	307	262	308	0.95
3	5	2.4e-11	2e-08	33.7	0.1	1	44	316	363	316	365	0.94
4	5	5.7e-07	0.00049	19.7	0.0	4	46	374	417	372	417	0.90
5	5	1.3e-07	0.00011	21.8	0.1	4	44	426	473	423	475	0.86

Sequence Information

Coding Sequence: ATGTCCAGTGTGAGTTCTGACTGCGAGTCTTCCTACTATACGGAATCGGAAGCAGAAAGTGATTACGTTACGCATGAGGAAGGACAACCGACGGCGCAATACAATCACACCCTCGAGGTGGAAGATATTATACGCGAGCATGTGGATGTTACGACAAAAAACGCAGTCGGTCTCAACCATCAGTATAAAGCGAAACTACTTGTTCTACGGCAGCAGCTAGAAGTGTTGCTTTCACGATGTCAACATCGTTTACTGGAGGTCGAAAAAAGCCTCGATGATATTCGTTTAAATTTGACACCAAAAACGCGTCCGTCACGGCCACGCCATCCCGGGTACATCTGCGGGCAACCGTTTTTCAAGGATTCCGAACTCTACCCCGGCCCCCACAATGAGGACTATCTGTACCGGAAGAACGTCAAGAAGGAGTTTTTCCCCCTGGATATGTTCGAGATGATCGACACGCTCTGGACACGCACGGACAAGCAGATGCTACGGGACAGTGTAGCTAGACAGGCATACGAATTCGTACGAAGGGAAAACCAGCTGCtggaaaaaatgtgtctcAATTCGGGCAATATAAGGCGGATCATAAAGGAAAGGATCGAAATGAAAGCGCTCCCCTTAGAAGAAATCTGGCCGAAAGCGCAAGCATTCGATGGGAAATATGGGCGCCAAAAATTCGTCGTCGACTGGTTAAAAATATCGAACGCCATCATGAACGGACGGCATTCTGCGGCCGCGTGCGAAGGCATGTGGAACAACTATCTGCTGCCCAGTTTGAAAAGATCCATTTGGACGCCCGATGAAGAATCGCGACTGGTCGCGGCTGTTGAAGCGAACGGACGTTCCAACTGGGCGTTGATAGCGTTGAGCGTGGAAAACCGTTCCGAGTACCAGTGTTTGGTGCATTATCAGACCAACTTTTCCGAACTATCGCAGATCAAAAAGATGCCCTGGACGCAGGAGGAGGACGATCAACTGTTACGCTTGGCGAATGAAAACCGCATCGGGAACAGTATCATATGGAACAAAGTCGTTGAACGCATGCCCTACCGGAACAAGGTGCAGGTTTATCATCGCTACAAGTACACGTTGTTGCGCCCGCTGCGTGGAGCCAAATTTGCGGCCGAAGAAGACTGTGTGATAACGGCGTACGTGCAGCAGTTTGGAGATGATTTCAAATTCTTCCCCGAAGATCTGCTACCGGGAAGGACCACGAAACAGGTCCGTGCCAGATACATGAACACGCTGCGCTTCGTTAACACGCACGTCGGTTGGAGCCTGGACGAGGACAAGCGTCTGATGAGCTACATCGCGGAGCATCTTACCGAGGAAGGCCCGGGCAAGATTTCCTGGGCCGAGTGTTCCAAACATCTCGGAAACCATTCGCGGTTAAGTTGCCGCACGCGGTACTACACGATAGAAAGGTTTCTCGAGCGAAATCCCAACGCAACACTGGAGAGTGTACcgagaagggaaaagaaaaagctttcctCTACCGTGACGGGTAAGAATTGGATAAAAACCATCGTGGAAATCAAGAGCGCACCGAAACTGGCGGGAAAATCCGGAACTTCCATCAATCCGCTCGAGGTTGGTAAATCTTCGCTGGCCGAATGGAGTTTGTACGAGCAGATGAAATTTTGCTTCCGTTACAAGTTCGGTAACAAGCTGGCCGTTACTACACTCCACAATCACGTCTACACGGGGACGAAAATGTTGCTCTATCTTTTGGAAGGTTTTAAAGGACCCTCCTCCGACTGCATGTTCCATCCGAAGAGTGAAGCATTACAGATGCAGCAGGCCATACTGCACAGTCCTTTGGATTGGGCCCATCTCGTGTCTATTATGCATCCCAAGGTGTCACTCACGGGCGAGTCAATGCTGTTTTGTCGCTTTCCTCCCAACTTCAACACGGTGCTGGGTTTGCGGGGCGTTTGCCTGAATGCCTGCAGCgaacaaacgaagcaaactTTCCCCGAACAAAAGCCTAAAAAACTCGGCACGTTTAATGAACCAATGTACAATCAAGCGATAGCTGTGTTCGTAGAGCGTTTCCGTAAGATGTTCCATTGGACCATGCTGCTAATGATGCTGAACATTGACGATGTGTCGCTCGAGAGTGAAGAACCGGCGCGCCACGATAACAGGAATGACCATCCCACGATAATCGTACCGGTGAAAATGGATACACTGATGAACGCGGTGAGCTGTGCTTCACATCCGGAACAAAGCGACACAAGCACCATGGAGGGAAACAATCTAAATCTAGTcacaaacataacaataatCGACCCGAAGGATCTTCCAGCTGTTCCCGAATATCAACTCAGGGAAAATGTTCCATACGGCGGAAGCGAATTTAAATGTCAGCAGTACTTAAACGATAAACCGGAACCTAGCAGTAAAACTTCAAAGGCAACCCGTAGATCGCGAACGACAAACAAGGTTAGCAAATCGTTAGGTAATGTTCAGCATGGAGTTGGCGATCATGCGGAACAATATAGCTCTGGGATGGTTTCCTCGACGATTGCTGTTCCTGGAggtatggaaaatggaatgctACAAAATTTACCAACGTTCACTTTCATCAAAATACCCCAAGAAATAACGTTGCTGCATCAGCACCAGAACCTTAGTACAATACCGGGTCACATGACCACCTATGCATCTTCGTCTGTTACGGTTAAGCATGACGATCACACAAACATCATTTACGATGGACATAAAATGAGCCCAATTGTTGAATCAAGCCGCATGGAGGGTAGAGTTATTGTTCCGTTGCAAATGTCCCAGCATCAAATGGTAAGCAACGAAAGTGTAGAAACCGAAGTACGTGCCAAGGTTGATGAAATCAGTACCAGCCCTGCATCCGCTAGCGAAGACATAGTTACGATCGACGTTGATCGTCATGCTTCGAACAATTCTAACACATGTAGTGAAAATCAGGCGCCGGAATGCTTTCCCCAAACGAAACAGAACATGCTGGTCCCATACAATCGGATTGCATACGAAGGAAATTGCCTGGCAAACAACGTTAttgATGATGTCAATGGTGCAAGTGGACCTATGGATATTTCACCGCACGCCGGCAACGATTGTCAACCATCTGGGCATATCACGTTAATGAAACCTTTGGAAATGCTTCATCAGAATCAAGACAacgaaagggggaaaatggaaatcgaATCCGTAGAACGAAATGAGGATTCCGCGCATCAATTGCAAGAGGGCGTGAATGTTGTAACGGGACCAATCCCATGCACAAAGTTTGATTCGAACGAAGAGCTCATGCCAGACTTGCAGGAACCGCTTACCGCCGTAGATATCATTCGAATGTTACGCGCACGACATAATACTCAGTATTTTGAAGACAGTGAGGAGAATGAAGacgaatttgaaaatgtaccaaatgactaa
Protein Sequence: MSSVSSDCESSYYTESEAESDYVTHEEGQPTAQYNHTLEVEDIIREHVDVTTKNAVGLNHQYKAKLLVLRQQLEVLLSRCQHRLLEVEKSLDDIRLNLTPKTRPSRPRHPGYICGQPFFKDSELYPGPHNEDYLYRKNVKKEFFPLDMFEMIDTLWTRTDKQMLRDSVARQAYEFVRRENQLLEKMCLNSGNIRRIIKERIEMKALPLEEIWPKAQAFDGKYGRQKFVVDWLKISNAIMNGRHSAAACEGMWNNYLLPSLKRSIWTPDEESRLVAAVEANGRSNWALIALSVENRSEYQCLVHYQTNFSELSQIKKMPWTQEEDDQLLRLANENRIGNSIIWNKVVERMPYRNKVQVYHRYKYTLLRPLRGAKFAAEEDCVITAYVQQFGDDFKFFPEDLLPGRTTKQVRARYMNTLRFVNTHVGWSLDEDKRLMSYIAEHLTEEGPGKISWAECSKHLGNHSRLSCRTRYYTIERFLERNPNATLESVPRREKKKLSSTVTGKNWIKTIVEIKSAPKLAGKSGTSINPLEVGKSSLAEWSLYEQMKFCFRYKFGNKLAVTTLHNHVYTGTKMLLYLLEGFKGPSSDCMFHPKSEALQMQQAILHSPLDWAHLVSIMHPKVSLTGESMLFCRFPPNFNTVLGLRGVCLNACSEQTKQTFPEQKPKKLGTFNEPMYNQAIAVFVERFRKMFHWTMLLMMLNIDDVSLESEEPARHDNRNDHPTIIVPVKMDTLMNAVSCASHPEQSDTSTMEGNNLNLVTNITIIDPKDLPAVPEYQLRENVPYGGSEFKCQQYLNDKPEPSSKTSKATRRSRTTNKVSKSLGNVQHGVGDHAEQYSSGMVSSTIAVPGGMENGMLQNLPTFTFIKIPQEITLLHQHQNLSTIPGHMTTYASSSVTVKHDDHTNIIYDGHKMSPIVESSRMEGRVIVPLQMSQHQMVSNESVETEVRAKVDEISTSPASASEDIVTIDVDRHASNNSNTCSENQAPECFPQTKQNMLVPYNRIAYEGNCLANNVIDDVNGASGPMDISPHAGNDCQPSGHITLMKPLEMLHQNQDNERGKMEIESVERNEDSAHQLQEGVNVVTGPIPCTKFDSNEELMPDLQEPLTAVDIIRMLRARHNTQYFEDSEENEDEFENVPND

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -