Basic Information

Insect: Polia nebulosa
Gene Symbol: -
Assembly: GCA_951329385.1
Location: OX589613.1:17461175-17467753[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.03 82 5.3 0.0 2 17 74 89 73 130 0.81

2 7 0.1 2.8e+02 3.6 0.0 21 44 350 374 342 376 0.86

3 7 0.00036 0.98 11.4 0.3 22 45 449 475 425 476 0.71

4 7 0.0052 14 7.7 0.2 22 46 589 623 577 623 0.74

5 7 0.00028 0.75 11.8 0.2 3 44 674 724 672 726 0.82

6 7 5.2e-05 0.14 14.1 0.2 13 42 858 894 843 898 0.81

7 7 0.03 80 5.3 0.2 3 16 1053 1066 1051 1113 0.60

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.03	82	5.3	0.0	2	17	74	89	73	130	0.81
2	7	0.1	2.8e+02	3.6	0.0	21	44	350	374	342	376	0.86
3	7	0.00036	0.98	11.4	0.3	22	45	449	475	425	476	0.71
4	7	0.0052	14	7.7	0.2	22	46	589	623	577	623	0.74
5	7	0.00028	0.75	11.8	0.2	3	44	674	724	672	726	0.82
6	7	5.2e-05	0.14	14.1	0.2	13	42	858	894	843	898	0.81
7	7	0.03	80	5.3	0.2	3	16	1053	1066	1051	1113	0.60

Sequence Information

Coding Sequence: ATGGATGGCTCAATAGTGGTGAAAACTGAGATGGGGACTAATGGAGAAATACTGCTTTTCTATGTTGATGaAAACGGTGGCAATGAAGAAGGAGTACTAACAACGGTTGAAAGCCTAGAAAACCAATCAATACAACTGCAACAAGATAACTCCTTCATCATTCAAGATGTCGGAGATGACTCAAATGTCTCAATCAGCATGCATCAATCCGCAGCGACTAACAACTGGACCGAAGATGAAACTAAAAAACTCCTTACCTTCTACAATGATAACAAAGGGACTTTCATATCAGGAACAACAAAAAAGGAACATCTCTGGACTGTAGCATGCAAGACCATGCTCATCGGAAAAAATCCCTACTCGTGCGAAGCTAAACTCAACAGCCTAAAAGCAAAGTATAATGAAATTATTGGCCAAATTCAGAAAGGAGTCTATGTAAAGTGGCTGTACTTTGAGCTTTGCCATCAAATATTCCACGATGAGACCCCCATGATTACAGTTGAAACTTTAAATACAACAGAACCACAAATAATCAAAGTTCCTGCATTAAAACAGAATTTTGATAATGTAATGGTAGTTAAAAAGGTGAATAGTCGTAATGTGGCTGATGAGAAAGTTGAAATGATGCTGAAATTGTATTTGAAGTACAAGAAGAACTTCCAAGCAGAGTATTGGAGACGTGGCATATGGGAAACCATTGCTTTAGAAATTGGAGAAGATGATGGAGAATACTGGCAGAAACGGTTCTTGAACTACAAGCAACATTACCTTAGATTGATTGATAAACGACgagaaagcggctcagagggcATTGCTTGGCCATATTTAGAACTATTTGATAAAATCTTCGAAGGTGATAAGGACTTCCATAGAAAATATGTTACGGAAGAGTACAGAGAACAATCAACTTATATCGAAAACCAAGCAATAGCTGAAGTCGAAGAGCCCCCACCTCCACAAGTCATAGATTGGGACACCACGGAAATGACCGTATTAGTAAAATACTGTTTTGACTGCTTTGAAGAATTTGAAGACGAAACTATTCCCAACAATTTCCTTTGGACTGAAATTGGTCGTTTATTAGACAAGACTGCTGAGGCATGCAACTTAAAGTACGAAGAACTTAAGAACAAACATTTAGACAAATACATAGAAGGTGGTTATGATCTACGAACAAGAAAACCCATAGCAATAATAtttgataatataatttcaaaaaaaatcgaGAATCAGATAATGAAAAGTGGTAAAATACCTGAACAACTAGAGATATGGAAGACGGAAGAATTGGATGAGCTGGTGCAATTCTTCTACGACAACATTGAGATGTATAAAGACCTTCTTTGCCATTTTGTATGCTGGGCAGCAGTTTCCAAGAAGTTGAAGAGGAGTCTGCAAAGTTGTCGAAGCCAGTGGGAGGATCTTTTGAGTCTTTATAGGACAATGTTGAATGATAAAAAGGAAAATCCTGATATGCAGATCGATTGGCGGTATATTGAAGTGTTTGATAGGATATTTGACTATGGTATGGATACTAATCTGCTTTCTGGATATGAAACCTTGAAAGGATTTAGACAGAATCAGAAAAATGATACTGGGAAGATTGGTGTAAAAAAAGTGAACATCAAACTGGACGACACTATGGATGAATTTACCGACGACGACGAGTCTTTTGACGAACGAGGCTTCACAAAACGCACAAAACGTCGCTCCGGAGACTCCAAAGCGTTCAAAATCCTCGAATACTACCAGAAGAACAAAGACAAATTCTCTACCACTAACAGAAACAAACATTCCCTATGGGATATCCTAGCCAAACAAATTGGTATATCAGCTACTCAATGTGCACATAGATTCAGAAACTTAAAACAAGTCTATACTGCTTATGTGCAAAGAGAGATCAATAAACCTGAAATGCCAATACTGTGGCCTTACTACGCActatgcaaaaaagtttttggttATAGAGCAATCAAATCTAAACTCAAAAATGGAAAACAGGATTCGGATGACAGCGAAGAATGGTCAGCAAAAGAAATCAAACAGTTGATAAACTATTTCTCACAAAACTTTGATGATATCAATAGTAATGTTGAAGACGCAAAAAAATGGTCAGATTTAGCTGGTGAAATAGGAAAAGGCGAAAATTCTTGCAAAGACAAGTTATTAGAACTACGAAAGTCTTATCGGAAATTGAAAACTATGAGAGCTAGGAACCCGGAAGTAAAGATTTCTTGGAAATATTTCAATATGTTTGAAGATATTTATAGTGCAAAGGAGAATGGCGTGGAGACGATGGAGGTGGATGGGAGTGAGACGAATTATGTGGATATACCTGCCGGTTCTGATGAGAGGATGGACCAGGAAGAAGACGACTACCAATGCATCATAGTAATCCCTGAAGGTCAAGACATATCACAGATAGAGAATGCTCGTATTATAATACAAGAACACCCAGCACCCCAAGAAATGAAACAAGATACTGAAACTGTCCTCACAGAACCTCCCAAGGAGGTCAAACCTCTTGTTAAATGGACCAAAAAGACCAAAAAGACGTTACTTATATTCTATATAAACTATATCAGAACACATAAAGGTAAAGAGATTAACGCCAAGGAAATGTGGGCAGAAATAGCTGGGAAACTACCCAACAAAACACCACTTGCTTGTAGAAAAATGTTTGCCAAACTAAAGACCAATCATAAGCAAATCGACCAATTAGATCCAAATATGAAGAAGACTCCTTATTTCGCGTTAATGGAGAAAGTCATGCGTTTGAAACCTAAATTCACTAAGACTGAACAAAATAAGGCATTAAAAGATGGAAAGGTGTACAAAGATGTAGCCTTACCTGATGAAAAAGTAATACAAGCTTTACAGTACTATTTAGAAAATATAGAAGATTTCGTCAGTCCAAGATTTGAAAAGAAATACCTCTGGACTGAACTAGCAAATTACGTTTGTGAACCTATTACGAAAGTATTCaacaaaatcaattatttaaaacaaGCGTATAACATGGATACTGACGAAGTTGCGGGCGAAAAGACGCCATTTGCTGAGTATTTGAAAGAAATTTTTGCTAAAGAGATAGCTATCAAACTCTTCTTAGAAAACCAACCAAAACCTGTGATTGAAGAACCAGGCGTTGAGGAAACTTGGTCTGATGAAGAAACAGAACAGTTATTAGAGTGGTATTTAAGTAATTTAGACAAATTCAAGAATCCTAAATTCGTCAGGAGTTATCTTTGGATGGAAATTTCCTCTATGCTAAATAAAAGTGCTATTACTTGTTCCAAGAAAATGTCTGAAATACGGACGCAATATAGGAATATGGTGAGGGAAAGACCAGAAGAATTGAATGAGTGGAGGTTCCTCGATTTGTGCCAGAAAATCTATGGGACAGGAAAGAAAGGTACCCCGATGAATAGTAATTAA
Protein Sequence: MDGSIVVKTEMGTNGEILLFYVDENGGNEEGVLTTVESLENQSIQLQQDNSFIIQDVGDDSNVSISMHQSAATNNWTEDETKKLLTFYNDNKGTFISGTTKKEHLWTVACKTMLIGKNPYSCEAKLNSLKAKYNEIIGQIQKGVYVKWLYFELCHQIFHDETPMITVETLNTTEPQIIKVPALKQNFDNVMVVKKVNSRNVADEKVEMMLKLYLKYKKNFQAEYWRRGIWETIALEIGEDDGEYWQKRFLNYKQHYLRLIDKRRESGSEGIAWPYLELFDKIFEGDKDFHRKYVTEEYREQSTYIENQAIAEVEEPPPPQVIDWDTTEMTVLVKYCFDCFEEFEDETIPNNFLWTEIGRLLDKTAEACNLKYEELKNKHLDKYIEGGYDLRTRKPIAIIFDNIISKKIENQIMKSGKIPEQLEIWKTEELDELVQFFYDNIEMYKDLLCHFVCWAAVSKKLKRSLQSCRSQWEDLLSLYRTMLNDKKENPDMQIDWRYIEVFDRIFDYGMDTNLLSGYETLKGFRQNQKNDTGKIGVKKVNIKLDDTMDEFTDDDESFDERGFTKRTKRRSGDSKAFKILEYYQKNKDKFSTTNRNKHSLWDILAKQIGISATQCAHRFRNLKQVYTAYVQREINKPEMPILWPYYALCKKVFGYRAIKSKLKNGKQDSDDSEEWSAKEIKQLINYFSQNFDDINSNVEDAKKWSDLAGEIGKGENSCKDKLLELRKSYRKLKTMRARNPEVKISWKYFNMFEDIYSAKENGVETMEVDGSETNYVDIPAGSDERMDQEEDDYQCIIVIPEGQDISQIENARIIIQEHPAPQEMKQDTETVLTEPPKEVKPLVKWTKKTKKTLLIFYINYIRTHKGKEINAKEMWAEIAGKLPNKTPLACRKMFAKLKTNHKQIDQLDPNMKKTPYFALMEKVMRLKPKFTKTEQNKALKDGKVYKDVALPDEKVIQALQYYLENIEDFVSPRFEKKYLWTELANYVCEPITKVFNKINYLKQAYNMDTDEVAGEKTPFAEYLKEIFAKEIAIKLFLENQPKPVIEEPGVEETWSDEETEQLLEWYLSNLDKFKNPKFVRSYLWMEISSMLNKSAITCSKKMSEIRTQYRNMVRERPEELNEWRFLDLCQKIYGTGKKGTPMNSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00771874;
90% Identity: -
80% Identity: -