Basic Information

Insect: Hyposoter dolosus
Gene Symbol: snpc-4_1
Assembly: GCA_963921915.1
Location: OY998131.1:19371858-19374551[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.87 9.1e+02 0.2 0.0 3 17 168 182 166 184 0.87

2 7 9.1 9.6e+03 -3.0 0.0 23 43 251 273 237 275 0.65

3 7 2.1e-12 2.2e-09 37.4 0.6 3 44 284 327 282 328 0.96

4 7 5.8e-10 6.1e-07 29.6 0.1 3 43 338 382 336 384 0.96

5 7 5.5e-14 5.7e-11 42.5 0.0 1 45 391 436 391 437 0.95

6 7 1.9e-11 2e-08 34.3 0.1 2 41 445 484 444 487 0.96

7 7 1.6 1.7e+03 -0.6 0.0 12 31 694 714 692 722 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.87	9.1e+02	0.2	0.0	3	17	168	182	166	184	0.87
2	7	9.1	9.6e+03	-3.0	0.0	23	43	251	273	237	275	0.65
3	7	2.1e-12	2.2e-09	37.4	0.6	3	44	284	327	282	328	0.96
4	7	5.8e-10	6.1e-07	29.6	0.1	3	43	338	382	336	384	0.96
5	7	5.5e-14	5.7e-11	42.5	0.0	1	45	391	436	391	437	0.95
6	7	1.9e-11	2e-08	34.3	0.1	2	41	445	484	444	487	0.96
7	7	1.6	1.7e+03	-0.6	0.0	12	31	694	714	692	722	0.82

Sequence Information

Coding Sequence: ATGAGTGATCCGGAGGAGGATCGCGAGTTCCTGGACGACATAAAAGCTTTAGAAGACGTATTAGCGAATGAACATGGAACATCGAGTGTTAAGCACTACGAAGAGGACCCATCGGAATGTAACCTTGTTAATAATCGTCGAGGCAACATTTCGTCCCGAGGATTCGGCCAAGTTGAGTGTGAAGACGAAAACGAAGGTAGGACGAGCGAGATTCAAGAAGGCCAAACAGCTTACGAGACGAATGAAAGATTGATCGAGTTGTTAAAAGAAACTAGACGCGAATTGATATCGTTGCTCGAGCGCTGCCGAGAAAACAAAGCGATCctcgatgagaaaattcgtctCAAAGCTCGTGTGACCCGAGGCTCAAAAGTCCTCATATGTACAGCAGGGATGCCATATTTCAAGGACGGAAAACAGTATCCAGCCCCGAGGAATAACGACGTGAAGAGAAAGCTAAAGAACGGCGAATTACAAGTCGTGCATCTCCGGACGACGTGTCCTTGGACGCCCAAGGACAGAAATATCCTCTGGCGAGCGATTCGCCACCAGGCAGCGTCCGAAGTCCTAGAGAGAGAATGGACAGCGGCGGACGACGTTTCTACGGATAATCCAGATCCCAACAGAATGGACCAAGAGCTGGACAACGATTCCTCGGCCATAACGAACCCCAGAGGAATGGGAAGACCGCTGAATCTTCCCAAGAACTTCAGAGACATGGTCGGCCCTCTGGGAAGTAGAGAATTCGATTGGCTCAAAATTGCAGTTTCCGACTTTGACGAACGTCACACAGCTGCCGAGTGCAAAGTAATGTGGCAAGTATTTCTTCATCCCGACATCAATCGTTACAGATGGACCAGAGACGAGGACGAACGCCTTAAAAATCTCATAAAAAAGCATCAAGCTGAAAACTGGGAAGTCATCGCCATGGAACTCGACAGCCGGAGAAGCGGGTACCAGTGTTTCCTTCGTTACAAGACCATAAACCGTGTTCCTTGCCATTCCGACGAGTGCTGGAGCCAAGCCGAGGACAACAGGCTCTGCCGATGCATAGAAAAGTTCAAAGTCGGCAATTATATCCCATGGGGCATTGTCGCGAGATACATGGAAGGGAGATCCAAAGCTCAGGTTTATCATCGTTACATGTACACGACAGCTCCGAGCTTGAAGAAAGGGAGATTTACGAGCGAAGAGGATGAGAGGCTCGTAGAGGCGGTCAAAAAGTAtggagaaaatttcaacaaaatagcACACTATTGTTTTTCCGATAGATCGGGTGTACAGCTGAACGATCATTATAGAACGCTCATGGTAAGAAAACGAGGAATAGATAATGCCTGGAGTATCAACGAGGACgcgaaattattgtttttgtacAACGAGTTTGGTCCTGATTGGtccaaaatttcacgaaaaataccTACGAAAACGAGGACTCAGGTCAGACATCGACACAACGCCATCGTTCGATATTGGGACAAAGGGATTTCCCTTTACGAGATACCAAGGAAATCCAAGAAACAATCGGTTACCGAGCACGCTGAGATCGATCTCGAGGACGATGAGTTCATTTCGAATGTCGAGAGGAACAGAATGCCCGAAAAAGATGACGAAACCAACTCGGAAATGGAGGCTATTGATCTTGAGTTGGCAAAGTATTTTCAGGTCATGCCTCCGGTGTCGAGACCCGGGAGGAAACGGAAGTATTATTCGAAGGACGAACTTCAGGATATGACAAGAAAATTGTGTATTCTTCTGAAAAGCCTTGGCGCGAATCTAGAGATTCCCGAGGATTTGGATGAAACGGAATTGCCGGAGAAAGAAAAGCAGCTTTTGAAGTCGCTCAAGGATTATCGAACGATGCAAATCGAACGGGCGAAAAATCGACCCAAGAGTTATCAATATATCGGACTCGACGACCCCAAAGAGTTTGGAGAACTTCATTTCTCCCCGGTGTGTTCTGGCAGCTgtaacttgaagaaaaaagctcgAGTTGACGAAAAGTTGGATTATGAGCCTCCCGCCGGGCTGGATCATTGTCAGGTCACCCTGGAAATGAAGTTGGACACACCGGAGAACGTCCTTGAGCTCGTGGGCAAGGAGCAAAAtgaggattttgaaaaaatctcaaaattcatgaattacGCAGAAATTGATGCGCGCAGATCGAAATTTGTAACTAAAATTTACGTTCTTGGGCCTCAACAAAGCTCCAGAATCTTGTCATCCGTACAGGTTGAACCGATCTCTCGCGATCCTGTGCTCGAAGTCCCTTCGACCACCAAAGTCCcgaaaaaacgaagcaaaaaagaaaaaccatggAATTCCAGCAAAAGCGAAGGAATAATTCAACGTCTGGATCAGCCGGTCACCTGCATAGAGCCGAATTTTTACACGTTACGAGCCTGGAAGCACATAATGTTGAAAGCTCAAGATAATCGTCGATGCTCTCGTTCCCCAGAAAGTGCGCCTTCTTCGACGAGCAACGAGGCCAATATggccatgaaaaaattgaaacagcGACTCGTACAACTCTTCAAATATCCCATTGGATTATCGCACATTATAAAACCGGAGTTTCCTGATGGGGGAATGGATTCTCAATGGATCGACATATCTCCCGAAGACACAATCGTTGACAATGACGAATGTTCAAACGTTCCTTCATCCCCgagcaaaaagaaacgatgttga
Protein Sequence: MSDPEEDREFLDDIKALEDVLANEHGTSSVKHYEEDPSECNLVNNRRGNISSRGFGQVECEDENEGRTSEIQEGQTAYETNERLIELLKETRRELISLLERCRENKAILDEKIRLKARVTRGSKVLICTAGMPYFKDGKQYPAPRNNDVKRKLKNGELQVVHLRTTCPWTPKDRNILWRAIRHQAASEVLEREWTAADDVSTDNPDPNRMDQELDNDSSAITNPRGMGRPLNLPKNFRDMVGPLGSREFDWLKIAVSDFDERHTAAECKVMWQVFLHPDINRYRWTRDEDERLKNLIKKHQAENWEVIAMELDSRRSGYQCFLRYKTINRVPCHSDECWSQAEDNRLCRCIEKFKVGNYIPWGIVARYMEGRSKAQVYHRYMYTTAPSLKKGRFTSEEDERLVEAVKKYGENFNKIAHYCFSDRSGVQLNDHYRTLMVRKRGIDNAWSINEDAKLLFLYNEFGPDWSKISRKIPTKTRTQVRHRHNAIVRYWDKGISLYEIPRKSKKQSVTEHAEIDLEDDEFISNVERNRMPEKDDETNSEMEAIDLELAKYFQVMPPVSRPGRKRKYYSKDELQDMTRKLCILLKSLGANLEIPEDLDETELPEKEKQLLKSLKDYRTMQIERAKNRPKSYQYIGLDDPKEFGELHFSPVCSGSCNLKKKARVDEKLDYEPPAGLDHCQVTLEMKLDTPENVLELVGKEQNEDFEKISKFMNYAEIDARRSKFVTKIYVLGPQQSSRILSSVQVEPISRDPVLEVPSTTKVPKKRSKKEKPWNSSKSEGIIQRLDQPVTCIEPNFYTLRAWKHIMLKAQDNRRCSRSPESAPSSTSNEANMAMKKLKQRLVQLFKYPIGLSHIIKPEFPDGGMDSQWIDISPEDTIVDNDECSNVPSSPSKKKRC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00828708;
90% Identity: iTF_00828708;
80% Identity: -