Basic Information

Insect: Scirpophaga incertulas
Gene Symbol: -
Assembly: GCA_036419045.1
Location: CM071633.1:10067010-10071224[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 8.3 2.5e+04 -3.1 0.1 4 16 159 171 159 173 0.91

2 6 4e-13 1.2e-09 39.6 0.5 1 45 263 309 263 310 0.95

3 6 1.1e-07 0.00032 22.2 0.4 2 44 316 362 315 363 0.93

4 6 4.7e-09 1.4e-05 26.6 0.0 1 43 368 410 368 412 0.97

5 6 0.00027 0.81 11.3 0.0 4 42 420 460 418 464 0.92

6 6 3.9 1.2e+04 -2.0 0.0 29 41 501 513 498 515 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	8.3	2.5e+04	-3.1	0.1	4	16	159	171	159	173	0.91
2	6	4e-13	1.2e-09	39.6	0.5	1	45	263	309	263	310	0.95
3	6	1.1e-07	0.00032	22.2	0.4	2	44	316	362	315	363	0.93
4	6	4.7e-09	1.4e-05	26.6	0.0	1	43	368	410	368	412	0.97
5	6	0.00027	0.81	11.3	0.0	4	42	420	460	418	464	0.92
6	6	3.9	1.2e+04	-2.0	0.0	29	41	501	513	498	515	0.88

Sequence Information

Coding Sequence: ATGGATATTAATACAGATAGTTATAATGAGCTGAATTCGGGACCACAGCTCAAGGATTTGGTACATTTAACTTCTGTCTTGAGATTCGGGCTTTTAGCGAACGACACATCTGGGCAACAGCTCAAGCCGCAGCCTTTACCGTCCTGTTCCACCGCAAGCGACACTTCATCTTCAGAATTGGAACAAACTAAAATCGAATCAACATTActtcttaataaaaaattgactgaAGCGTTACTTAACGTGGAGAACTTTCTTATCAACAAGTTGCTGAATGGCGAAAATAAGTCATCAGAACAATTCAATCGAAACCCAAAACAACTCAACTCTAACACGCCTCTATTTCGGACTACACAAGGTAATAATCCATTTTTCATGGATTGTAAAGGCTATGTCCCTCCTGACAATAAAGATACAGTTCAAATGAAAAGAGATGGGATGTACCTCTTTCCAAGTATGTTTGTTGGATTTGGATGGTCAGTCAAAGATAAGCGTATATTTGAAAAGGCAGTACTTGAAGCATCAAAATCAATTagaataaatgaattaaatagtaaaatttctAAAATACAATGTGATGCAAATATGAAcagttctaaaaaaaaaaatgaaataaaagacTTAGAAGAGGAGATTAAGTCAGTTAAAAGGAATGGCACTTTAGCACAATTAGCATTGCCAATTAATGAAGAATATTATTGGTATAACTTGATGCCATCAGAATCCAGACATACTCCAGAAGAATATTCTAGAATGTGGAAATTATTTGCACATCCAAGTCTGAATAAGAGTAACTGGACAAAAGAAGAACACAAAAAATTGATATGTATTGCACAAGAGCACAATTATCAAGATTGGGATGCCATAGCAAACAAACTAAACACAAATCGATCTGGTTTTCAATGCTTGGTTTACTATAgaacaaatttcaataactctAAAAATAATAGGTGGACAGCAGAAGAAGAAGAGTATCTGAGAAGAATAATTCATTACCATAGAGAAGATAATTACATACCATGGGGACAAGTGGCAGCATGTATGGATAATAGAACCAAAATTCAAGTTTACAATAAGTTTAAAAGGCTTAGTGAACTAAGGAAAGGCCGATTTTTGCCTGAAGAAGATTCTGTATTACTTAGCTGTGCCAAAAAATTTGGTTTAgtctttagtaaaataaaaaaagttataccAGGAAGATCTGCTGATCAATTGAGAGCTCGTTATCAggttttgacaaaaaaaatttCAGCAGTATGGACTGTTTCTGAAGATAAAAAACTATTACAATTAATGGCGGGTCAAGGGGAGAATTTGAATTATGCTGCTTTATGTCCATTTTTTCCTGATAAAGATCGTGCAAACATAAGAACTAGATATGGAACATTAATAAAGTGGTTGTTTAAAAACCCAAATGTTGATATTGCTTTTGCTCCTCGTCGTGCAGCTCGTCGACTGTGCCACGGTCAAGCTGAACATTCTATTAGAAAGGCTTTAACTAAGTTAGAAAGTAGAATGCAAAATGAAGTCAAGCTTCGTATGTCTAAATCTAAATCTAAGAGAGTCACTAAGGATTCATCTTTTGAAGAAATAGAAGAGGCTGTTATTGCATTTTTAACTACAGAGAACATTCAAGAAGGGGAAAGTTCTTtactggatcttctgctgaccacacgtccGGACGGATACACCATCACAGTGGATGCACCCCTCGGTTCGTCCGACCACTGCCTCATCCGGACAAAAGTACCATGTGCGCAGCCAATTACATCTAGGCCGAAACACCTACGTCGCATGTGGCAGTACAAGTcggcagattgggatggattgcgtCAATTCTAcgcatcgtacccgtggaggcagCTTTGCTTCATATCAGATGATCCCGACGCCCCTGCAGCCGCTGTCGCTGAGACAATCCTAGTGGGTATGGTATATTTTAAACCAAACGCACTGGTAGCTGCGGGGCAAAAtaaacgaccgtggtttaatcggtcctGCAAGGAAGCTAGACTTCGGAAGCAGACCGCATACAGGGCTTGGACCACGGCTCGTATCAACAAGGATCCGAACGTCTCTGATATGAAATGCAAATACAATGCTGCTTCGAGGTCCAGTAAGAGAATTATTGCCAGAGCCAAATTCGATTTCATCAGTAGAATTGGTGAGCGACTCACGGGCTATCCCTCTGGGAGTCGTGCCTTCTGGTCGCTTACCAAAGCTGCCGAGGGGAACTTTTGCCAgccgtccttaccaccactgcgAAATGTCGATGGCAATCAGGCCCACAGTGCAAAGGAGAAAGCCGATTTATTGGGTAatctctttgcctcaaactcgactttGAACGACATTGAGGGCGATTTGCCGCCTTCGATCCCTTGGTGTGGATTCTCTATGCCAGAGATAAATATCTCTCAGAGGGACGTACGGCGAGAGCTGCTTTCTTTGGACgttcataagtcgagtgggccagacggcaTACCAGCAGTGGTGCTCAAACAGTGTGCCCCTGTGTTGTGCCCTGTGATAACGCGACTTCTCGCGCTTTCTTACCACACTAGTCAAgtgccatcttcgtggaagactgCCAATGTGCatccggtgcccaaaaagggcgataggtcggacccatcgaattacaggcctatagcTATAACCTCTCTTCTCtctaaggtgatggagcgtgtgatgtttatcacacgctccatcaccttagctccttag
Protein Sequence: MDINTDSYNELNSGPQLKDLVHLTSVLRFGLLANDTSGQQLKPQPLPSCSTASDTSSSELEQTKIESTLLLNKKLTEALLNVENFLINKLLNGENKSSEQFNRNPKQLNSNTPLFRTTQGNNPFFMDCKGYVPPDNKDTVQMKRDGMYLFPSMFVGFGWSVKDKRIFEKAVLEASKSIRINELNSKISKIQCDANMNSSKKKNEIKDLEEEIKSVKRNGTLAQLALPINEEYYWYNLMPSESRHTPEEYSRMWKLFAHPSLNKSNWTKEEHKKLICIAQEHNYQDWDAIANKLNTNRSGFQCLVYYRTNFNNSKNNRWTAEEEEYLRRIIHYHREDNYIPWGQVAACMDNRTKIQVYNKFKRLSELRKGRFLPEEDSVLLSCAKKFGLVFSKIKKVIPGRSADQLRARYQVLTKKISAVWTVSEDKKLLQLMAGQGENLNYAALCPFFPDKDRANIRTRYGTLIKWLFKNPNVDIAFAPRRAARRLCHGQAEHSIRKALTKLESRMQNEVKLRMSKSKSKRVTKDSSFEEIEEAVIAFLTTENIQEGESSLLDLLLTTRPDGYTITVDAPLGSSDHCLIRTKVPCAQPITSRPKHLRRMWQYKSADWDGLRQFYASYPWRQLCFISDDPDAPAAAVAETILVGMVYFKPNALVAAGQNKRPWFNRSCKEARLRKQTAYRAWTTARINKDPNVSDMKCKYNAASRSSKRIIARAKFDFISRIGERLTGYPSGSRAFWSLTKAAEGNFCQPSLPPLRNVDGNQAHSAKEKADLLGNLFASNSTLNDIEGDLPPSIPWCGFSMPEINISQRDVRRELLSLDVHKSSGPDGIPAVVLKQCAPVLCPVITRLLALSYHTSQVPSSWKTANVHPVPKKGDRSDPSNYRPIAITSLLSKVMERVMFITRSITLAP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -