Basic Information

Insect: Aporophyla nigra
Gene Symbol: -
Assembly: GCA_947507805.1
Location: OX382291.1:31961753-31966150[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 2.2 2e+03 -0.4 0.0 5 20 129 144 129 149 0.90

2 7 0.51 4.5e+02 1.7 0.0 5 20 199 214 199 216 0.91

3 7 0.51 4.5e+02 1.7 0.0 5 20 337 352 337 354 0.91

4 7 0.51 4.5e+02 1.7 0.0 5 20 669 684 669 686 0.91

5 7 0.51 4.5e+02 1.7 0.0 5 20 807 822 807 824 0.91

6 7 0.51 4.5e+02 1.7 0.0 5 20 945 960 945 962 0.91

7 7 0.1 92 3.9 0.0 5 20 1083 1098 1083 1100 0.94

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	2.2	2e+03	-0.4	5	20	129	144	129	149	0.90
2	7	0.51	4.5e+02	1.7	5	20	199	214	199	216	0.91
3	7	0.51	4.5e+02	1.7	5	20	337	352	337	354	0.91
4	7	0.51	4.5e+02	1.7	5	20	669	684	669	686	0.91
5	7	0.51	4.5e+02	1.7	5	20	807	822	807	824	0.91
6	7	0.51	4.5e+02	1.7	5	20	945	960	945	962	0.91
7	7	0.1	92	3.9	5	20	1083	1098	1083	1100	0.94

Sequence Information

Coding Sequence: ATGCTTGATGAAAAAAAAAAATCTTTAGCTAGCTTATCAGAAAAAGAAAAAAATCTCAGAGCACAGGCCGTAGCAGCAGGTCGTCGTATTTCAAAGGtacctttagcagccaaggctccttcagacaaaagggaaaaaaaggcgaaagccgaaggtttactaacaccactaaaagacaaatcgccagtacaaagagaaaaaattcttaagggactggctaatcacggtatacctctccctgaagggcaatcaccttcagaaaaaaaaatcataaataaagttcgcgccgaccttggtctgcctgctgaacctaaaacaaaagcaatgcgagacaaacatgcagaagctgctagagctggcttactgcaaccattggaaggcaaatcacctgaagaaaaggaaaaggtattaaaaggtctgcatgatatgggcattccactacctaaaggacggacaccatccgaaaaatctttggtatctaagatagtggcaagcagtcgtcatccttcaaaggttactacaccgtttctgtcgccatcggaactagcccgtagagcaaaagccgacggattacttacgccactcaaaaacaaaactccagaagaaagagaaagaattctaagggctctggctaaacgaggtatacctcttcctgaaggtcagtcaccttcagaaaataagctgattcataaggtgcgtaatgaccttggtcttcctattgaacctaaaactaaagctattagagataaacaccaacaagcagctttagctggcttactctatccattagaagacaaaacacttgcacagaaggaaaatttactacgaggtcaacatggaatgggtatcccattacctgtgggacggacgcctacagaacgatctctcattgccaaaataacagcgggtagtcgtcgaccttcaaaattgggttcaatggtcctgtcgccttccgagcaaatgcgtagagcgaaagcggaaggattacttatgccactcaaaaccaaaacaccagaagaaagagagcgaattctaagggctctagctaaacgaggtatacctcttcctgaaggtcaatcaccttcagataaaaagctgattcataaggtgcgcactgacctcggtcttcctattgaacctaaaactaaagctattagagataaacacgaacaagcagctctaggtggcttactctttccattagaagacaaaacacttgcacagaaggaaaagttactacgaggtcaacatagaatgggtatcccattacctgtgggccggacgcctacagaacgatctctcattgccagaataacagcgggttctcacgtagcttcaactagcaaaataccgtccaaggctatttcagcgctcctggcgccctcggagcacatgcgtagggtgaaagcggagggattattaacgccactcaaaggcaaaacaccagatcaaagagaaaaaattctgaaggcgctagctatgcgagggatacctttacctgaaggtcagtcaccttcagaaaataagctgattcataaggtgcgcattgaccttggtcttccaattgaacctagaactaaagctattagagataaacatgaacaagcagctttaacaggcttactttttccattggaaggcaaaactcctgcacaaaaagaaaagttactacgaggtcaacatagaatgggtatccctttacctgtgggacgaagtccttcagaaaaatctctaatagccaagatattagcaggtagtcgtcagccttcaaaggtggcTTCAGCACCCAGTGCAACTGATGCGAGTATTCGTAGAGCAAAAGCGCAAGGATTACTAACAAGGTCACAGGTCAaaggtttacatgatacgggcataccattacgtaaaggacggattgcggcaagtagtggtcatccttcaatggtagctccagcgtcccaggtgccttcagagcaaatgcgtagagcgaaagcggaaggattacttacgccactcaaaaacaaaacaccagaagaaagagaaagaattctaagggcactagctaaacgaggtatacctcttcctgaaggtcagtcaccttcagaaaataagcttattcataaagtgcgcactgaccttggtcttcctattgaacctaaaactaaagctattagagataaacaccaacgagcagctgtagctggcttactctatccattagaagacaaaacacttgcacagaaggaaaagttactacgaggtcaacatggaatgggtatcccattacctgtaggacggacgcctacagaacgatctctcattgccaaaataacagcgggtagtcgtcgaccttcaaaattgggttcagcggtactatcgccttccgagcaaatgcggggagcaaaagccgcaggattacttacgccactcaaaaacaaaacaccagaagaaagagaaagaattctaagggcgctagctaaacgaggtatacctcttcctgaaggtcagtcaccttcagaaaataagcttattcataaagtgcgcaatgaccttggtcttcctattgaacctaaaactaaagctattagagataaacacaaacaagcagcttcagctgggttacttttcccattagaaggcaaaacacttgcacagaaggaaaagttactacgaggtcaacatggaatggctatcccattacctgtgggacggacgcctacagaacgatctctcattgccaaaataacagcgggtagtcgtcgaccttcgaaattgggttcaatgggcctgtcgccttccgagcaaatgcgtagagcgaaagcggaaggattacttatgccacttaaaaccaaaacaccagaagaaagagagcgaattctaagggctctagctaaacgaggtatacctcttcctgaaggtcaatcaccttcagataaaaagctgattcataaggtgcgcactgaccttggtcttcctattgaacctaaaactaaagctattagagataaacacgaacaagcagctctagctggcttactctatccattagatgaaaaaacacttgcacagaaggaaaatttactacgaggtcaacatggaatgggtatcccattacctgtaggacggacgcctacagaacgatctctcattgccagaataacagcaggtagtcgtcgaccttcaaaattgggttcaacggtactatcgccttccgagcaaatgcggagagcaaaagccgaaggattacttacgccactcaaaaacaaaacaccagaggaaagagaaaaaattctaagagcgctagctaaacaaggtatacctcttcctgaaggtcagtcaccttcagaaaaaaagctgattcataaggtgcgcactgaccttggtcttccaattgaacctaaaaataaagctattagagataaacacgaacaagcagctttagctggctttctttttcccttagaaggcaaaacacctgcacaaaaggaaaaattattacgaggtcaacacaatatgggtattccattacctgtgggacggagtgtttcagagaaatctctcattgatagaatAATGGCAGGTCGTAAACGAAAATCATTAAGTGTTTTAGCGTCAAAAAGACTAGCAGCAGGCAAAGAAGTAAAAGCAGGAATAGTAACTGAATATCAAGATGTTGTTAAAACAACAACATGCGACCGTGGTTGCGGTTGCGACAAAAAGAAAATCAAATTTAAGCACAGTTACGTAAAAATAAGAGTGACGTCTCCTGATATATCGTCTTTTTGCGATTGTCCTGGTGAATGTATCCCAGGCGTTTTGAGTGGGGCCTTTATTGACAACGAGGGTATTAAAGTTACAGTTGGAAGAGCTGTTGGGATACCATCATTTACCAAGGAAGTTTTATCAAAAACCGATAATAGAAACAGTTATACCAAGCAAAAATGCCTTGAAGACTCGATATATTCAAAATATAATGATTCTAGGTTTCAATCGGGTAGTTGTTTTTATGAAGAAAATTACTGTCTTAACAGCCACGGTTCTGTTGATAGCTCTAGTACGAGAGCATATAGCACAGAAAGCGAGAACATCTACCTGCAGAGTAGCACACCACCCTACGAAGGTCGAACCTGTAAATCTGATAGGACTGTTGAAAGTTTAAAAAGCCATCAACCATTAGACGATAAATACCAAAGCTTTAACTCAAAAATGAAATCTGCTACAAGCAGTCTCAATTCAATTTTGATAATAAAAAGTGAGATCTCGATATGCAGTTCAAACACAAGCAAGTGCATGGCCATAGCCAGTTTGATGTCGAGTATGGATAGCAGCATCTCATCAAAATCCACGAATTATTCGGACTACCAGTCTACTGATGACGTTATGAGTATGAGCTCACTAGACGAACCAACAACAAGGTAA
Protein Sequence: MLDEKKKSLASLSEKEKNLRAQAVAAGRRISKVPLAAKAPSDKREKKAKAEGLLTPLKDKSPVQREKILKGLANHGIPLPEGQSPSEKKIINKVRADLGLPAEPKTKAMRDKHAEAARAGLLQPLEGKSPEEKEKVLKGLHDMGIPLPKGRTPSEKSLVSKIVASSRHPSKVTTPFLSPSELARRAKADGLLTPLKNKTPEERERILRALAKRGIPLPEGQSPSENKLIHKVRNDLGLPIEPKTKAIRDKHQQAALAGLLYPLEDKTLAQKENLLRGQHGMGIPLPVGRTPTERSLIAKITAGSRRPSKLGSMVLSPSEQMRRAKAEGLLMPLKTKTPEERERILRALAKRGIPLPEGQSPSDKKLIHKVRTDLGLPIEPKTKAIRDKHEQAALGGLLFPLEDKTLAQKEKLLRGQHRMGIPLPVGRTPTERSLIARITAGSHVASTSKIPSKAISALLAPSEHMRRVKAEGLLTPLKGKTPDQREKILKALAMRGIPLPEGQSPSENKLIHKVRIDLGLPIEPRTKAIRDKHEQAALTGLLFPLEGKTPAQKEKLLRGQHRMGIPLPVGRSPSEKSLIAKILAGSRQPSKVASAPSATDASIRRAKAQGLLTRSQVKGLHDTGIPLRKGRIAASSGHPSMVAPASQVPSEQMRRAKAEGLLTPLKNKTPEERERILRALAKRGIPLPEGQSPSENKLIHKVRTDLGLPIEPKTKAIRDKHQRAAVAGLLYPLEDKTLAQKEKLLRGQHGMGIPLPVGRTPTERSLIAKITAGSRRPSKLGSAVLSPSEQMRGAKAAGLLTPLKNKTPEERERILRALAKRGIPLPEGQSPSENKLIHKVRNDLGLPIEPKTKAIRDKHKQAASAGLLFPLEGKTLAQKEKLLRGQHGMAIPLPVGRTPTERSLIAKITAGSRRPSKLGSMGLSPSEQMRRAKAEGLLMPLKTKTPEERERILRALAKRGIPLPEGQSPSDKKLIHKVRTDLGLPIEPKTKAIRDKHEQAALAGLLYPLDEKTLAQKENLLRGQHGMGIPLPVGRTPTERSLIARITAGSRRPSKLGSTVLSPSEQMRRAKAEGLLTPLKNKTPEEREKILRALAKQGIPLPEGQSPSEKKLIHKVRTDLGLPIEPKNKAIRDKHEQAALAGFLFPLEGKTPAQKEKLLRGQHNMGIPLPVGRSVSEKSLIDRIMAGRKRKSLSVLASKRLAAGKEVKAGIVTEYQDVVKTTTCDRGCGCDKKKIKFKHSYVKIRVTSPDISSFCDCPGECIPGVLSGAFIDNEGIKVTVGRAVGIPSFTKEVLSKTDNRNSYTKQKCLEDSIYSKYNDSRFQSGSCFYEENYCLNSHGSVDSSSTRAYSTESENIYLQSSTPPYEGRTCKSDRTVESLKSHQPLDDKYQSFNSKMKSATSSLNSILIIKSEISICSSNTSKCMAIASLMSSMDSSISSKSTNYSDYQSTDDVMSMSSLDEPTTR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -