Basic Information

Insect: Catoptria pinella
Gene Symbol: -
Assembly: GCA_963556745.1
Location: OY750784.1:5675788-5682504[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 2.5 2.1e+03 -0.6 0.1 3 13 90 100 89 103 0.89

2 9 1.2 1e+03 0.5 0.0 29 44 128 143 107 145 0.77

3 9 3.8 3.3e+03 -1.2 0.0 17 31 239 260 234 269 0.82

4 9 1.1 9.1e+02 0.6 0.0 21 44 363 387 359 389 0.84

5 9 0.016 14 6.4 1.9 2 44 433 484 432 486 0.74

6 9 0.00091 0.78 10.4 0.1 23 46 608 630 585 630 0.85

7 9 0.0045 3.9 8.2 0.1 3 44 680 729 678 731 0.81

8 9 0.0019 1.7 9.4 0.2 22 42 883 905 855 909 0.79

9 9 1.5 1.3e+03 0.1 0.2 3 13 1061 1071 1059 1079 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	2.5	2.1e+03	-0.6	0.1	3	13	90	100	89	103	0.89
2	9	1.2	1e+03	0.5	0.0	29	44	128	143	107	145	0.77
3	9	3.8	3.3e+03	-1.2	0.0	17	31	239	260	234	269	0.82
4	9	1.1	9.1e+02	0.6	0.0	21	44	363	387	359	389	0.84
5	9	0.016	14	6.4	1.9	2	44	433	484	432	486	0.74
6	9	0.00091	0.78	10.4	0.1	23	46	608	630	585	630	0.85
7	9	0.0045	3.9	8.2	0.1	3	44	680	729	678	731	0.81
8	9	0.0019	1.7	9.4	0.2	22	42	883	905	855	909	0.79
9	9	1.5	1.3e+03	0.1	0.2	3	13	1061	1071	1059	1079	0.90

Sequence Information

Coding Sequence: ATGGAACATATTGTGGTTAAAACTGAGGTGCAACCAAATGGTGAAATATTACTCTACTATGTTGATGAAAATGGTGATGTTGACGGAGATCATGTGTTACAACTCGAAGAAGGTACTGATTATGAGATTTTAGAAGCTGTCAATGATGCCAATGGTGATGAGATCATAGAAGCTGTCGATGATGCCAATGGTGATGAGATCTTAGAAGCTGTCAATGATGCCAATAATGATGAAGCTTCTATCAATCAAACTATGCAAGATCTTGACCAATGGTCAGATGAAGAATTACATAAACTCATCATATTTTATGTTGATAACAAGGAGGCATTCCTCAAAGGGGCCGCTATGAAACAACATCTTTGGACAGTAGCGTGTAAAACAATGCTAGTAGGTAGAAGTGCAAATGATTGTGGCAACAAGCTTCATGACTTGAAGAAGAAATATGCACTACAGAGAGTGGAACATCAAAAAGGCTATAATGTTACTTGGACATTGTACAATCTGTGCCATCGAGCTTTTAATGATGACAGTTATGTTAACTTACTGTTAAAAGATTTCGAACAACAAACTCAAACAATTACAAAAGTGACAATACCTGTACCATCAACCACAGAAGATCCAAATGAAGGCATTTTAGTGCTAAGAAATGTTAATTCTAGTAAATCAACACCTGATGATAAAGTTGAAACCATGCTTAATCTATACTTGAGATATAAAAAGTATGGGCAAAAAGAAATGTCTGCTAAAGTTTTATGGGAGACTATTGCTATGGAACTTGGTGAAGAGAGCTCTGAATATTGGCACAAACGGTTCTTGAATTTCAAGCAACACTACCTACGAATGCTTGCAAAAAGATCTGTAGATGGGCCTTCTAGTGTCAGCTGGGTTTACATGGATTTATTCGACAAAATATTTAGCGATGACCCTGCCTTCCAAAGTAGATATGTTGATGTGAGAAACAATAAAACTACAACTTTTTTTGAAGTTCCTATCACGGGCAATGATGAATGGAATGATACAGAGTGTACTATTCTCGCCAAGTATTACTTTGACTGCTTCCATGAATTCCAAGATGCTACTATTCCTAACAACTTTCTCTGGAATGAAGTTGGCAGATTGTTAGATAAGAAACCGAATTTATGCAAGGAAAAGTATGAAGAAATGAAAGAGGCTCATTACGAAAAGTATTTCACGGGTTCTTATACTTTACGCACTCGTACACCGTTAGAAATACtatatgataatattatatcaaAGGAGGTTGAGGCTGAGATAGTTCAAGACAAATTCATAATAGGTACATGGACCACTGAAGAAATAGATCAAttagttaaatttttatatcaaaacgtGGAGCTGTTAAAGGATTCAGTTTGCTATTTTGTGTGTTGGGCTTGTACTAGCAGATTATTGAAGAGAAGTATTGTAAGCTGTCGCAAACAATGGGAGGAATTGAAAATGCTATATAAGTCAATACTCAATGATAAAATGGAAAATCCGGACATGCAAATTGATTGGAGATATATTGAACTGTTTGATAGAATATTTGATTACGGCATGAATGCTAATCTCTTAAATGAAGATGAGAAATTGAAAGACCTGCAAAATAAGGCAGTAAAGGAAGTAGGggcaaaGAAGGTCATCATTAACTTAGATAGTGAACCATACGAAAACGGCACAGATGACGAAGAGTTTGATGAGCGTGGTTTCACCAAACGAACTAAAAGACCGTTCGGAGATTCGAAAGCTTTCAAAATCCTAGAATACTATCAGAAAAATAAGGTTATGTTCTCAAAATCTCTTAGAAAGAAACAATCATTGTGGGATGTTCTCGCAAAGCAGATTGGTATAACTGGCGAGCAGTGTGCACACAGGTTTAGGAACTTAAAACAAGTGTACACAGCTTATTTGCAACGTGAAATAAACAAACCTGAAATGCCTATCATCTGGCCGTACTATAATCTTTGCAAAAAAGTCTTTGGGTACAGAGCGATAAAGTCTAAATTGAAAAACAGTCAAGATTCCGATGAGGCCAAAGAATGGTCTGCGAAAGAAATCAAACAGTTGATTGCATATTTTGGACTGCATTTTGAGGAACTATTGAACAGTGATGACGTTTCTAAGTGGAAAGACTTGGCTCAAGATATGCGTAAGACTGCAACTGCTGTTAAAGACAAATTTGTTGAATTGAGGAAATCATATAGAAGACTTAAGACTGTAAAGGAGCATAATCCGCGATACAAAGTCTCGTGGAAGTATTTCAATTTGCTTGATGAGATTTATGAACGGACTGACGGACAAATTATGGAGATAGATGAAACCTATGAAGTCTTGAATCAGGACAAAAATGAAGATGAGGAAGATTATCAATGCATCATCGTAATACCTGAAGGGGGGGATATCAATGACGCCCAAATAATTATGCAAGATAGTTCTCGAAATTCAGAAACATTAGAAGAAAATCAACAAGACTCGCAATTAACATTAGAAGAAAGTCAACAAGACTCTCAATTAACATTAGAAGAAAGTCCACAAGACTCGCAATCAAAAACTACCCCCATTAAGTGGACTAAAAAGAGTAAGAGACGACTGCTGATCCTGTACCACAACTATGTTAAAGCGAAAAAAGGACAGGAGATAAACCCCAAAGAAATGTGGGCGGAAATCGCGTCAAAGTTAACCTCAAAAACACCACTATCATGCAGAAAGATGTTTGCAAAACTTAAAGCGAACCACttgaaattaaaagattttgatgaggaaaataataaaaagtctcTTTATTATACAGTGTTAAAGAAAATACTAGCACTGAAGCCTAAATTCCCGAAAACTtcccaaaaaaaactaaaggaaGGGAGACCTTTCAAAGATGTGTTATTACCCGCAAATAAAGTTGAGCTCGCGTTGCAATACTACCTTCAACATATTGACGAATTCATGAGTCCCAAGTACGAGAAGAAGTATTTATGGACGGAACTGGCTAATTTTGTATCTGAACCGgtcaataaactttttaataaagtcaACTATTTGAAGCAAAATTATAACGTAGATACAGATGAAGTGGCCGGAGAGAAAACTCTTTTTAGTGAACTGCTAAGGGAAATTAGAACTAAAGAGGATGCTGTTACAACTGAAATTACATTGCCAGTAAGTGTTGAGGAAAATGAAGAAGCCGCTTGGTCAGATGATGAAATAGAACAGCTCTTAGTTTGGTACTTGGCCAACTTGGACAAATTTAAAAACCCGAAGTTCGTTCGTAAATACCTTTGGTTGGAGGCCTCTTCAATATTGGCGAAGAGTCCTTTGACTTGCTCTAAAAAAATGACGGAAATAAGGACTCAGTACAAAACTATGATTAAAGAAACTCCTGATGCGTTGATCCAATGGCGGTTTTACGAATTGTGCCAGAAAATATACGGCACTGGGAAAAAGAATGAAATTACCAACGTTACCGACATTAGTGCGGAACATACCGTTTGA
Protein Sequence: MEHIVVKTEVQPNGEILLYYVDENGDVDGDHVLQLEEGTDYEILEAVNDANGDEIIEAVDDANGDEILEAVNDANNDEASINQTMQDLDQWSDEELHKLIIFYVDNKEAFLKGAAMKQHLWTVACKTMLVGRSANDCGNKLHDLKKKYALQRVEHQKGYNVTWTLYNLCHRAFNDDSYVNLLLKDFEQQTQTITKVTIPVPSTTEDPNEGILVLRNVNSSKSTPDDKVETMLNLYLRYKKYGQKEMSAKVLWETIAMELGEESSEYWHKRFLNFKQHYLRMLAKRSVDGPSSVSWVYMDLFDKIFSDDPAFQSRYVDVRNNKTTTFFEVPITGNDEWNDTECTILAKYYFDCFHEFQDATIPNNFLWNEVGRLLDKKPNLCKEKYEEMKEAHYEKYFTGSYTLRTRTPLEILYDNIISKEVEAEIVQDKFIIGTWTTEEIDQLVKFLYQNVELLKDSVCYFVCWACTSRLLKRSIVSCRKQWEELKMLYKSILNDKMENPDMQIDWRYIELFDRIFDYGMNANLLNEDEKLKDLQNKAVKEVGAKKVIINLDSEPYENGTDDEEFDERGFTKRTKRPFGDSKAFKILEYYQKNKVMFSKSLRKKQSLWDVLAKQIGITGEQCAHRFRNLKQVYTAYLQREINKPEMPIIWPYYNLCKKVFGYRAIKSKLKNSQDSDEAKEWSAKEIKQLIAYFGLHFEELLNSDDVSKWKDLAQDMRKTATAVKDKFVELRKSYRRLKTVKEHNPRYKVSWKYFNLLDEIYERTDGQIMEIDETYEVLNQDKNEDEEDYQCIIVIPEGGDINDAQIIMQDSSRNSETLEENQQDSQLTLEESQQDSQLTLEESPQDSQSKTTPIKWTKKSKRRLLILYHNYVKAKKGQEINPKEMWAEIASKLTSKTPLSCRKMFAKLKANHLKLKDFDEENNKKSLYYTVLKKILALKPKFPKTSQKKLKEGRPFKDVLLPANKVELALQYYLQHIDEFMSPKYEKKYLWTELANFVSEPVNKLFNKVNYLKQNYNVDTDEVAGEKTLFSELLREIRTKEDAVTTEITLPVSVEENEEAAWSDDEIEQLLVWYLANLDKFKNPKFVRKYLWLEASSILAKSPLTCSKKMTEIRTQYKTMIKETPDALIQWRFYELCQKIYGTGKKNEITNVTDISAEHTV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -