Basic Information

Insect: Cerastis leucographa
Gene Symbol: -
Assembly: GCA_963082945.1
Location: OY720372.1:6108813-6114949[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.19 3.8e+02 2.5 0.6 4 43 75 126 72 129 0.58

2 7 0.02 41 5.6 0.0 21 44 344 368 334 370 0.86

3 7 0.063 1.3e+02 4.0 0.2 13 45 432 469 419 470 0.72

4 7 0.005 10 7.5 0.2 22 46 590 617 570 617 0.76

5 7 4.5e-06 0.0092 17.3 0.2 3 45 668 719 666 720 0.83

6 7 1.6e-05 0.033 15.5 0.2 13 42 851 887 837 891 0.82

7 7 0.047 95 4.4 0.1 3 15 1046 1058 1044 1105 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.19	3.8e+02	2.5	0.6	4	43	75	126	72	129	0.58
2	7	0.02	41	5.6	0.0	21	44	344	368	334	370	0.86
3	7	0.063	1.3e+02	4.0	0.2	13	45	432	469	419	470	0.72
4	7	0.005	10	7.5	0.2	22	46	590	617	570	617	0.76
5	7	4.5e-06	0.0092	17.3	0.2	3	45	668	719	666	720	0.83
6	7	1.6e-05	0.033	15.5	0.2	13	42	851	887	837	891	0.82
7	7	0.047	95	4.4	0.1	3	15	1046	1058	1044	1105	0.88

Sequence Information

Coding Sequence: ATGGAGGGTTCAATAGTGGTGAAAACTGAGATGGGGTCCAATGGAGAAATACTGCTTTTCTATGTTGATGAAAATGGTGGTAATGAAGAAGGAGTATTGACAACAGTTGAAAGCATAGAAGATCAAGCCATACAACTACAACAAGATAACTCCTATATCATTCAAGATAATGGAGATGAATCAAATGAAATAAGCATTGATCAAGCGACCCTAAGAGAAATATGGACTGAGGATGAGACCAAAAGATTACTTGTATTCTACAATGATAACAAACAGAGTTTCATATCTGgaacaacaaaaaagaaacatctCTGGACTGTAGCGTGCAAGACCATGCTTGTCGGCAAAAATCCAAACTCATGCGAATCAAAACTCAACAGCTTACAACAAAAGTACAATGAAATTTGTGGTCATATACAGAAAGGAGTCTATGTAAAGTGGCCATACTTTGAACTATGCCACCAAATATTCCAGGATGAAACCCCAATGATTACAGTTGAAACCTTAAACACACTGGAACCACAGATAATCAAAGTTCCAGCTCTGAAACAGGATTATGATAATGTAATGACGGTAAAAAAGGCGAATAATCGGGTAAATGTTGACGAAAAAGTGGAAATGATGCTCAAATTGTATCTGAAATACAAGAAAAACTTCCAATCCGAGTATTGGAGACGAGGAACTTGGGAGACCATTGCTTTAGAGATAGGAGAAGATGACGGAGAATACTGGCAGAAACGGTTCTTGAACTACAAGCAACATTATCTAAGACTTATTGACAAAAGACGAGAAAGCGGCTCAGAAGGCATCAACTGGCCCTACCTGGAACTATTCGATAAGATCTTTGAAGGTGACGAGGGTTTCCATAGAAAATATCTGACAGATGAGTACAGATTGATTGAAAATCAGGCGATAGCTGAAGTTGAAGAGCCGCCTCCTAAAGTCGAAGATTGGGACACAACAGAAATGACAGTATTAGTCAAATACTGTTTTGATTGCTTTGATGAATTTGAAGACAAAACCATTCCCAACAATTTCCTTTGGAACGAAATTGGACGTTTACTTGACAAGACTGCTGAAACCTGCAAAACTAAATATGAAGAACTGAAGAATTCACATTTAGATAAATACATTGAAGGTGGCTATGACTTAAGAAATAGAAAACCCATTGCGATTCTATTTGACAATataatatctaaagaaattgaaaatcaAATAATGAAAAGTGGCCGAAAGGCTGAGCCACTGGAGATATGGAAGACAGAGGAATTGGATGAGCTagtacaatttttctatgacaACATAGAAATGTATAAAGATATGATATGCCACTTTGTATGCTGGGCAGGGGTTACCAGAAAACTGAAAAGAAGTCTTTCAAGTTGCCGAATTCAATGGGAAGATCTATTAAGTCTCTACAAGACAATATTGAATGATAAGAAAGAAAATCCTGATATGCAAATAGATTGGAGATACATTGAGGTCTTTGATAGAATATTTGACTATGGTATGGACACTGGCTTGCTATCTGGGTATGAGATCTTGAAAGGATTTGGACAAAGTCAGAAAAATGAGACAAAAGTTGGTGTAAAGAAAGTGAACATCAAGTTAGACGACGATATGGAAGAGTTTACTGACGACGAAGAATCATACGACGAACGTGGCTTCACAAAGCGCACAAAACGCCGCTCAGGAGACTCGAAAGCGTTCAAAATCCTCGAATATTACCAGAAAAACAAAGATAAGTTCTCCTCAACCACAAATAGGAACAAACATTCTCTATGGGACATACTTGCTAAACAGATAGGCATATCTGCTACTCAATGCGCACACCGATTCAGGAATTTAAAGCAAGTGTACACAGCTTACGTCCAAAGGGAAATTAACAAACCAGAAATGCCAATCCTTTGGCCTTACTACGCTCTATGCAAAAAAGTATTTGGCTACAGAGCTATCAAATCTAAACTTAAGAACGGAAAACAGGATTCCGATGACAGTGAAGACTGGTcagcaaaagaaataaaacaattaataaactACTTCGCACAAAACTACGATGATATCAACAGTAATATTGAAGACAAAACAAAATGGTCTGACGTAGCGTCCGAAATAGGCAAAGGCGAAAATTCTTGCAAGGAAAAGTTTCTGGAACTGAGAAAGTCTTATAGGAAATTGAAAACTTTGAGGGGCAGAAACCCTGAAACTAAGATATCTTGGAAATATTTCAATATGTTTGAAGATATATATAATTCGAGAGAAAATGGTGTGGAGGCAATGGTGGTCGATGGTAATGAGTTGACGTATATGGAGGTACCTGCCGCTTCTGAAGAGAAGATTGAGCAAGAAGAAGACCAAGACGACTACCAATGCATCATCGTTATCCCAGAGGGTCAAGATATATCCCAGATCGAGAACGCACGAATCATAATACAAGAAAATCCAGTGCCCCAAGAAGAAACCATAGCCACCACAGAACCACCTAAAGAAACACTCAAACCGCTCGTCAAATGGACGAAGATAACCAAAAAGAAGCTTCTTATCTTCTATATAAACTATATCAGAACACATAGGGGTAAAGAAATTAATGCTAAAGATATGTGGGCAGAAATTGCTTCAAAATTACCCAATAAGACACCATTGTCTTGTAGAAAAATGTTCGCCAAACTCAAGGCAAATCATAAGCAAATTGATGTACTAGACCCTAATATGAAGAAAACTCCCTATTTCGCGTTAATGGAAAAAGTAATGCGTCTAAAGCCCAAATTCACTAAAACGGAGAAAAATAAGGCGTTAAAAGATGGGAAAGTATACAAAGATGTAGTTCTACCGGATGATAAAGTGGTCCAAGCATTACAGTACTATTTAGAAAACATTGAAGACTTTACCAGCCCAAGATTCGAAAAGAAATACCTTTGGACTGAACTTGCTAATTACGTTTGCGAACCAATTACTAAAGTGTTTAACAAAATCAACTATTTAAAACAAGCTTATAACTTGGATACAGATGAAATCGCAGGAGTAAAGACCCCATTTGCagaatttttaaaagaaatcttCGCTAAGGAAATAGCTATAAAGCTTGTATTAGAAAATCAGCCGAAACCCGTGATAGAAGAACCAGGAGTTGAAGAAACCTGGTCTGATGAAGAGACAGAACAGCTATTGGAATGGTATCTAAGTAATTTAGATAAATTCAAGAACCCTAAATTTGTCAGATCCTACCTATGGATGGAAGTTTCAGGCATGCTGAATAAGAGCGCCATTACTTGCTCGAAGAAAATGTCGGAAATTCGAACTCAGTATAGAAATATGGTCAGAGAACGACCTGAGGAGTTAAATGAATGGAGATTCCTTGATCTTTGTCAGAAAATCTATGGGACTGGAAAGAAAGGTACTCCAATGAATAGTAATTAA
Protein Sequence: MEGSIVVKTEMGSNGEILLFYVDENGGNEEGVLTTVESIEDQAIQLQQDNSYIIQDNGDESNEISIDQATLREIWTEDETKRLLVFYNDNKQSFISGTTKKKHLWTVACKTMLVGKNPNSCESKLNSLQQKYNEICGHIQKGVYVKWPYFELCHQIFQDETPMITVETLNTLEPQIIKVPALKQDYDNVMTVKKANNRVNVDEKVEMMLKLYLKYKKNFQSEYWRRGTWETIALEIGEDDGEYWQKRFLNYKQHYLRLIDKRRESGSEGINWPYLELFDKIFEGDEGFHRKYLTDEYRLIENQAIAEVEEPPPKVEDWDTTEMTVLVKYCFDCFDEFEDKTIPNNFLWNEIGRLLDKTAETCKTKYEELKNSHLDKYIEGGYDLRNRKPIAILFDNIISKEIENQIMKSGRKAEPLEIWKTEELDELVQFFYDNIEMYKDMICHFVCWAGVTRKLKRSLSSCRIQWEDLLSLYKTILNDKKENPDMQIDWRYIEVFDRIFDYGMDTGLLSGYEILKGFGQSQKNETKVGVKKVNIKLDDDMEEFTDDEESYDERGFTKRTKRRSGDSKAFKILEYYQKNKDKFSSTTNRNKHSLWDILAKQIGISATQCAHRFRNLKQVYTAYVQREINKPEMPILWPYYALCKKVFGYRAIKSKLKNGKQDSDDSEDWSAKEIKQLINYFAQNYDDINSNIEDKTKWSDVASEIGKGENSCKEKFLELRKSYRKLKTLRGRNPETKISWKYFNMFEDIYNSRENGVEAMVVDGNELTYMEVPAASEEKIEQEEDQDDYQCIIVIPEGQDISQIENARIIIQENPVPQEETIATTEPPKETLKPLVKWTKITKKKLLIFYINYIRTHRGKEINAKDMWAEIASKLPNKTPLSCRKMFAKLKANHKQIDVLDPNMKKTPYFALMEKVMRLKPKFTKTEKNKALKDGKVYKDVVLPDDKVVQALQYYLENIEDFTSPRFEKKYLWTELANYVCEPITKVFNKINYLKQAYNLDTDEIAGVKTPFAEFLKEIFAKEIAIKLVLENQPKPVIEEPGVEETWSDEETEQLLEWYLSNLDKFKNPKFVRSYLWMEVSGMLNKSAITCSKKMSEIRTQYRNMVRERPEELNEWRFLDLCQKIYGTGKKGTPMNSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00771874;
90% Identity: iTF_01531969;
80% Identity: -