Basic Information

Insect: Linepithema humile
Gene Symbol: CEF1_1
Assembly: GCA_000217595.1
Location: NW:430603-434229[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.19 1.3e+02 2.1 0.0 3 17 165 179 163 186 0.91

2 6 2.3 1.6e+03 -1.4 0.0 23 46 233 258 219 258 0.69

3 6 3.1e-12 2.1e-09 36.7 0.3 1 45 264 310 264 311 0.95

4 6 9.7e-09 6.6e-06 25.4 0.4 3 43 319 363 317 365 0.96

5 6 7.5e-13 5.1e-10 38.6 0.0 1 44 372 416 372 418 0.94

6 6 9.5e-16 6.5e-13 47.9 0.2 1 43 424 466 424 469 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.19	1.3e+02	2.1	0.0	3	17	165	179	163	186	0.91
2	6	2.3	1.6e+03	-1.4	0.0	23	46	233	258	219	258	0.69
3	6	3.1e-12	2.1e-09	36.7	0.3	1	45	264	310	264	311	0.95
4	6	9.7e-09	6.6e-06	25.4	0.4	3	43	319	363	317	365	0.96
5	6	7.5e-13	5.1e-10	38.6	0.0	1	44	372	416	372	418	0.94
6	6	9.5e-16	6.5e-13	47.9	0.2	1	43	424	466	424	469	0.95

Sequence Information

Coding Sequence: ATGATGAGTGATTCCGACGACTCTGACATTTTGGCTGATATCCAGGCCTTGGATCGAGTTCTGACCACGACTTCACAGGAAAATGTACAATATCCTAGTAGCAGTAAAGTGCAATTTGATAATGTTTACTCGACAGAGATTGATTCGGATGTTGAGAGCGACAACTTCTCCAACTTTGTTAAAGAGAATTGTGATGCCAACATAAACTCTCTTAACGCTTTTGAAATTAACATGAAATTGATAACAGGTTTGACGATAGTCAAGAACAAATTTAGTGTCATGCTGCGACAGTGTGAAGAAAAGATAAAGCAATTAGACCAAGAGCTAGAAAACAGCAGTAAAGAAAGCAATAGATGTTCTAAATTGCCAATCAGCCATGCTGGTATGCCATATTTCAAGGACAAGGATTACTTTTATGTTCCTAAAAATTCTGacacaatattaaaagaagCACGTGGTGAATTATTTGTTGTATATATGCAGAAACCAAGTCGTTGGTCAGATAAGGATAGACAAACTCTTCTAAGGGCTGTGCATAATGAAGCATTCGAATCAGTTCTATCCAGAGGATTTGACAAACAAGTAGATAGTAGAAAGTCCAAACGTAAAGAAAACAACCAAGCTGAGGAAGCCAAGTTGGTGCTTCccagaaattttaatgaaatggtAGGAGCATTAGGCGAGAGAGAATTTGACTGGCTTAAAATTTCGAATGTGgattttgataataaacatTCCGCGGGTGAATGTCGGGCTATGTGGAACGTCTACCTGCATCCGGATATCAGGAAAACCGAATGGACAGCCGCGGAGGACAAGAAACTGATAAAATATGCTAAGTTATGTAAATATCAAGATTGGGACACTATCACGCAGAAACTGGGAACGAATCGCAGCGCTTACCAATGTTTCATTAGATATAATACTATCAAGGCAGTGCCATCCTCCGGACTTACCTGGACGAAGCAGGAAGACAAGCATCTCCTAAGAGTCATAGAGACACTCAGGGTCGGAAATTACATCCCTTGGTTTGAAGTTGCAAATTACTTGCGGCACAGAACTAAGCAGCAAATTTACACACGATGGATATACAGGACAGCGCCGCATTTGAAGAAGGGTAGATTTACCTTAGCGGAAACGCAGCAACttttttgtgcaataaaaaagtaCGGCAAGGACTTTCGTAAAATCGCGCACGTTGTGATGCCGAATCGAACTTCCTCACAACTCATCAATCGTTACAACACAATAATCACGAAGGCGAATGGCAGGAATTTATGGACAGCGGAGACCGACATGCAATTGATTCAGCTGCACAAAAAGCACGGTAACAACTGGTCCTATATAGCCAAGTATTTTTCTGGCAAAACAAGAACACAGGTGAGACATCGGTTTAATGCGATACTAAAATACGTGCAGAGAGGTATTTCCATAGACAACATACCTAGAGCATCTGCCCCTAAAAAAGTGCGTTACAAGAAATCTGAACACAGCACCATGTCAGaatataacaaaaagatattaatggAAAAACTTCTTGAGAAAGCCAAGCATCGTACTGTAGACACTAATGATATTGAGCCGAGACTGTACGAAACTCTTGTGTTTCCACCTTCGTCGGAATCCGCTACTCAGGAAGAACCttataactttaaattacTTGCACGTGAAACTAGAAAGTTATACAATACATTGGAATTATTAGGCGCTAAGCTTGATATTCCTATggattttctaaattatatgcACCTAAATAAAAGAGACAAAGAACTCGTGACttctttaaaagaatatataaatattaaaaataataaaacgcagAATAGCAATGTGATAGAAGAATTTAGAACGCGAATGTTTGGCCCTGAACTGACAGTTGATGAAACTTCTCGCTTTATACCGCCACTTCCGTTTAACGGATACGTAAGACAgacaaaaaaagtaagaaaaaaggaCAAAGTTATAGATTGCAACTTAGGGGACGATAAACATCTTATTACCGATGTACCTGTAGAATTTTTTCCGTGTACGCTTTCATTGTCTTTTCTTAGTTTCGAGGAAAGAAttcaatttgataaatttagtcAGTTCTTCGCGAATGATTATCACGAGAAGcgaaatgtaaatttacacaaatcaTTACAATGCAACTCCTCTTTCGATGGATCAAGGAGTTCATTATCAAGACGTAGCAAATCAAATACGAATTCGAAAGTAAGTTCAAGAAGTTGCACACAAGTACAACAATCAGATAACTTAGAAGAAACCATCAGTACTGAATACgatgaaaatgaagaaaatacgTGGGATAATATAATTCTGCCAAACAACGCAACTTTATTAGGTTGGAAAAACTTGCTTGTTTGGAAATTGTTGTACGAATGTGAAAATGAATTTGACGCATCCGATGAATCTAACGAATTGTCATCGGAGAAACAATCGGAAGAACGTGCTGAATCTGAAGACGAATGTGAAAGTGCTGAATACCAGCTGCTACGAACGCGCctcttaaaattattcaaatttcctGTAGGTTTGTCAAACACTATATTAGAAATAACTAAACCagacatatttttaacaaacgaGGAACAGCATCCCGTTCATGAAAACActtcaagaaaaagaaaatttgttaaacgTGTATCCAAGagaaaaaaggtaaaaaataacGATGTCTTTTGA
Protein Sequence: MMSDSDDSDILADIQALDRVLTTTSQENVQYPSSSKVQFDNVYSTEIDSDVESDNFSNFVKENCDANINSLNAFEINMKLITGLTIVKNKFSVMLRQCEEKIKQLDQELENSSKESNRCSKLPISHAGMPYFKDKDYFYVPKNSDTILKEARGELFVVYMQKPSRWSDKDRQTLLRAVHNEAFESVLSRGFDKQVDSRKSKRKENNQAEEAKLVLPRNFNEMVGALGEREFDWLKISNVDFDNKHSAGECRAMWNVYLHPDIRKTEWTAAEDKKLIKYAKLCKYQDWDTITQKLGTNRSAYQCFIRYNTIKAVPSSGLTWTKQEDKHLLRVIETLRVGNYIPWFEVANYLRHRTKQQIYTRWIYRTAPHLKKGRFTLAETQQLFCAIKKYGKDFRKIAHVVMPNRTSSQLINRYNTIITKANGRNLWTAETDMQLIQLHKKHGNNWSYIAKYFSGKTRTQVRHRFNAILKYVQRGISIDNIPRASAPKKVRYKKSEHSTMSEYNKKILMEKLLEKAKHRTVDTNDIEPRLYETLVFPPSSESATQEEPYNFKLLARETRKLYNTLELLGAKLDIPMDFLNYMHLNKRDKELVTSLKEYINIKNNKTQNSNVIEEFRTRMFGPELTVDETSRFIPPLPFNGYVRQTKKVRKKDKVIDCNLGDDKHLITDVPVEFFPCTLSLSFLSFEERIQFDKFSQFFANDYHEKRNVNLHKSLQCNSSFDGSRSSLSRRSKSNTNSKVSSRSCTQVQQSDNLEETISTEYDENEENTWDNIILPNNATLLGWKNLLVWKLLYECENEFDASDESNELSSEKQSEERAESEDECESAEYQLLRTRLLKLFKFPVGLSNTILEITKPDIFLTNEEQHPVHENTSRKRKFVKRVSKRKKVKNNDVF

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -