Basic Information

Insect: Cryptophagus acutangulus
Gene Symbol: lilli_1
Assembly: GCA_963556235.1
Location: OY744570.1:60685-69510[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 4.6e-10 1.4e-05 25.3 0.2 4 117 20 132 18 186 0.66

2 7 9.2e-12 2.7e-07 30.9 15.2 348 511 239 413 223 416 0.58

3 7 0.06 1.8e+03 -1.5 7.5 442 479 460 497 428 515 0.63

4 7 1 3e+04 -7.1 14.7 430 490 566 631 555 641 0.62

5 7 0.16 4.6e+03 -2.8 2.7 185 228 684 725 628 755 0.61

6 7 0.63 1.9e+04 -4.8 20.2 119 214 772 872 712 922 0.48

7 7 0.4 1.2e+04 -4.2 0.3 180 262 1024 1031 996 1066 0.39

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	4.6e-10	1.4e-05	25.3	0.2	4	117	20	132	18	186	0.66
2	7	9.2e-12	2.7e-07	30.9	15.2	348	511	239	413	223	416	0.58
3	7	0.06	1.8e+03	-1.5	7.5	442	479	460	497	428	515	0.63
4	7	1	3e+04	-7.1	14.7	430	490	566	631	555	641	0.62
5	7	0.16	4.6e+03	-2.8	2.7	185	228	684	725	628	755	0.61
6	7	0.63	1.9e+04	-4.8	20.2	119	214	772	872	712	922	0.48
7	7	0.4	1.2e+04	-4.2	0.3	180	262	1024	1031	996	1066	0.39

Sequence Information

Coding Sequence: ATGATCGGAGGATATCATGAACGGAATCCCATGCTAAAAGGCACATTAACAAGTGTGGAACGAGACCGCTTGCGAGAGCGAGACAGGCAGGCACGGGCCCAGATGTCTTCGCAATCTTCCGAACAAGAAAGTCGTCCAGGTGCCTCAGGAGATGTTTTATTTAGTGGGCCCATCAAAGTGAACCCGTCCTCTGCTGATCATGTCAAGCAACAAATCCAAAGTACATTGGGTGATTACCAGCGAGTGCGCCCCTATTTAGACCAAAATGCCTCGGCCGGGTTGATTGGCGTCGATGGAGTGCCGCCTAGTCCAGGATGTCCGCCGTCAAGCCGACACCATCACATACCACCGCCCGGTGCCACCGGAACACCACAAACCAGGTTGCAACAACCATCTCCCGAATCTCGATCCGAATTCAAAAAGCCCAATCATCATCCACAGCAACAGCGTGGAGGATATGTGAAACCGGCTGATGGAAAGCCGGATTATGGTGGTCGAGGTGGATATCCCGGTCAGCCGGTTAAGCACGGTAGTAGTGCAACCAATCATCGGTCGAATGGAATACTTCCACCAAAGGGACCGCCGCAACCACCGCTTACGTCACCAACTGGTCGGATACATGCCAGTCGGAATAGTCGCGTTCCTTTTGAGCAGaatcaAGGAGCTGAAACGGCTGGTCCTCGGGAGCCCTTGCCGTCTGCTACTCCCAGTGCAGATGTTGACAACATATTTAAGGAAATGTGTGAGCTTCCAATTCCATTGTCAGTGATTGCAACACCACGGATTGACCAAGACAATAAATATGCATGTAATTCGAATCCAGCTCTTcttacaacaacaacaaagATGCCCGAAGCTCATCAATCAGTCATCGCAACCGCATTCATTAAGAAACGCGATCGACAGCAGCAACAGCTTGCGTTGCGACACTCAACCAATCTACGCGATGATCTCGATTTGTCTGAAGAGAGCGACGATGAGCAGAAACGTGACACTCTGCACACTTCATCGTTATCAGTAGAAAAAATGTTATCGCCGCTTGGGGCGACACCTGCCATGGAAAAAATGGACCAATCTCCACCAATCGGACCAAGTTCGACAACCAGTTCGGACGCTTCCGATTCAGACAGCGATTCGAGCAGCGACGATTCGATCGATGAAAACGCAACCACATCGCAACCTACCTTAACTAAGCCGACCGAAGAGGAATCTAATAAAGTGCGCTGGAATTTAGCGTCATTTGTCGGCGCCGTGCCGCCATCTATCGCTAGTAAACAGCCAAAAGAAGAATCAGACACTAGCGATTCGACCAAGGACATCGACCGGGTGGTTGCGGAAGCGTTTGCTTCGAACGCGGTGCCACTTTTGTCGAGTTTTTCCGATTCCGATGATAGCGCTGTCAAGAAAGCGCCTCCCACCTTGTCGTTGAAAAAACGTCTCACCAAAACGCATAGCGATAGTGACGCGTCGCGTGATTCCGATTCGGAAGCAGCTGCAACGACGAAAGTGACAATGGCGGCTCCGAAGCGGGGTCGGCCGCGCAAAATCAAAGACGAAAAAAGTGAGGTGCGCAAAAAGCGTGGTCGGCCACCGAAGCAGCGACGGCCGAGCAGTTCTGATGAGGAGACTCCGGCGCCAGCGAAGCCGATTGTGCGCAAGCGTACTATTTCGAAACGAGCCACGTCGACGAGTTCCGATGATGATTTCGATCGGGCGAAATTGCCGCTGGACGAAGATAGTAAAATTACCAAGTTGCGTGGTAGGAAATTGAAGAGTGTGTCAACGGTTCCGACGTCGGATGATTCCAGTGAATCGGATTCGGGATATAGGAAAATGAGTCAGAGGTCGGACAGTGAATGTGATTCAACTGAGAAGAAAATTGAGGAGAACAAGTCGAAGGATAAGAAGAAGAGTGATACTCTGAGGAAGTTGTTTACTCCCAAACGGGATTCGGAGGGTGGAAAAGGGGGTGGAAAGGGCGGTGGAAAAGGGGGTAAAGGTGGAAAAGGAAAATGTGGTGTAAATGTAATAATGGTAGACGAAAATTACGAACGGAGCAGTTCATCAGTGGAAGACGAAACAATGCCCAGCATATCAAGCAATCCAATTTTGTTGTCAccaatttcatcaaataacgaaatgaaaaaatcaccacaacaacaacaacaacgaaCAGTTCCAACTGTCGCCGAACCAATCAAAATTAAGACTGATCATCAATGCATGGTAAAAATCGATCTGAACCGtatcaatttgcaaaacaTTCCGCAACTTCGCAAACATATTGAAACGAACTTGCCATGGTTAGTAGAtgcgacgacgacgacgacagAGACCGCTGAACAGCAGCGCAAACACAAATCAAAAAAACGCAAACGACGGACGAGTGCCAGCTCGATGGCAAGCAGTGTGTCAACGAACACCGATGGTGCCAagaagaacaagaagaagaaagagcATCAAAAGGAGAATAGTCAAAACGCGGTGGTagtaaagaagaagaagaagaaaaaagaagaGGAGGAATTTTTTGAAGGGGGGTTTCGATCTCAGGGTGAGGAAAATGTAAGTGTGTTGCCAACGAATCACGAGCGGCTTAGTCCGTTGGTGACCGATCGTGGCGGCCGCTTGCCACGACAATACCATTCGTATTTCGAAACTTCCTATAAGCCTTCTGAGTATGAAGAGAGGGATCAAAACCAGTACCTGAGTGATGCAAAACGGCTCAAACATATGGCCGATAAAGAGACTGACCCCATTAAGCAGTGTATGCTCTATCTTGAAGCTGTGCTTTATTTCCTGTTGACTGGCAATGCGATGGAACATGAAAGTGTTACCGAAAAAGCGGCTTTTACCATGTACAAGGATACTCTTAGTTTAATTAaatatATTTCGTCAAAGTTCCGTAACCAGCAAAACGCCTCGTCTGTCTACAACAAACTGGCTGTACTTAGTTATCGGTGCCAAGCCTTATTGTACTACAAACTATTCAAATTGCGCAAACAAGAATCGAAAGATATTCAAAAAACCATCACCGAGTTTTGCAGTAATCGAAATGCGGCCATACCACAAGAGCAACAGCCACAACAGCAAGGTGGACAAGGCACGCCGTCACCTTTGTCACCCACACCATCACCGGCCGGCTCAGTTGGTTCGGTCGGCAGTCAAAGTTCAGGATATAGAAGTGGCGAATTGGAAGCACGGGGCAACAATTTGCCAGTGTCATCGACACATGCACCATGTACTAGTGGCGTTTGGGTGCCATTGCCTGTTTATAATGCGATGGCCAAACAGAACCATCAATTCACATATCTGCTTTCTTATCAGGATCTGTGGGACACGGCCGATAATTTGGTAGTGAAAGGCAAACACACAGattttttCATCGAATTGGATCGACAATGCAAACCCCTAACGATGCACAGCTCCCTTATCGATCTGGTACGACATGTAAAAGAAGGAATTAATCGACTTAAAAATCAAAGCTAG
Protein Sequence: MIGGYHERNPMLKGTLTSVERDRLRERDRQARAQMSSQSSEQESRPGASGDVLFSGPIKVNPSSADHVKQQIQSTLGDYQRVRPYLDQNASAGLIGVDGVPPSPGCPPSSRHHHIPPPGATGTPQTRLQQPSPESRSEFKKPNHHPQQQRGGYVKPADGKPDYGGRGGYPGQPVKHGSSATNHRSNGILPPKGPPQPPLTSPTGRIHASRNSRVPFEQNQGAETAGPREPLPSATPSADVDNIFKEMCELPIPLSVIATPRIDQDNKYACNSNPALLTTTTKMPEAHQSVIATAFIKKRDRQQQQLALRHSTNLRDDLDLSEESDDEQKRDTLHTSSLSVEKMLSPLGATPAMEKMDQSPPIGPSSTTSSDASDSDSDSSSDDSIDENATTSQPTLTKPTEEESNKVRWNLASFVGAVPPSIASKQPKEESDTSDSTKDIDRVVAEAFASNAVPLLSSFSDSDDSAVKKAPPTLSLKKRLTKTHSDSDASRDSDSEAAATTKVTMAAPKRGRPRKIKDEKSEVRKKRGRPPKQRRPSSSDEETPAPAKPIVRKRTISKRATSTSSDDDFDRAKLPLDEDSKITKLRGRKLKSVSTVPTSDDSSESDSGYRKMSQRSDSECDSTEKKIEENKSKDKKKSDTLRKLFTPKRDSEGGKGGGKGGGKGGKGGKGKCGVNVIMVDENYERSSSSVEDETMPSISSNPILLSPISSNNEMKKSPQQQQQRTVPTVAEPIKIKTDHQCMVKIDLNRINLQNIPQLRKHIETNLPWLVDATTTTTETAEQQRKHKSKKRKRRTSASSMASSVSTNTDGAKKNKKKKEHQKENSQNAVVVKKKKKKKEEEEFFEGGFRSQGEENVSVLPTNHERLSPLVTDRGGRLPRQYHSYFETSYKPSEYEERDQNQYLSDAKRLKHMADKETDPIKQCMLYLEAVLYFLLTGNAMEHESVTEKAAFTMYKDTLSLIKYISSKFRNQQNASSVYNKLAVLSYRCQALLYYKLFKLRKQESKDIQKTITEFCSNRNAAIPQEQQPQQQGGQGTPSPLSPTPSPAGSVGSVGSQSSGYRSGELEARGNNLPVSSTHAPCTSGVWVPLPVYNAMAKQNHQFTYLLSYQDLWDTADNLVVKGKHTDFFIELDRQCKPLTMHSSLIDLVRHVKEGINRLKNQS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -