Basic Information

Insect: Onthophagus taurus
Gene Symbol: lilli_1
Assembly: GCA_000648695.2
Location: NW:2638905-2839129[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 1.2e-05 0.16 10.8 18.1 4 160 22 186 20 195 0.57

2 6 7.5e-15 1e-10 41.1 22.1 341 504 273 445 231 461 0.75

3 6 0.7 9.7e+03 -5.0 11.5 89 222 547 671 496 689 0.49

4 6 1 1.4e+04 -16.0 32.8 125 242 701 823 678 841 0.31

5 6 1 1.4e+04 -8.3 27.1 75 213 878 1003 861 1048 0.33

6 6 1 1.4e+04 -5.5 14.5 87 193 1033 1126 1006 1143 0.34

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	1.2e-05	0.16	10.8	18.1	4	160	22	186	20	195	0.57
2	6	7.5e-15	1e-10	41.1	22.1	341	504	273	445	231	461	0.75
3	6	0.7	9.7e+03	-5.0	11.5	89	222	547	671	496	689	0.49
4	6	1	1.4e+04	-16.0	32.8	125	242	701	823	678	841	0.31
5	6	1	1.4e+04	-8.3	27.1	75	213	878	1003	861	1048	0.33
6	6	1	1.4e+04	-5.5	14.5	87	193	1033	1126	1006	1143	0.34

Sequence Information

Coding Sequence: ATGGTAGGAGGCGGTTACAATGCGCGATACAACCCCATGATAAAAGGGACGTTGTCTAGtgTGGATAGGGACAGGCTCCGTGAGCGTCAACGTCAAGCAAGGGCTCAAATGTCCTCGCAGGTTGCCGAACAGGATGGTGGACCAGGTGGACAGCCCCTTTTCGGAGCTCCAGTCCGGgTAAATCCATCCTCAAGCGATccattaacacaaaaaataatcagCAAATTTGGCGAATACCAACGAGTGGTACCATATGTGGAAAGTACCTTATTAAAAGGAGGTGGGGCGTTGCTCACGGGTATTCTATCGACCCCTATGATagaaaattcacaaaaaagcCCCGTCGGAACCACAAACTCGGTTTCCTCATCTTCGCCATCTTCATCTTCAAGACCTAATCAACAGCAACAACAACACCAAAGTTCCTCATCCTCTTCCACGTCCTCTTCAAATCCGCCGGTTTCATCGCGACTCCAACCTCCACCTGAATTCAAGAAGCCGCAGCAACAAAGCAATAGCCGACCACCTCCTCCAAGTCATCATCAACAAACGCACCAACGAGGTGGGGTTTTTATTAAACCTTCGGATGGAAAACCACCATATGAAGGACGGGGTGGATACCCTGGACAACCTGGAAAACATGGGAATGGAAACCATCGGTCTAACGGGATACATCCACCGAAAGGACCTCCCAATGGGGGGAATGGGAGTTCTACGTCACCGATGCCTTCCAATCGCCTGCACAATGTAGCACGTACTTTACCGAGGATACCTCTCGATCAgCACCATTTGTCGAGTAGTAGAGATGAAAGATCGTCAAATCCACGTGGTTCCGAAGAAGTTCAAAGTATATTTAAGgaaatgatcgacaatcgGCCGCCAGTAACCGCAATAGCAGCAACGCCACGTAATAACGACcaagaaaaatttcttttccatCACACTaagccTCAGGAAATATCAGTTCCAACATCATCGTCTTCAACATCAAATCAAAAACGTTTGGATAGGCCACAAACAGCTCGTGAATCGGcGGGTTTGCAGAGCGACCTCGAGATATCGGATAGCGATGATGAGCAGAAGAGGAGGGGTATTCTTCATCCGCACAAACCTATTATAAGaaTGTTATCACCAATTGCACAAACACCAGCTCCTCATTCTTCATCCAGTATGCACCAAGACATACCTGATCCACAAGAAGTTCGTTCTCCTCAAGGAACATCAAGTGGTTCGGATTCATCGGGTTCGGATAGCGATTCGAGTAGTGATGATTCTTTGGATGAAGTGGCGCCGTCCCTAAAACACTCGCCTCCTCCACCTGAACCAAAAGTTGAAGAGGAAAAGGAGGGTCGGTACACGTGGAATTTAAGCTCTTATTTACCACAACCAAACAACCCTCAACTCGGCCGAAGAACGGGGCAAAGTCCAAATCAACCGAGTCCAAATAATGCTGAATCGGATGATGaagaaatggttaaaaatttagatataaaaGAGGTGATAAATGAAGTGAGGACGGTACCGTTATTGGCTAATTTATCCGATACGGATGAAAGTgataaattaagtaataataataatgttaatagtgggaatgttaaaaagaaaagtggTTTGGTGGTGTTAAGTGATAATAGTGACAGTGAAAATGATACGGGGAGGACACCGAAGGTAAAACCGTCGAATCGAGCGACGGTTAGGGCTAAATTGATCGATAGTGATTCCTCAGAAAAAGAGGAAGTGATTGATAAAGAAGCTGAAGTACGGACTAGTACTGTTCAGTTACCGAAAAATAATAACGCGGTTGAATCTTCACCAAGCAAAAAACAACGAGGTAGACCGAAAAAGAACGTAGATAACAATGTTGTGGGTAGTAAACCGAAAAGAGGGCGACCCCCTAAAACACCTGCTGATTTAAGCGGATCTGAAAAGAAGAGAGGAAGACCACCATCAAAACCAAAACCACCTCTATCTCCATACAGTTCCGACGACGATGATAACAGCAATAAACCACCAAATCAAGTGTTTGGAAAACCTCATCCTGGGAGAAGAAGAAGGAAAGATTCTAGAGGTATATCAAACAGTTCATCGGATGAAAGTTATTatcacaataaaaaagaatcctCAAGAAAAACGCAAAAATCCTCAAATTATTCCGATAGCGATGAAGAGGTTGAAAATCGTAATCGGGCgcctttaaaagaaaatcaatcgTTACGAAATCAAAAACATATAGAATCTCAAAAGAAGAAACGTTCGGTACCGAAAAAACCACCGAAAAGTGATGCGATTGTAAAAACATCGGATTCGGATAGCGATTCGGATGTAACCAATAAATCGTTACCGAAAAAATTACCACCTCAGCGAAGTAACCGTACGATAAGTTCGAGTAGTGATAGCGATGACTCAAGAAGAAGTGATTCTTCAGATCGTGaacgaaaaaatattaaattagacATCGATTCAAACACAGTtcaagataaaaagaaaagtgatACGATAAGAAAACTCTTTCAACCGCCGAAAGGTGGTGGAAAAGGTGGCGGGAAAGGTGGTAAAGGTGGAAAAGGCGGTAAAGGAGGTGTTGAGGTGATAATCAAAGATGAAACGTACCAAAGGAGCAGTTCGTCGGTTGAAGACGAAATTGTCCCAATTAGgaccaataataataataacaattctaCAGAAACTAAAACGACCACAAAGACTGAGTTAccagaaaaatcaaaaacattaattaaacgaTTACCCGTACGCATCGAATTGAGCCGTTTAAGCAACTTAAccaaacaattaattaataagaaaaaatctgaagaattaagaaaatggTCTTCGTTATCAAACACCAGGCAACAGCAGccgcaacaacaacaacatcaacaacaaaatcaatCCAACCAAAATAATAACTCCAATAATAATAGCAACAACACCACCTTTGAGTTACCGAACGataataattctaataattCAAGACAATCGAGTACCTTAATTCAAAGTGATTGTGATCGACggactaaaaatttaaatgaaaatacaaatgataaatttaaaaaaatcccatTGGCGACGAAACCTCccgtttataataataaaatcaacgaGAATAGTGATGTTGAATCGACGAAAAAGTCGTCGTCGTGGAAGATGGATTTGCTAGAACCGATGGaccaaaaaatcaaaaaacgtAAACGGCACAATAGCAGTAGCTCATCGCTATCGACGACGAGCAATTTATCGCACAATAGTAGTGGGAGACGAAGAGATAAAGTCGATCATAAAAGTAAACGAAGAAAAGAGGAATGTATTAGTAGATCTCAGGATACATATCATCAAATCGGCAACGCTCCTTCGTCAAACCACGAAATGGAAGAGTACAAAATGAATATTCACGATTTGGGTGGTGATAGTCATGAGGAAAGGAATTGGCCACATCGATCTAGGGGGGAATATAATCCTTATTTTGAACCGCCAGACGAGGAAGATTCAGATAGggataaagatcgatttttaaatgaagctaaaagattgaAACATCTCGCTGATAGTGAAGCGGATGCTATACAACAATGTATGTTGTATTTAGAAGCAATACTTTACTTTATTCTAACCGGAAACGCCATGGAACAAGAAGCCCAATCGGACACCGCTGCCTTTACAATGTACAAAGATAcccttaatttaattaagtatatatcatcaaaatttaagaacCAACAAAATCCGTCGTTGACTGGGACCAAATTAGTTGCTTTAAGtttacgGTGCCAAGCACTGTTATACTACAAACTATACAAAATACGTGCTCAGGACGTAAAAGAAACTGAACGTCAAATATGGGAATTCCTGCAGAAGGTAAAACGCGACTCTAACCCTTTCTACACGATCTCAATGTCGAATACTGTGTGCCACCAGAACTCCGGGGCATTGGTGCACGCAGATGCGGCTTCCGTTGCTGTTCCTTCATCGACTGGCGGCGGTGGCCACGGTGGCGGTCAAGGGACGCCTTCACCTCTTTCACCGACGCCGTCACCGGCGAGCAGCATAGGAAGTGTCGGGGGTAGCAGTCAATCCTCCGGATATAGCAGCGGGGAATTAGCGGGACCGCCGCGGCATCATCACCATCCTGTGGTCGCTCCTGTACCACCTCAACAAGGAGGTGTTGGTCCACAACAACCCACTGTGGGACCACCACAACCAGCCCCAACGCCTTGTGTGCTAGTTCCTTTACCTATTTATACgttgattcaaaaacaaaCGCAGAATATttcgtattttattaattatcaagATTTATGGGAACAGGCTGAAGAACTTACTAAAAAACATCATTtagatatttttcatcatttggATCGGACATATAAGCCTTTATCGCTACATAGTTCTTTATCGGATTTGGTGGCGTATATGCAAGCTGggattaaatttgttagagAAGAGAATCGAAATAGTACGAATTATAGtcgataa
Protein Sequence: MVGGGYNARYNPMIKGTLSSVDRDRLRERQRQARAQMSSQVAEQDGGPGGQPLFGAPVRVNPSSSDPLTQKIISKFGEYQRVVPYVESTLLKGGGALLTGILSTPMIENSQKSPVGTTNSVSSSSPSSSSRPNQQQQQHQSSSSSSTSSSNPPVSSRLQPPPEFKKPQQQSNSRPPPPSHHQQTHQRGGVFIKPSDGKPPYEGRGGYPGQPGKHGNGNHRSNGIHPPKGPPNGGNGSSTSPMPSNRLHNVARTLPRIPLDQHHLSSSRDERSSNPRGSEEVQSIFKEMIDNRPPVTAIAATPRNNDQEKFLFHHTKPQEISVPTSSSSTSNQKRLDRPQTARESAGLQSDLEISDSDDEQKRRGILHPHKPIIRMLSPIAQTPAPHSSSSMHQDIPDPQEVRSPQGTSSGSDSSGSDSDSSSDDSLDEVAPSLKHSPPPPEPKVEEEKEGRYTWNLSSYLPQPNNPQLGRRTGQSPNQPSPNNAESDDEEMVKNLDIKEVINEVRTVPLLANLSDTDESDKLSNNNNVNSGNVKKKSGLVVLSDNSDSENDTGRTPKVKPSNRATVRAKLIDSDSSEKEEVIDKEAEVRTSTVQLPKNNNAVESSPSKKQRGRPKKNVDNNVVGSKPKRGRPPKTPADLSGSEKKRGRPPSKPKPPLSPYSSDDDDNSNKPPNQVFGKPHPGRRRRKDSRGISNSSSDESYYHNKKESSRKTQKSSNYSDSDEEVENRNRAPLKENQSLRNQKHIESQKKKRSVPKKPPKSDAIVKTSDSDSDSDVTNKSLPKKLPPQRSNRTISSSSDSDDSRRSDSSDRERKNIKLDIDSNTVQDKKKSDTIRKLFQPPKGGGKGGGKGGKGGKGGKGGVEVIIKDETYQRSSSSVEDEIVPIRTNNNNNNSTETKTTTKTELPEKSKTLIKRLPVRIELSRLSNLTKQLINKKKSEELRKWSSLSNTRQQQPQQQQHQQQNQSNQNNNSNNNSNNTTFELPNDNNSNNSRQSSTLIQSDCDRRTKNLNENTNDKFKKIPLATKPPVYNNKINENSDVESTKKSSSWKMDLLEPMDQKIKKRKRHNSSSSSLSTTSNLSHNSSGRRRDKVDHKSKRRKEECISRSQDTYHQIGNAPSSNHEMEEYKMNIHDLGGDSHEERNWPHRSRGEYNPYFEPPDEEDSDRDKDRFLNEAKRLKHLADSEADAIQQCMLYLEAILYFILTGNAMEQEAQSDTAAFTMYKDTLNLIKYISSKFKNQQNPSLTGTKLVALSLRCQALLYYKLYKIRAQDVKETERQIWEFLQKVKRDSNPFYTISMSNTVCHQNSGALVHADAASVAVPSSTGGGGHGGGQGTPSPLSPTPSPASSIGSVGGSSQSSGYSSGELAGPPRHHHHPVVAPVPPQQGGVGPQQPTVGPPQPAPTPCVLVPLPIYTLIQKQTQNISYFINYQDLWEQAEELTKKHHLDIFHHLDRTYKPLSLHSSLSDLVAYMQAGIKFVREENRNSTNYSR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -