Basic Information

Insect: Tribolium castaneum
Gene Symbol: lilli_1
Assembly: GCA_000002335.3
Location: NC:5664185-5700650[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 9.9e-05 1.2 7.7 0.7 29 130 8 110 2 193 0.71

2 6 4.4e-12 5.5e-08 32.0 21.7 349 513 211 389 195 390 0.60

3 6 1 1.3e+04 -11.5 18.6 91 215 429 547 398 586 0.44

4 6 0.21 2.7e+03 -3.3 8.6 436 479 570 609 555 626 0.52

5 6 0.0044 56 2.3 12.0 164 250 880 965 845 1035 0.54

6 6 0.15 1.9e+03 -2.7 0.6 193 205 1148 1152 1077 1224 0.49

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	9.9e-05	1.2	7.7	0.7	29	130	8	110	2	193	0.71
2	6	4.4e-12	5.5e-08	32.0	21.7	349	513	211	389	195	390	0.60
3	6	1	1.3e+04	-11.5	18.6	91	215	429	547	398	586	0.44
4	6	0.21	2.7e+03	-3.3	8.6	436	479	570	609	555	626	0.52
5	6	0.0044	56	2.3	12.0	164	250	880	965	845	1035	0.54
6	6	0.15	1.9e+03	-2.7	0.6	193	205	1148	1152	1077	1224	0.49

Sequence Information

Coding Sequence: ATGACTTCGCAAGTGGACGATCAAGGGACCTTTCTGTTTGGAGCACCCGTTAGGGTGAACCCGTCCTCTTCGGACCCCGTCACGCAGCAGATCCAGAGCAAGCTCGGCGACTTCCAGCGACTGCGGCCGTTCCTGGACCAGAAGGACCTCATCGGCGTCGATGGCGTCCCGCCAAGTCCCGGCGTGCCCAACGGGCCGAGCTCGAGGCATAATCCGTTCATGTCGAATCTTGCCTCGGCGGCGGTGTCGTCGAGGCTCCAACCCTCACCAGAATCTCGTCCCGAATTCAAGAAACCACATCACCACCAGATACATCACCAGCATCAAAGAGGCGGATACGTGAAGCCGGCCGACGGGAAGCCGCCCTACGAAGGCAGAGGCGGATATCCAGGTCAACCGGTCAAACACGGCAGCGGCATCACAAATCACAGGTCCAACGGGATCCTTCCGGCGAAGGGTCCGCCCCAGTCGTCGCCGAACTCGTCGGCGCCGCTCTTGCCGTCCAGCAACTCCTCCAGGTTACACAACAGTGGCGCACGCAATCATCCCCGCAATACTACGTTCGAACAGAATCAAGGACCTCCGGCTGGCCCGAGGGAACCTTTGCCTTCCGCTACACCCAATACAGATATGGAGAACATTTTCAAGGAAATGATCGAAGTTCGACGTCCGCTCACTGCCATCGCTGCAACTCCCAGGAAAGAGCCCGATAATAAGTTTACCTTCAGTCCTGTTTTTACCAAGTTGACGGAGTCTACGCCAACGCCGTCTGCACCGAAGAAACGCGAAAAAGTCGCAGCTCCACGCCCGTCAACTGACTTACGAGATGATCTAAATCTGTCAGATGACAGCGATGACGATCAAAAGCAATCTTCCAAGTTACCAGTAGAAAAGATGGTTTCTCCGCTGGGTGCGACTCCGGCCGTTGGTAGTTTCTCCAAGATGGAGTATCCGCCGGAACCGGCAGATCCGGCTGGGTCTTCGTCGAGCGATTCGGGCTCGGATTCGGGATCAGAGAGCGACTCGAGCAGCGACGATTCGGCCGAAGACAACGTGACTTCGTCGAATCCGAGCAAATCAAACGTAGTACCTGCCGAAACGGGACCGTCTTCGCCGCCTCCGCCCGAAGAAAAAGACAAGAAGCGATGGAACCTTGGTTCGTATTTGGTCATCGACCAGAACAACGCCAAAGCGGACTCCGTTCTCTCACCGAAAGTACAAACGTCGCCGCTCACCTCCAGCATGCTCCCTTTGGCCGTCGACAAGAAAAAAGTTACCGAAGAGTCGGACGCCAGTGATTCGACGAAAGATCTAGACAGTGTGGTTGCCGAGGCACTGGCCTCGGCAACGGTGCCCCTCTTGTCGAGTTTCTCCGATTCGGACGATAGTGTGACGGAAAGACGCACGAAAAGACGCAAACATACCATAATACAATCAGTTACCAAAAATTCGGAAAGTGACAGTGACGATGCCGAACGGACGAAAAAACCGAAACCGGTGCGACGTGCCAGTCCTCGGACTAAATCAGTGGATTCGTGTAGTGATTCGGACAATAACAGTGCCAATATTATCAAAAAACGTCTATCACCTTTGCCTCATAAATCGCCCGAACAGTTAGTCAAACCCAAACAGAGTCGCGGACGTCCCAGAAAAATCAAACCGGCTGTGAGTGGATCCGACAAGAAACCGCGAAAAAGGGGACGACCACCAAAACCCCGACCCTCACACCCGAGCAGTTCCGACGAAGAAGACAACGTGGACAAAAGGCCGGTCCGACGGAGAACAATCTCGAAACGTGACGCTTCGAGCAGCTCCGACTCAGACTCACGGTACCGAAAGTACGAATCACCAAAGAAAATCCCAAAACCATTCGAGGACAAAATCAAAAGGCCCGCCATCAAAAACGACTCGGACGACGATTGGGGCAAGAAGAACAAGAACAAACTGAAACCAAGACAGAGGAGCGAGTCGGAAAGCTCCAAGAAGAACGACTCCCCCAAGAAGGAGGTCTTCCGGCGGAAAGGAAGAACGTCAAACCCACATCACAAAAGCGCCGCAACTCTTCCCACAACGACCGATTCGAGCGACAGCGATTCGGGCCCTTCCAAGCGCTTACAACGAAGTCTGAGTTCAAGGAGTCGCAGCCGGTCCTCGGACAGCGACACGAACATTCTAGCCAAATCCCCGGTGAATAAAGTCGAGGAGACGAAACCGATCAAAGACAAAAACAAGAGCGACACTCTACGCAAGCTGTTCACTCCGAAGCGCGACTCCGAGGGCGGCAAAGGGGGCGGCAAAGGCGGCGGCAAGGGCGGGAAAGGCGGCAAGGGCAAGGGGGGCGTCAATGTGATATTCGCCGACGGCGGAAACGAACGCTGCGTTTCGCCCGTCGAAGACGAAACAATGCCGACCATATCAAACCCAACTCTCCTATCACCAATCCCCCACAAGGAGGCCAAACCTCCACTAGCATCCCCTTGCGCCGAACCAATCAAATTCATTAAGACTGAGCCTCTCGATGACGAGAAAATCTCGATGAAAGTCAAAATCGGTCTGAATCGCATCGACTTGAACGCTGTGATTTGCCTCAAAAACAAGCTCGAAGCGCTGAAACATCCCTACTTCCGGGAGTTTGAGAAGAAGAAGCTGAGCGATAATGATAACGAAAGTAAGAAGAAGGATTCGGATTTGGCCGAATTGAAGCACAAGTCGAAGAAGCGAAAGCGGCGGAACAGTTCGAGCTCGATTTCGTCGCTGTCGACGGTCAGCAACTTGTCGCACAGTAGCAAGAAACTGGAGCATCGCAAAGATCGGGAGAATCACAAGATGAAACGGCGAAAAGACGACGAAATCTATCCCAGATCACAAAGTGATAATATCAGTCTGACGAATGCACCACCGACCAATCACGAGCGGGAAGGTAGCAGAAGTCGGCAGGTGATCTCGCCCGTCGACAAAAACAAGTCGCAAAGTACCAGGGAGTATCATTCGTACTTTGAGAAGCCCGACGAGCCCCTAGAGTGCGAAGAGAGAGCTCAAAGTCAGTACCTGAGCGATGCGACTCGTTTGAAGCACTTAGCTGATAAAGAGACTGATACAACAAAACAGTGTATGCTGTACCTGGAGGCTGTACTTTTCTTCTTACTAACGGGCAACGCCATGGAACTCACAAGGGTTACAGAAAACGCCTGTTTCACAATGTATAAAGACACATTATCGTTAATAAGGTACATCACTTCGAAATTTCGAAGTCAACATAACGCGTCTTCGAAGCACAACAAGCTCGCTGTGTTAAGTTATCGGTGCCAAGCGCTTCTTTATTATAAACTATTCAAGATGAAGAAGCACGAAGCGAAGGACTACCAGAAGGTCCTCAGCGAATATTTCAACAACAAGGCCGTTGCGATCCCCCCAGAGCAGCAGACCCAGCAAGGCCAGGGTACACCGTCGCCCATGTCACCGACGCCGTCTCCTGCCGGTTCTGTGGGTTCGGTGGGCAGCCAGTCGTCCGGCTATAGCAGTGGTGAGTTGGCGGCGAGGGGCAGCAACGTGCCGCCACCTGTTCCATCAACGCACGCACAAAGTGGGGGCGCTCACGTGTGGATTCCTCAAAATATTTACAACGCCATGTACAAGCAGAACCAGAATTTCACATATCTTCTGTCTTGTCAGGATCTGTGGGATACGGCCGATGCGCTCGTCATCAAGGGCAAACACACAGATTTCTTTATCGACTTGGATAGGCTGTGCAAGCCTCTGACGATGCACAGCTCGCTGATAGACCTGGTGAGGTACATTCGCGAAGGGATAAAAAGGTTGAATGAGAGTTAG
Protein Sequence: MTSQVDDQGTFLFGAPVRVNPSSSDPVTQQIQSKLGDFQRLRPFLDQKDLIGVDGVPPSPGVPNGPSSRHNPFMSNLASAAVSSRLQPSPESRPEFKKPHHHQIHHQHQRGGYVKPADGKPPYEGRGGYPGQPVKHGSGITNHRSNGILPAKGPPQSSPNSSAPLLPSSNSSRLHNSGARNHPRNTTFEQNQGPPAGPREPLPSATPNTDMENIFKEMIEVRRPLTAIAATPRKEPDNKFTFSPVFTKLTESTPTPSAPKKREKVAAPRPSTDLRDDLNLSDDSDDDQKQSSKLPVEKMVSPLGATPAVGSFSKMEYPPEPADPAGSSSSDSGSDSGSESDSSSDDSAEDNVTSSNPSKSNVVPAETGPSSPPPPEEKDKKRWNLGSYLVIDQNNAKADSVLSPKVQTSPLTSSMLPLAVDKKKVTEESDASDSTKDLDSVVAEALASATVPLLSSFSDSDDSVTERRTKRRKHTIIQSVTKNSESDSDDAERTKKPKPVRRASPRTKSVDSCSDSDNNSANIIKKRLSPLPHKSPEQLVKPKQSRGRPRKIKPAVSGSDKKPRKRGRPPKPRPSHPSSSDEEDNVDKRPVRRRTISKRDASSSSDSDSRYRKYESPKKIPKPFEDKIKRPAIKNDSDDDWGKKNKNKLKPRQRSESESSKKNDSPKKEVFRRKGRTSNPHHKSAATLPTTTDSSDSDSGPSKRLQRSLSSRSRSRSSDSDTNILAKSPVNKVEETKPIKDKNKSDTLRKLFTPKRDSEGGKGGGKGGGKGGKGGKGKGGVNVIFADGGNERCVSPVEDETMPTISNPTLLSPIPHKEAKPPLASPCAEPIKFIKTEPLDDEKISMKVKIGLNRIDLNAVICLKNKLEALKHPYFREFEKKKLSDNDNESKKKDSDLAELKHKSKKRKRRNSSSSISSLSTVSNLSHSSKKLEHRKDRENHKMKRRKDDEIYPRSQSDNISLTNAPPTNHEREGSRSRQVISPVDKNKSQSTREYHSYFEKPDEPLECEERAQSQYLSDATRLKHLADKETDTTKQCMLYLEAVLFFLLTGNAMELTRVTENACFTMYKDTLSLIRYITSKFRSQHNASSKHNKLAVLSYRCQALLYYKLFKMKKHEAKDYQKVLSEYFNNKAVAIPPEQQTQQGQGTPSPMSPTPSPAGSVGSVGSQSSGYSSGELAARGSNVPPPVPSTHAQSGGAHVWIPQNIYNAMYKQNQNFTYLLSCQDLWDTADALVIKGKHTDFFIDLDRLCKPLTMHSSLIDLVRYIREGIKRLNES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00752958;
90% Identity: -
80% Identity: -