Basic Information

Insect: Hycleus cichorii
Gene Symbol: lilli_1
Assembly: GCA_013841215.1
Location: JACDRQ010000071.1:176069-202644[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 3.7e-10 4.7e-06 25.6 12.8 4 227 12 227 10 240 0.55

2 11 2.9e-12 3.6e-08 32.6 15.6 349 493 250 406 237 413 0.66

3 11 0.65 8.3e+03 -4.9 9.6 135 254 463 591 403 603 0.36

4 11 1 1.3e+04 -9.9 18.7 106 244 538 673 474 693 0.45

5 11 1 1.3e+04 -7.1 18.8 67 233 581 742 579 753 0.44

6 11 0.34 4.3e+03 -3.9 31.6 394 493 697 795 682 799 0.66

7 11 0.052 6.6e+02 -1.2 10.4 446 486 803 841 798 855 0.65

8 11 1 1.3e+04 -8.4 19.6 164 260 906 1007 847 1015 0.38

9 11 0.17 2.2e+03 -3.0 6.3 106 244 1004 1137 995 1152 0.36

10 11 1 1.3e+04 -5.9 26.3 91 229 1185 1320 1153 1347 0.33

11 11 0.17 2.2e+03 -3.0 1.0 212 491 1529 1556 1485 1598 0.51

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	3.7e-10	4.7e-06	25.6	12.8	4	227	12	227	10	240	0.55
2	11	2.9e-12	3.6e-08	32.6	15.6	349	493	250	406	237	413	0.66
3	11	0.65	8.3e+03	-4.9	9.6	135	254	463	591	403	603	0.36
4	11	1	1.3e+04	-9.9	18.7	106	244	538	673	474	693	0.45
5	11	1	1.3e+04	-7.1	18.8	67	233	581	742	579	753	0.44
6	11	0.34	4.3e+03	-3.9	31.6	394	493	697	795	682	799	0.66
7	11	0.052	6.6e+02	-1.2	10.4	446	486	803	841	798	855	0.65
8	11	1	1.3e+04	-8.4	19.6	164	260	906	1007	847	1015	0.38
9	11	0.17	2.2e+03	-3.0	6.3	106	244	1004	1137	995	1152	0.36
10	11	1	1.3e+04	-5.9	26.3	91	229	1185	1320	1153	1347	0.33
11	11	0.17	2.2e+03	-3.0	1.0	212	491	1529	1556	1485	1598	0.51

Sequence Information

Coding Sequence: ATGGAGGCTTTAAGACATTATCCGGATAGTGTGGAGAGAGACCGCCTGCGAGAGCGGGAAAGACAGGCCCGGGCCCAGATGTCTTCTTCACAAGTTGAAGAACAAGAATATCATCTGTTTGGTGCACCCTTTAGGGTGAACCCGTCGTCGACGGACCCTGTCACGCAGGACATCCAGAGCAAGTTAGGGGATTTCCAACGATTGAAACCATTTCTTGATCAAAAAGAATTAATTGGTGTTGATGGAGTCCCACCAAGTCCTGGGGTGCCTTCTTCTTCTACTGCATCTTTATCATCACGTCATCATTTATTCTCCTCTTCATCATCCGGGGCCAATTCCAGATTACATCCATCACCAGAAGCACGGCCTGAATTTAAAAAACCACACCATCATCACATACATCATTCTACCTCTTCGACATCATCGTCACATCAACGTGGTGGTTATGTGAAACCGACTGATGGTAAACCACCATATGAGGGACGTGGTGGTTATCCTGGTCAACCAGTCAAACATGGTAGTGGTATAACAAATCATAGGTCAAATGGTATTTTGCCAGCAAAAGGACCACCTCCATCATCGCCAAATTCTTCTACTACTACTACTTCGTCTACTTCCTCAACGTCAAGAGTGCATTCAAATACGTCTTCAAGGAATCAGTCTCGTATTTCTCATGAACAAAATCAGGGTGCTTTACCTACGGCTGGTCCGAGGGAAATTTTACCTTCCGCTACACCTAATCCTGATATGGAAAATATCTTCAAGGAGATGATTGAAGTCCGACCACCACTCACTGCCATCGCTGCAACACCTAGAATAGAACCAGATAATAAGTTTACCTTCAATCCTGTATTGAGCAAGTTGACTGATACGATACCAACACCATCCACACCAAAAAAACGTGAACGGACGACATCATCGAATGTTAGACAGTCAACTGATTTAAGAGATGATCTCAACTTATCTGATGATAGTGATGATGAACAAAAACGTGAATCTCTACTACAATCTTCCAAGTTACCAATAGAAAATACAAGAATGTTATCTCCATTGGGATCAGAATCAATAAATGTAGCAACAACGACGACGACGGCAACAACAACAACAACGGCAGCTATATCTAATGGTGGTGGTAGTTCATCTAGTGATTCGTGTTCAGATTCGGGTACAGAGAGTGAAACAAGTAGTGATGATTCGATTGAAGAGAATGTTTCATCATCAAATTCAACAACATTGAAACAAACTGTTAACGGTGAAATAATCCAACCAATAACAACGACAACAACAACAACATCATCAACACCACCACCACCACCACCACCGCTACCACCGCCATTATTACCACCACAACAAATTGAAGAGAAGAAACGTTGGAATTTAGGTTCCTATATAGATCAAAATAGTGTCAATAATAATAATAATTATAATAATAGCAATAGTAAAATTGATTCAATCAATCAATCTCCAAAAGTGCTGTCACCATTAACATGCGGTAGTAGTAATAGTATGCTTCCATTAAATCATAATCATAATAGAAAACAACGTGGTGGTATTATTGAAGAATCGGATGGTAGTAGTGATTCAATCAAAGATTTAGATAGTGCCGTTGCTGAAGCATTAACATCAACAACAGTACCGTTATTGTCTAGTTTATCAGATTCTGATACCAGTAATGATGATGATGATGATGATATTGATAATGATAATAATGATAAAAATGAGATAAATAAACGTTATAAAAAATCTAATAAACGTACAGTGCCAGTTACCAAAAATGTAATAAATAATAGTGATAGTGAAGATGATAATGATGAAGATGATGGTGATTATGATAGGACGAGTAATAATACTAATAAAAATGATAAAACCAAACATCTGATAAAACCATCACCAAGAACTAAAGTTCCAATTACTAGTGATTCTGATGAAGATCATTACCATCATAAAACTAGTGCTAATAGTGTTAAATTATCAACAACAATAACAACAAGTGAAAAATCTGTGAAACCGAAATCAAATCGTGGTAGACCTCGTAAAAATAAACCAATAGATAATAGTGGTGGTAATAATTCTGATGGTGAAACACGTACGAAAAAACGTGGTCGGCCACCATTAGCAAAGAATCGTCGATCATCACCACCGACAAGTGGATCAGATGTTGAAATGTCTACAAATAATAACAATAATAATACTATAACATCACGTATAAGTAATAATAATAGTAATAATAGTAAAAAACGTGGCCGTCCACCAAAGGCTCGACCATCATCACCACCGAATTGTAGCGGAGGTGGGAGTAGTAGTAGTAGCAGCAGTAACAGTAGTAGTGATGGTGGTAGTAGTAGCAGTAGTAGTAGTGATAGTAGCAGTGATGAAGATGCTAGGGGTGGTGGTGGTTACAATAAAAAACACCATCACCGTCATCAACAACAACAGCAACAATCATCACGTAGACGCAGAATATCAAAAGTTGAAGTTACATCATCAAGTGATAGTGATAGTGAGTCGTGTCATCAAAATTCGCAGAATATCGTTGATAAATATTCTAATAATAACAATAATAATGTAAATTATAGAAAAAATAATAATAATAAACATACATCGCCAAAATCAATAGATGATAATAATGGTAGATTAATGAAAAAATGTAAAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATGGGTGGGCAAACAAAATAAAAATAAATCAAAAATTAACGATCAAGATGGGAAGAAAGCAGAATTATCAAAACGAAAAGATAATTGTAAACGTAAAGTACGCAGAACTTCAATTAGTGCTGCTACTTTGCCTACCACCACCGATAGTGATAGTGAAGTTGCTACTACTACAACTACAACAAATAATAATAATAATAATAATAGAATTAATAATAAATCAAAAATGTATAAAAGTGATAGTGATTCTAATAATCAACATTCAGATGATAGTGATGATTTACATCGTAGAAAATCTGAAACAACAACGACATCAACAACAACAGCTAGTGTAACGAATTTAATTGGTACAAAAGTTGATGAAAACAATTCGGTTAAAGATAAAAAGAAAAGTGATACTTTACGTAAATTATTCACATTAAAACGTACAGATACAGATAGTGGTGGTAAAGGTGGCGGTAAGGGTGGTAAAGGTGGTAAAGGTAAAGGTGGTGTTAATGTTATCTATGCTGATGAAGAGCGAAATAATAATAACAATAATAATAATATTTCATCAATTGAAGATGATACTCCGATATTACCAACAACAAATCCAACGTTATTATCACCAATACCAACTAAAAGTAATGAATTATCAGCAATCAAATCTGCAAAGACTGAATTTAATAGTAATAATAATAATAATAAGAGTAATAAAGAGAATCAATTATCAACAAAACATACAATCAAAATTGCAATTGATTTAACTCGTATTGATATTAATCGTATAAAAAACTTAAAAAAACATTTAGAAGAGGTACGGCATCCTTATTTAAAAGAAATTGATAAGAAACTATGTGCTCCACCGAAACAACAACAATGTCGTGAAAGTGATAACGAAAATATTAATAACAATAATAATACTAATAAATTATGGAAAAATGAAAATAACAACGAATCAATAGAGAATCGTAAAAAATCAAAGAAACGTAAAAGGCGTAATAGTTCAAGTTCTATATCATCGTTATCAACAATTAGTAATATATCGTATAATAATACCATTAGTAACAATAATAGTAATAATAAGAAGAATGATAGTAATAATAGGAAAGATAATAATCATAAAACAAAACGACGGAAAAATGATAGTGGTAATAATCCAATTATTGAATCAACAACAACAACAACAACAACAAATCGATCTCAAATTGATAATTTAACAAAAACACCACCCACAAATCATGATCGGGAAGGTAATAGTAATAATAACAATAATAACACAAATACCACGAATCATAATCATCGACAATTAATGGAGACAAAACCGCAAATAATTCGAGAATATCATTCGTATTTCGAAGAAGAACCCATCGATAGAGAAGAAAGGGATCAAAGTCAGTACCTGAACGATGCAACAAGATTAAAACATTTAGCTGATCGCGAGACTGATACAACAAAACAATGTATGTTATATTTAAGGGCTGTATTATATTTCTTATTAACTGGTAATGCAATGGAGAAAACTAGAGTTACAGAGAATTCATGTTTTACAATGTACAAAGATACACTATCATTAATTAGGTATATTTCATCGAAATTCCGAAATCAAACAAATACATCACCGAAACAAAACAAATTGGCTGTTTTAAGTTATCGTTGTCAAGCTTTACTCTATTATAAATTGTTTAAAATGAAGAAATATGAAGCTAAAGAAACACAGAAGATTATCGGTGAATATTTTAGTAATAAACAAATGCCAACAATACCACCACCAGAACTACATGCACAACCGATAAATGGTTGTAATAATAATACTAATAATAGTGTTGGTGGTGGTGGTGGTGGTCAAGGTACTCCATCACCATTATCACCAACCCCATCGCCGGCTGGTTCTGTTGGTTCCGTTGGTAGTCAATCATCCGGTTATAGTAGTGGTGAATTGGCGGCAGCAGCACGTAGTAGTATCAGCAATAATACTAATAATAATAACAATAATAATAGTAATAATACAGTTCCTGTAGTACCAACACAAGTACATACAACACCAAATACAAGTAATACACCACATATGTGGATACCTTTAAATGTTTATAATGCAATGCATAAACAAAATCAACATTATACATATCTATTGTCGTGTCAAGATTTATGGGATACTGCTGATGCATTGGTTAAAAACGGCGAACATACAGATTTTTTTATCCAATTGGATCGTCGATGTAAACCGTTAACAATGCACAGTTCTCTACAACATTTAGTATTCTATATTCAAGAAGGTATAAAACGACTTAATGAAAGTTAG
Protein Sequence: MEALRHYPDSVERDRLRERERQARAQMSSSQVEEQEYHLFGAPFRVNPSSTDPVTQDIQSKLGDFQRLKPFLDQKELIGVDGVPPSPGVPSSSTASLSSRHHLFSSSSSGANSRLHPSPEARPEFKKPHHHHIHHSTSSTSSSHQRGGYVKPTDGKPPYEGRGGYPGQPVKHGSGITNHRSNGILPAKGPPPSSPNSSTTTTSSTSSTSRVHSNTSSRNQSRISHEQNQGALPTAGPREILPSATPNPDMENIFKEMIEVRPPLTAIAATPRIEPDNKFTFNPVLSKLTDTIPTPSTPKKRERTTSSNVRQSTDLRDDLNLSDDSDDEQKRESLLQSSKLPIENTRMLSPLGSESINVATTTTTATTTTTAAISNGGGSSSSDSCSDSGTESETSSDDSIEENVSSSNSTTLKQTVNGEIIQPITTTTTTTSSTPPPPPPPLPPPLLPPQQIEEKKRWNLGSYIDQNSVNNNNNYNNSNSKIDSINQSPKVLSPLTCGSSNSMLPLNHNHNRKQRGGIIEESDGSSDSIKDLDSAVAEALTSTTVPLLSSLSDSDTSNDDDDDDIDNDNNDKNEINKRYKKSNKRTVPVTKNVINNSDSEDDNDEDDGDYDRTSNNTNKNDKTKHLIKPSPRTKVPITSDSDEDHYHHKTSANSVKLSTTITTSEKSVKPKSNRGRPRKNKPIDNSGGNNSDGETRTKKRGRPPLAKNRRSSPPTSGSDVEMSTNNNNNNTITSRISNNNSNNSKKRGRPPKARPSSPPNCSGGGSSSSSSSNSSSDGGSSSSSSSDSSSDEDARGGGGYNKKHHHRHQQQQQQSSRRRRISKVEVTSSSDSDSESCHQNSQNIVDKYSNNNNNNVNYRKNNNNKHTSPKSIDDNNGRLMKKCKXXXXXXXXXXXXXXXXXWVGKQNKNKSKINDQDGKKAELSKRKDNCKRKVRRTSISAATLPTTTDSDSEVATTTTTTNNNNNNNRINNKSKMYKSDSDSNNQHSDDSDDLHRRKSETTTTSTTTASVTNLIGTKVDENNSVKDKKKSDTLRKLFTLKRTDTDSGGKGGGKGGKGGKGKGGVNVIYADEERNNNNNNNNISSIEDDTPILPTTNPTLLSPIPTKSNELSAIKSAKTEFNSNNNNNKSNKENQLSTKHTIKIAIDLTRIDINRIKNLKKHLEEVRHPYLKEIDKKLCAPPKQQQCRESDNENINNNNNTNKLWKNENNNESIENRKKSKKRKRRNSSSSISSLSTISNISYNNTISNNNSNNKKNDSNNRKDNNHKTKRRKNDSGNNPIIESTTTTTTTNRSQIDNLTKTPPTNHDREGNSNNNNNNTNTTNHNHRQLMETKPQIIREYHSYFEEEPIDREERDQSQYLNDATRLKHLADRETDTTKQCMLYLRAVLYFLLTGNAMEKTRVTENSCFTMYKDTLSLIRYISSKFRNQTNTSPKQNKLAVLSYRCQALLYYKLFKMKKYEAKETQKIIGEYFSNKQMPTIPPPELHAQPINGCNNNTNNSVGGGGGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAAAARSSISNNTNNNNNNNSNNTVPVVPTQVHTTPNTSNTPHMWIPLNVYNAMHKQNQHYTYLLSCQDLWDTADALVKNGEHTDFFIQLDRRCKPLTMHSSLQHLVFYIQEGIKRLNES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01022211;
90% Identity: iTF_00814396;
80% Identity: -