Basic Information

Insect: Eupristina verticillata
Gene Symbol: lilli_1
Assembly: None
Location: GWHALOE00000424:202702-282207[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 2.4e-06 0.029 13.0 0.1 44 129 51 137 41 147 0.65

2 7 3.8e-09 4.5e-05 22.3 0.8 324 381 205 263 192 272 0.88

3 7 1 1.2e+04 -9.1 30.6 448 503 279 342 264 357 0.45

4 7 1 1.2e+04 -6.1 13.1 433 503 374 442 356 448 0.51

5 7 0.57 6.8e+03 -4.7 17.7 423 503 559 666 533 672 0.71

6 7 1 1.2e+04 -8.1 13.0 192 246 948 999 814 1023 0.48

7 7 0.5 6e+03 -4.5 9.2 200 246 953 999 871 1067 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	2.4e-06	0.029	13.0	0.1	44	129	51	137	41	147	0.65
2	7	3.8e-09	4.5e-05	22.3	0.8	324	381	205	263	192	272	0.88
3	7	1	1.2e+04	-9.1	30.6	448	503	279	342	264	357	0.45
4	7	1	1.2e+04	-6.1	13.1	433	503	374	442	356	448	0.51
5	7	0.57	6.8e+03	-4.7	17.7	423	503	559	666	533	672	0.71
6	7	1	1.2e+04	-8.1	13.0	192	246	948	999	814	1023	0.48
7	7	0.5	6e+03	-4.5	9.2	200	246	953	999	871	1067	0.52

Sequence Information

Coding Sequence: ATGTTTGAATATGTACGTGAGACACTTAAAAAAGTTTTGTTTTACCCCATTTTCTCTTTTTTTCCCTGCAAGCTTGCCTTCTACATAATAATAATACCGAATACAGAGCACAAGAATAATGAATATAAATTTGTAAACCCGGACGCCCACGACCGCACAACCCAGCAGATCCAGTCGAAACTTGGCAACTATTCGCTGGTGAAGCACTTGCTGGACGAACCAAAGCGACTGATCGGCATCGAGGGCGTGCCTGCAAGTCCAGCCCCGGTGAGCTCTGGACATCCGCGGTTGCCCTCGAGTCGGAGTTCGCCCTCCGCTGCCCAGGAGTTCAAGAAACCCGGTGGCCCGCGCTCTTCCTCGGTGGTAGCACCAACACCGACGGCCACTTCCACGTCCACAGCCTCCTCGCAGCGTGGCGGCTTCCTGAAACCCGCCGACGGGAAGCCGCCGTACGGGGGACGAGGCGGATACCCGGGCCAGCCAGTCAAGCATGCGGGGAGCAGCGGCGATCACCGAAGCCACGGCCTCATTCCGGCCAAGGGTCCACCGGTCCCCCTAGGATCGGGGCCTACGGCCTCACCTGGATCCGGCATCCAGAGCAGGTTGCACACGGCCAGTGTCAGGTTGCCCAAGCTCCCCATCGATGCTGGATCGAGTTCCAGACATTTGAGTGCCGATAGTACTGCAGAGGTAGAAACCATCTTAAAGGAGATGACTATGCCTCCAACGCCTTTAACCGCAATAGCTCAAACTCCCAGAAAAGAATTGGAATCCAAATTTACTTTTAATCCTGTCCTCGCCAAGCTCACAGAAGTTCCACCCCAGGAAGCCGTGAAGCCTCGAGAAGCGCCAGTGAGTTCGGGCAGTGCCTCCTCGTCCTCGGACTCGGGCTCGGAGTCGGGCTCGGATAGCAGCGACGACTCGGAAGACTCCCCGAGCACGGGCCCAAGGCAGAGTTCCAAGGGACCGGCTACGCCTCCTTCCCACTCACCGAGCGAGGTCCTGGAGGAACCGCCCCCGCCTGCGGTCGAGGAGTCCAAGCCTCGCTGGAACCTGAGCTCGTTCTTCAACAAGGCTGAGCAACCGGAGACTCAGCTTGGGCGTAAAAAGGAGGAAATCCGCAGCGAACCCGAACCTCAACCGGAGCGGCGCTCCTCGAGACACTCGCAGCACCATGACTGGGAGCTCGATGAAGCCCTCAAGCACAACAGGTCCAGCCAGATGCTCAGCAGCCACAGCGATAACGAGCAACAGAGCGATACCGACAAGGATCCGAGCAAAGACCAACCGCTAAGGACGCAGAAAGATAAGCCGAAACCACCGGACGTACGCAAACGAGGCCGACCCCGTAAAACGGACAAAAGCCCAAAGGATCTTGGAACCGGTACTACGACAAGTTTGACGGTGCCTGTCGAGGAACCCAAAATCCCAGCAAAACGCAATCGGCAACGCAGCAGCCAGGCGTCCACTGGTAGTCCCCCACGTCGGGCTAAGAAGCAGCCGATCTCCAAACCCGTCCTGACCACGACAACCAGCGACGACGGAAGCGATGGGCATCATTATAGTGATTCGGATTCGGAGCCTCCACCCCTTCTGCCTTCAACCCATAACAGGCGACCAGTGGGCTCACCCATCACCGAAGCCAGGCATCATCGACCTCGACTCAGCGTCTCTTCGAGCGACGATGACGATGACGAGGATGACGACGACGAGGACGACGAAGAAATCGAAAGGCAACGCAGACGAGGCAAGAGGCCACACGAGGATGACGCACCCTGGAGCAGACTGTCTTCAATAAAAAGAAGTAGCAAGCTGAGCGAGTCACCGAAAAAAGTCGCAGAAAAGAAAAAGAGTCCACCGAAACTGAAACCGAGGAGGCAGAGGTCTCGAGTCACCAGTGCCCCGGAATGTCCGTCGGAGTCTGACAGTGAATCCGAGGTGGCGTTGAGGACCAATCGGAAGGTCGCACGAGTACAACCGAGGCCCCGGGCGCCGCCGACGCGCACCACGAGCCCTGAGAACTCGGACAGCGACAACAGCCCAGCCTCGGTAAAGGTGCAAGAGGAAGGCGGTGCCACGGTCCAGGATAACAAGAAGAGTGCTCTGCGCCGATTGTTCGTGGATTCGCGCGCTAAGGGTGGAAAGGGGGGAAAAGGGGGCAAGGGTGGAAAGGGCGGCGGCAAGTGTGGTATTTACGTAGAGGAGTACACGTCCAATACGCCCACGGGAAGCGAGAGCCCGTACAAGCGTCCCTCACCCGTGGTTGTAACGGCTGCAGCTGTCCAGCCGGTCGTTCTCGATCGCCAGGAAGAGAAGAGGCTCGGACTCCCCGCGCTCACCTACGTCAATGGCATGCCTAGGCTTGTCTGTAGACTCGACCTCAGCAGGCTGGGACACATACCTAAGCCTGTGAGGGGCCAGGAGATCAGACAAAGAACTGAGATGCCTGACACCAGGCCGACTTCAAGGCAACAGTCAAATGGGTTGTCAGCACAGAGTCAATCACAGAGGCCTTCAACCCCAGAGGAGGGCGAGATCGTTGAGTCACGTAGTACAGCCGGTAGCATACCTATATCGGGAGGTACAATTGCCGAAGACAGCGACTCTGCGACGACGACCCTCATCAAGGGGACCGGCGTGGGTGCAGGTTCTGGGAGTAGCGTGGGTGCCAGTAATAATATCCGCAGCGGTTTAAAGAGTGAGAGTATGGATGTAAAGTCCATTGATACGAAACCAATCACGATTGCAACTGAGGGTACTGGTAGTGGAAACAGCATCGGTACCAAGGCCAGCATCCACGGGGATGCGTGTGAGGTGGCGACTGCTGGTAGCGGCGTAAAGAGAAAACGCAAGGAGAGCTGCAGTTCAGTGTCAAGTCTTAGTACTGTGTGTTCGCTTGACACCAAAGTCAAGGTCGAGTCTAAGGAAGAGAAAAAGAAGCGCAAAAGGAAACATCAGGACCAAGAGAGTCTAGTCAGGTTCTCGACGAGTCAGCACAATGACGCACAACCAACAAATCATGAACGGGAAGAGAAGCCTGACATAAATCTGTTACCACCACCACCACAGCGAATATTTTATTCCTATTTTTATATGCAAAACGATGTATCGGAAGACTTGGACAGTTATCAGGAGCAGTACTTGGCCGAAGCAAAGCGATTAAAGCATAGTGCCGATGAAGAAAGCGATGTGACGACGCAGGGGTTGCTTTACCTCGAAGGCGCCATTTACTTTATCCTGACAGGACAGGCCATGGAATCGGCTCACATGTCCGAACGAGCTGCCTACAGGATGTACAAGGATACACTTTCTATTATCAAATTTATAGCAACGAAATTTCAAGTGCAACCAAATAACTCGGTCGAAAGTAATATACACATTAAGCTGCTTATATTGAGTTTATGGTGCCAGTCTCTTATCTACCAAAAGCTTTTCAATCTAAAGAAAGCTGAAATAAAGGAAAATCATTTACTCTTAGCCGAGTATCATCAAAAGCAGGTGTTGGTGCAGCCAGAGGGTCAAGGTACCCCATCTCTCTCTCCGACACCGTCGCCGGCTGGCTCCGTAGGCTCGGTCGGAAGTCAAAGCAGCGGATACAGCAGCGGGGAGTTGGCCAACCGTGGTCTCGCCAATGGCCAGGCTCCGGTCCCGACCTACGTCAGTGTACCGCTCAGCGTCCACAATGCCATGCAGAAGCAGCACAACGACATGGGGATGCTGATGAGCTCGCACGAGAAGTGGGACAAGGCCTGCGCCCTTGTCACAGACAAGCATAGAGACTTTTTCATCGAACTGGATGAAACTCTGGGACCCCTAACTCCGAAGAGCTCACTCACAGATTTGGCACGTTACGTGCAGGCCGGCATCAAAAAATTACGTGCTCTTTGA
Protein Sequence: MFEYVRETLKKVLFYPIFSFFPCKLAFYIIIIPNTEHKNNEYKFVNPDAHDRTTQQIQSKLGNYSLVKHLLDEPKRLIGIEGVPASPAPVSSGHPRLPSSRSSPSAAQEFKKPGGPRSSSVVAPTPTATSTSTASSQRGGFLKPADGKPPYGGRGGYPGQPVKHAGSSGDHRSHGLIPAKGPPVPLGSGPTASPGSGIQSRLHTASVRLPKLPIDAGSSSRHLSADSTAEVETILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVPPQEAVKPREAPVSSGSASSSSDSGSESGSDSSDDSEDSPSTGPRQSSKGPATPPSHSPSEVLEEPPPPAVEESKPRWNLSSFFNKAEQPETQLGRKKEEIRSEPEPQPERRSSRHSQHHDWELDEALKHNRSSQMLSSHSDNEQQSDTDKDPSKDQPLRTQKDKPKPPDVRKRGRPRKTDKSPKDLGTGTTTSLTVPVEEPKIPAKRNRQRSSQASTGSPPRRAKKQPISKPVLTTTTSDDGSDGHHYSDSDSEPPPLLPSTHNRRPVGSPITEARHHRPRLSVSSSDDDDDEDDDDEDDEEIERQRRRGKRPHEDDAPWSRLSSIKRSSKLSESPKKVAEKKKSPPKLKPRRQRSRVTSAPECPSESDSESEVALRTNRKVARVQPRPRAPPTRTTSPENSDSDNSPASVKVQEEGGATVQDNKKSALRRLFVDSRAKGGKGGKGGKGGKGGGKCGIYVEEYTSNTPTGSESPYKRPSPVVVTAAAVQPVVLDRQEEKRLGLPALTYVNGMPRLVCRLDLSRLGHIPKPVRGQEIRQRTEMPDTRPTSRQQSNGLSAQSQSQRPSTPEEGEIVESRSTAGSIPISGGTIAEDSDSATTTLIKGTGVGAGSGSSVGASNNIRSGLKSESMDVKSIDTKPITIATEGTGSGNSIGTKASIHGDACEVATAGSGVKRKRKESCSSVSSLSTVCSLDTKVKVESKEEKKKRKRKHQDQESLVRFSTSQHNDAQPTNHEREEKPDINLLPPPPQRIFYSYFYMQNDVSEDLDSYQEQYLAEAKRLKHSADEESDVTTQGLLYLEGAIYFILTGQAMESAHMSERAAYRMYKDTLSIIKFIATKFQVQPNNSVESNIHIKLLILSLWCQSLIYQKLFNLKKAEIKENHLLLAEYHQKQVLVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGLANGQAPVPTYVSVPLSVHNAMQKQHNDMGMLMSSHEKWDKACALVTDKHRDFFIELDETLGPLTPKSSLTDLARYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -