Basic Information

Insect: Anopheles quadriannulatus
Gene Symbol: lilli_1
Assembly: GCA_000349065.1
Location: KB665488.1:743394-799512[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 5.8e-10 7e-06 25.0 2.7 6 160 14 173 9 196 0.66

2 9 0.00012 1.4 7.5 0.0 335 382 230 278 218 295 0.85

3 9 0.077 9.3e+02 -1.8 9.0 436 490 319 369 306 383 0.66

4 9 1 1.2e+04 -9.6 14.4 69 229 423 585 410 622 0.56

5 9 1 1.2e+04 -5.8 10.2 104 228 673 798 661 833 0.30

6 9 1 1.2e+04 -9.8 21.4 435 499 852 912 844 930 0.60

7 9 0.43 5.2e+03 -4.3 3.6 469 479 1055 1065 1012 1081 0.66

8 9 0.62 7.5e+03 -4.8 11.5 117 248 1225 1357 1204 1415 0.51

9 9 0.033 3.9e+02 -0.6 5.3 91 230 1502 1570 1438 1582 0.49

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	5.8e-10	7e-06	25.0	2.7	6	160	14	173	9	196	0.66
2	9	0.00012	1.4	7.5	0.0	335	382	230	278	218	295	0.85
3	9	0.077	9.3e+02	-1.8	9.0	436	490	319	369	306	383	0.66
4	9	1	1.2e+04	-9.6	14.4	69	229	423	585	410	622	0.56
5	9	1	1.2e+04	-5.8	10.2	104	228	673	798	661	833	0.30
6	9	1	1.2e+04	-9.8	21.4	435	499	852	912	844	930	0.60
7	9	0.43	5.2e+03	-4.3	3.6	469	479	1055	1065	1012	1081	0.66
8	9	0.62	7.5e+03	-4.8	11.5	117	248	1225	1357	1204	1415	0.51
9	9	0.033	3.9e+02	-0.6	5.3	91	230	1502	1570	1438	1582	0.49

Sequence Information

Coding Sequence: ATGAACAAATCGCTTTACCCAAGGCACGACGATGAGCATGAAAGGATGGAGCGGAGAGAACGGGATAAACAGGCCCGTGCCCAGCTACAGGCCGAACGGGAACCGGAACCAACAGCCCCACTATTTGCAGCACCAGTTAAAGTGCAAAGTCCATCCGATATGGACATGCACATCGCGAAGCGACTTGGTAACTTCGAGGTAGTTAAGAAACACATCCTGGAACCGTCCACATCGCATCATGTTATCGGAATTGCTCCAACCCCTTCAACGCCATTGCGTTCGTCGAGCGCGATGCCCAGCCTGGTCGCCGGCAGCCACCATCGGTCGCTTCCACCAAAAACCAATAGCAATAGCAGTAGTAGTACCATTAGCAATAGTAATGTCAACTTCGTCAAACCGGCCGACAATCGCTCCGTTTACAATGGACGGCCATCGGGATCGAGCGCAGGATGGAACAATCTACCGGGCCATTATTCGTCCTCTTCTTCATCCTCAGCGGGGTCGTTTAACAAACACGAGGCGCACAACTTCTCATCGAAAGGACCGCCTTCATCCGTTCCACCTTCACTGATGAACGGCCGAACCTCGTCAGCAGCGGGAGGAAGTATCGGCAGCAGCAGCGGTGGGACCGGTGGTCCATCCTTTGGCAGTGATAAGTTACCCTCGCAAATGCCCAACGGTCGACTGTCCCAGGTTGCAAACTCAAAAATGCCTAGAGTAGGCAGCAACGTGGAGAAGATATTGAACGAGATGAAGATCAACGTCATGACGCCGCTGACGGAAATCGGGGCCACACCGCGCAAGGAGTTGGAATCGAAGTTTAACTTCAACAACCCGAGCGCAAACCCGAGGCACGTTTACGCCACCCTGCCTTCAATGTTGGGGCCGCTGAAACCTTTGGCTGGAGGTGCGGGTGGTACCACGAAATCGTCCCTTTCTGGATTGGCGATGCGTCCACTTAGCTCAAATATTGAGGACGATAATCCAAACAATGGCTCGGATAGTGACGACGGTGCAGACGGAGAGTCGAAGAAACGCAATTCTAGTGATACCTCATCGAATGAAAGCGCAGACGAATCATCGAGCGAGGACTCTAACATTGGCAATAAATTGGGAGGAACCGTTCCCGTGACTGGCGGTCCAATGGCTGGAGGAATGAATGGAAATGGTGCCAGCGGAGCAGCAGGAGAAGGAGTGACTGGAGCGGCTGGAACAGGAAATGGAAATGGCAATAGCAGTCCCGTGCGGAGGCCAAGCGATTGGTCACTGCTGAATTTCCTAAAGCAGCCTACCAGCAATAGTCAACAAGTGCCAACAAACGAAAGTGCTCCCCATGTCGGTGGTGGTGCTGTTGGGGATCGCACTAGTGCCCATCACCATCATCAACACCATCACCAAAACTTACACCACACACATGAAGAAAATTCCGTATCATCTCCATTGCGACAGCAGAGATTAAGCGGTTTAAGTGAAGTCGTACAAGGATTCATCGCATCCCCTATTGCGGACGGACGCTCTGCGACGGTTGCACCTGTAAAAAACGAACCTTTGGCGCCGTTGGACGATGACCACCTATCAAACGCGAGCAGTAACGCGAGCAATAGCGAGCTTCCTGCAGGCCAGGGTGTATCTTTGTCCTCCGGTATCAATGCAGGATCCTCATCGTCGTCGTACGTAAAGCAGGAACCGTATCCCAGCGAAAACAGTGCCTCGCCACCCGGAATCAAGAGTGAGCAAAAGGATGACGGTGCCGATCGGTTATCGTTGTCTAGTCCTGCGAAAAGTCCGGAGCTGCAACATCACGTCGGTAACTATAGCCTCCACCATCGCCAACAGCAGCACCTGTTTAACGACAGTGTCGAACAGGTAGATGTGATATGTGCCCTACAGGAAGCCAAAGAGTTTAGCCTGATCAAACCCATCTCGAGCATGTCGGATTCCGATTCGGACGACGCAGAGATACCCTCAATGGTCGGTGGCGACCTTGAGCAACAGCACCGTGTAAATCTCCACCACGTTAACACCCATATGTCCCATCAACCGGATGGGGAACCGGTGGCGGCAGGAAATGGTGTAGTGTTAGCATCAGCGACAGCTAACGCTGTCAAAAAGAAAAAGTGGAAACGGAAGCTTATTGCTGGAACCGGCAATGAGCGTGAAACTCGCGATAGTTCAACAAGCAGTAGCGAAGACGAACGATACGGTGCAGCGCGAAGAAGTCGATCACAGTCCTTTGAGAAGGAAAAGACGCATCTGAAACCGCGGGGTCGGGTGCGTAAAGGACACAGTGGCAATACTCATGGTAGTGGTGGTGGTGGAGGTGGTGGTACTACAAGTGCCGCATCCAGTGCTCGTTATTCAGATGCAGACTCTATAACGAGTGGAGGTGGACACCGGTCAAGCAAAACGTCCTCCCATGGGTCAACACCTACCAAAAAAGGTAGCGCCTCGTCGGCTATAAATTCGCTACCGTACGCTCACGGTGATACTGGAGCTGCGGGTATTATGAGCCCTCCGATTAGCATTCCGTCAGTTGATGGGATCGTCCTGTCGAAAAAAGCAAACTCCCGTAAACCGCGCTCGTCAAAGATTCTCAGCAGCGAAACAGTGCTTTCCACCGAGAGTAGCTCCTCTTCGTCGGGTTCGTCTGCTGAGGAGGACGGAGTAGCATCGTCAGGAGAGTCTGCGGATTCCAATTCTGGCCATGAACGATCTACACCCGCACCAGCTGATCCCGTTGTGCCAGTGACGAAAACGAAGAAGCATAAATCGAAGAAGAAGCTGGACAAAATGGCACCGGCTGACGTTTTGACGAGCAACATATCAGCGGGCAAGGGAAATGGACCGATCACCAACGATGTTTCTATGAAAAATAGACCCATCAATGGAAGCGGCAGTAGTCGGAGTAACAATAACTATCATCTGCACAATCTTTCATCCGACAGCAATGACGAGAGGCCTTCTTTACTAACATCGCCCTTCCAAGACAGTGGTGGAAGGTTAGGAGAAGTTGCAACTAGTGGAAACCTTCCCAAGAAACCACATAAACTATCAATCAGTCAGACATCAGTCGATGAGGAAGAATCCCGTGTGCTCAACTCCAACGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCGCTCTGATTCTCACAGCGATAGTGATAGCGATACTCCAACCAAAAAAGAAAAGAAACAAAATAAAAACAAGAAAGCGGCTCTCTTTGCTCGGGTGTTTATCAACACAGCTGCTGCCAGTGGTGGCAAGGGAAAGGGCGGCAAAGGAAAGGGCGGAAAAGGCAAGGGTCAAGTTTACATTGACCACGTTGATGAGCTGAATCTGGCGAAAAGCAATGGAGCTTCGACGACACCAAACGCTAACAATCAAGCTGGAACAGCAGCTACAGAGATGCGGCGATCGGCACATCAGCACCTCACCGTACCAGGACTGGTGGAAACTTCTCCCAGGCCACCTTCAGCCACAGGAGAGAGTCGACCCAGCAGTCAGGGAATGGCAGTGTTAGCGGCGGCCGTCTCACCTACACTGGACAAGATGCTCTATTCACATACCAGTGGTGCCTTAAGCAACAACAATGTTTCGCTCGTTTGTCGGATCGATCTAAGTCGTTTGTTAAAAATTCCACCGCCACCACCACAGAACCGGCCCCAGTCTGGACTGCGGTCACACGATAACTACAACGCACACCGCAGTGCCTCTTCCGCGCGACAGAAGAGCAAAAGCCCTTACGATCAGCTGCACGGTAAGCGGCGGCGAAGTTCGGTGGGCCAGCAAGACCACCACGATCGCAGTGGCAGCTCAGTGCACAGTTCCTCCTCGACTCCCAGGCTACTGGATGATCGTGTGTCGTATGGTGGAAGCGTTCCCAATCGACTACTGGCGGGTGAATCATCGCCAGTGCTAGAAAATGGAACTATTGGATCCTCCGAACGACACAGAAGCAATTCCATCAACAGTGACCACAGTGGTGCCGCCCAGAAGGCGCGAGATTATCGCGCAGGGCTGGATGCTTCTTACGGAAATAATTCACCTTCGTTGCACCATCGGCATCATCCTCAAACCACCTACACTAACCATCATCAACATCTTGCCAGTCAATCCGACGCTGGACCAAAAGGCGTCGAAAGTGACAAGTACGACGAAAAATTGTTGACAAAATCCGAAAAACTAGGCTACGACGAACAGCGTTTGAAGGAAGACAAGACAACTTCCCTACTTTACGGCAGCAATCGTGGCAGCGGTGGTGGAAAATACTCCAACTATGGGGGAGTGATAAAGCAGGAGAGCAGTACGCCAGCAGCTCAATCATTGATTAAACAGGAGTACAATAGGGACGATTTGTTGACGGATAATAAGCTGGGAAAGCCGACCATGGGACCTACGTTGACAAATGGTACAACAGGAGATGGAGATACGGGAGGCAGTGGACGAATGCGAAAGCGTTCCGTCAGCTCGGGGAGTAACAATACGTACAAGGAGAAGCGCCGGAAAAAGGATAAAACATCCGCCAACTTACAGACTGATCAACTTGACCAACTACCACCAACCAATCACGATCGGTTAGATGAAAGCTCATCGGGAGCAAGTTCAGGTCGTTCAGCGATAGCAATTGAGAGAAACGGACAACAGCATCACAGCAGCACCAATGTTCAAGGGCAACAGCAGCAACAACATCTGACGGTCGGTGCTAATGGGTTTGATTCGGGCATTGCGCCCGTAACAGGCGGTGATATTGGACCACCAGCAGAGGTCCCGGTGCAAATCAAAAAGGTGTATGTGTCGTACTTCGAACGCAACGAGGAAGTACCGGAAATACGGGACCAAAGCCGATTTCTCTCGGAAGCAAAGCGGTTGAAGCACGCGGCCGATCGGGAGGGTGACCATTTAGCACAAGCAATGCTGTACCTGGAAGCCGTACTGTTTTTCCTGCTCACTGGTGACACGATGGAGCGAGACCCGATTACCGAGAAAGCTGCCTTTACGATGTACAAAGATACGCTTTGTTTGATTAAGTTCATTTCGTCTAAATTTCGTAGTCAATTGCAAAATCAAACGATGCAGGGTAACATCCACACAAAGGTGGCGATTCTCAGTTTGCGTTGTCAATCATTGATCTATCTCAAGTTATACAAGATGCGCCGAATGGACATGAAAGAAACGGGCAAGACAATCGGCGAATTTAATCACAAAACCAGCACAGTACCGGCGGAGCTAGCTAATGGTAATACTCCGTCTCCACTGTCGCCCACGTCGGTTGGTTCGCAGAGCTCTGGTTACAGTTCTGGACAAAACAACCACGTTGGATCAATGCCACCGATGAATTCTTCTCCTGCTCAATGCATTATAATGCCAATAAATGTCCATGCAGCGTATCAAAAGCAAACTACGTTGTTTACTCATCTTTCCACTTGTCTCGATCTTTGGGAGCAAGCGGATAGCTTAGTGTCACGCGGGAACCATGTCGAATTTTTCATCGAACTGGATCACGAAAACGGGCCCATGACGCTGCACAGTTCCCTGTACAATGTCGTAAAGTACGTACAAGCTGGGATTCAGAAGCTTCGGCGCATGTAA
Protein Sequence: MNKSLYPRHDDEHERMERRERDKQARAQLQAEREPEPTAPLFAAPVKVQSPSDMDMHIAKRLGNFEVVKKHILEPSTSHHVIGIAPTPSTPLRSSSAMPSLVAGSHHRSLPPKTNSNSSSSTISNSNVNFVKPADNRSVYNGRPSGSSAGWNNLPGHYSSSSSSSAGSFNKHEAHNFSSKGPPSSVPPSLMNGRTSSAAGGSIGSSSGGTGGPSFGSDKLPSQMPNGRLSQVANSKMPRVGSNVEKILNEMKINVMTPLTEIGATPRKELESKFNFNNPSANPRHVYATLPSMLGPLKPLAGGAGGTTKSSLSGLAMRPLSSNIEDDNPNNGSDSDDGADGESKKRNSSDTSSNESADESSSEDSNIGNKLGGTVPVTGGPMAGGMNGNGASGAAGEGVTGAAGTGNGNGNSSPVRRPSDWSLLNFLKQPTSNSQQVPTNESAPHVGGGAVGDRTSAHHHHQHHHQNLHHTHEENSVSSPLRQQRLSGLSEVVQGFIASPIADGRSATVAPVKNEPLAPLDDDHLSNASSNASNSELPAGQGVSLSSGINAGSSSSSYVKQEPYPSENSASPPGIKSEQKDDGADRLSLSSPAKSPELQHHVGNYSLHHRQQQHLFNDSVEQVDVICALQEAKEFSLIKPISSMSDSDSDDAEIPSMVGGDLEQQHRVNLHHVNTHMSHQPDGEPVAAGNGVVLASATANAVKKKKWKRKLIAGTGNERETRDSSTSSSEDERYGAARRSRSQSFEKEKTHLKPRGRVRKGHSGNTHGSGGGGGGGTTSAASSARYSDADSITSGGGHRSSKTSSHGSTPTKKGSASSAINSLPYAHGDTGAAGIMSPPISIPSVDGIVLSKKANSRKPRSSKILSSETVLSTESSSSSSGSSAEEDGVASSGESADSNSGHERSTPAPADPVVPVTKTKKHKSKKKLDKMAPADVLTSNISAGKGNGPITNDVSMKNRPINGSGSSRSNNNYHLHNLSSDSNDERPSLLTSPFQDSGGRLGEVATSGNLPKKPHKLSISQTSVDEEESRVLNSNGXXXXXXXXXXXXXXXXXRSDSHSDSDSDTPTKKEKKQNKNKKAALFARVFINTAAASGGKGKGGKGKGGKGKGQVYIDHVDELNLAKSNGASTTPNANNQAGTAATEMRRSAHQHLTVPGLVETSPRPPSATGESRPSSQGMAVLAAAVSPTLDKMLYSHTSGALSNNNVSLVCRIDLSRLLKIPPPPPQNRPQSGLRSHDNYNAHRSASSARQKSKSPYDQLHGKRRRSSVGQQDHHDRSGSSVHSSSSTPRLLDDRVSYGGSVPNRLLAGESSPVLENGTIGSSERHRSNSINSDHSGAAQKARDYRAGLDASYGNNSPSLHHRHHPQTTYTNHHQHLASQSDAGPKGVESDKYDEKLLTKSEKLGYDEQRLKEDKTTSLLYGSNRGSGGGKYSNYGGVIKQESSTPAAQSLIKQEYNRDDLLTDNKLGKPTMGPTLTNGTTGDGDTGGSGRMRKRSVSSGSNNTYKEKRRKKDKTSANLQTDQLDQLPPTNHDRLDESSSGASSGRSAIAIERNGQQHHSSTNVQGQQQQQHLTVGANGFDSGIAPVTGGDIGPPAEVPVQIKKVYVSYFERNEEVPEIRDQSRFLSEAKRLKHAADREGDHLAQAMLYLEAVLFFLLTGDTMERDPITEKAAFTMYKDTLCLIKFISSKFRSQLQNQTMQGNIHTKVAILSLRCQSLIYLKLYKMRRMDMKETGKTIGEFNHKTSTVPAELANGNTPSPLSPTSVGSQSSGYSSGQNNHVGSMPPMNSSPAQCIIMPINVHAAYQKQTTLFTHLSTCLDLWEQADSLVSRGNHVEFFIELDHENGPMTLHSSLYNVVKYVQAGIQKLRRM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00093446;
90% Identity: iTF_00093446;
80% Identity: -