Basic Information

Insect: Eufriesea mexicana
Gene Symbol: lilli_1
Assembly: GCA_001483705.1
Location: NW:1387263-1543205[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.089 8.8e+02 -2.0 0.1 4 26 23 45 21 69 0.83

2 10 0.048 4.8e+02 -1.1 4.6 45 81 161 198 158 228 0.58

3 10 1 9.9e+03 -15.1 33.2 441 490 213 261 201 275 0.54

4 10 4.7e-11 4.6e-07 28.6 3.6 344 435 354 442 334 464 0.72

5 10 0.83 8.2e+03 -5.2 29.4 435 498 525 594 507 613 0.49

6 10 1 9.9e+03 -7.5 10.5 69 173 588 693 583 727 0.43

7 10 0.26 2.6e+03 -3.6 6.1 471 495 759 783 715 793 0.63

8 10 0.0014 14 3.9 4.5 424 502 817 893 811 900 0.71

9 10 0.016 1.6e+02 0.4 4.5 196 250 1138 1188 1119 1258 0.57

10 10 0.033 3.2e+02 -0.6 2.0 129 221 1303 1396 1274 1432 0.58

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.089	8.8e+02	-2.0	0.1	4	26	23	45	21	69	0.83
2	10	0.048	4.8e+02	-1.1	4.6	45	81	161	198	158	228	0.58
3	10	1	9.9e+03	-15.1	33.2	441	490	213	261	201	275	0.54
4	10	4.7e-11	4.6e-07	28.6	3.6	344	435	354	442	334	464	0.72
5	10	0.83	8.2e+03	-5.2	29.4	435	498	525	594	507	613	0.49
6	10	1	9.9e+03	-7.5	10.5	69	173	588	693	583	727	0.43
7	10	0.26	2.6e+03	-3.6	6.1	471	495	759	783	715	793	0.63
8	10	0.0014	14	3.9	4.5	424	502	817	893	811	900	0.71
9	10	0.016	1.6e+02	0.4	4.5	196	250	1138	1188	1119	1258	0.57
10	10	0.033	3.2e+02	-0.6	2.0	129	221	1303	1396	1274	1432	0.58

Sequence Information

Coding Sequence: ATGCCGTCGTCCGGTGGATACTATGACGACAGGAATCCTCTGCTCAAGGGCACCTTATCGAGCGTGGACCGGGACCGGCTTCGGGAGCGGGAACGACAGGCCCGCGCGGCGATGTCGGTCCAGGCCGAACAGGCGGCAGCAGGAGGTGGTCCTGATACCAGACACCATCACCATGGCCACCACAACCACGCTCACCATCACGCAAATCCGCACGCCGTCTCCGCTCCGCTCTTCAGCTCTGAATTGATCATCGTGGGTCCATCTTGGACCCTACCACTACCTGGTCACGATACGGGAGGATTCCCTGATcactgctgtctcggtggttttacaAGTTTCGTATGTCTACTGGTTGGTTGCTGTAAAACtggtggatgtttaaacaatttgggcCCTCATGCccatcgtcttaagggtgatttatCGACCtttgctaaggttcacccaagtggtgatCAGGTGAACCCAGACGCCAGAGACAGTACGACGCAGCAAATTCAATTGAAACTAGGCAACTATTCGCTGGTGAAGCATCTGCTGGACGAGCCGAAACGGCTGATCGGCATCGAGGGTGTACCACCGAGCCCAGCCCCGCCCCCGGCGCCCTCGGCCCTTCGAATGAGTTCCAGTTCGGTCGGCTCGAATTCCAGGAGCTCGCCCTCCTCCCAAGAATTCAAGAAACCCGGAGGACCGAGGACCGACGGTTCGTCCTCGTCGTCATCGGCGTCGTCCACATCcacgtcgtcgtcatcgtcgtcgtcgtcgtcgtcgagtcATCAACGCGGCGGTTTCGTGAAACCAGCCGACGGCAAGCCGCCCCACGGAGGCAGGGGTGGTTACCCCGGTCAGCCAGTGAAGCACGGGGGCAACAGCAACGATCATCGGAGCCACGGTTTATTACCCGCCAAAGGACCGCCCACGAATTCACCGGGGAACGGTACGCTCGTTGGCAATTCGAATATCGGGAATTCCAGCGGCAGCAGGCTTCACTGTGTCGGCAGCAGACTGTCCAGGTTACCTCTCGATAACGGAACGAGTTCCTCGAGGCCTGGGCCCACTGAGAATTCCGCGGACGTGGAGAATATTTTGAAGGAAATGACAATGCCGCCCACGCCTCTGACGGCCATCGCCCAGACGCCGAGGAAGGAGCTCGAGTCGAAGTTCACGTTCAACCCCGTGCTGGCGAAGTTGACCGAAGTGACGCCGCAGGAAGCCACGAAGCCTCAGCGCGAGAGGCACAGCGTCAACAGGCTATCGGCAGACTTGGAGCGGGACTTGAGCCTATCCGAGGACAGCGAGGATGAGACTAGCAAGGAAACGTCATCGCGGACGGCGAGGGGAAACAGAAGCCCCGACCTCACGGTCGATCTGTCGACACCCTTGATACCAGCGATGACGCCTGCCCCGCCGCCATTGGCGCCCATGTCACCCATGGGTCTGTCACCGGTGGGTCCGATGTCGCCCACGAGGCCACTCAGCCCCAGCAGACCGTCGTCACCGCCGAAGCAATTGACACCTGAGCAAGTACTTTCCCCTCCGCCGGTTAGTCCTTTAGAATCCAAAGGTTCTCCGAGCCCAACGTTGCACCAAAGGCCACCCAGTCCCTCGGGCCAGGCGCCCCAGAGTTCCGGAAGTGCCAGCTCTAGCGCTAGCTCCGACTCCTGCTCCGACTCCGGCTCCGACAGCAGCGACGATTCCGAGGACGAATCCGGCACCCAGCCCACCAAGGGCCCCTCTACCCCTCCCTCCGTGTCACCAAAGAACGAAAATTTGATCGAGGAACCGCCGCCCGCGGTCGAGGAATCGAAACCGAGGTGGAACCTTAGATCGTTCTTCACCAAAACCACAACGCCGCACGAGGAGCCGAATTCGGAGAACAAGCAGGCACAGGACTGCAACAGGCGAGAGGGTTCTCCGGTGGCTACGGCGGATGCCAGAACGCACAGAGACAAGGCAGCACACGACTGGCAGCTCGACGAGGCCCTCAAGAGGACCCACAACGCGACGATAATCAGTCTGCTCGACAGCGACAGCGATCGTCCCTCGGACCAGGAGAAAGCGCAGCCGGTAGAGGAAAACCGTGCACAGCCGGAGAAACCAAAGGTGGCAGACGCCAGGAAACGAGGTCGACCCAGGAAGCCTACCAAGAGTCCGAAGGATGGTCACCGGACGTCGGACGAAGGTTTGAAGAACGGCAAGCCTCGCAGCAAGCCGAGAGGTGTGGGTAGTCCTATGAAGAAGAAGGCACCCCTCTCGAAGCCCACTATAACCACCAGCGACGATGGAAGCGACGACAGATCGCAGGGTGCGTCCAGCGACTCTGACAGCGATCGACCGACCAGGGTGTCACCGGTAATCCCGCCCGTGAACGAGAAGAGGACCACGTCTAGATTGAGCGGCTCTTCCAGCGAAGACGAAAGTCCGCCGAATGGGAAGAACAACAGTGCCTCCGAGGACGATACCACGCGTTGGAGAAGGATGCCGATCAAGAGAAGCAAACTGGCCGACTCGCCGAAGAAGCAGGACAAGAAGAAGAGTCCCGCGAAAGCGAAACCCAGGAGATCTACCTCGCGGGTGACCAACGTGGTCGGCGGGGGGTCCGATTCCGACAGCGAGTCCGAGTTGTCGGTGAGGAATCGTATCCAGGTCGCCAGAGTACCCCCTAGGCCAAGGGCTCCGCCGACCCGCGCCACTTCTCCGGAGAATTCGGACAGCGACAACAGTCCAGGTTCGAAGCTGCAGGAGGAGGACGCGGGCAACGTGCAGGACAAGAAGAAGAGCGACACGCTTCGAAAGGTGTTCTCGTCCTCGATGGGCGGAGGGAAGGGTGGTGGTAAAGGAGGAAAAGGTGGGAAAGGTGGAGGAAAGTGTGGCATCTACGTGGAAGAGTACACGACCTCTGCCAATACACCTACCGGAGGGGAGAGTCCGTACAAAAGACCGTCGTCACAGACGTCCAGCGTTATTCAGTCTTTCCCGCCGCTCACGTACGTGAACGGTGTGCCGAGTTTGTTCTGTAGGatcgaggtgagcaaacttccgcATATATCGCAGCTATCGAGGGGGCAAGAGTTGAGACAGCGCACGGAACTTCCGGACACCAGGCCGTCGTCGAGACAAGCCTCGACGCTGGTAACGCAACCCCCTCGACCGCCTACACCGGAGGAAGGGGAAATCGTGGACACGCCACCGCCTCAACAGCTAGCCTCGGACACGAGGATTCACGGCGAGGCAGCGTTGCTGGTCGACGGTGACCTTAAGAATCGCGCTGTGATCAAGGGCGAGCCTATATCGGACACGAAGAACACTTGCGGCATCGGTGTTGGCGCTGTTGTCGTCGTCGGTGCAGGTGCTAGTGGAGGTGGTAGTGGTGCTAGTGGTGCGGGTAGCGCGCCCAAGAGGAAACGTAATCCGAGTTGTAGTTCTGTGTCCAGTTTGAGTACTGTGTGTTCCGCGGAGACGAAGACGAAAGGGTCGGGCGAGCACAAAGagaggaagaagagaaagagaaaacatGCCGATGTCGAAGCTGTTACATCCAGGCCATCTTCCAGTCAGCAAAGTGATATACAACCAACGAACCACGAACGGGAAGAAAAGCCTGACACCAGTTTGTTgccgccaccacccccgcctCAGCGCGTCTATTATTCCTACTTCAATCCTCAGAATGAAGTTTTGGAGGATCAGGATAGGTGGGACCAGAATCAGTACCTGATGGAAGCGAAACGGCTGAAGCACAGCGCCGACAAGGAGTGCGAGCTCACGGCGCAGGGTATGCTTTACCTAGAAGCCGTTCTGTGTTTCCTGCTCACTGGCAATGCCATGGAGTCGGATCCTCTCACGGAGAGGGCGTCGTTCACCATGTACAAGGATACTCTCAGTCTCATCAAATACATCTCTTCGAAGTTCAAGAGCCAGCAGAACAACTCGCCGGAGAGCAGTATACATAACAAGCTGGCCATTCTAAGTCTCTTTTGCCAGTCCCTCATATACTTGAAGCTGTTCAAGATGCGCAAACACGAAGTCAAAGAGAACCAAAAAATCGTTACCGACTACCATCAAAAGCCTGCTCAGGCAACACCGGTACAACCAGAGGGACAAGGTACGCCATCTTTGTCACCGACACCATCACCAGCCGGTTCCGTGGGTTCCGTTGGCAGCCAGAGTTCTGGATACAGCAGCGGCGAACTGGCGAATCGAGGAGCTGCTTCGGGTCAACCGCAGGCAGCTCCGTACGTTAGCGTTCCACTTAGTGTTCACAACGCTATGGCGAAGCAAAATTATCAGTTCAGCTTGCTGCTCAGCTGCCACGATCTCTGGGACCAGGCAAACGCTCTGGTGACGGATAAGCACAGAGATTTCTTCATCGAGCTGGATGAAAAATTGGGACCTCTCACGTTGAAAAGCTCTTTGCGCGATCTGGTGCGCTACGTTCAAGCTGGGATAAAAAAGCTTCGAGACCTCTGA
Protein Sequence: MPSSGGYYDDRNPLLKGTLSSVDRDRLRERERQARAAMSVQAEQAAAGGGPDTRHHHHGHHNHAHHHANPHAVSAPLFSSELIIVGPSWTLPLPGHDTGGFPDHCCLGGFTSFVCLLVGCCKTGGCLNNLGPHAHRLKGDLSTFAKVHPSGDQVNPDARDSTTQQIQLKLGNYSLVKHLLDEPKRLIGIEGVPPSPAPPPAPSALRMSSSSVGSNSRSSPSSQEFKKPGGPRTDGSSSSSSASSTSTSSSSSSSSSSSHQRGGFVKPADGKPPHGGRGGYPGQPVKHGGNSNDHRSHGLLPAKGPPTNSPGNGTLVGNSNIGNSSGSRLHCVGSRLSRLPLDNGTSSSRPGPTENSADVENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVTPQEATKPQRERHSVNRLSADLERDLSLSEDSEDETSKETSSRTARGNRSPDLTVDLSTPLIPAMTPAPPPLAPMSPMGLSPVGPMSPTRPLSPSRPSSPPKQLTPEQVLSPPPVSPLESKGSPSPTLHQRPPSPSGQAPQSSGSASSSASSDSCSDSGSDSSDDSEDESGTQPTKGPSTPPSVSPKNENLIEEPPPAVEESKPRWNLRSFFTKTTTPHEEPNSENKQAQDCNRREGSPVATADARTHRDKAAHDWQLDEALKRTHNATIISLLDSDSDRPSDQEKAQPVEENRAQPEKPKVADARKRGRPRKPTKSPKDGHRTSDEGLKNGKPRSKPRGVGSPMKKKAPLSKPTITTSDDGSDDRSQGASSDSDSDRPTRVSPVIPPVNEKRTTSRLSGSSSEDESPPNGKNNSASEDDTTRWRRMPIKRSKLADSPKKQDKKKSPAKAKPRRSTSRVTNVVGGGSDSDSESELSVRNRIQVARVPPRPRAPPTRATSPENSDSDNSPGSKLQEEDAGNVQDKKKSDTLRKVFSSSMGGGKGGGKGGKGGKGGGKCGIYVEEYTTSANTPTGGESPYKRPSSQTSSVIQSFPPLTYVNGVPSLFCRIEVSKLPHISQLSRGQELRQRTELPDTRPSSRQASTLVTQPPRPPTPEEGEIVDTPPPQQLASDTRIHGEAALLVDGDLKNRAVIKGEPISDTKNTCGIGVGAVVVVGAGASGGGSGASGAGSAPKRKRNPSCSSVSSLSTVCSAETKTKGSGEHKERKKRKRKHADVEAVTSRPSSSQQSDIQPTNHEREEKPDTSLLPPPPPPQRVYYSYFNPQNEVLEDQDRWDQNQYLMEAKRLKHSADKECELTAQGMLYLEAVLCFLLTGNAMESDPLTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLFCQSLIYLKLFKMRKHEVKENQKIVTDYHQKPAQATPVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGAASGQPQAAPYVSVPLSVHNAMAKQNYQFSLLLSCHDLWDQANALVTDKHRDFFIELDEKLGPLTLKSSLRDLVRYVQAGIKKLRDL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01123054;
90% Identity: -
80% Identity: -