Basic Information

Insect: Eledona agricola
Gene Symbol: lilli_1
Assembly: GCA_964023215.1
Location: OZ026860.1:347347-372996[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 1.3e-11 2.9e-07 30.5 0.2 4 114 20 138 18 152 0.73

2 6 5.5e-14 1.2e-09 38.3 12.8 349 512 239 407 223 409 0.66

3 6 1 2.3e+04 -8.0 15.3 118 180 470 528 407 586 0.32

4 6 1 2.3e+04 -8.5 27.2 79 238 594 764 576 789 0.30

5 6 0.018 4.2e+02 0.2 18.2 95 255 911 1063 883 1079 0.50

6 6 0.34 7.8e+03 -4.0 0.3 65 82 1184 1201 1160 1226 0.45

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	1.3e-11	2.9e-07	30.5	0.2	4	114	20	138	18	152	0.73
2	6	5.5e-14	1.2e-09	38.3	12.8	349	512	239	407	223	409	0.66
3	6	1	2.3e+04	-8.0	15.3	118	180	470	528	407	586	0.32
4	6	1	2.3e+04	-8.5	27.2	79	238	594	764	576	789	0.30
5	6	0.018	4.2e+02	0.2	18.2	95	255	911	1063	883	1079	0.50
6	6	0.34	7.8e+03	-4.0	0.3	65	82	1184	1201	1160	1226	0.45

Sequence Information

Coding Sequence: ATGCCATTCCTCGAGGAACGATCGGTGGGTGTGATTTTATTTGGACCAAAAAGCGTGGAGAGAGACCGCCTGCGCGAGCGGGAGAGGCAGGCAAGGGCACAGATGTCTTCGCAAGTGGACGAGCAAGGGGCTTTTCTTTTTGGAGCACCCGTCAAGGTGAACCCGTCTTCATCGGACCCCGTCACGCAGCAGATCCAGAGCAAGCTCGGCGATTTCCAGAGATTGAAGCCGTTCCTGGATCACAAGGACTTGATTGGCGTCGATGGAGTGCCGCCTAGTCCGGGCGTGCCGTCCTCGAGGCACACGAACCCCTTCTTGACTTCCGGGGTGTCGTCAAGGCTCCAGCCTTCGCCCGAATCTCGTTCGGAATTCAAGAAACCCCATCACCATCAAATACATCACCAACACCAGCGAGGCGGATACGTGAAGCCCGCCGACGGGAAACCGCCCTACGAGGGCCGGGGTGGGTATCCCGGTCAGCCCGTCAAACATGGCAGCGGCATCGCCAATCACAGGTCCAATGGGATTCTCCCGGCCAAGGGTCCACCTCATTCTTCGCCGAACTCATCGGTGTCGTTGCTGCCGTCCAACAACTCTTCGAGTCGGATACACAGCGGAGGAGGACGCGGTCATCCTCGTAACACGTTCGAACAGAATCAAGGACCTCCGCCCGGCCCGAGGGAATCATTGCCTTCCGCTACACCTAACACGGATATGGAGAACATCTTCAAGgaAATGATCGAAGTTCGAGCTCCGCTCACTGCCATCGCCGCAACTCCCAGGAAGGAGCCCGATAATAAGTTTTCCTTCAGTCCTAAGTTGACGGAGTCGATACCAGCACCGTCTGCACCGAAGAAACGGGAAAAGGTGGCCCCAACTCGACCCTCGGCTGACTTACGGGATGATCTAAATCTGTCAGATGACAGCGATGACGAACAAAAGCACTCTTCCACGTTACCCTTAGACAACAACAGGATGGTGTCTCCGTTGGGTGCGACTCCTGCCGTCAACGCCTACTCCAACGTGGAGTATCGTCATCCACCGGAGACCGCGGGTCCGGCGGCGACGTCCTCAAGTGAATCCGGTTCGGATTCGGGGTCTGACAGCGACTCCAGCTCCGACTCGTCGACTCCGCCGAAAGCCACCGTGCCGGGGGAAGCGGCGACAGCAGCTGTGTACGCTCCGCCCGAAAACGAAATGAGATGGAACCTCGCCCAGTTCGTCGATCCGACCACCACTAAGACTGACTCCTCAGTCCTCTCGCCTAAAGTACAAAAATCACCGCTCGCCTCCAACCTATCGTCGAGAAAAGTTACCGAAGAGTCGGACGCCAGCGACTCCACAAGGGATCTGGACAGAGTGGTGGCGGAAGCCTTGGCGTCGAGGACCGCGGTGCCGCTGCTCTCCAGCTTCTCTGATTCCGACGAGAGCGAAACGGAGAGGCGAACCAAAAGGCGGCGCAAGCGGGCCGTCCAGTCAGTTACCAAAAATTCGGACAGTGACAGTGATAACGAAAGGACGAAAAAACCAAAGCCGGTCAGTCGTGCCAATCTTCGGACTAAATCGGTGGACTCGTGTAGTGACTCGGACGCCGACGACACCAAACCGTATACTAGTGCCAACGTTATCAAAAAGACATTATCGCCTTTGCCACACAAATCGCCCAAGGATCAGCTCCTCGTTAAGCCCAAGCAGAGTCGCGGGCGACCTAGAAAAATAAAACCGGCTGTGAGTGAATCGGAAAAAGTTCCGCGCAAGAAACGGGGCCGACCGCCCAAACCGCGACCGTCGCCGCCCACCAGCTCCGATGACGAGGACGATGTGGTGGTGGACAAGGAGCGGCTTCCGAAGAAGTGGCCCGTGGCGGCGAAACACGAAGTTTGCAGCAGCTCCGACTCGGATCCCAATGACAGGCGCGTCGACAAAACGAACAATGTGCTGCCTTCGGAGGACAAGTTGAAGAGGGCGAAGAACGACTCGGACGACGAATGGGGGGGCAAGCAGAACAAGAACAAGCTAAAGCAGCAACGCCAGCGGACCGAATCGGAAAGCTCGAAGAAGAACGATTCACCCAAAAAGGAGACATTCAGGCGGAAAGGTCGGCCGGTGTCGTCACAGCAAGTGAAGAGCGCCGCCACTTTGCCCACCACAACTGACTCAAGCGAAAGTGACTCGGCGCCGTCGTCCAAATCGCGCAAATCACTGCAGCGGAGCACTAGTTTTGGGAGCCGACGAAGCAGATCTTCGGACACCGACAACAACGAGTCGATAGTCAAAGCGTCGATGAACAAGGTCGAGGAGGGCAGCAAGATAAAGGACAAGAACAAAAGCGACACTTTGAGGAAACTGTTCACGCCGAAGCGGGACTCGGAGGGCGGAAAAGGTGGCGGAAAAGGAGGCGGCAAGGGTGGAAAAGGCGGAAAAGGTAAAGGCGGTGTCAACGTGATATTCGCCGACGGCGGCAACGAGCGAAGCAGCTCGCCGGCGGAAGACGAAGCAATGCCGACCATATCAAACCCGACGCTGCTTTCGCCCATCCCCGGCAAGGAGACGAAGGCGCTTCCTTTGTCGCCCCGCAACGAACCAATCAAATTCAAAAAGACTGATAATCCAGACATGGACAGGGCGTCCATCAAAGTCAAAATCGGTCTAAGCCACATCGATCTTAGGATGATGCCGAGTCTGCGACTGAAGTTAGAGGCAATGAAGCATACGTACGTACGCGAGTTCGACAAGACGAAGAGTTCCAAAAACAGCGATACGGAGAATAAGAAACCTTGGAGGATGGAGAAAGAATCGGCTGCAGCGTCCGATTTTGCAGAGTTGAAGTACAAATCTAAAAAACGCAAGCGGCGCAACAGCTCGAGTTCCATATCTTCCCTGTCCACGGTCAGCAACAAGTCGCACGGTAGCAAAAAGCTCGTTCATCGGAAGGAAAGGGGGGACAGTCACAAGTCCAAGCGGCGAAAAGACGACGCCGAAATCTATCCCAGGTCTCTGAATGACAATATCAGCCTGACCAACGCCCCGCCGACCAACCACGAGCGGGAAGGCAGCAGAAGTCGGCAGCCGAGTTCGCCGGCCGACAAAAGCGCGAAGACGCAAAGCTCCAGAGAGTATTATTCGTATTTTGAGAAGCCGGACGAGCCGCTGGAAACCGAGGACAATAAAGCTCAAAGCGAACATCTGAACGCCGCGACTCGTCTGAAGCATCTCGCCGACAAAGAACCGGACACTACCAAGCAGTGCATGCTCTACTTAGAAGCAGTGCTTTACTTTCTGTTGACCGGTAACGCCATGGAGCTGTCGAGGGTGTCGGAAACCGCCTGCTTTACAATGTACAAAGACACACTCTCGCTAATTAGGTACATCACGTCCAAGTTCAGGAGCCAGAACGTGACGACACCTAAACACAACAAACTCGCGGTTTTAAGTTATAGGTGTCAGGCGCTGCTGTACTATAAGCTGTTCAAGATGAAGCGGCACGAAGCCAAAGAGTTCCAGAAGATGCTGAGCGAGTATCTGAACAATAAGGGCGTGGCGCTTCCCACCGAGCAACAGAACCAACAGGGTCAGGGGACGCCCTCACCGATGTCGCCGACTCCGTCCCCGGCTGGATCCGTGGGTTCGGTCGGGAGCCAGTCGTCGGGCTACAGCAGCGGAGAGCTGGCGGCGAGGGGCAGCAACGTGCCGCCGGTGCCGATCACCACGCACACACCCAACTCTATGTCTCACGTGTGGATCCCGCAAACTATATACAACGCCGTGTACAAGCAGAACCAAAATTGCACATATCTACTATCGTGTCACGAGCTTTGGGACATGGCCGACGCCCTCGTTAAGAACGGCAACCACACAGatttctTTATCGGCCTGGACAGGTACTGCAAGCCTTTAACGATTCATAGTTCGCTGAACGACCTGGTAAGGTACATCCGCGAGGGGCTGAAAAGGTTAGACGATAAGGATAAGGAAAAAGAGGATCAATGA
Protein Sequence: MPFLEERSVGVILFGPKSVERDRLRERERQARAQMSSQVDEQGAFLFGAPVKVNPSSSDPVTQQIQSKLGDFQRLKPFLDHKDLIGVDGVPPSPGVPSSRHTNPFLTSGVSSRLQPSPESRSEFKKPHHHQIHHQHQRGGYVKPADGKPPYEGRGGYPGQPVKHGSGIANHRSNGILPAKGPPHSSPNSSVSLLPSNNSSSRIHSGGGRGHPRNTFEQNQGPPPGPRESLPSATPNTDMENIFKEMIEVRAPLTAIAATPRKEPDNKFSFSPKLTESIPAPSAPKKREKVAPTRPSADLRDDLNLSDDSDDEQKHSSTLPLDNNRMVSPLGATPAVNAYSNVEYRHPPETAGPAATSSSESGSDSGSDSDSSSDSSTPPKATVPGEAATAAVYAPPENEMRWNLAQFVDPTTTKTDSSVLSPKVQKSPLASNLSSRKVTEESDASDSTRDLDRVVAEALASRTAVPLLSSFSDSDESETERRTKRRRKRAVQSVTKNSDSDSDNERTKKPKPVSRANLRTKSVDSCSDSDADDTKPYTSANVIKKTLSPLPHKSPKDQLLVKPKQSRGRPRKIKPAVSESEKVPRKKRGRPPKPRPSPPTSSDDEDDVVVDKERLPKKWPVAAKHEVCSSSDSDPNDRRVDKTNNVLPSEDKLKRAKNDSDDEWGGKQNKNKLKQQRQRTESESSKKNDSPKKETFRRKGRPVSSQQVKSAATLPTTTDSSESDSAPSSKSRKSLQRSTSFGSRRSRSSDTDNNESIVKASMNKVEEGSKIKDKNKSDTLRKLFTPKRDSEGGKGGGKGGGKGGKGGKGKGGVNVIFADGGNERSSSPAEDEAMPTISNPTLLSPIPGKETKALPLSPRNEPIKFKKTDNPDMDRASIKVKIGLSHIDLRMMPSLRLKLEAMKHTYVREFDKTKSSKNSDTENKKPWRMEKESAAASDFAELKYKSKKRKRRNSSSSISSLSTVSNKSHGSKKLVHRKERGDSHKSKRRKDDAEIYPRSLNDNISLTNAPPTNHEREGSRSRQPSSPADKSAKTQSSREYYSYFEKPDEPLETEDNKAQSEHLNAATRLKHLADKEPDTTKQCMLYLEAVLYFLLTGNAMELSRVSETACFTMYKDTLSLIRYITSKFRSQNVTTPKHNKLAVLSYRCQALLYYKLFKMKRHEAKEFQKMLSEYLNNKGVALPTEQQNQQGQGTPSPMSPTPSPAGSVGSVGSQSSGYSSGELAARGSNVPPVPITTHTPNSMSHVWIPQTIYNAVYKQNQNCTYLLSCHELWDMADALVKNGNHTDFFIGLDRYCKPLTIHSSLNDLVRYIREGLKRLDDKDKEKEDQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -