Basic Information

Insect: Myzus persicae
Gene Symbol: lilli_1
Assembly: GCA_001856785.1
Location: NW:153721-303834[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 5.6e-10 8.3e-06 25.0 20.8 4 244 32 276 30 296 0.48

2 8 0.018 2.7e+02 0.2 3.6 302 361 235 295 233 334 0.67

3 8 3.8e-05 0.56 9.1 23.1 402 514 406 523 361 523 0.53

4 8 1 1.5e+04 -13.5 32.7 448 493 565 606 527 619 0.44

5 8 1 1.5e+04 -9.3 17.2 421 500 701 774 649 779 0.48

6 8 0.23 3.4e+03 -3.4 3.0 462 487 789 802 764 821 0.51

7 8 0.0042 62 2.3 3.4 153 220 937 995 915 1037 0.56

8 8 1 1.5e+04 -7.4 4.3 206 219 1306 1319 1284 1336 0.40

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	5.6e-10	8.3e-06	25.0	20.8	4	244	32	276	30	296	0.48
2	8	0.018	2.7e+02	0.2	3.6	302	361	235	295	233	334	0.67
3	8	3.8e-05	0.56	9.1	23.1	402	514	406	523	361	523	0.53
4	8	1	1.5e+04	-13.5	32.7	448	493	565	606	527	619	0.44
5	8	1	1.5e+04	-9.3	17.2	421	500	701	774	649	779	0.48
6	8	0.23	3.4e+03	-3.4	3.0	462	487	789	802	764	821	0.51
7	8	0.0042	62	2.3	3.4	153	220	937	995	915	1037	0.56
8	8	1	1.5e+04	-7.4	4.3	206	219	1306	1319	1284	1336	0.40

Sequence Information

Coding Sequence: ATGAATTACCGTCCGAAACCCAATCCTTTCGATGGCTTGAGGAACTCTCCATCTTCGCACAACCGTGGAGGACTCAGCTACATGACTACaatGGAACGGGAAAAACAACGTGAGAAAGAAAGGCAGTCCAGACAGCAACAAGTTTCCGAGAACAATGTCAAAGACAAGAAAGAACTATTCGGCTCTCCAGTAAAGGTGGACGACGCAAACGACGATGAACAGAGCCAGCTGATCCAGAGTCAGTTGGGTTCGTTCGACGACGCCAAACCGTACTTGGACCTGGTGTTCAGCTGCGGAATCACCGGCATGCCGCCGAGTCCcgctccaccgccgccgccgtcatcgTCGCTGTCCGTCGCCGGTATGATGCAACACCACCACTCGTCGACATCGTCGTATCCCTCCTCGTCGTCTGCAGCCATCTCCTCCGCAGCATCGGCAAAGTCACACCATcacgccgccaccgccgctgccgccgtGATCGGCCAACAACAGTCGTCGTCCAGGAGATCCGTGTCGCCCGCGTCCGGCGGTGGATCCGTGGCACCCGCAGTCACGGCGTCCTTTAAGAAACCGACCGTCACGTCGCACGCCATGGCTAGATCGTCGTCATCCGGGGGCGGCGGCGGCTCCTCTTCGTCGGCGCACTTTCAGCCACCCGCCAACCCACCCAGGAGCAGTAACTTTTTGAAACCTGGTGAAATGAAGCCACCTTACTCGTCGATGAGTCGATCGACGAGCAGCAACATGAGGAGTAGCCATTCTTCGCACCACAGGCCAACACACAAGCCCAACCTTGCCATATCAAATAGTCATAGTTCAAACGATACCAGCACGCCCAGCACGATCGAAGACATCCTAAACGAAATGACCGTAGGTCTTCCGCTTGTGTCGGACATCGCAGAAACTCCGAGGGTCTCGATCGTCGACTCCAAGTACACCGCAGATGGAAAGGTGGAACCGCAGCAAAGGATGAGTCCCAAAGACGCGTCCGAGAGCCTGAAAAAAATGCTCGGCGAACCCAAACAACTGTTTGCGGATCCCGTGCACAGAAATCCACAGCCATCGTCGCACGGCGTCTCGCCGGACGCCGCTGCTTCCGTCTcggctgcagcagcagcagccgccGCGGCCGTGCCCATGGACGCCAAACCGTCGGGGCCGTACAACCACTCGCTGTTCGCATcGTACATGGTTAAACCGTCGGTCAGAGGGTCTAACATAATATCACAACCTCAGCAGACGCAACTGATGCAGgAATCACAGCAGTTGTCGTTATCTCCACCCACTGACAAGATCCGCCGGAGTTCCACGTCGACCAACGTCATATCGTCTGACACAACCAACTACAGTTCCACAAAGGCCGACAAGACCAGTAGTGACATGTCCGTGGATGAGGACAGCTCGTCCAGTGAAGAAGGCGAGAAGGACAGTAGTTCGGATAGCAGCTGTAGCGACAGTGAGAGTAACGACGAGAAGAAGGACACCGTCCCACCGGCGGCCGTTTCACCGCCCCCGCAAGAGGAACAGGAAGAAGAGCCCAAGTGGTATCtgaaaaactttttgaaaaagaGCACGCCCGACACGAACAACACGACCAGGACGTCACAACAGgaGGAACCTGTTGGATTGGGTGATCCTAAATCTAGTCCAAGCTTTCCTACGCAGCGATCTGAGgttgttgaattattatcagAGATGTCAGACTCAGACTCTAACCATAGTGATAAACAAAAAAGCCAATCTGATTCATCATCTTCTTCATCTTCATCATCCTCATCATCCGAAGATGAAGACGATAAGAAGAAAAAACCTCGAGACACTAGCAGTGATTCGTCCTATAGTAGCCGTTCGCATGCATCATCTAAACCAATAACAGACTTACACAAGAAATACTCAGCATTAGTAAAGTGCGAGAAAAAAGATCTCAAGAAATCATTAGTTAAACCTGCTAAATTAGTAGAAAGGAAATCAACACCAGTGTTGGTAAAAAAAGAGGAACCAGTTGAAGAACCAGTTGCAAAAAAAAGAGGTCGAAAGAAGGGTTCAACAAAAACTCCTAAACCTCTTCTGCCATCAAAAATCAAGTCAAAACCTTTGGTTTCATCAGATACAGAGGATGATGAACCACCTAAACCAGTAAAGATAAGTGGAAAACCAAGGGGTCGACCACCAGGtagtaaaaattcaaaagtggTATCAGCTAGCAGCGAATCAGAAGAATGGACTGATAGTAGCCGAAAGAGTCGAAAGAAAGATTCTGAAAAGAAGTCTTCACATTCAGTAAAGAAAACACCGTCCTGGGAAAAAAACCAACCTCAAAAACCTGTAGCTCGAGTTAGTGCTGCTTTACGTCCACCACGTTCAATTTCGAGCAGTGCAGATTCAGACTCCTCTGATGTAGAATGTAGGCCACCACCCATGTCGACAGCAACTGAAAGTCCACCCAAACTTGATGTAGAGGGAATTAAAGTGCAAGATAAGAAGAAGAATGATACTTTAAGGAAACTGTTTATAACACGACGTGAAGATGGTGGAGCCAAGAGTGGTGGAAAATCCAAAGGGGGCAAAGGTGGCAAAGGTGGAGTTATCATAATTGATAACAATGAAGCAATGCGCAATGACAACGAACGTGTTATATCTCCTGTACCAGTCATTCCACTCATGCCTAAAGAACCTGAAGGCCTAAAGACTTTAAAATTATCTGTGATGTGTAAAATACCTTTAAGTAAATTGCCacctaatttaaattacttggtAAAACCAGCAAGATCTGAAGAGCTGAGAACCTGTGCTGATTTGGCAAATACAAGGcaagatgaaaaaaaacaaaagcatAGGCATCATAAGCATCATCACAAAGGCAGTCCATCACAAGCCATTTCAGGATCAGAAAAATCTAAATCCAACGAATCTCCAGCGAATACTGCTCCGCCTGCTCAGCCTCTTCTCCAACAGCCTTCTTCTGATGGCTATTCCAAAGGCATGATGGACAATGTTAATGTATGGCGTAAGCCAACATCTGTATGTGCAGTAATACCAGAAGCAAAAGTTAAACCCCTTGAGCatagtactATGTCATACTTGCAACGCCCAGCTGCCACCAGTGGTCTGATTCATGGCCCTTACGAAGAATCATCCGAAGACGAAGATGGTGGACCACCTCCTTTCCTTCCATATAGTACCACCTCTGTTCAAATAATGGACCCTCGGTATAAACGTTCATTGGAACTAGATCAATACTCTCCTAATGCTTCAAAAAGACGAAAATTTCACAATCCAACTGGTTCAGCAACACTAGGAAGATATGCTACAGGAATAGGCGATGGATTAATAAATGATATCTTGGTGGATCGCATGCATGAAGTTCCTGTACAACCTCCTCCCAGACAACCATCATGGCGCATGCAATCCATGCACCACCAGTATCCTCCAAGGAAAAGATTCTTCTCATACTTTGTAACTGACTTGTACCCTGAAAACAAtatGCACCAAGAGGTCCCGTTGAAGGAGGCACAAGCATTAACCAAATTAGCAGAGTACGAGCCTGATCCTATTACTCAAGAAATGAAATACTTGGACGGTATTCTGTGTTTTGTACTTAGTGGGCATTTGATGGAGAATGATGGGACTAGGGAAAGAGCAGTGCTCAAAATTTATAATGACACTGTTGacttaattaaAGTTATTTGGTCAAAAATCTATAACTACCGTGCAGACTGTGATCATGAAGAGCTAGacgaaatatttgaaatggCTGATAACCCAGAAAGGGATAATAGGCTATTAATACTTTGGATGAGGTGTCTTAGCTTCCTGCGATTGAAATTATTCAAACTTCTTGTATACCAAAATAGACAAAATTTTAAGACTGTTCAGCAACATTTTCTGAagAATGTGGGTTCAAGTCCCATTTCACCATCTCCATCACCAGCCAGTTCTGTGGAAAGTCACTCATCAGGATACTGTAGTAGTAGCATCACGCCCAGTGGTGGAGCTGCATCGTCTGGAGCTGCAACAGGTGTGATCGGCGTTCCAATTGTTGTGCACAATGCTATTCATTCGCAGCACATTTTGTATTGTCATTTGGCAGCAGCACATGAAATGTGGCAACGTGCTGACCTTTTAGTTATGCGCGGGAAACATACACAATTCTTTGTTGAGATGGACCGACATTGTGGACCGCTCACACTACATAGTACCGGCCATGATCTCACCCTGTATGCTCGCATTGCAATTTCCCGCATGAGATGTgagtttaacataaaaaattacctTCCATGA
Protein Sequence: MNYRPKPNPFDGLRNSPSSHNRGGLSYMTTMEREKQREKERQSRQQQVSENNVKDKKELFGSPVKVDDANDDEQSQLIQSQLGSFDDAKPYLDLVFSCGITGMPPSPAPPPPPSSSLSVAGMMQHHHSSTSSYPSSSSAAISSAASAKSHHHAATAAAAVIGQQQSSSRRSVSPASGGGSVAPAVTASFKKPTVTSHAMARSSSSGGGGGSSSSAHFQPPANPPRSSNFLKPGEMKPPYSSMSRSTSSNMRSSHSSHHRPTHKPNLAISNSHSSNDTSTPSTIEDILNEMTVGLPLVSDIAETPRVSIVDSKYTADGKVEPQQRMSPKDASESLKKMLGEPKQLFADPVHRNPQPSSHGVSPDAAASVSAAAAAAAAAVPMDAKPSGPYNHSLFASYMVKPSVRGSNIISQPQQTQLMQESQQLSLSPPTDKIRRSSTSTNVISSDTTNYSSTKADKTSSDMSVDEDSSSSEEGEKDSSSDSSCSDSESNDEKKDTVPPAAVSPPPQEEQEEEPKWYLKNFLKKSTPDTNNTTRTSQQEEPVGLGDPKSSPSFPTQRSEVVELLSEMSDSDSNHSDKQKSQSDSSSSSSSSSSSSEDEDDKKKKPRDTSSDSSYSSRSHASSKPITDLHKKYSALVKCEKKDLKKSLVKPAKLVERKSTPVLVKKEEPVEEPVAKKRGRKKGSTKTPKPLLPSKIKSKPLVSSDTEDDEPPKPVKISGKPRGRPPGSKNSKVVSASSESEEWTDSSRKSRKKDSEKKSSHSVKKTPSWEKNQPQKPVARVSAALRPPRSISSSADSDSSDVECRPPPMSTATESPPKLDVEGIKVQDKKKNDTLRKLFITRREDGGAKSGGKSKGGKGGKGGVIIIDNNEAMRNDNERVISPVPVIPLMPKEPEGLKTLKLSVMCKIPLSKLPPNLNYLVKPARSEELRTCADLANTRQDEKKQKHRHHKHHHKGSPSQAISGSEKSKSNESPANTAPPAQPLLQQPSSDGYSKGMMDNVNVWRKPTSVCAVIPEAKVKPLEHSTMSYLQRPAATSGLIHGPYEESSEDEDGGPPPFLPYSTTSVQIMDPRYKRSLELDQYSPNASKRRKFHNPTGSATLGRYATGIGDGLINDILVDRMHEVPVQPPPRQPSWRMQSMHHQYPPRKRFFSYFVTDLYPENNMHQEVPLKEAQALTKLAEYEPDPITQEMKYLDGILCFVLSGHLMENDGTRERAVLKIYNDTVDLIKVIWSKIYNYRADCDHEELDEIFEMADNPERDNRLLILWMRCLSFLRLKLFKLLVYQNRQNFKTVQQHFLKNVGSSPISPSPSPASSVESHSSGYCSSSITPSGGAASSGAATGVIGVPIVVHNAIHSQHILYCHLAAAHEMWQRADLLVMRGKHTQFFVEMDRHCGPLTLHSTGHDLTLYARIAISRMRCEFNIKNYLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01346444;
90% Identity: iTF_00973037;
80% Identity: -