Basic Information

Insect: Melanaphis sacchari
Gene Symbol: lilli_1
Assembly: GCA_002803265.2
Location: NW:2537987-2663956[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 2.1e-10 2.5e-06 26.4 19.5 4 246 35 277 33 289 0.47

2 6 0.0037 44 2.5 2.8 320 361 260 300 236 310 0.70

3 6 0.0032 37 2.8 29.6 402 514 411 528 367 528 0.55

4 6 1 1.2e+04 -17.8 39.0 445 486 572 613 530 628 0.40

5 6 1 1.2e+04 -9.9 17.4 143 213 731 807 643 834 0.41

6 6 0.0053 63 2.0 3.5 153 220 935 993 908 1035 0.56

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	2.1e-10	2.5e-06	26.4	19.5	4	246	35	277	33	289	0.47
2	6	0.0037	44	2.5	2.8	320	361	260	300	236	310	0.70
3	6	0.0032	37	2.8	29.6	402	514	411	528	367	528	0.55
4	6	1	1.2e+04	-17.8	39.0	445	486	572	613	530	628	0.40
5	6	1	1.2e+04	-9.9	17.4	143	213	731	807	643	834	0.41
6	6	0.0053	63	2.0	3.5	153	220	935	993	908	1035	0.56

Sequence Information

Coding Sequence: atgtATAGGCCACCAGACGAACTGCGTGCCCATAGCAAGATGTCTTGGGACAACCCAAGGGAGTACATGCTGAAAGGAGCTACGCCACTAAAAGTCAAAATGGAACGGGAAAAACAACGTGAGAAAGAAAGACAATCCAGACAGCAACAAGTTTCCGAAAATAATGTCAAAGATAAGAAAGAACTGTTTGGCTCTCCAGTAAAGGTGGACGACGCAAACGATGACGAACAGAGCCAGCTGATCCAGAGTCAGTTGGGTTCGTTCGACGACGCCAAACCGTACTTGGACCTGGTGTTTAGCTGTGGTATCACCGGCATGCCGCCAAGTCCCGCCCCCCCGCCACCGCCTTCATCATCACTGTCCGTCGCCGGAATGATGCAGCACCACCACTCGTCGACATCATCGTATCCCTCCTCGTCGTCTGCAGCCGTCTCCACAGCATCGGTCAAGTCACATCAtcacgccgccgccgccgccgtgaTCGGCCAACAACAGTCATCATCCAGGAGATCCGTATCGCCCGCGTCCGGTGGTGGATCTGTGGTACCCGCTGTAGCGGCGTCCTTCAAGAAACCGACTGTCACGTCACACGCCATGGCCaggtcatcgtcgtcgtctgGGGGCGGCAACGGAGGCTCCTCTTCCTCGGCGCACTTTCAGTCGCCTGCCAATCCACCTAGaagcAGTAATTTTTTGAAACCAGGTGAAATGAAGCCACCTTACTCGTCGATGAGCCGATCCACGGGCAGTAGCATGAGAAGTAGCCATTCTTCGCACCACAGACCCACACATAAACCCAACCTTGCCATATCAAATGTAAAGAATAGTCATAATACAAACGATACCAACACGCCCAGCACGATCGAAGACATTCTAAACGAAATGACCGTCGGTCTTCCACTCGTCTCGGACATTGCTGAAACACCAAGGGTCTCGATTGTTGATTCCAAGTACACCGCCGACGGAAAAGTAGAACCGCAGCAAAGGATGAGCCCCAAAgATGCGTCCGAGAGCTTGAAAAAAATGCTCGGCGAAACCAAACAACTGTTTGCGGATCCCGTGCATAGAAATCAGCAGCCTTCGTCGCACGGCGTTTCGCCGGACGCCGCTGCTTCCGTCTCCgctgcagcagcagcagccgcGGCGGCCGTGCCCATGGACGCCAAACCATCGGGGCCATACAATCATTCGCTATTCGCATCGTACATGGTTAAACCGTCAGTAAGAGGATCCAACATTATGCCGCAACCACAGCAGACGCAACTGATGCAGGAATCCCAACAGTTATCGTTATCACCACCCACTGACAAGATTCGCCGAAGTTCTACATCAACCAACGTCATATCGTCGGACACAACCAACTGCAGTTCTGCCAAGGCCGATAAAACCAGTAGTGACATGTCCGTGGATGAGGATAGTTCATCTAGCGAGGAAGGCGAGAAGGATAGCAGTTCAGATAGTAGCTGCAGTGATAGCGAGAGCAACGACGAGAAGAAGGAAACTGTTCCACCATTGGCTGTTTCGCCGCCCCCACAAGAGGAACAGGAAGAAGAACCTAAGTGGTAtctaaaaaactttttgaaaaagaaTACACCCGACACGAACAACACGACCAGAACGTCACAACAGgAGGAACCTGCTGGAATGACTGATCCTAAATCTAGTCCAAACTTTCCTACACAACGATCTGAAGTTATTGAACTATTATCAGAAATGTCAGATTCAGACTCTAATCACAGTGATAAACAAAAAAGCCAATCTGATTCATCATCCTCTTCATCCTCTTCATCTTCATCATCTGAAGACGAAGacgataaaaagaaaaaatcacATGACAGTAGTTGTGATAGTGATTCATCTTATAGTAGCCGTTCACATGTATCATCTAAGCAAATAACAGACTTACATAAGAAATATTCAGCATTAGCAAAATGTGAGAAAAAGGATCTCAAAAAATCTTCTGTAAAACCTGCTAAATTAGTAGAGAGAAAATCAACACcagtgataattaaaaaagaggAACCAGTTGAAGAACCGGTTGCAAGAAAGAGAGGTCGAAAGAAGGGTCCAACAAAGACTCCAAAACCTCTTCTGCCATCAAAAATCAAGTCAAAACCTTTGATTTCATCAGATACAGAAGATGATGAACCGCCTAAACCAGTACGAAGAGGTCGACCACCAGgtagtaaaaattcaaaagtgaTATCAGCTAGCAGTGAATCTGAAGAATGGACTGATAGTAGCCGCAAGAGTCGAAAAAAAGATACTGAGAAGAAGTCTTCACATTCAGTAAAGAAAACACCCTCTTGGGAAAAAAATCAACCACAAAAACCTGTAGCTCGAGTCACTGCTGCTATGCGTCAGATTAGCAGCGCAGATTCAGACTCCTCTGATGTAGAATGTAGACCACCACCTATGTCAACAACAACTGAAAGTCCACCCAAACTTGATGTTGAAGGAATCAAAGTACAAGATAAGAAAAAGAATGATACTTTAAGGAAGCTGTTTATAACAAGACGTGAGGATGGTGGTGCCAAAAGTGGTGGAAAATCCAAAGGTGGTAAAGGTGGCAAAGGTGgggttattataattgataataacgaAGCAATGCGCAATGATAATGAACGTGTTATATCTCCTGTACCAGTCATTCCACTTATACCTAAAGAACCAGAAAGCCTAAagactttaaaattatctgtGATGTGTAAGATACCATTAAGTAAGCTGCcacctaatttaaattacttggtGAAACCTGCAAGATCTGAAGAGCTAAGAACCTGTGCTGATTTGGCAAATACACGGCAAGATGAAAAGAAACAAAAGCATAGACATCATAAACATCATCACAAAGGCAGTCCATCACAAACCGCTCCAGGATCAGAAAAATCTAAATCCAACGAATCTCCAGCTAATACTGCTCCGCCTACTCAGCCTCTTCTCCAACAGCCATCTTCTGATGGCTATTCCAAAGGTATGGTGGAGAATGTTAATGTATGGCGTAAGCCAACATCTGTATGTGCAGTAATACCAGAAGCAAAAGTCAAACCTCTTGAGCATAgtacTATGTCATATTTGCAACGCCCAGCTGCTACCAGTGGTCTGATTCATGGTCCTTATGAAGAATCATCTGAAGATGAAGATGGTGGACCACCTCCTTTCCTTCCTTATAGTACTACTGCTGTTCAAATAATGGACCCACGGTATAAACGTTCACTGGAATTAGATCAATACTCTCCTAATGCATCAAAAAGACGAAAGTTTCATAATCCAACTGGGTCAGCAACTCTAGGAAGATATGCTACTGGAAtaGGCGATggattaataaatgatatctTGGTGGACCGCATGCATGAAGTTCCTGTCCAACCTCCTCCCAGACAACCTTCATGGCGTATGCAATCCATGCACCATCAGTACCCTCCAAGGAAAAGATTCTTCTCATACTTTGTTACCGACTTATATCCTGAAAACAAtatgcaTCAAGAGGTTCCATTAAAGGAGGCACAAGCATTGACCAAATTAGCAGAATACGAGCCTGATCCTATTACCCaagaaatgaaatatttagatgGTATACTATGTTTTGTGCTTAGTGGTCATTTGATGGAGAATGATGGGACTAGGGAAAGAGCAGTGCTCAAGATTTATAATGATACTGTTGACTTAATtaaAGTTATTTGGTCAAAAATCTACAACTACCGTGCAGACTGTGATCACGAGGAGCTAGacgaaatatttgaaatggcTGATAATCCAGAAAGGGATAATAGACTGTTAATACTTTGGATGAGGTGTCTTAGCTTTTTGAGattgaaattgtttaaactACTTGTATACCAAAATAGACAGAATTTCAAGACTGTTCAGCAACATTTCCTCAAGAATGTGGGTTCAAGTCCCATCTCACCCTCTCCATCACCAGCCAGTTCTGTGGAAAGTCACTCATCAGGATATTGTAGTAGTAGTATTACTCCTGGTGGTGGAGCTGTATCATCAGGGGTTGCGACAGGTGTGATCGGAGTTCCAATAGTTGTACACAATGCTATTCATTCGcaacatatattgtattgtcatTTGGCTGCAGCACACGAAATGTGGCAACGTGCTGACCTTTTAGTTATGCGTGGAAAACATACACaGTTCTTTGTTGAGATGGACCGGCATTGTGGACCGCTAACATTACATAGCACTGGCCATGATCTCACACTGTATGCTCGCATTGCTATTTCTCGCATGAGATgtgagtttaatataaaaaattaccttcCATGA
Protein Sequence: MYRPPDELRAHSKMSWDNPREYMLKGATPLKVKMEREKQREKERQSRQQQVSENNVKDKKELFGSPVKVDDANDDEQSQLIQSQLGSFDDAKPYLDLVFSCGITGMPPSPAPPPPPSSSLSVAGMMQHHHSSTSSYPSSSSAAVSTASVKSHHHAAAAAVIGQQQSSSRRSVSPASGGGSVVPAVAASFKKPTVTSHAMARSSSSSGGGNGGSSSSAHFQSPANPPRSSNFLKPGEMKPPYSSMSRSTGSSMRSSHSSHHRPTHKPNLAISNVKNSHNTNDTNTPSTIEDILNEMTVGLPLVSDIAETPRVSIVDSKYTADGKVEPQQRMSPKDASESLKKMLGETKQLFADPVHRNQQPSSHGVSPDAAASVSAAAAAAAAAVPMDAKPSGPYNHSLFASYMVKPSVRGSNIMPQPQQTQLMQESQQLSLSPPTDKIRRSSTSTNVISSDTTNCSSAKADKTSSDMSVDEDSSSSEEGEKDSSSDSSCSDSESNDEKKETVPPLAVSPPPQEEQEEEPKWYLKNFLKKNTPDTNNTTRTSQQEEPAGMTDPKSSPNFPTQRSEVIELLSEMSDSDSNHSDKQKSQSDSSSSSSSSSSSSEDEDDKKKKSHDSSCDSDSSYSSRSHVSSKQITDLHKKYSALAKCEKKDLKKSSVKPAKLVERKSTPVIIKKEEPVEEPVARKRGRKKGPTKTPKPLLPSKIKSKPLISSDTEDDEPPKPVRRGRPPGSKNSKVISASSESEEWTDSSRKSRKKDTEKKSSHSVKKTPSWEKNQPQKPVARVTAAMRQISSADSDSSDVECRPPPMSTTTESPPKLDVEGIKVQDKKKNDTLRKLFITRREDGGAKSGGKSKGGKGGKGGVIIIDNNEAMRNDNERVISPVPVIPLIPKEPESLKTLKLSVMCKIPLSKLPPNLNYLVKPARSEELRTCADLANTRQDEKKQKHRHHKHHHKGSPSQTAPGSEKSKSNESPANTAPPTQPLLQQPSSDGYSKGMVENVNVWRKPTSVCAVIPEAKVKPLEHSTMSYLQRPAATSGLIHGPYEESSEDEDGGPPPFLPYSTTAVQIMDPRYKRSLELDQYSPNASKRRKFHNPTGSATLGRYATGIGDGLINDILVDRMHEVPVQPPPRQPSWRMQSMHHQYPPRKRFFSYFVTDLYPENNMHQEVPLKEAQALTKLAEYEPDPITQEMKYLDGILCFVLSGHLMENDGTRERAVLKIYNDTVDLIKVIWSKIYNYRADCDHEELDEIFEMADNPERDNRLLILWMRCLSFLRLKLFKLLVYQNRQNFKTVQQHFLKNVGSSPISPSPSPASSVESHSSGYCSSSITPGGGAVSSGVATGVIGVPIVVHNAIHSQHILYCHLAAAHEMWQRADLLVMRGKHTQFFVEMDRHCGPLTLHSTGHDLTLYARIAISRMRCEFNIKNYLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01346444;
90% Identity: iTF_01305543; iTF_00463337; iTF_00019021; iTF_01304174; iTF_01167600; iTF_01328626; iTF_01032883; iTF_01037782; iTF_00940486; iTF_00136121; iTF_00135315;
80% Identity: -