Basic Information

Insect: Rhopalosiphum maidis
Gene Symbol: lilli_1
Assembly: GCA_003676215.3
Location: NC:35864702-35923470[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 3e-09 3.6e-05 22.6 21.5 4 241 32 275 30 282 0.48

2 6 0.01 1.2e+02 1.0 3.1 329 361 264 295 228 318 0.73

3 6 0.0038 45 2.5 30.9 402 514 406 523 362 523 0.53

4 6 1 1.2e+04 -18.2 39.0 434 493 539 606 525 627 0.40

5 6 1 1.2e+04 -9.2 17.7 422 500 704 777 665 784 0.63

6 6 0.00086 10 4.6 2.8 151 219 938 997 906 1040 0.58

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	3e-09	3.6e-05	22.6	21.5	4	241	32	275	30	282	0.48
2	6	0.01	1.2e+02	1.0	3.1	329	361	264	295	228	318	0.73
3	6	0.0038	45	2.5	30.9	402	514	406	523	362	523	0.53
4	6	1	1.2e+04	-18.2	39.0	434	493	539	606	525	627	0.40
5	6	1	1.2e+04	-9.2	17.7	422	500	704	777	665	784	0.63
6	6	0.00086	10	4.6	2.8	151	219	938	997	906	1040	0.58

Sequence Information

Coding Sequence: ATGAATTACCGTCCGAAACCTAATCCTTTCGATGGATTGAGGAATTCTCCGTCTTCGCACAACCGTGGAGGACTCAGTTATATGACTACAATGGAACGGGAAAAACAACGTGAGAAAGAAAGGCAATCCAGACAGCAACAAGTTTCCGAGAACAATGTCAAAGACAAGAAAGAACTGTTCGGCTCTCCAGTAAAGGTGGACGACGCTAACGACGACGAACAGAGCCAGCTGATTCAGAGTCAGTTGGGTTCGTTCGACGACGCCAAACCGTACTTGGACCTGGTGTTCAGCTGCGGAATCACCGGCATGCCGCCGAGTCCCGCTCCTCCGCCACCGCCGTCATCGTCACTGTCCGTCGCCGGAATGATGCAGCACCACCACTCGTCGACATCATCATATCCCTCCTCATCGTCGGCAGCCGTCTCTACAGCATCGGTGAAGTCGCACCATCACGCTGCTGCTGCCGCCGCCACTGTGATCGGTCAACAACAGTCATCATCCAGGAGATCCGTATCGCCCGCATCCGGCGGTGGATCTGTGGCACCCGTTGTCGCGGCGTCCTTCAAGAAACCAACTGTCACATCGCACGCCATGGCCaggtcatcgtcgtcgtctgGTGGCGGCAGCGGCGGCTCCTCTTCCTCGACGCACTTTCAGCCGCCTGCCAATCCGCCCAGAAACAGTAACTTTTTGAAACCTGGTGAAATGAAACCACCCTACTCGATGAGCCGATCGACGAGCAGCAGCATGAGAAGTAGCCATTCTTCGCACCACAGGCCCACACACAAACCCAATCTTGCCATATCAAATAGTCATAATTCAAACGATACCAACACGCCCAGCACGATTGAAGACATTCTAAACGAAATGACCGTTGGTCTTCCACTCGTGTCGGACATTGCGGAAACGCCAAGGGTCTCGATTGTCGATTCCAAGTACACCGCCGATGGAAAGGTGGAACCACAGCAAAGGATGAGCCCCAAAGACGCGTCCGAGAGCTTGAAAAAAATGCTCGGAGAACCCAAACAACTGTTTGCGGATCCCGTGCATAGAAACCAACAGCCATCATCGCACGGCGTTTCGCCGGACGCCGCTGCTTCCGTCTCCgctgcagcagcagcagccgcCGCGGCCGTGCCCATGGACGCCAAACCGTCGGGACCGTACAACCATTCGCTGTTTGCAtcGTACATGGTTAAACCGTCGGTAAGAGGATCTAACATTATGCCACAACCGCAGCAGACACAACTGATGCAGGAATCGCAACAGTTATCGTTATCACCACCCTCTGATAAGATCCGCCGGAGTTCTACATCGACCAATGTCATATCGTCGGACACAACCAACTGCAGTTCAGCAAAGGCCGACAAGACCAGTAGTGACATGTCCGTGGACGAGGACAGTTCGTCCAGTGAGGAAGGCGAGAAGGACAGCAGTTCGGATAGTAGCTGTAGTGATAGCGAGAGCAACGACGAAAAGAAGGAAACGGTTCCACCGGCGGCCGTTTCGCCACCCCCACAAGAAGAACAAGAAGAAGAGCCCAAGTGGTATCTgaaaaactttttgaaaaagaGTACGCCGGATACGAACAATACGACCAGGACGTCACAACAAgaGGAACCTGCTGGAATGACTGATCCTAAATCTAGTCCAAACTTTCCTACACAACGATCTGaggttattgaattattatctgAAATGTCAGACTCAGACTCCAATCACAGTGATAAGCAAAAAAGTCAATCTGATTCGTCATCTTCTTCATCTTCTTCATCTTCATCATCCGAGGATGAAGacgataaaaagaaaaagcCTCGTGATAGTAGTTGTGATAGTGATTCATCCTATAGTAGCCGTTCACATGCATCATCTAAACCAATAACAGACTTACACAAAAAATACTCTGCATTAGCAAAATGTGAGAAAAAAGATCTCAAAAAATCATCTGTAAAACCTACTAAATTAGTAGAGAGGAAATCGACACcagtgttaataaaaaaagaggaACCAGTTGAAGAACCAGCTGTGAAAAAGAGAGGTCGAAAGAAGGGTCCCATAAAGACTCCAAAACCTCCTCTACCATCCAAAATCAAGTCAAAACCTTTGATTTCATCAGATACAGAAGACGATGAACCGCCTAAACCAGTAAAAATAAGTGAAAAACGAAGAGGTCGACCACCAGGTAGTAGTAAAAAGTCAAAAGTTATATCAGCTAGCAGTGAATCAGAAGAATGGACTGATAGTAGCCGCAAGAGTCGAAAAAAAGATTCTGAAAAGAAGTCTTCACATTCAGTAAAGAAAACACCATCCTGGGAAAAAAACCAACCACAAAAACCTGTAGCTCGAGTCAGTGCTGCTTTACGTCCTCCACGTTCAATTTCAAGCAGTGTAGATTCAGATTCCTCTGATGTAGAATGTAGGCCGCCACCTATGTCAACAACAACTGAAAGTCCACCCAAACTTGATGTTGAAGGAATCAAAGTACAAGATAAGAAAAAGAATGATACTTTAAGGAAGCTGTTTATAACACGACGTGAAGATGGTGGTGCTAAAAGTGGTGGAAAATCCAAAGGTGGTAAAGGTGGCAAAGGTggagttattataattgataacaaCGAAGCAATGCGCAATGACAACGAACGTGTTATATCTCCTGTACCAGTCATTCCACTTATGCCTAAAGAACCCGAAAGCCTAAagactttaaaattatctgtgATGTGTAAAATACCATTAAGTAAGTTGCcacctaattttaattacttgatGAAACCAGCAAGATCTGAAGAGCTGAGAACCTGTGCTGATTTGGCAAATACGCGGCAAGATGAAAAGAAACAAAAGCATAGACATCATAAACATCATCATAAAGGAAGTCCATCACAAACGACTTCAGGATCGGAAAAATCTAAATCTAACGAATCTCCAGCAAACACTGCTCCGCCTACTCAGCCTCTCCTCCAACAGCCATCTTCTGATGGCTATTCCAAAGGTATGATGGACAATGTAAATGTATGGCGTAAACCAACATCTGTATGTGCAGTAATACCAGAAGCAAAAGTTAAACCTCTAGAGCATAgtactaTGTCATATTTGCAACGTCCAGCTGCCACCAGTGGTTTGATTCATGGCCCGTATGAAGAATCATCTGAAGATGAAGATGGTGGACCACCTCCTTTTCTTCCTTATAGTACCACTGCTGTTCAAATAATGGACCCTCGGTATAAACGTTCACTGGAATTAGATCAATACTCTCCTAATGCGTCAAAAAGACGAAAGTTTCACAATCCGACTGGGTCAGCAACACTAGGAAGATATGCTACTGGAATAggCGATggattaataaatgatatctTGGTGGATCGCATGCATGAAGTTCCTGTACAACCTCCTCCCAGACAACCTTCATGGCGCATGCAATCCATGCATCATCAGTATCCTCCAAGGAAAAGATTCTTCTCATATTTTGTAACCGACTTGTACCCTGAAAACAAcatGCACCAAGAGGTTCCGTTAAAGGAAGCACAAGCTTTAACCAAATTAGCAGAATATGAACCTGATCCCATTACCCaagaaatgaaatatttggaTGGTATACTATGTTTTGTACTTAGCGGTCATTTGATGGAGAATGATGGGACCAGGGAAAGAGCAGTgctcaaaatttataatgatactgTTGacttaattaaagtTATTTGGTCAAAAATCTACAACTACCGTGCAGACTGTGATCATGAGGAGTTAGacgaaatatttgaaatggcTGATAATCCAGAAAGGGATAATAGACTGTTGATACTTTGGATGAGGTGTCTTAGCTTCTTgagattaaaattgtttaaactaCTTGTATACCAAAATAGACAGAATTTCAAGACTGTTCAGCAACATTTCCTCAAgAATGTGGGTTCAAGTCCTATTTCACCCTCTCCATCACCAGCCAGTTCTGTGGAGAGTCACTCATCAGGATACTGTAGTAGTAGCATTACACCCGGTGGTGGAGCTGTATCGTCAGGGGCAGCGACAGGTGTGATCGGAGTTCCAATAGTTGTACATAATGCTATTCATTCGCAACACATATTGTATTGTCATTTGGCTGCAGCTCACGAAATGTGGCAACGTGCTGACCTTTTAGTTATGCGCGGAAAACACACACaattttttgtTGAGATGGACCGACATTGTGGACCTCTCACATTACATAGCACTGGCCATGATCTCACATTGTATGCTCGCATTGCCATTTCTCGCATGAGATgtgagtttaatataaaaaattaccttCCATGA
Protein Sequence: MNYRPKPNPFDGLRNSPSSHNRGGLSYMTTMEREKQREKERQSRQQQVSENNVKDKKELFGSPVKVDDANDDEQSQLIQSQLGSFDDAKPYLDLVFSCGITGMPPSPAPPPPPSSSLSVAGMMQHHHSSTSSYPSSSSAAVSTASVKSHHHAAAAAATVIGQQQSSSRRSVSPASGGGSVAPVVAASFKKPTVTSHAMARSSSSSGGGSGGSSSSTHFQPPANPPRNSNFLKPGEMKPPYSMSRSTSSSMRSSHSSHHRPTHKPNLAISNSHNSNDTNTPSTIEDILNEMTVGLPLVSDIAETPRVSIVDSKYTADGKVEPQQRMSPKDASESLKKMLGEPKQLFADPVHRNQQPSSHGVSPDAAASVSAAAAAAAAAVPMDAKPSGPYNHSLFASYMVKPSVRGSNIMPQPQQTQLMQESQQLSLSPPSDKIRRSSTSTNVISSDTTNCSSAKADKTSSDMSVDEDSSSSEEGEKDSSSDSSCSDSESNDEKKETVPPAAVSPPPQEEQEEEPKWYLKNFLKKSTPDTNNTTRTSQQEEPAGMTDPKSSPNFPTQRSEVIELLSEMSDSDSNHSDKQKSQSDSSSSSSSSSSSSEDEDDKKKKPRDSSCDSDSSYSSRSHASSKPITDLHKKYSALAKCEKKDLKKSSVKPTKLVERKSTPVLIKKEEPVEEPAVKKRGRKKGPIKTPKPPLPSKIKSKPLISSDTEDDEPPKPVKISEKRRGRPPGSSKKSKVISASSESEEWTDSSRKSRKKDSEKKSSHSVKKTPSWEKNQPQKPVARVSAALRPPRSISSSVDSDSSDVECRPPPMSTTTESPPKLDVEGIKVQDKKKNDTLRKLFITRREDGGAKSGGKSKGGKGGKGGVIIIDNNEAMRNDNERVISPVPVIPLMPKEPESLKTLKLSVMCKIPLSKLPPNFNYLMKPARSEELRTCADLANTRQDEKKQKHRHHKHHHKGSPSQTTSGSEKSKSNESPANTAPPTQPLLQQPSSDGYSKGMMDNVNVWRKPTSVCAVIPEAKVKPLEHSTMSYLQRPAATSGLIHGPYEESSEDEDGGPPPFLPYSTTAVQIMDPRYKRSLELDQYSPNASKRRKFHNPTGSATLGRYATGIGDGLINDILVDRMHEVPVQPPPRQPSWRMQSMHHQYPPRKRFFSYFVTDLYPENNMHQEVPLKEAQALTKLAEYEPDPITQEMKYLDGILCFVLSGHLMENDGTRERAVLKIYNDTVDLIKVIWSKIYNYRADCDHEELDEIFEMADNPERDNRLLILWMRCLSFLRLKLFKLLVYQNRQNFKTVQQHFLKNVGSSPISPSPSPASSVESHSSGYCSSSITPGGGAVSSGAATGVIGVPIVVHNAIHSQHILYCHLAAAHEMWQRADLLVMRGKHTQFFVEMDRHCGPLTLHSTGHDLTLYARIAISRMRCEFNIKNYLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01346444;
90% Identity: iTF_00973037;
80% Identity: -