Basic Information

Insect: Acyrthosiphon pisum
Gene Symbol: lilli_1
Assembly: GCA_005508785.1
Location: NC:55660865-55809408[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 1.4e-10 2.4e-06 27.0 20.4 4 235 35 268 33 288 0.48

2 8 0.0025 41 3.1 3.1 301 361 237 301 234 324 0.70

3 8 0.0068 1.1e+02 1.7 29.6 406 514 416 529 374 529 0.53

4 8 1 1.7e+04 -15.3 35.1 448 494 571 613 536 632 0.64

5 8 1 1.7e+04 -9.3 18.9 420 500 708 783 662 789 0.52

6 8 0.18 2.9e+03 -3.0 2.7 445 486 781 810 772 838 0.56

7 8 0.0044 73 2.3 4.6 155 221 946 1005 925 1046 0.55

8 8 1 1.7e+04 -7.0 3.1 205 219 1314 1328 1294 1339 0.40

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	1.4e-10	2.4e-06	27.0	20.4	4	235	35	268	33	288	0.48
2	8	0.0025	41	3.1	3.1	301	361	237	301	234	324	0.70
3	8	0.0068	1.1e+02	1.7	29.6	406	514	416	529	374	529	0.53
4	8	1	1.7e+04	-15.3	35.1	448	494	571	613	536	632	0.64
5	8	1	1.7e+04	-9.3	18.9	420	500	708	783	662	789	0.52
6	8	0.18	2.9e+03	-3.0	2.7	445	486	781	810	772	838	0.56
7	8	0.0044	73	2.3	4.6	155	221	946	1005	925	1046	0.55
8	8	1	1.7e+04	-7.0	3.1	205	219	1314	1328	1294	1339	0.40

Sequence Information

Coding Sequence: atGTATAGGCCACCGGAGGAACTGCGTGCCCACAGCAAGATGTCTTGGGACAACCCAAGGGAGTACATGCTGAAAGGAGCTACGCCACTAAAAGTCAAAATGGAACGGGAAAAACAACGTGAGAAAGAAAGGCAGTCTAGACAGCAACAAGTTTCCGAGAACAATGTCAAAGACAAGAAAGAACTGTTCGGCTCTCCAGTAAAGGTGGACGATGCAAACGACGATGAACAGAGCCAGCTGATCCAGAGTCAGTTGGGTTCGTTCGACGACGCCAAACCGTACTTGGACCTGGTGTTCAGCTGCGGAATCGCCGGCATGCCGCCGAGTCCCGCACCTCCGCCTCCGCCGTCGTCTTCGTCGCTGTCCGTCGCCGGTATGATGCAACACCACCACTCGTCGTCATCGTCATATCCCTCCTCGTCGTCTGCAGCCGTCTCCGCAGCATCAGCCAAATCACACCATCACGCCTCCACCGCCGCTGCCGCTGTGATCAGCCAACAACAGTCGTCGTCCAGGAGATCAGTATCGCCCGCGTCCGGCGGTGGATCCGTGGCACCCACTGTCGCGGCGTCCTTTAAGAAACCGACCGTCACGTCGCACGCCATGGCCAGGTCCTCATCATCCGGGGGCGGCGGCGGCTCCTCTTCCTCAGCGCACTTTCAACCACCCGCCAACCCACCCAGgagCAGTAACTTTTTGAAACCTGGTGAAATGAAGCCACCTTACTCGTCGATGAGCCGATCGACTAGCAGTAACATGAGAAGTAGTCATTCTTCGCACCACAGGCCCACACATAAGCCCAACCTTGCCATACCAAATGTAaagaatAGTCATAATTCAAACGATACCAACACGCCCAGCACGATCGAAGACATCCTTAACGAAATGACCGTCGGTCTTCCGCTCGTGTCAGACATCGCTGAAACTCCGAGGGTCTCGATCGTCGACTCCAAGTACACCGCAGACGGAAAGGTGGAACCGCAGCAAAGGATGAGTCCCAAAGATGCGTCCGAGAGCCTGAAAAAATTGCTCGGTGAATCCAAACAACTGTTTCCGGATCCCGTGCACAGAAACCAACAGCCGTCGTCGCACGGCGTCTCGCCGGACGCCGCTGCTTCCGTCTCcgctgcagcagcagcagccgccGCGGCCGTGCCCATGGACGCCAAACCGTCGGGGCCGTACAACCATTCGCTGTTCGCATCGTACATGGTCAAACCGTCGGTCAGAGGGTCTAACATAATGCCGCAACCGCAGCAGACGCAACTGATACAGGAATCGCAACAGTTGTCGTTATCGCCACCCACTGACAAGGTCCGCCGGAGTTCCACGTCGACCAACGTCATATCGTCTGACACAACCAACTACAGTTCCACAAAGGCCGACAAGACCAGTAGTGACATGTCTGTGGATGAAGACAGCTCGTCCAGTGAAGAAGGCGAGAAGGACAGTAGTTCGGATAGTAGTTGTAGCGACAGTGAGAGTAACGACGAGAAGAAGGACACCGTCCCACCGGCAGCCGTTTCACCGCCCCCGCAAGAGGAACAGGAAGAAGAGCCCAAGTGGTATCtgaaaaactttttgaaaaagaGCACGCCCGACACGAACAACACGACCAGGACGTCACAACAGGAGGAACCTGTTGGATTGGGCGATCCTAAATCTAGTCCAGGTTTTCCTACGCAGCGATCTGAGGTTGTTGAATTACTATCGGAAATGTCAGATTCAGACTCTACTCACAGTGATAAACAAAAAAGCCAATCATCTTCATCATCTTCATCGTCTTCATCATCCTCATCATCCGAAGACGAAGacgataaaaagaaaaaacctcGTGACACTAGTTGTGATAGTGATTCATCCTATAGTAGCCGTTCACATAAATCATCTAAACCAATAACGGACTTACACAAGAAATACTCGGCATTAGCAAAGTGTGAGAAAAAGGATCTCAAGAAATCATTAGTAAAACCTGCTAAATTAGTAGAAAAGAAATCGACACCAGTGATAGTAAAAAAAGAGGAACCAATTGAAGAACCAGTTGCAAAAAAGAGAGGTCGAAAGAAGGGTTCGACAAAAACTCCTAAACCTCTTCCGCCATCAAAAATCAAGTCAAAACCTTTGGTTTCATCAGATACAGAGGACGATGAACCACCAAAACCAGTAAAGATAAGTGAAAAACGAAGAGGTCGACCACCAGGTAGTAGTAAAAAGTCAAAAGTGGTATCAGCTAGCAGTGAATCGGAAGAATGGACTGATAGTAGCCGAAAGAGTCGGAAAAAAGATTCCGAAAAGAAGTCTTCACATTCAGTAAAGAAAACACCGTCTTGGGAAAAAAATCAACCTCAAAAACCTGTAGCTCGAGTCAGTGCTGCTCTACGTCCACCACGTTCAATTTCGAGCAGTGCAGACTCAGACTCCTCTGATGTAGAATGCAGGCCGCCACCCATATCAACAACAACTGAAAGTCCACCCAAACTTGATGTAGAGGGAATCAAAGTGCAAGATAAGAAAAAGAATGATACTTTAAGGAAACTGTTTATAACACGGCGTGAAGATGGTGGGGCCAAGAGTGGTGGAAAATCCAAAGGTGGAAAAGGTGGCAAAGGTGgagttattataattgataacaatGAAGCAATGCGCAATGATAACGAACGTGTTATATCTCCTGTACCAGTCATTCCACTTATACCTAAAGAACCAGAAGGCCTAAAGACTTTAAAATTATCTGTGCTGTGTAAAATACCATTAAGTAAATTGCCacctaatttaaattacttggTGAAACCAGCAAGATCTGAAGAGCTGAGAACCTGTGCTGATTTGGCAAATACAAGGcaagatgaaaaaaaacaaaagcatAGACATCATAAACATCATCACAAAGGCAGTCCATCACAAACCATTTCAGGATCAGAAAAATCTAAATCCAATGAATCTCCAGCTAACACTGCTCCGCCTACTCAGCCTCTTCTCCAACAGCCTTCTTCTGATAGCTATTCCAAAGGCATGATGGATAATGTTAATGTATGGCGTAAGCCAACATCTGTTTGTGCAGTAATACCAGAAGCAAAAGTTAAACCCCTAGAGcatagtaccaTGTCATACTTACAACGTCCAGCTGCTACCAGCGGTTTGATTCACGGCCCTTATGAAGAATCATCTGAAGATGAAGATGGTGGACCACCTCCTTTCCTTCCTTATAGTACCACCTCTGTTCAAATAATGGACCCTCGGTATAAACGTTCACTGGAACTAGATCAATACTCTCCTAATGCGTCGAAAAGACGAAAATTTCACAATCCAACTGGGTCAGCAACACTAGGAAGATATGCTGCAGGAATAGGCGACGGATTAATAAATGATATCTTGGTGGATCGCATGCATGAAGTTCCTGTACAACCTCCACCCAGACAACCATCATGGCGCATGCAATCCATGCACCACCAGTATCCTCCAAGGAAAAGATTCTTCTCATACTTTGTAACTGACTTGTACCCTGAAAATAAtatgcACCAAGAGGTCCCCTTGAAAGAGGCACAAGCATTGACCAAATTAGCAGAGTACGAGCCTGATCCCATTACTCAAGAAATGAAATATTTGGACGGTATACTGTGTTTTGTACTTAGCGGACATTTGATGGAGAATGATGGGACTAGGGAAAGAGCAGTGCTTAAGATTTATAATGACACTGTTGACTTAATtaaAGTTATTTGGtcaaaaatatacaactatCGTGCAGACTGTGATCACGAGGAGCTAGACGAAATATTTGAAATGGCTGATAATCCAGAAAGGGATAATAGGCTGTTAATACTTTGGATGAGGTGTCTTAGTTTCTTgcgattaaaattgtttaaactaCTTGTATACCAAAATCGACAGAATTTCAAGACTGTTCAGCAACATTTCCTgaagAATGTGGGTTCAAGTCCCATTTCACCGTCTCCATCACCAGCCAGTTCTGTGGAGAGTCACTCTTCAGGATACTGTAGTAGTAGCATCACACCCAGTGGTGGAGCTGCATCTGGAGCTGTGACAGGTGTGATCGGTGTTCCAATAGTTGTGCACAATGCTATTCATTCACAGCACATATTGTATTGTCATTTGGCAGCAGCACATGAAATGTGGCAACGTGCTGACCTTTTAGTTATGCGCGGGAAACATACGCAATTCTTTGTTGAGATGGACCGACATTGTGGACCTCTCACGCTGCATAGTACCGGCCATGATCTCACACTGTACGCTCGCATTGCCATTTCCCGCATGAGATGtgagtttaatataaaaaattaccttCCATGA
Protein Sequence: MYRPPEELRAHSKMSWDNPREYMLKGATPLKVKMEREKQREKERQSRQQQVSENNVKDKKELFGSPVKVDDANDDEQSQLIQSQLGSFDDAKPYLDLVFSCGIAGMPPSPAPPPPPSSSSLSVAGMMQHHHSSSSSYPSSSSAAVSAASAKSHHHASTAAAAVISQQQSSSRRSVSPASGGGSVAPTVAASFKKPTVTSHAMARSSSSGGGGGSSSSAHFQPPANPPRSSNFLKPGEMKPPYSSMSRSTSSNMRSSHSSHHRPTHKPNLAIPNVKNSHNSNDTNTPSTIEDILNEMTVGLPLVSDIAETPRVSIVDSKYTADGKVEPQQRMSPKDASESLKKLLGESKQLFPDPVHRNQQPSSHGVSPDAAASVSAAAAAAAAAVPMDAKPSGPYNHSLFASYMVKPSVRGSNIMPQPQQTQLIQESQQLSLSPPTDKVRRSSTSTNVISSDTTNYSSTKADKTSSDMSVDEDSSSSEEGEKDSSSDSSCSDSESNDEKKDTVPPAAVSPPPQEEQEEEPKWYLKNFLKKSTPDTNNTTRTSQQEEPVGLGDPKSSPGFPTQRSEVVELLSEMSDSDSTHSDKQKSQSSSSSSSSSSSSSSEDEDDKKKKPRDTSCDSDSSYSSRSHKSSKPITDLHKKYSALAKCEKKDLKKSLVKPAKLVEKKSTPVIVKKEEPIEEPVAKKRGRKKGSTKTPKPLPPSKIKSKPLVSSDTEDDEPPKPVKISEKRRGRPPGSSKKSKVVSASSESEEWTDSSRKSRKKDSEKKSSHSVKKTPSWEKNQPQKPVARVSAALRPPRSISSSADSDSSDVECRPPPISTTTESPPKLDVEGIKVQDKKKNDTLRKLFITRREDGGAKSGGKSKGGKGGKGGVIIIDNNEAMRNDNERVISPVPVIPLIPKEPEGLKTLKLSVLCKIPLSKLPPNLNYLVKPARSEELRTCADLANTRQDEKKQKHRHHKHHHKGSPSQTISGSEKSKSNESPANTAPPTQPLLQQPSSDSYSKGMMDNVNVWRKPTSVCAVIPEAKVKPLEHSTMSYLQRPAATSGLIHGPYEESSEDEDGGPPPFLPYSTTSVQIMDPRYKRSLELDQYSPNASKRRKFHNPTGSATLGRYAAGIGDGLINDILVDRMHEVPVQPPPRQPSWRMQSMHHQYPPRKRFFSYFVTDLYPENNMHQEVPLKEAQALTKLAEYEPDPITQEMKYLDGILCFVLSGHLMENDGTRERAVLKIYNDTVDLIKVIWSKIYNYRADCDHEELDEIFEMADNPERDNRLLILWMRCLSFLRLKLFKLLVYQNRQNFKTVQQHFLKNVGSSPISPSPSPASSVESHSSGYCSSSITPSGGAASGAVTGVIGVPIVVHNAIHSQHILYCHLAAAHEMWQRADLLVMRGKHTQFFVEMDRHCGPLTLHSTGHDLTLYARIAISRMRCEFNIKNYLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01346444;
90% Identity: iTF_00973037;
80% Identity: -