Basic Information

Insect: Pyrocoelia pectoralis
Gene Symbol: lilli_1
Assembly: GCA_036250285.1
Location: CM070078.1:34825269-34868722[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 9.7e-07 0.047 14.4 3.1 18 143 4 126 2 208 0.59

2 6 7.5e-13 3.7e-08 34.5 11.5 361 513 213 400 207 401 0.60

3 6 1 4.8e+04 -13.7 20.8 141 282 418 564 401 571 0.37

4 6 1 4.8e+04 -12.8 20.7 84 226 648 743 586 782 0.29

5 6 1 4.8e+04 -6.7 17.6 436 498 765 825 753 833 0.56

6 6 0.0035 1.7e+02 2.6 17.4 124 250 993 1123 925 1152 0.50

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	9.7e-07	0.047	14.4	3.1	18	143	4	126	2	208	0.59
2	6	7.5e-13	3.7e-08	34.5	11.5	361	513	213	400	207	401	0.60
3	6	1	4.8e+04	-13.7	20.8	141	282	418	564	401	571	0.37
4	6	1	4.8e+04	-12.8	20.7	84	226	648	743	586	782	0.29
5	6	1	4.8e+04	-6.7	17.6	436	498	765	825	753	833	0.56
6	6	0.0035	1.7e+02	2.6	17.4	124	250	993	1123	925	1152	0.50

Sequence Information

Coding Sequence: ATGTCCTCACAAGTGGCCGAGAGAGATAGAGAACAGGAGGTCCCTGGAGCACCGCTCTTCGGAGCACCTGTCAGGGTAAACCCGTCCTCAGCTGATCGAGTAACGCAACAAATACAAAGTAAGTTAGGAGATTATCAGAGAGTTAaaccgtttctggacgattccAAACGACTTATCGGTGTCGACGGTGTTCCTCCAAGTCCTGGCGGTCCTCCTTCGGCTGGTAATAATTTGCCGCCTTCTCCATCGTCTCGCCCATCTTCTCTtggtttaaattcaaatttggtGCTACCGTCGAGGCCTCCACCACCGAATAGTGCGCGGTCCGAATTTAAAAAACCACCGCAAAACAACGCAAGACCACCACATCACCCTCATCCGAGGAGGGACTTTACCAAACCTAACGACGGTAAACCTCCTTATGAAGGTCGTGGTGGATATCCGGGACAACCAATTAAACCGGGAAATTCCATTAGTAATCATCGATCTAATGGTCTTGTGCCAATAAAACCACCTCCACCGCCATCATCTTCATCGTCATCCACATCTAGTGTAAATTTGTCATCTTCTTCAAGAATACATGGTGCAAGTCGCAATTTGCCTAGACTTTCCGTTGATCAGgaAATGATTGACGTACCGACGCCTCTAACAGCAATTGCGGCAACTCCTCGCATTGAACCGGATTGTAAGTTTACCTTCAATCCAACTACGACGCAACCCAAGTGTGGAAGTACTGATAGGAACATCGTAAAGGGAGTACAAAAATCGCAAGGATGCAAGGATTATAATGTATACATGCGAGACTGGTACAAGAATAAGGAGCTTTGCGATGATCTTAATATATCCGATACGGATGATAGTGAAGATGAGAAAAATTTACCACCACCAACATCCTCACAAGTATCTTCCAATATACATATAGTGGAAAAATTGGTATCACCAATTGCCGCAACACCTGCTAGTAATCCTGTGATGGAACGTCCTGTAGAACCCATATCTCGTATAACAGCTGCTGCAAGTTCCACAAGCGATTCAGGCTCTGATTCAGAATCTGAAAGTGATTCTAGTAGTGATGGTACTGGCGAAGAAAACGTGACGACCACCAATGCACGTGTTTCTCCCGTAGCTTCAAATCCTCCACATATCTCACCGAAACCAGAAGAAGAAACAAGACCGAGATGGAATTTGGCATCGTATTTAGATCAAAATGGAGCTAAAGCAGAAACAGTGCAATCGCCGCGTGTTCAGTCACCATTTCACAATTCATCTTCCCACAATCTATCTTTAAATTCGTCCAACATCCGAAGGAACTGTAGTGATGATTCAGATTCGAGTGATTCAACAAAAGATCTGGATAGTGTTGTTGCGGAAGCTTTTGCGTCTAAACCTCCCGCGCCTTTATTATCTAGTTTTTCAGAATCGGACGGCAGTGTTAAAACAAAAAGTCCTAAAAGACGAAAGCGACCCGTGTCTTCAGTTACCAATATGTCAGATAGTGATAGTGACGATGATCAGCGGACAATTGCCAAAATTCCTAAACCGGTGAATCGCGTAAGTCCGAGACCTAAATCCGCGTGTAGCGACTCGGACTTAGAATCGAACAACTACATACGTTCTTCGAACAGCGATTTAAATAAACAGCGATTGTTGTCGCCTAATATAAAAAAGCCTGAGCCTGGTAATCAAAAACCAAAATCAAACAGAGGTCGCCCACGGAAAAATAAAGTGCGTTCTTTAAGCGGCTCCGATGGCGAAATACGGATAAAGAAACGTGGCCGACCTCCCAATAATCATAAGGTCGTCAAAACTTTAAGCGGTTCAGAAAATGAAAATCCAGTTAGAAAAAGAGGTAGGCCTCCGAAACGTCCACCTTCGCCGAGCAGCTCCGAAGACGAAAGAAAACCGTCTGTTTTCGATAAACCTTTACCACCACGAAGGCGAACAATTTCAAAAAGGGATATGTCGAATAGCGATTCCGACCATGAAAGGTTGTCCAATCCTAAGGAAGCCGATAAATTTAGTTTAGCATCTCGCccaaacaaattaaaatctaAAGGCGAGGATAAGGatcgtaataaaaataaagaggaTTCGGATAATGATGAatggggtaaaataaataaaaataaaatcaggaaTCATTTAATGGAAAGAAGTCGCGAAAGAAGTAACAGTTTAGCTAAAGAGGGTAAACAAAAACGTGCTACAGATTCTCCCAAGAAGAAAGAAACAGTCGTACCTTTTCGAAGGAAAGGCCGGACGAATTCGTCTATGAAAAGTGCTCCTTATTTACCTACTACAACAGATACCGATAGTAGCGATTCGGAtcaagcgtctgtcaaaaagCCTTCCGTAACCGTACCTCAACGAAATCGTAGCCGATCTTCGAGCTCGGACAGTGATGTAAATAGCAATCGGGAAGATAGATCTTCGGATAGTGATCATTTAACTCAAACCATTGTGAACAATAGTAAGGTGGAAAGCCCAGTTAAAGTTGATACCGGAGGAAAATCAATTCAAGATAAGAAAAAGAGCGATACGCTCCGGAAATTGTTTACACCAAAAAGAGATTCGGAAGGTGGTAAAGGAGGTGGTAAAGGCGGCGGTAAAGGTGGGGCTAAAGGAGGTAAAGGTGGTAAGGGAAAAGGAGGAGTTAATGTTATTGTCGTGGATGGCGATTATGAGCGAAGCAGTTCATCAGTGGAGGATGAAGCAATGCCAACCGTGTCTAATCCCTCATTGTTATCGCCAATTCCCAACCACGACACAAAAATGGTTGCATCACGTCCTTGTTCTGTTAGTGAAATTGTTAATCCTAAGACTGAGTTACCAGTTAGCAATAGTGCTAAATTTGAAAGAGATAGTGTACTAGTGAGAATTGAATGGAATAGGATAGATTTAAATCATTTAAGACATAtaccaaaattaaataaaaaacaatcggAGGAACTTCGGCAACGTTCCGATTTAGCGGATACGAGGCAAAGTGATGTGAACAAAATGAAGACTGAACCTTATAGCTCCCCTATTGAAATAAAGTGTTCCACATATtcagaaaatgtaaataaaaataaaagtgacaGAACTAGCCTTATAATTGAGAGTGATAGTGATTTAGGTACCAGAACGACAGTTTGGAAGAAGGATTCAGATTGTCCAAATCAAAATCAATCAAAATCCAGTAATAAGCGCAAAAGGCTTAACAGCTGTAGTTCGTTATCTTCATTGTCTACCGTAAGTAGTATATCACATAGCAGTAGTAGAAGAAAGGAACATAGAAAAGAAAAAGGCAATCACAAAAGTAAGAGACGGAAAGATGAGTTGGAAAGTTCACAAAGATCTCATGTCGATAGTGACAATCTAACAGATGTTCCACCTACAAACCATGAAAGGAAAGGACCGAGAACACCTCCAATGCCTTCTCCTGCTGAACGTAACTGTAGTAATTGGTCTCAACCCATAAGAGAGTATCATTCTTACTTTGAAAGAGTAGATGAACCATCTGAAGATGAGGAAAGAGATCAAAATAGGTACCTGAGTGAAGCAAAGAGGTTAAAGCATTTGGCGGATAAAGAACCGGATACCATAAAGCAGTGCATGCTATATCTAGAAGCGGTTCTTTATTTCCTGCTAACCGGAAATGCCATGGAACGAGAAAGTCTTAGCGAAAAAGCTGCCTTTACTATGTACAAAGATACCCTTTGCCTTATAAAATATATTTCATCAAAGTTTCGGAGTCAACAAAATTCTTCGTCTATGCACACACAATTAGCGGTCTTAAGttttcgatgTGTGGCTCTTATATATTACAAATTATTCAAGTTAAAAAAGTACGAGatgaaagaaaatcaaaaacttATTAACGATTATTTCACAAagTCTGCAAATATGGCACCAATTCAATCGGACCAAATTAATCATGCTCTTGGAGGGCAGGGCACACCTTCCCCATTATCACCGACTCCTTCACCTGCGGGTTCTGTTGGTTCAGTTGGCAGTCAGTCTTCTGGTTATAGTAGCGGGGAATTAGCAGTACGTGCAAATACTACAGTCCCTACAACAGTACCAACTCCACCTACGCCTTGCATGTTGATGCCTGTTCATGTCTACAGTGCAGTGTccaaacaaaatgaaaatttttcataTCTATTTTCTTATCAAGATCTCTGGGACCAGGCCGATGCACTGGTTATAAAAGGCAAACAAAGGGGTAAGTAG
Protein Sequence: MSSQVAERDREQEVPGAPLFGAPVRVNPSSADRVTQQIQSKLGDYQRVKPFLDDSKRLIGVDGVPPSPGGPPSAGNNLPPSPSSRPSSLGLNSNLVLPSRPPPPNSARSEFKKPPQNNARPPHHPHPRRDFTKPNDGKPPYEGRGGYPGQPIKPGNSISNHRSNGLVPIKPPPPPSSSSSSTSSVNLSSSSRIHGASRNLPRLSVDQEMIDVPTPLTAIAATPRIEPDCKFTFNPTTTQPKCGSTDRNIVKGVQKSQGCKDYNVYMRDWYKNKELCDDLNISDTDDSEDEKNLPPPTSSQVSSNIHIVEKLVSPIAATPASNPVMERPVEPISRITAAASSTSDSGSDSESESDSSSDGTGEENVTTTNARVSPVASNPPHISPKPEEETRPRWNLASYLDQNGAKAETVQSPRVQSPFHNSSSHNLSLNSSNIRRNCSDDSDSSDSTKDLDSVVAEAFASKPPAPLLSSFSESDGSVKTKSPKRRKRPVSSVTNMSDSDSDDDQRTIAKIPKPVNRVSPRPKSACSDSDLESNNYIRSSNSDLNKQRLLSPNIKKPEPGNQKPKSNRGRPRKNKVRSLSGSDGEIRIKKRGRPPNNHKVVKTLSGSENENPVRKRGRPPKRPPSPSSSEDERKPSVFDKPLPPRRRTISKRDMSNSDSDHERLSNPKEADKFSLASRPNKLKSKGEDKDRNKNKEDSDNDEWGKINKNKIRNHLMERSRERSNSLAKEGKQKRATDSPKKKETVVPFRRKGRTNSSMKSAPYLPTTTDTDSSDSDQASVKKPSVTVPQRNRSRSSSSDSDVNSNREDRSSDSDHLTQTIVNNSKVESPVKVDTGGKSIQDKKKSDTLRKLFTPKRDSEGGKGGGKGGGKGGAKGGKGGKGKGGVNVIVVDGDYERSSSSVEDEAMPTVSNPSLLSPIPNHDTKMVASRPCSVSEIVNPKTELPVSNSAKFERDSVLVRIEWNRIDLNHLRHIPKLNKKQSEELRQRSDLADTRQSDVNKMKTEPYSSPIEIKCSTYSENVNKNKSDRTSLIIESDSDLGTRTTVWKKDSDCPNQNQSKSSNKRKRLNSCSSLSSLSTVSSISHSSSRRKEHRKEKGNHKSKRRKDELESSQRSHVDSDNLTDVPPTNHERKGPRTPPMPSPAERNCSNWSQPIREYHSYFERVDEPSEDEERDQNRYLSEAKRLKHLADKEPDTIKQCMLYLEAVLYFLLTGNAMERESLSEKAAFTMYKDTLCLIKYISSKFRSQQNSSSMHTQLAVLSFRCVALIYYKLFKLKKYEMKENQKLINDYFTKSANMAPIQSDQINHALGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAVRANTTVPTTVPTPPTPCMLMPVHVYSAVSKQNENFSYLFSYQDLWDQADALVIKGKQRGK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -