Basic Information

Insect: Lamprigera yunnana
Gene Symbol: lilli_1
Assembly: GCA_013368075.1
Location: JABVZV010002608.1:2413168-2561946[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 9.4e-13 1.8e-08 34.2 0.8 4 119 6 134 4 154 0.61

2 6 1.5e-12 2.9e-08 33.6 31.9 341 513 228 428 188 429 0.69

3 6 0.59 1.1e+04 -4.7 9.1 433 477 432 477 423 509 0.60

4 6 1 1.9e+04 -9.4 20.2 78 250 565 731 543 760 0.59

5 6 1 1.9e+04 -6.9 15.9 460 491 824 850 794 867 0.49

6 6 0.0021 41 3.4 11.9 132 268 1039 1168 929 1178 0.58

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	9.4e-13	1.8e-08	34.2	0.8	4	119	6	134	4	154	0.61
2	6	1.5e-12	2.9e-08	33.6	31.9	341	513	228	428	188	429	0.69
3	6	0.59	1.1e+04	-4.7	9.1	433	477	432	477	423	509	0.60
4	6	1	1.9e+04	-9.4	20.2	78	250	565	731	543	760	0.59
5	6	1	1.9e+04	-6.9	15.9	460	491	824	850	794	867	0.49
6	6	0.0021	41	3.4	11.9	132	268	1039	1168	929	1178	0.58

Sequence Information

Coding Sequence: atgAAATTGCGCGTGGAAAGAGACCGCCTTCGGGAGCGGGAGCGGCAGGCACGTGCCCAGATGTCCTCACAAGTGGCCGAGAGAGATAGAGAACAGGAGGCCCCTGGAGCGCCGCTCTTTGGAGTACCTGTCAAGgtgAACCCGTCTTCGGCCGACAGGGTGACGCAACAAATTCAGAGCAAGTTAGGGGATTATCAAAGAGTCAAACCATTTTTGGACGATTCGAAGCGATTAATCGGAGTGGACGGCGTTCCTCCAAGTCCCGGCGTTCCTACTTCGGCAGCAAACCCTCTTCTATCTTCCTCGTCAAGGCTTCCACCCGGTACGAATTCAAATTTGGTGCTACCTTCTAGACCGCAATCTTCCGATACGAGGTCGGAGTTTAAAAAGCCGCCGCAAAACAGGCCACCCCATCATCCGCATCAGAGAAGAGAATTTATTAAACCGACAGATGGTAAACCTCCTTACGAAGGTCGCGGTGGATATCCCGGTCAACCGATCAAACCTGGAAGTTCCATTAGTAATCATAGAACGAATGGTATTGTGCCAATAAAGCTTCCGCCACCTTCGTCGTCGCAATCTTCTTCAAGTTCTGCAAATTTAAGACTGCACGGATCGGCACGTAATCTTCCAAGAATTTCGTTAGACACGAGTGGCGCCAACAGCGGGAGTACCGCACCAAGCGAGACCAGTGGATCTCAGGAAGTCGAAAGTATTTTTAAGGAAATGATTGACGTTCGGACGCCTCTTACTGCCATCGCGGCAACACCACGCATCGAACCGGATTGCAAGTTTTCATTCAATCCGACACAAGCCAAGTTGACagaatcatcatcatcatcgacGTCACTACAACTTACGCCAAAGAaaCGAGAGCGCCAGTCTCTTCCTCGGCAGCAATCGGAGCTTTGCGATGACCTTAATATATCAGATACAGATGACAGCGATGACGAAAAGAACACACGTCCACCGTCAGCATCCCAACTATCTAGTAACATTCATGTAGTAGAGAAATTGGTATCGCCAATTGCTGCAACACCTGCTAGTAATCCTGTAATGGAACGTCCTCCAGAACCGACAGCTCCTTTGTCCGCAGCCGTAAGTTCAACAAGCGATTCAGGTTCAGATTCGGAATCCGACAGTGATTCTAGCAGTGACGGTACCGGAGAAGAGAATAATATATCGGTGAAGGCTAGAACGTCCCCGGTCGTTTCGCATCCACCTCATATATCACCGAAACCAGAAGAGGAAGCAAAACCCAGGTGGAATTTGGCGTCGTATTTAGATCAGAATGGAAGTAAAACGGAAACAGTACAATCGCCACGGGTGCAATCGCCATTTCAAACTTTATCGTCCAACAATCTGCCTTTAAGCTCTTCCAAGGGTCGACAAAAATCTAGTGATGATTCAGATTCGAGCGATTCAACTAAAGATTTGGATAGTGTTTTTGCTGAAGTTCTTGCCGCGAAACCAGTGGCACCGTTGTTGTCTAGTTTTTCGGAATCAGACGgtagtattaaaaacaaaagtccCAAACGAAGAAAGCGACCTATACCTCCAGTTACCAATATGTCGAATAGTGATAGTGACGATGATCATCGGACAGACAACAAAATTCCCAAACCCGTGAATCGCGTAAGCCCTAGACCTAAATCGATGGATTTTGTTGGCGACTCTGATGGCgaatcaaacaattttgttaataGTGAGTTTAGTAAACCGCGTTTATCTTTATCGAATGTAAAAAAAACCGAAACGCTCAATCAAAAGCCGAAATCAAATCGAGGTAGGCCGCGTAAAAATAAACCGCCCTCTCTTAGTGGTTCAGATGTTGAATTACGGGTAAAGAAACGAGGTCGACCTCCGAATAGTCAGAAAACTAATAAATCGTTAAGCGGGTCGGAAAACGAAGCACCCGTAAAACGAAGGGGAAGACCGCCTAGGCAAAAACGTCCACCTTCACCCAGTAGCTCGGAAGACGAATTGAAGTCTGATAAAATGGTACCTTCTAGAaggaaaaccgtttcaaaaagaGACATATCTCGTAGTGATTCTGATAACGATGTATCGCAAAATGATATCAGTAGAGGATCCGATAAAGACGCGACGAAGTTCGGAAATAGCGTTCaatcaaataaaatgaaagtaacAAGGCCTGATGAtaaggaaagaaaaattaataaagaaaattcggATAACGACGAATGGGGCAAaatgaataagaataaaatcagGAACCGTTTATTGGATCAAAGTCTAGAGAGAAATAGTATTACTTCCGCTATTAAAGATGGTAAACAAAAAAGGCCGTCAGATTCAccaaagaagaaagaaactatTGTCCCGTTTCGAAGAAAAGGTCGATCTAATTCGTGTATGAAAAGTGCAGCTTATCTTCCCACAACTACAGATTCCGATAGCGAGGACGACGAAGTATCTGTAAAGAAACCGTTTCTCGCTGTACCTCAACGAAATCGTAGTCAATCAACCAGTTCTGAAAGCGATTCTAATAGTAATCGAAGAAGTAGATCTTCCGATAGCAATCGGTCTCTGCACGTTGCAAATAGTAGTAAAATAGAAAGCCCCGTAAAAGTTGATACCGGAACGAAATCTATTCAAGATAAGAAAAAGAGCGACACACTTAGGAAATTGTTTACTCCTAAGAGGGACTCCGAAGGTGGCAAAGGGGGTGGTAAAGGTGGTGCTAAAGGAGGGAAAGGTGGAAAAGGAAAGGGCGGTGTgaatgttattattatggatGGTGATTATGAACGCAGTAGTTCTTCGGTGGAAGAAGAAACGATGCCAACTGTGTCCAATCCTACTTTCATATCGCCGCTTCTGAATCACGAGAATAAAACTACTATATCGCACCCTTGTTCTGTTACCGAAATTAAACCTGTTAAGACTGAGTTACCAGTTAGTGAAAATTCTAAGTTTGAGAGAAAAAGTGTGCTAGTGAGAATTGACTTGAATCTAATAGATTTAAGTCGGCTAAGacatataccaaaattaaataaaagacaaTCGGAAGAACTTCGTCAGCGTGCCGAATTAGCTGATACAAGGCAAAGTGTTGAAGTGAATAAAGTTAAGACTGAAACTTATAACTCTCCAATAACTACTAGTGAAGTAAAACATTCTCCGTTTATTGATAGTGTAAATAAGAGTAAAACAGACAGAACTAGCCTTATTAATGAAAGTGATAGTGACTTAGGGATTAGAAGACCAGTTTGGAAGAAGGAAGTGGATCAAACGCAATTGTTAAAAGTTAACACTCTTAAGCGTAAAAGACTTAACAGTTGTAGTTCTTTGTCTTCGTTGTCTACAGCGAGCAGTATATCGCACAGCAGTAGAAGAAAAGAACATAGGAAGGAAAAGGGGAACCATAAGAGCAAACGGCGAAAAGACGAAATGGAGAGCACACAACGATCTCATGTCGACAATGACAATCTAACAGATGTTCCACCAACTAATCATGAAAGGAAAGGACCAAGGACCCCACCTCCTATGCCATCTCCTGCAGAACGCAACTGTAGTAATTGGTTGCAACCTATTAGAGAGTATCACTCTTATTTTGAAAGAGTTGATGAGCCTTCTGAAGATGAGGAAAGAGATTCGAATAAGTACCTGAGTGAAGCAAAGCGTCTAAAGCATTTAGCAGATAAAGAACCAGATACAATAAAACAATGCATGCTGTACCTTGAAGCGGTTCTCTTCTTTCTGTTAACCGGAAATGCCATGGAACATGAGAGTGTCACGGAAAAAGCTGCCTTTACTATGTACAAAGATACTCTTAGCCTTATAAAGTACATTTCGACAAAATTTCGAAATCAACAAAATTCTTCATCTGTGCATACCAAGTTAGCAGTTTTAAGTTATCGATGTTTGGCTCTTAtacattacaaattgttcaaattgaagAGGCACGAGATGAAGGAGAATCATAAACATATTAATGATTATTATGCGAAGTCTGCAAATATGGCACCAATTCAATCGGACCAAATCAATCATGCTCTTGGTGGTCAAGGCACACCCTCTCCCTTATCACCAACACCTTCACCAGCTGGTTCTGTAGGTTCAGTCGGAAGTCAGTCTTCTGGGTATAGTAGTGGGGAGTTGGGAGTAAGGACAAATAGTACAGCACCTACAACTACAGTGCCGACTCCACCTACTCCTTGCATGTTGATGCCTGTTTATGTGTACAATGCGGTGTCGAAATTAAACGAACACTCTTCATATCTATTTTCTTATCAAGACTTGTGGGACCAGGCTGATTCACTGGTGATGAAGGGCAAACAAAGAGatTTTTTCATAGAGTTGGACAGGACATGTAAACCTTTGACGTTGCACAGTTCTCTCATAGACTTGGTGAAGTATGTTCGAGCGGGAATCAAAAGACTCAAAGAGAAAGTATAA
Protein Sequence: MKLRVERDRLRERERQARAQMSSQVAERDREQEAPGAPLFGVPVKVNPSSADRVTQQIQSKLGDYQRVKPFLDDSKRLIGVDGVPPSPGVPTSAANPLLSSSSRLPPGTNSNLVLPSRPQSSDTRSEFKKPPQNRPPHHPHQRREFIKPTDGKPPYEGRGGYPGQPIKPGSSISNHRTNGIVPIKLPPPSSSQSSSSSANLRLHGSARNLPRISLDTSGANSGSTAPSETSGSQEVESIFKEMIDVRTPLTAIAATPRIEPDCKFSFNPTQAKLTESSSSSTSLQLTPKKRERQSLPRQQSELCDDLNISDTDDSDDEKNTRPPSASQLSSNIHVVEKLVSPIAATPASNPVMERPPEPTAPLSAAVSSTSDSGSDSESDSDSSSDGTGEENNISVKARTSPVVSHPPHISPKPEEEAKPRWNLASYLDQNGSKTETVQSPRVQSPFQTLSSNNLPLSSSKGRQKSSDDSDSSDSTKDLDSVFAEVLAAKPVAPLLSSFSESDGSIKNKSPKRRKRPIPPVTNMSNSDSDDDHRTDNKIPKPVNRVSPRPKSMDFVGDSDGESNNFVNSEFSKPRLSLSNVKKTETLNQKPKSNRGRPRKNKPPSLSGSDVELRVKKRGRPPNSQKTNKSLSGSENEAPVKRRGRPPRQKRPPSPSSSEDELKSDKMVPSRRKTVSKRDISRSDSDNDVSQNDISRGSDKDATKFGNSVQSNKMKVTRPDDKERKINKENSDNDEWGKMNKNKIRNRLLDQSLERNSITSAIKDGKQKRPSDSPKKKETIVPFRRKGRSNSCMKSAAYLPTTTDSDSEDDEVSVKKPFLAVPQRNRSQSTSSESDSNSNRRSRSSDSNRSLHVANSSKIESPVKVDTGTKSIQDKKKSDTLRKLFTPKRDSEGGKGGGKGGAKGGKGGKGKGGVNVIIMDGDYERSSSSVEEETMPTVSNPTFISPLLNHENKTTISHPCSVTEIKPVKTELPVSENSKFERKSVLVRIDLNLIDLSRLRHIPKLNKRQSEELRQRAELADTRQSVEVNKVKTETYNSPITTSEVKHSPFIDSVNKSKTDRTSLINESDSDLGIRRPVWKKEVDQTQLLKVNTLKRKRLNSCSSLSSLSTASSISHSSRRKEHRKEKGNHKSKRRKDEMESTQRSHVDNDNLTDVPPTNHERKGPRTPPPMPSPAERNCSNWLQPIREYHSYFERVDEPSEDEERDSNKYLSEAKRLKHLADKEPDTIKQCMLYLEAVLFFLLTGNAMEHESVTEKAAFTMYKDTLSLIKYISTKFRNQQNSSSVHTKLAVLSYRCLALIHYKLFKLKRHEMKENHKHINDYYAKSANMAPIQSDQINHALGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELGVRTNSTAPTTTVPTPPTPCMLMPVYVYNAVSKLNEHSSYLFSYQDLWDQADSLVMKGKQRDFFIELDRTCKPLTLHSSLIDLVKYVRAGIKRLKEKV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00003744;
90% Identity: -
80% Identity: -