Basic Information

Insect: Earota dentata
Gene Symbol: lilli_1
Assembly: GCA_027574905.2
Location: JAODGB020029203.1:4300-12362[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 3e-09 6.3e-05 22.6 13.2 412 503 39 130 33 133 0.83

2 7 0.0027 55 3.0 11.1 109 246 123 250 117 258 0.50

3 7 1 2.1e+04 -18.4 33.7 88 253 239 403 229 408 0.61

4 7 0.64 1.3e+04 -4.9 17.1 438 496 362 418 342 430 0.42

5 7 0.009 1.8e+02 1.3 29.1 378 501 415 532 407 538 0.64

6 7 0.6 1.2e+04 -4.7 1.8 480 504 614 638 608 669 0.55

7 7 0.041 8.4e+02 -0.9 24.0 84 245 724 889 704 902 0.37

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	3e-09	6.3e-05	22.6	13.2	412	503	39	130	33	133	0.83
2	7	0.0027	55	3.0	11.1	109	246	123	250	117	258	0.50
3	7	1	2.1e+04	-18.4	33.7	88	253	239	403	229	408	0.61
4	7	0.64	1.3e+04	-4.9	17.1	438	496	362	418	342	430	0.42
5	7	0.009	1.8e+02	1.3	29.1	378	501	415	532	407	538	0.64
6	7	0.6	1.2e+04	-4.7	1.8	480	504	614	638	608	669	0.55
7	7	0.041	8.4e+02	-0.9	24.0	84	245	724	889	704	902	0.37

Sequence Information

Coding Sequence: ATGTGTCCCTCTTCGGTCTACGGCATGCTAGGCAAATactcgctgccgctgcatGCCTTGGGCATTGGGAAGGTGGGAATGCATGCGCCCGGGTATTGCATTGCCAATGCGAATGTGCGGACCCTGCAGAATGATCTTTCGATATCTGACGACAGCGAGGACGATCGCAGGCTGCCGATAGAAAAGATGCTATCGCCGATTGGAATGACCCCAGCGAGCGGTAGCATCGAACGACACATCGAACCGATTGCGCCCATGTCCCCAGTGCGAAGTTCGTCCAGCGACTCCGGCTCCGATTCCGGCTCCGACTCGGACTCCAGCAGCGACGACTCTCCGGAAGAGACTCGCCAATTCGCGCGCGGTCCGAAGAGTCCGCCGATGCCCCCGGCACCTGTTGAACCCATCGCTCCCATGTCGCCCAGCATCCACGAGGCGGAAGAAGAGACGCGGCAGACGCGTTGGAATTTGGCGTCGTACTTCTCCAACAACAACTCCGCCGCGCCCCAGTCGCCGCCGCAGAATCCCTCGTCAAACGCATCGAACAAAGGTGATCATCGTAAGCGGCACGACGATTCTGACGGCAGCGATTCCGCAAAGGATGTGGATCGAGTGTTGGATGAGGTGAAGATTTGTTCGCCATTATCAAGCCTTTCCGAGTCTGACGGCAGCACCGAGAAGAAAACGCTTCGCAGGCGCAAGCAGATCATGTCCAAGTCGAATGTGCCTGAggatagtgatagtgatgaAAGTCCGATGCGgacaaaagtgcaaaaaccTGTGAATCGCGCGAGCCCGCGTACCAAATCGCCTGTATCTAGCGATACCGAAGCCGAGCGTAGCAAACAATCGAAAACCTCGCCGATCAAATCAAAGTTACAAGACAAGTCAGTGAAACCGAAATCAAATCGCGGTCGACCGCGCAAAATCAAACCTTCAAACAGCGGCTCCGACCAGGAAGTGAAGAAGAAACGCGGCCGCCCACCTGGTAGCAGTAAGAATCGACGGCCATCCATCAGCGGATCTGATATCGAAACGCCCAAAAAGCGTGGACGGCCACCGCTGAAGGCAAAAcggccgccatcgccaagCAGTTCCGATGACGATAAGTCGCCAGCGACTTTCGAGAAGCCGACGGTGCCTGCGAGACGGCGGACAGTCTCGAAGCGTGCGTCGAGTTCTGGATCCGACTCCGATTCGCGCTCCTCATCGGTGGTCAAGACCTCCGACAAGGAGACCGCGAAGAAGAAGTCGCCCACGAAACATCGACCTCCAGCGGAGGACAAACGAAAACGTCCAGATTCGGACAACGACGAATGGAATCAAGCACGCAAGACTAAACTCCAAAATTATCTCTTTGAGAAGCACGATCGCACAGAAGCGACGAATCAAAAGCGGCCTTCGCAATCGCctcacaaaaaagaaactaaaGTTCCTGTCAAACGCAAAGGAAGATCAAACTCGCACAAAAGCGCTGCCCTCGTGCCGACATCAAGTGACTCGGACAGCAGCGCTTCCGACGGTTCGTCGCGTAACTCCAGCTCCAAGAAGAAGCATACAGCGCGGCCTTCACGTTCCTCTAGTTCCGAGCCAGACGTGAAGGTACACAGTTCCGACTCGGAGGCACCGCCAGTCAAGATTGACAGTCCGGCGAAGTTGGGCGCGGACCACAAGAGCGTTCAGGACAAAAAGAAGAACGACACACTCAGGAAACTGTTCTTCACGCCCAAGCGTGATTCGGAAGGCGGGAAGGGCGGCAAAGGAGGTGCTAAGGGCGGCAAAGGTGGCAAAGGCGGCAAGGGCAAGGGCGGCGTCAATGTTATCATCATGGATGGTGATTATGAGCGCAGCAGCTCACCGGTGGAGGAGGAGGCGATGCCCACAGCCCTCGCGCCGCTGCCATCGCCAACGCCAAGCGACTCCAAGTCGTCGGCGCCCCAGACCGCTTCAGCGGACCTTACAAGAGTAAAGACTGAACCGGACAGTGCAGACTGCAAATCTCCCAGGTTGCCTAGCCTCATGGTGCGCATTGAACTGTCTCGACTCTCAATTataccaccgccgccgcctaaGGGACGTAAGCTATCGGACTACCGGCCATTCGTGGATTTTAGTACGGTAGCGTTGCGGTTGGAGAAGCCGATCAAAAAGGAGCCCTCCGACGCGTTGAGCTCCGACGCGCATCATAAACAGAGTGACTGTGAGGACAAACGGACGTGTAACGACAGTGATAGTGAGTTTAGCCGGAAGCTGGTCAGAGATGAGCCGATGGTTGACACGAAGAGCAAGAAGCGAAAACGGCAGAACAGCTGCAGCAGCATGTCATCGATATCAACCATCAGCAGTATGtcgcacagcagcagcaggaagaagGACTCCAAGGGGCGCAGCCATCACAAGAGCAAGCGGCGGAGAGACGACGCCGATGCgtcgggcgccgccgccagttcGTCGCGTGACTTTGATGAGAACCGCGtgcagcagcaacagcgcgaacagcagcagcagcaacttCCGAGCACGTCGGAGGAACCTTCTCCTGCCCCTGCACAACCCATTAGAGAATATCATTCTTACTTCGAAGTTACGGACGATCAATCCGACGAAGAAAGAGATCAAAATAGGTACCTGAGTGAAGCGAAAAGATTAAAGCATTTAGCAGACAAAGAAAAagacacaataaaacaatgtaTGCTGTACCTGGAAGCTGTGCTTTACTTCTTGCTGACTGGCAATACCATGGAGCGTGAAGGTTCCGATAAGACAATTGCCTTCGTGATGTACAAAGATACTCTGTCACTAATTAAATATATAtcatctaaatttaaaaatcaacaaaatccTACTTCGGTACATAACAAATTAGCCGTGTTAAGTTATCGCTGTCAGGCATTACTACACCAcaaattatacaaaatgcGACGTCTGGAATTGAAGGATTATCAGAAAATAATCAGTGATTTCTGCCAAAAGACTGCGACAACGGCACCATTACAAGCGGACCAAATCAGCCAGATCCTTGGCGGTCATGGCACGCCATCGCTGTCGCCGACGCCGTCACCTGCCGGTTCGGTCGGCTCGGTGGGCAGCCAGTCGTCGGGATATGGCAGTGGCGAGCTGGCAGGACGTGGCAGCTCCTCGCAAACGCCGGTTGCCGCCGCCATCCCTGTGGCGCAGCAGTGTATGCTGTTGCCGATGAACGTCTACTCGGCGATTTCGAAGCAGAACGAAATCACCGGATACCTCATCTTTTATCAAGACTTGTGGGATCAAGCCGATACTATTGTCACCAAGGGCAAACATACAGATTTCTTCATCGAATTAGATAGGAAATGCAAGCCTTTGACATTGCATAGTTCCGTCACCGATTTGGTGCGTTATGTTCGCGCCGGAATCGCGAAGCTGAAAGCGCAGATAGGTGATACTTGA
Protein Sequence: MCPSSVYGMLGKYSLPLHALGIGKVGMHAPGYCIANANVRTLQNDLSISDDSEDDRRLPIEKMLSPIGMTPASGSIERHIEPIAPMSPVRSSSSDSGSDSGSDSDSSSDDSPEETRQFARGPKSPPMPPAPVEPIAPMSPSIHEAEEETRQTRWNLASYFSNNNSAAPQSPPQNPSSNASNKGDHRKRHDDSDGSDSAKDVDRVLDEVKICSPLSSLSESDGSTEKKTLRRRKQIMSKSNVPEDSDSDESPMRTKVQKPVNRASPRTKSPVSSDTEAERSKQSKTSPIKSKLQDKSVKPKSNRGRPRKIKPSNSGSDQEVKKKRGRPPGSSKNRRPSISGSDIETPKKRGRPPLKAKRPPSPSSSDDDKSPATFEKPTVPARRRTVSKRASSSGSDSDSRSSSVVKTSDKETAKKKSPTKHRPPAEDKRKRPDSDNDEWNQARKTKLQNYLFEKHDRTEATNQKRPSQSPHKKETKVPVKRKGRSNSHKSAALVPTSSDSDSSASDGSSRNSSSKKKHTARPSRSSSSEPDVKVHSSDSEAPPVKIDSPAKLGADHKSVQDKKKNDTLRKLFFTPKRDSEGGKGGKGGAKGGKGGKGGKGKGGVNVIIMDGDYERSSSPVEEEAMPTALAPLPSPTPSDSKSSAPQTASADLTRVKTEPDSADCKSPRLPSLMVRIELSRLSIIPPPPPKGRKLSDYRPFVDFSTVALRLEKPIKKEPSDALSSDAHHKQSDCEDKRTCNDSDSEFSRKLVRDEPMVDTKSKKRKRQNSCSSMSSISTISSMSHSSSRKKDSKGRSHHKSKRRRDDADASGAAASSSRDFDENRVQQQQREQQQQQLPSTSEEPSPAPAQPIREYHSYFEVTDDQSDEERDQNRYLSEAKRLKHLADKEKDTIKQCMLYLEAVLYFLLTGNTMEREGSDKTIAFVMYKDTLSLIKYISSKFKNQQNPTSVHNKLAVLSYRCQALLHHKLYKMRRLELKDYQKIISDFCQKTATTAPLQADQISQILGGHGTPSLSPTPSPAGSVGSVGSQSSGYGSGELAGRGSSSQTPVAAAIPVAQQCMLLPMNVYSAISKQNEITGYLIFYQDLWDQADTIVTKGKHTDFFIELDRKCKPLTLHSSVTDLVRYVRAGIAKLKAQIGDT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00022187;
90% Identity: -
80% Identity: -