Basic Information

Insect: Mantis religiosa
Gene Symbol: lilli_2
Assembly: GCA_030765055.1
Location: CM060948.1:345280330-345369123[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2.5e-11 1.2e-06 30.5 16.9 363 503 7 172 4 200 0.74

2 5 0.19 9.2e+03 -2.1 0.6 455 491 233 265 205 277 0.45

3 5 1.8 8.6e+04 -5.3 14.4 77 250 274 439 254 455 0.47

4 5 2 9.5e+04 -18.4 30.5 94 212 475 601 450 690 0.43

5 5 0.00029 14 7.2 13.5 104 220 841 955 813 1015 0.58

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2.5e-11	1.2e-06	30.5	16.9	363	503	7	172	4	200	0.74
2	5	0.19	9.2e+03	-2.1	0.6	455	491	233	265	205	277	0.45
3	5	1.8	8.6e+04	-5.3	14.4	77	250	274	439	254	455	0.47
4	5	2	9.5e+04	-18.4	30.5	94	212	475	601	450	690	0.43
5	5	0.00029	14	7.2	13.5	104	220	841	955	813	1015	0.58

Sequence Information

Coding Sequence: ATGACAGAAGTGATGGCACCAATATCTGGAATTGCCACACCAAGGAAAGAACTGGAATCTAAGTTCACCTTCAGTCCCATTGTTCCCAAGAGCACCACCTCCGAAGTGCAGCCTTCGCGAGTCGCTACCGATTACAACCGGAATAACAACAGGCATGGAAATCAGGTGCTGCCAACGACGGGCAATTTGGAAAAGGACCTGAGTCTGTCGGACAGTAGTGATGATGACAAGGATGTGCTTAAGTCGAGTGGAAAACCCTCCTCTGCTGCTGCAGTTAAAATGGACCAATCCAGGCGAGTTCCAGCGCTGCTGACTACCAGTCCTACTCCAAGCATCCTTAGTGTGGGAAGTAGACCACCAGAGCCAGCACCGCTAATGTCCCCAGTTGGACCTGCTTCATCTTCCAGTGAAGCAGATTCTGACTCTGGCTCTGGGTCAGACAGTGAGTCAAGCAGTGAGGACTCTGGGGATGAAGCTCCACGCGAGTCAGCTGAACCAGCAGCAATGcctacaacagcagcagcagcatcgcCACACCAGATGGAGCAGTTAGAAGAGGCAAAGCCCCAGGATCGCTGGAACCTGGGAAGGTTTCTCAAACCCATTGGAGAACCTCCAGAAGAGAATGAACAAACTAGAACTGGTCCAGAATTTGCTAAGCAAGACGAGTCCCCAGCTGCTGCAGTAGTCGCTACAGCAGCAGTAGCCACATCAGTTCCTGCAATTAGTACTTCGTCCAAGGAGAAGCAGGAAGAAGGCGAGATTGTTTCTGATGACAGCGACTCCAACAAGGAGTTGGACAATGTTGTGGAGGACTTGCAGCATCCAGTACCACTTCTGTCAGGCATCTCAGATGAGTCTGATTCTCCACCTGTTATGGAAACTAGGACTGCCCCCATCACAAAAAGGAAACGTCCGTCAATCAACACTAGGCCCCCTGTGCTATCAGAGAGTGACAGTGATGGTGAAGTGAAAGTGAGGGAAAAACCAAGGACACATAAGAGGACTCAGCCCCGTACTAAGAAACAAACACGCTCTCCTAGTTCATCAGATGATGAACCTGAGGACCCTGCCAGAACAATAAAGCTGCGAAATGGTGGCACAACCCGATCTCTAGATGGTGACAATCACCGAAAAAAGTCAAGGAATCGtaaaccactaccaccaccaccaccaccaccgccaccaccaccaccaccaccagctgCATCATCGAGTGAGTCAGAACCTGAGGATATGAAGAAAAAAGTAACCAAAGTCGTATTATCATCTTCTAGTTGTTCAGAAGGTGAGATTAAGGAGCCAAAGCCAAAAGAAAAGACAGTTGTTAATGTTCCATGTGCATCAGGAGAAGAGTCTGAACCAGTCAAGAAAAATGTCAGTGAGTCAGAGGAAGAGGTGAAGTCAAAAATTCATAGTGCAAGCAGCAGAGAAAGTTCTAAAGTGAGGACAAAGGTTCATGTAAGTGACTCAGACGAGGAACTGAGTATAAAACCGTCAGTTGTGATAGAAGTGAGTGACTCTGACGAACCAAACTGGGACAAGAGTAAGACCAAAGTACAAAGTGCAAAGAAAGGTAGAGCTAGGAGTAAGCCAAGATCAAGTGAGAGGTCAGCCAAGCGAGAGGAAAAGAAATCCAGCGGTCCAAAGAAAGAAAGGACACCCAAACGTCCGAACAATAGAAAGAGACCTAGAGATGACACTTCACTGGGCCCAAAGAAATCTTCAGGACCTGGAAGGCCAATGCGAAAGAGTGgcatttttaaaagcatggaAACATGCCCTCCAGATACTCCTTCGAACAGTGATGGTGAAATGGACATTGTAAGTACTTCCCCAGTAAAGCCAGTCACAAGACCTAAACTGCTGAACAACAACTGTCGAGATTCTAGCTCTGACTCGGATGGGGCTCACACTAGGATAAAACCAGATGTGATTCCAAAACGCAAACATTCATCAGATAGTGAACGGGACAGCGATGGGTCTCCTGTGAGTCGTCCACAGGCCTCTAAAGTAGAGAGTCCTCCCAAACTGGATAGTGAGgacaaaaccatccaggacaagAAGAAAAGTGATACATTACGGAAATTGTTCACATTGAAGGGTGGGGCTAAAGGAGGTGGTAAAGGAGGAGCCAAGGGGGGTGGCAAAGGTAAGGGGGGCTCTAAGACACCAGGGGTGCTAGTGATAGAGTGTGGCGAGTGTGAAGACGAGCACTTGCCCACCCCAGTCAGTCCTGAGCTTTTGTCACCACTGCCAAGTAGCGAGGGTGGTAGCACTGCAACCAAAAGAAAACCTAGTAAGAAGGATTCAGCAGTGGAACTTCCTCCATTAGTTTATAGTGACAGTGGTATTCCAATTTTGTTGTGTCAGGTGGATCTCTCAAGACTGTTGCATATACCTGCAGGCAAAGGTCAAGACGTAAGAGTACGCACTGAACTGCCTGACACCAGGCAACCCACTGACATTGAGGATACAGTTATACCAAAGTGTACAGGTTGTGACAACACAGATGAAAAGGCTTCCAAGAAGCACAAGAAGAAGAAGCAAGGCTCCAAGGATACTGAGGGTGAGAAGTCAGGAGATAAACATCATCATAAGCGAGAACGCCGAACCAGCAACAGTTCAGTTTCATCGTTATCAACAGAATGTAGTCGTGTTTCATCACAAGGTGCTAGAACCCACAAACGCCACAGGCACAGTCACAGTCACGAACACAGTTCCAGCAAACGACGGAaaggtggtagtggtggtagacAACCGCCACCAGTAGAAGAGGATCTGCCAGAACCAAAATTATCTAGTCAAAGTACCAACACAACAGCACTAAGCGATGTGCCTCCAACAAATCATGAACGAGAGGAGGGTAATGAAGATGTGAATATTGCTCCAGCTGCTGATGCACTAGTGCCATGTGCTGGCTGGGCACCTCAGCCCCAGAAGGTTTACTATTCTTACTTTGAACGAGAGGAAGAGGATACCTCTGATCATGAGGAGAGAGATGAGAATCAGCAGAACAACTATCTGAAGGAAGCAAAGAGGCTGAAGCATGGGGCAGATAAAGAGATGGACCATTTggcacagggaatgcagtacttaGAGGCAGTGTTGTTCTTCATTCTCACTGGCAACGCAATGGAACGCGAAAGAGTGACTGAGAAAGCAGCATTCACCATGTATAAGGATACACTTAGCCTCATCAAGTTCATTTCCTCTAAATTTCGAACACTCCAAAATCATTCTCCAGTCAGCATAGACAAAATTGCTATTTTGAGTTTGAGATGTCAGTCATTGCTGTATCTGAAGCTGTTTAAAATGAGGCGTCACGAAGTTAAGGAATATCAGAAAGTATTGCAGGATTATCATCAAAAGGCCACTCAGCCGACACCTTTGCAGCCGGAGCAGTGTGGGGGCCAAGGGACACCTTCTCCACTATCACCAACCCCTTCTCCTGCTGGCTCTGTAGGTTCCGTTGGCAGTCAGTCCTCCGGATATAGTAGTGGTGAACTGGCGGCAGGAAGAACTGGTGTGGGAGTAGGTAATGCTGTGGTACAGCAGCCCCCAGCAGCCAACATGGGACCTTGTGTAGCAGTTCCATTGGCAGTGCACTCTGCAATGCAAAAACAGAACCAACACTTCAGTTATTTGCTGTCATGTCATGAGTTGTGGGAACAAGCTGATGACTTGGTGTACAAAGGGAAACACACAGGTATATTACTACCCTTATGCATTTGCTAA
Protein Sequence: MTEVMAPISGIATPRKELESKFTFSPIVPKSTTSEVQPSRVATDYNRNNNRHGNQVLPTTGNLEKDLSLSDSSDDDKDVLKSSGKPSSAAAVKMDQSRRVPALLTTSPTPSILSVGSRPPEPAPLMSPVGPASSSSEADSDSGSGSDSESSSEDSGDEAPRESAEPAAMPTTAAAASPHQMEQLEEAKPQDRWNLGRFLKPIGEPPEENEQTRTGPEFAKQDESPAAAVVATAAVATSVPAISTSSKEKQEEGEIVSDDSDSNKELDNVVEDLQHPVPLLSGISDESDSPPVMETRTAPITKRKRPSINTRPPVLSESDSDGEVKVREKPRTHKRTQPRTKKQTRSPSSSDDEPEDPARTIKLRNGGTTRSLDGDNHRKKSRNRKPLPPPPPPPPPPPPPPAASSSESEPEDMKKKVTKVVLSSSSCSEGEIKEPKPKEKTVVNVPCASGEESEPVKKNVSESEEEVKSKIHSASSRESSKVRTKVHVSDSDEELSIKPSVVIEVSDSDEPNWDKSKTKVQSAKKGRARSKPRSSERSAKREEKKSSGPKKERTPKRPNNRKRPRDDTSLGPKKSSGPGRPMRKSGIFKSMETCPPDTPSNSDGEMDIVSTSPVKPVTRPKLLNNNCRDSSSDSDGAHTRIKPDVIPKRKHSSDSERDSDGSPVSRPQASKVESPPKLDSEDKTIQDKKKSDTLRKLFTLKGGAKGGGKGGAKGGGKGKGGSKTPGVLVIECGECEDEHLPTPVSPELLSPLPSSEGGSTATKRKPSKKDSAVELPPLVYSDSGIPILLCQVDLSRLLHIPAGKGQDVRVRTELPDTRQPTDIEDTVIPKCTGCDNTDEKASKKHKKKKQGSKDTEGEKSGDKHHHKRERRTSNSSVSSLSTECSRVSSQGARTHKRHRHSHSHEHSSSKRRKGGSGGRQPPPVEEDLPEPKLSSQSTNTTALSDVPPTNHEREEGNEDVNIAPAADALVPCAGWAPQPQKVYYSYFEREEEDTSDHEERDENQQNNYLKEAKRLKHGADKEMDHLAQGMQYLEAVLFFILTGNAMERERVTEKAAFTMYKDTLSLIKFISSKFRTLQNHSPVSIDKIAILSLRCQSLLYLKLFKMRRHEVKEYQKVLQDYHQKATQPTPLQPEQCGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAAGRTGVGVGNAVVQQPPAANMGPCVAVPLAVHSAMQKQNQHFSYLLSCHELWEQADDLVYKGKHTGILLPLCIC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01410792;
90% Identity: -
80% Identity: -