Basic Information

Insect: Apolygus lucorum
Gene Symbol: lilli_1
Assembly: GCA_009739505.2
Location: CM019167.2:49903378-50151758[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 8e-14 1.6e-09 37.7 6.5 4 153 5 164 4 185 0.59

2 7 2.5e-06 0.048 13.0 0.4 336 384 180 228 168 239 0.80

3 7 0.00033 6.5 6.0 16.2 379 513 298 448 281 449 0.58

4 7 1 2e+04 -7.2 6.7 436 477 484 524 452 557 0.43

5 7 1 2e+04 -8.7 23.1 72 234 573 735 564 786 0.58

6 7 0.1 2e+03 -2.2 1.0 476 502 766 792 762 794 0.81

7 7 0.012 2.3e+02 0.9 29.3 87 253 866 1031 839 1118 0.58

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	8e-14	1.6e-09	37.7	6.5	4	153	5	164	4	185	0.59
2	7	2.5e-06	0.048	13.0	0.4	336	384	180	228	168	239	0.80
3	7	0.00033	6.5	6.0	16.2	379	513	298	448	281	449	0.58
4	7	1	2e+04	-7.2	6.7	436	477	484	524	452	557	0.43
5	7	1	2e+04	-8.7	23.1	72	234	573	735	564	786	0.58
6	7	0.1	2e+03	-2.2	1.0	476	502	766	792	762	794	0.81
7	7	0.012	2.3e+02	0.9	29.3	87	253	866	1031	839	1118	0.58

Sequence Information

Coding Sequence: ATGGACTGCATTGAGCGGGACCGCCTGagagaacgggagaggcaggcGAGGGCGCAAATGTCCAGCGAGAGGGAGGATCCACCGGGTGGCGCCCCCCTCTTTGGAGCCCCTGTCAGGATCAACCCTTCGCCCGAGGACAGGGTGAGGCAGAACATCCAGACTCGGCTCGGAGAGTACGATAAAGTCAAGCATCTCCTGGATGAGCCGAAGCAGTTGCTGGGCTACGACGGGCTCCCGCCCGCCTCCCCCGCCCCCGCTCCGCCGCCTTCATCGAAGTCCTCCTCCTCGAGAAGCGAGTTCAAGAAGCCGCCCTCCTCCTCGCACCCTTCGCAGTCCTCTAGGTCTCATCCTTCCAGCAGGTTCGTCAAGCCCGGAGAGTCGAAACCTAGCAGCTACGGAGGAGGGCGGAGTCTTCATTACAACCAGCAATCGAAACCATCGGAGGTTCGGAACGGCATCAGCAGCAGCAACGCCAAGCAGCCCGTTCATCGCCTTCCGGGCTCGCGAAACCCTTCCTCCCGACCGGAGACGggGGCGAAGGACTCCTCCAGATCGCTTTCATCTCATCCCAATGATGTTGACATTATCCTTAAAGAAATGACTGGTATCATGACCCCCCTCACGGCTATCGCATCAACGCCTCGCAAAGAACCTGAATCGAAGTTCAACTTTGAACTACCATCCTATCAATCAGCCGAGAGGGTGGAGCCGAAAGTGGCAATGATCCAGCCAGAGATCCCGCCGCCTTCCTTCGCCGCCCCGTCGCTCTTCGGGGGCGCCCTCATAGGGGGCGCCCTCCTCTCGCCGCCCAAACCCGAGTCGCCGCCCCCGCAGCCCCTGTCGCCGCCGCCCGCCACCCCTTGCCATAAAATATCAACCAATACCATCAGCGGTATCCAGAAAAACGGTGTTGTGAGGAAACCATCCAGTCATCAGTCGCAACATCAACCGCTCCCTTCAATACATACGTTGCTTTTGCCACCTCCGTCTTCTCAATTGGAACCCGATTGGAAGACAGACCTAACTCTGTCTGAGGACAGCGATGACGACGCGAAGATTCCGACGCCAGCTCCCGTTGTCAAACATTGTGATCTTCCTCCCCAAAGGGCTCGGTCCCCATCTCCATTAATGGATAAAACTATGCTTTCGCCAGCTGTAAGCGTAGTTCCTGACCCTATCCGACCGATGTCCGTCTCACCTCCTGGTGCTAGCTCCTCCAGTGATGACTCTGGTTCTGATTCCTCCGAGTCTGACTCGAGTAATTCTATCCCTCCTGTGCCAGAGCCTCCTCCACCTGTTCAGGAGCCACAGAGGCCACGCTCTTGGGGTCTCCAGCAGTTCCTTCCTCCCCAACCAGAACGTCGAATTTCACCTGATCCTTCCCTGAGTAAAACGAAAAATGGTGAAGAAAGTGACAATGACCTGGCGAGAAGTGTTAAAACGACTCAACCATTGATCTCCAGTTTTTCTGATAGTGATACAGAGAAGAGACCAGAGCCTGAGAAAGAAGCAGGGAGGACGAGGGGAAGGAAGAAACGAAACGTGAAGCCACCTGTCCCTGAATCTGATAGTGAGGATGAAATTATCGAAATACCTGATAGTTCTCCTGAACCCCCTGAGCCTCCCACTGAACCGatcgttattcctgaaccaGAGCCTGTTCACAGCAAACCACCTAGAACCCCATCAGTGAACGAAGTGGAACCAAAAGTTCAACTGAAGAGAAAATGTAAACCCACCACTCCATCCAATCCCTCCCCAGAGAAATCTAAGAAGAGAGCACCTCCTAAAAGCACTGAAAAAGAGTCTCCATCATCTGGTAAAAGATCGAGGAAGAGGGTAGTTAAACCTCCCATAACGCCTTCTGATACAGAGGACGAAGGAGGGAAACGAAAGCGTGTTGCCAGCATCAGTGATAGTGGAGAGGACACGTGGAACACAACCACCCGACCGCGGAGTTCCAGGAGGTCAGTTAAAGAGAGTTCCAGCGAACGGACCAACAAGCGCGATACTAGTAGTGAGGATGAGACCCCCGTGGTTGCACAATCTCCTATCAAGCCAGTATCTAGGGTCGTTCCTGCTCTCGGGAAGAGGCCACCTATTGGATCCAGTGAGAGCGATGCGGAGAAAGAAGAAAGCCCTCCTAAAATCGACTCTGAAGGGCAGTCTATACAAGACAAGAAGAAGAACGACACCCTCAGGAAATTGTTTTCCAAACGAGACAACGAAGGAGGACTTGGGAAAGGAGGCAAAGGGAAAGGTGGTAAAGGAAAAGGGATGGTTGCCGTTGTCGTCGAATCAGACTCCCAGTCTCATCATTCGCCGAAAGTTGAATTATTACCTCCCAGAGTTCCTTCGCCTAATCCCAGTCCAGAGGAGAAGATCCCGGACATCAAGCCTGTGGAAAAATTACCTCCTGTACCTTTACCGAAACTGGTTTACGTTGACGGCAAGCCTTCACTGACTTGCAAGATCGACCTTAGTATATTATCTCATATACCTAGTAAAAAGCGTTCTGAAGAAGTAAGAACGCATACCGAAATCCCTGACACTAGGCAAAATGTCGACTCTCGGCAACCTACTGAAATTAGGCAAACTTCCGATATTAGACCAGCTTCCGATAGTAGGCACATGGCTGATAATAAACAAACTACCGATAGTAAGCTACCTGCCGAGAGTAAGCCAACTGTCGACAGTAAGCCAAGTGTCGATAGTAAACAATCTACCAATAATAAGCAAACCGACAGTAAGCAAGGAGCAGATAAAAGCAAAAAGCCATCTAGAGACGCTAAAAATGACAAAAGGGATCGTAAACATACGGACAAACATCGATCCAGAGATGACAAgagcaagaagaagaaatcTGTTGAAGCTGTTGAGGTCAAGGATGAGGATCAAAAACAGATTCAAGCAGAAGTCATCAAGCGACTTACCCCTGATATTAAAACGGACAGCGGACCGCATGCGAGCAATTCTGGGATGAAAAGAGAGAGGAGAAATAGCGCAAGTACCTCTTCGAATTCCATGAGACAACCTTCCAAGCCTGGTAGCAAAAGAAAGAAACATGGAGAACGACCTTCAGCAGTCAGCGAAAGTTCAATGGTTGATGCACCTCCGACGAATCATGAACGGGAGAAAGATAAAGATGCCGACAGTCGAAACACAGAAGTTGATGAAAAGCGTGATAGAGTTAATAAAGATGTTTCGAAAAACCTtacttatttttcttattttgaacagGCCGATGATGCTGATTTATCTGACAACGACGATAAGGATACTTATCTGTCGGAAGCTAAAAGGTTAAAGCACGCTGCTGACAAAGAAACAGACGATACTGCCCAAGGTATGCAATACTTGGAGGCAGTGATGTACTTTTTGCTTACTGGCAATACTATGGAACATGAAACTGTCACAGAAAAGGCTGCTCAGACAATGTATAAAGATACTCTTCATCTTATCAAgtacaTATCATCCAAGTTCCGAAGTAAGCAGAACAGTACTGCTCCACAAGCACTCATTCATAATAAATTAGAAGTTCTGAGTTTGAGGTGCCAGTCTCTACTGTATTTGAAGCTATTCAAAATGAGAAAGGCAGAAGTGAAAGAGTGTCAAAGGGTTATAAACGACTACATGCAAAAGCAATTTGATTATGTCTTTCAGGCAAACCCACCAACTACGGTGGAACAGTGTGGGTCCGTTGTTCAGGGTCAAGGGACCCCGTCACCGTGTTCGCCTACGCCCTCCCCTGCCAGCAGTGTTGGATCCGTGGGTTCTCAATCCTCAGGCTACAGCAGTGGTGAACTCAGAGGTGCATCCGCCGCCCAAGGACAACCACATCCACCTGTGGCACCCTGTGGACCTTGCATCGCAGTTCCACTTCCAATTCACCTTTCCCTGCAAAAGCAGACTGCTAACTTCAACTCATTACTTACAGCGCATGATCTTTGGGATCAAGCAGATATTTTGGTGCATAAAGGGAAACACAAAGAGTTCTTCATTGATTTGGACAGAGCCTGTGGACCCCTGACACTTCATAGTTCCTTGAAGGATCTTGTAAAATACGTGAGAGTGGGCATAAACCGTTTGAAGGAAATGCGAAGTGACTGTGTGTGA
Protein Sequence: MDCIERDRLRERERQARAQMSSEREDPPGGAPLFGAPVRINPSPEDRVRQNIQTRLGEYDKVKHLLDEPKQLLGYDGLPPASPAPAPPPSSKSSSSRSEFKKPPSSSHPSQSSRSHPSSRFVKPGESKPSSYGGGRSLHYNQQSKPSEVRNGISSSNAKQPVHRLPGSRNPSSRPETGAKDSSRSLSSHPNDVDIILKEMTGIMTPLTAIASTPRKEPESKFNFELPSYQSAERVEPKVAMIQPEIPPPSFAAPSLFGGALIGGALLSPPKPESPPPQPLSPPPATPCHKISTNTISGIQKNGVVRKPSSHQSQHQPLPSIHTLLLPPPSSQLEPDWKTDLTLSEDSDDDAKIPTPAPVVKHCDLPPQRARSPSPLMDKTMLSPAVSVVPDPIRPMSVSPPGASSSSDDSGSDSSESDSSNSIPPVPEPPPPVQEPQRPRSWGLQQFLPPQPERRISPDPSLSKTKNGEESDNDLARSVKTTQPLISSFSDSDTEKRPEPEKEAGRTRGRKKRNVKPPVPESDSEDEIIEIPDSSPEPPEPPTEPIVIPEPEPVHSKPPRTPSVNEVEPKVQLKRKCKPTTPSNPSPEKSKKRAPPKSTEKESPSSGKRSRKRVVKPPITPSDTEDEGGKRKRVASISDSGEDTWNTTTRPRSSRRSVKESSSERTNKRDTSSEDETPVVAQSPIKPVSRVVPALGKRPPIGSSESDAEKEESPPKIDSEGQSIQDKKKNDTLRKLFSKRDNEGGLGKGGKGKGGKGKGMVAVVVESDSQSHHSPKVELLPPRVPSPNPSPEEKIPDIKPVEKLPPVPLPKLVYVDGKPSLTCKIDLSILSHIPSKKRSEEVRTHTEIPDTRQNVDSRQPTEIRQTSDIRPASDSRHMADNKQTTDSKLPAESKPTVDSKPSVDSKQSTNNKQTDSKQGADKSKKPSRDAKNDKRDRKHTDKHRSRDDKSKKKKSVEAVEVKDEDQKQIQAEVIKRLTPDIKTDSGPHASNSGMKRERRNSASTSSNSMRQPSKPGSKRKKHGERPSAVSESSMVDAPPTNHEREKDKDADSRNTEVDEKRDRVNKDVSKNLTYFSYFEQADDADLSDNDDKDTYLSEAKRLKHAADKETDDTAQGMQYLEAVMYFLLTGNTMEHETVTEKAAQTMYKDTLHLIKYISSKFRSKQNSTAPQALIHNKLEVLSLRCQSLLYLKLFKMRKAEVKECQRVINDYMQKQFDYVFQANPPTTVEQCGSVVQGQGTPSPCSPTPSPASSVGSVGSQSSGYSSGELRGASAAQGQPHPPVAPCGPCIAVPLPIHLSLQKQTANFNSLLTAHDLWDQADILVHKGKHKEFFIDLDRACGPLTLHSSLKDLVKYVRVGINRLKEMRSDCV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -