Basic Information

Insect: Iselma pallidipennis
Gene Symbol: lilli_1
Assembly: GCA_037464855.1
Location: JAZBHA010000097.1:21316-32896[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 2.1e-05 0.3 9.9 23.0 29 229 9 208 3 219 0.47

2 8 4.1e-09 5.8e-05 22.2 15.6 349 492 241 416 228 423 0.62

3 8 0.19 2.7e+03 -3.1 5.2 142 253 434 542 413 556 0.47

4 8 1 1.4e+04 -7.0 15.5 66 213 573 725 562 753 0.43

5 8 1 1.4e+04 -8.9 26.4 439 486 753 798 739 810 0.55

6 8 1 1.4e+04 -6.3 14.8 96 217 935 1011 894 1039 0.31

7 8 1 1.4e+04 -9.9 28.6 79 247 1101 1275 1079 1320 0.38

8 8 0.18 2.5e+03 -3.0 1.4 147 173 1510 1533 1432 1583 0.38

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	2.1e-05	0.3	9.9	23.0	29	229	9	208	3	219	0.47
2	8	4.1e-09	5.8e-05	22.2	15.6	349	492	241	416	228	423	0.62
3	8	0.19	2.7e+03	-3.1	5.2	142	253	434	542	413	556	0.47
4	8	1	1.4e+04	-7.0	15.5	66	213	573	725	562	753	0.43
5	8	1	1.4e+04	-8.9	26.4	439	486	753	798	739	810	0.55
6	8	1	1.4e+04	-6.3	14.8	96	217	935	1011	894	1039	0.31
7	8	1	1.4e+04	-9.9	28.6	79	247	1101	1275	1079	1320	0.38
8	8	0.18	2.5e+03	-3.0	1.4	147	173	1510	1533	1432	1583	0.38

Sequence Information

Coding Sequence: ATGTCTTCTTCACAAGTTGAAGAACAAGAATATCATCTGTTTGGAGCACCCTTTAGGGTGAACCCATCGTCGACGGATCCCGTCACACAGGACATCCAGAGCAAGTTGGGGGATTTTCAACGATTGAAACCATTTCTTGatcaaaaagaattaattggTGTCGATGGAGTACCACCAAGTCCTGGTGTACCTTCTGCGTTATCTTCATCACGTCATCATCCATTCGCCTCAGCAGCACCAgcatcagcatcatcatctGGGGCGGCCAGTTCGAGattacATCCATCACCTGAATCACGGCCTGAATTTAAGAAACCACACCATCATCACTTACACCATTCTTCCTcctcctcatcatcatcatcatcgtcacaTCAACGTGGTGGTTATGTGAAACCGACTGATGGTAAACCACCATACGAGGGACGTGGTGGTTATCCTGGACAACCAGTGAAACATGGTAGTGGTATAACAAATCATAGGTCAAATGGTATTTTACCAGCAAAAGGACCACCTCCATCATCGCcaaattcttcttcttcgtcaaGAATACACTcaagtagtagtaatagtagtagtaataataataatggtgcaTCATCGTCTTCAAGGAATCAGTCTCGTATTTCTCATGAACAAaatCAGGGACCTCCTCCTGTACTACCACCTCTGGCGGCTGGACCGAGAGAAACTTTACCGTCTGCAACACCTAATCCTGATATGGAAAATATCTTCAAGGAAATGATAGAAGTCCGACCACCACTCACTGCCATAGCTGCAACACCTCGGATAGAACCAGATAATAAGTTTACCTTCAATCCTGTATTAACTAagTTGACggatccaacaacaacaacaacaacaataataataccaacacCATCaactccaccaccaccaaaaaAACGTGAACGGGCAACAGCAAGTGTTCGACCGTCAACTGACTTAAGAGATGATCTCAACCTGtctgatgatagtgatgatgaacAAAAACGTGAATCTCTACAATCTTCCAAGTTACCAATAGAAAACTCAAGAATGGTGTCCCCATTAGTGGCAACATCAAGTAgtaattttcaacaagaatCAACAAATGTGGCAACCACAACACCAAcgacatcaacaacaaccatcacaaCATTACCTagaaatggtggtggtggtggtagctCATCAAGTGATTCGTGTTCCGATTCTGGTACAGAAAGTGAGACAAGTAGTGATGAttcaattgaagaaaatgtttcatcatcaaattcaacaattaaaaaacaaattggtggtggtgattctatacaatcaacaacaacaacaacatcaccaccattattaccagcacaacaaattgaagaaaaagacAAGAAACGTTGGAATTTAGGTTCATATCTTGATCAAAATAgtgttaataacaataatagtaaaattgattcaatcaaTCGATCCCCAAAAGTGCTCTCACCATTAACATGTGGCAGTAGTAGTATGCTTCcattaaataatcataataatagtaaatgtaatgataataaaagacaACGTGGTGGTGTTATTGAAGAGTCTGATGGTAGTAGTGATTCGATAAAAGATTTAGATAGTGTCGTTGCTGAAGCattaacatcaacaacagTGCCGTTATTATCTAGTTTTTCGGATTCTGACAGTTGTAATGaggatgataatgatgatgatgatgatgatgataatgatgatgataacaatgatggTAATCATAAACGAGTGAAAAAATCTAAACGTACAGTGCCAGTTACCAAAAATTTAGatagtgatagtgatgatgataatgatgaaaggacgagtagtaataataataatcataataagaAACCAAAACCAATAACAAGACCAAGTCCAAGGACTAAAAATATAGATACTAGTGATTCTGATattgatcatcatcattatcatcataaaaCCAGTGCCAATAATGTAAAACCATCAataatcacaacaacaacatcaacgccaatattgaataataataaaaatagtgacAAATTATTAGTGAAACCAAAATCAAATCGTGGTAGACCACGTAAAGTTAAACCATCAGATGGTAATTCAGATGGTGAAAttcgtattaataataaacgacGTGGTAGGccaccattatcatcaaaaaagCGTCGATCCTCCCCAACACTACCTAGTGGTTCAGATATTGAAATGACAACTGGTAGTAGTACAGTGACacgtgttaataataatattattaataataataatagaaataagaAACGTGGCCGACCACCGAAGCCACGACCATTATCACCACCAAATTGTAGTGGCACTAGTAGCACTAGTGGCAGCAGCAGTAGCAGCAGCAATAGTAGCAGTAGTGGTACCAGTAGTAGTGATAGtagtagtgatgatgataatgttggtgattataataataagcaaaaatCAAGACGTCGTAGAATATCAAAAGTGGAAATCACATCAACATGTAGTAGTGATACAGATTCATGTCATCGGTCACaagcaattaaaattaaagataaatataataataataataacaacaaaaaagtgaatgataataataatagtaatagtaaacATAAATCACCAAGATCGGtggttgatgataataataaattaataaagaaaattagaaatcgTTCagacgatgataatgatgatgatgaatggGGTAAACAGAATAAGAACAAATTAAGAAATCTAGATATTgttaataagaaattaataGATCCATCAAAGAAAAAGGAGAGTTTTCGACGTAAATCACGTAGAACATCAATAAGTGCTGCaacattaccaacaacaactgatACCAGTGATAGTGAACACAatacaactactactactagtacaGGTGGTATTGCTGCTACCACAgttaaaactaataataatcataaatcaaaaatctacaaaaGTGATAGTGAttcaaataatcatcaatcggatgatagtgatgatttGCATCGTAGAAAAtcagaaataacaacaacaacaacaacaacatcaataacaacaacagcaatgaAAGTCGATgagaataattcaattaaagataaaaagaaaagtgaTACATTACGTAAATTGTTTACAATGAAACGTGGTGATAcagatggtggtggtaaaggTGGCGGTAAAGGTGGCAAAGGTGGTAAAGGTAAAGGTGGTGTTAATGTCATTTATGCTGATGAGGAACGGAACAATTGTATTTATGAACGTAGTAGTTCATCAGTTGatgatgaaacaacaacaccaataataccaacaaatccaacattattatcaccgataccaacaaaaaatcatGAATTACCATCAATAATCAAATCTTCAAAGactgaatttaataataataataataataataataataataataatagtaataataaagaaaatcaattattatcatcaaaacattcaatgaaaattataattgatttgaatCGTATCGATATAAATCggataaaaaatttaaagagaCATTTAGAAGAGTTACGGCATCcgtatttaaaagaaattgataagaaaatgatATATGCACCACCATCGAAACAACCATTTCGTGAAAGTGATAATGAAAAtactaatactaataataataatagtaataaattatggaaaaatgaTAGTAATGATTCTATAGAAAAtcggaaaaaatcaaaaaaacgtAAACGACGTAATAGTTCAAgttcaatatcatcattatcaacgaTTAGTAATATGTCACatacaagtaataataaaaaattagaaaataataataataatcagaatattaaaaataatcgaaaagataataatcataaaacgAAACGACGAAAagatgatattaataatacaaaaacaccaccaacaaatcATGATCGGGaagataatggtaataataatttcaataataataataataatcatcctCATCATCGACAACAATTAGGTGAAACAAAACCACAAATCATCAGGGAGTATTATTCGTATTTTGAAGAGGAACCTGTCGATAGGGAGGAAAggGATCAAAGTCAGTATCTGAATGATGCAACAAGATTAAAACATTTAGCTGATCGTGAGACtgatacaacaaaacaatgtaTGTTATATTTAAGGGCTGtattatatttcttattaACTGGGAATGCAATGGAGAAGACTAGAGTGACTGAGAATTCATGTTTTACAATGTACAAAGAAACACTTTCATTAGTTaggtatatTTCATCGAAATTCCGAAATCAAACGAATACATcaccaaaacaaaacaaattggCTGTTTtaagTTACCGTTGTCAAGCTCTTcttcattataaattgttcaaaatgaGAAAATATGAAGCTAAAGAAACACAGAAGATAATTCAGGaatattttagtaataaaCAAATGCCAACGATACCTCCGcctgaacaacaacaacatccccAACAAATGAttaatagtggtggtggctgtagtagtggtggtggtggtggtcaaggtacaccatcaccattatcaccaACCCCATCACCAGCTGGTTCAGTTGGTTCAGTTGGTAGTCAATCATCTGGTTATAGTAGTGGTGAATTGGCAGCACGTAGTAGCAATAATATaactaatattaataataatacagttcCTTTAGTACATAcaacacaaatacatacaacacCAAATACGAATACCactaataatacaacaacaacaacaacaccacatATGTGGATACCATTAAATGTCTATAATGCAATGTATAAACAGAATCAAAATTATACATATCTGATATCGTGTCAGGATTTGTGGGATACAGCAGATACTTTAGTTAAAAATGGTGAACATACTGATTTCTTTATCCAATTGGATCGTCGATGTAAACCATTAACAATGCACAGTTCGTTACAACACTTGgtattttatatacaagaaGGTATAAAACGACTTAATGAAAGTTAG
Protein Sequence: MSSSQVEEQEYHLFGAPFRVNPSSTDPVTQDIQSKLGDFQRLKPFLDQKELIGVDGVPPSPGVPSALSSSRHHPFASAAPASASSSGAASSRLHPSPESRPEFKKPHHHHLHHSSSSSSSSSSSHQRGGYVKPTDGKPPYEGRGGYPGQPVKHGSGITNHRSNGILPAKGPPPSSPNSSSSSRIHSSSSNSSSNNNNGASSSSRNQSRISHEQNQGPPPVLPPLAAGPRETLPSATPNPDMENIFKEMIEVRPPLTAIAATPRIEPDNKFTFNPVLTKLTDPTTTTTTIIIPTPSTPPPPKKRERATASVRPSTDLRDDLNLSDDSDDEQKRESLQSSKLPIENSRMVSPLVATSSSNFQQESTNVATTTPTTSTTTITTLPRNGGGGGSSSSDSCSDSGTESETSSDDSIEENVSSSNSTIKKQIGGGDSIQSTTTTTSPPLLPAQQIEEKDKKRWNLGSYLDQNSVNNNNSKIDSINRSPKVLSPLTCGSSSMLPLNNHNNSKCNDNKRQRGGVIEESDGSSDSIKDLDSVVAEALTSTTVPLLSSFSDSDSCNEDDNDDDDDDDNDDDNNDGNHKRVKKSKRTVPVTKNLDSDSDDDNDERTSSNNNNHNKKPKPITRPSPRTKNIDTSDSDIDHHHYHHKTSANNVKPSIITTTTSTPILNNNKNSDKLLVKPKSNRGRPRKVKPSDGNSDGEIRINNKRRGRPPLSSKKRRSSPTLPSGSDIEMTTGSSTVTRVNNNIINNNNRNKKRGRPPKPRPLSPPNCSGTSSTSGSSSSSSNSSSSGTSSSDSSSDDDNVGDYNNKQKSRRRRISKVEITSTCSSDTDSCHRSQAIKIKDKYNNNNNNKKVNDNNNSNSKHKSPRSVVDDNNKLIKKIRNRSDDDNDDDEWGKQNKNKLRNLDIVNKKLIDPSKKKESFRRKSRRTSISAATLPTTTDTSDSEHNTTTTTSTGGIAATTVKTNNNHKSKIYKSDSDSNNHQSDDSDDLHRRKSEITTTTTTTSITTTAMKVDENNSIKDKKKSDTLRKLFTMKRGDTDGGGKGGGKGGKGGKGKGGVNVIYADEERNNCIYERSSSSVDDETTTPIIPTNPTLLSPIPTKNHELPSIIKSSKTEFNNNNNNNNNNNNSNNKENQLLSSKHSMKIIIDLNRIDINRIKNLKRHLEELRHPYLKEIDKKMIYAPPSKQPFRESDNENTNTNNNNSNKLWKNDSNDSIENRKKSKKRKRRNSSSSISSLSTISNMSHTSNNKKLENNNNNQNIKNNRKDNNHKTKRRKDDINNTKTPPTNHDREDNGNNNFNNNNNNHPHHRQQLGETKPQIIREYYSYFEEEPVDREERDQSQYLNDATRLKHLADRETDTTKQCMLYLRAVLYFLLTGNAMEKTRVTENSCFTMYKETLSLVRYISSKFRNQTNTSPKQNKLAVLSYRCQALLHYKLFKMRKYEAKETQKIIQEYFSNKQMPTIPPPEQQQHPQQMINSGGGCSSGGGGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAARSSNNITNINNNTVPLVHTTQIHTTPNTNTTNNTTTTTTPHMWIPLNVYNAMYKQNQNYTYLISCQDLWDTADTLVKNGEHTDFFIQLDRRCKPLTMHSSLQHLVFYIQEGIKRLNES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -