Basic Information

Insect: Latheticus oryzae
Gene Symbol: lilli_1
Assembly: GCA_030157265.1
Location: CM058052.1:14971831-14991501[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 1.3e-10 2.3e-06 27.1 0.2 4 89 23 108 22 235 0.87

2 7 1.8e-11 3.1e-07 30.0 12.0 349 513 263 446 246 447 0.59

3 7 1 1.7e+04 -6.0 8.8 113 185 497 537 448 594 0.34

4 7 0.072 1.2e+03 -1.7 9.5 430 491 599 659 591 678 0.68

5 7 0.83 1.4e+04 -5.2 16.0 152 247 665 759 651 776 0.40

6 7 0.0039 68 2.4 18.8 58 240 858 1039 857 1071 0.51

7 7 0.03 5.2e+02 -0.5 2.0 188 274 1174 1261 1105 1266 0.43

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	1.3e-10	2.3e-06	27.1	0.2	4	89	23	108	22	235	0.87
2	7	1.8e-11	3.1e-07	30.0	12.0	349	513	263	446	246	447	0.59
3	7	1	1.7e+04	-6.0	8.8	113	185	497	537	448	594	0.34
4	7	0.072	1.2e+03	-1.7	9.5	430	491	599	659	591	678	0.68
5	7	0.83	1.4e+04	-5.2	16.0	152	247	665	759	651	776	0.40
6	7	0.0039	68	2.4	18.8	58	240	858	1039	857	1071	0.51
7	7	0.03	5.2e+02	-0.5	2.0	188	274	1174	1261	1105	1266	0.43

Sequence Information

Coding Sequence: ATGAAAATTCGATGCGAGTATATTTATTCTAAACGTCATTTACTCCACGACCAGCCTAGAATCGTGGAAAGAGACCGCCTGCGAGAGCGGGAGCGGCAGGCCAGGGCACAGATGACTTCACAAGTGGACGATCAAGGGACTTTTCTTTTCGGAGCACCCTTTCGGGTGAACCCGTCCACTACCGATCCCGTCACGCAACAGATCCAGAGTAAATTAGGCGACTTCCAGCGTTTGAAGCCGTTTCTGGATCAGAAGGACTTGATTGGAGTTGATGGCGTCCCACCAAGTCCTGGTGTGCCAAATGGGCCATCGTCTAGACATAGCAATCTGTTTGCTTCAGCAATGGCGTCGTCAGGTGGTGGTGGAGGAGGAGGTGGTGGAGGCGGAGGAGGTGGAGCATCATCGAGATTACAACCGTCGCCTGAATCTCGATCTGAATTTAAGAAACCCCATCACCATCAGTTGCATCATCAACATCAGAGGGGCGGTTACGTGAAACCAGCCGATGGAAAACCACCTTATGAAGGACGAGGTGGATATCCAGGGCAACCTGTTAAGCATGGTAGTGGCATCACAAATCACAGGTCCAATGGGATTCTTCCCGCTAAAGGCCCGCCTCAATCTTCGCCAAACTCTTCGGCTGCGTTATTGCCGTCCAATAATAGTTCTTCGAGTCGGTTACATACCAGTGGAGTACGTAATCATCCCCGCAATACATTCGAACAGAATCAAGGACCTCCGGCTGGCCCGAGGGAATCTTTGCCTTCCGCTACACCTAACACCGATATGGAGAACATTTTCAAGgaaATGATCGAAAGTCGGACGCCGATCACTGCCATTGCCGCTACGCCTCGAAAAGAACCtgataacaaatttatttttagtccAGGTTTTACTAAGACTCCTTGCATCCTTGACATTTTTCCAATAGGTATGCAAGTGTTGACTTGTCATTTTAATTGCAGTGACCTCAGAGATGATCTAAATCTGTCAGATGATAGTGATGATGAACAAAAGTGCGATTTGCAATCTTCCAAGTTACCAGTAGAAAAAATGGTATCGCCTTTGAGTGCCACTTCCGCCGTTagtaatttttcgaaaatggATTATGTCCCCGAGCCATTAGAAACAGCAGTAGCAGCAACGGCGACAGTATCATCATCAAGCGATTCCGGTTCAGATTCGGGTTCTGAAAGTGATTCAAGTAGTGATGATTCAGTTGAAGACAATGTATCGTCGtcgaatttaataaaactgaatgtTGTAACAGAAACAACACCGTCATCACCACCGCCTGAATTAAAAGATAAGAAACGTTGGAATTTGGGTTCTTATTTGGAAATAGATCAGAATAATGCAAAAGCTGATTCAGTGTTATCGCCCAAAGTACAAACATCACCATTAAAGAAGATAACTGAAGAATCAGATGGTAGTGATTCAACAAAAGATCTCGATAGTGTGGTAGCGGAAGCATTAGCATCGACACAAATACCTTTattatcaagtttttcaaCGTCGGAAGATAGTGCGACTGAACGACGTACGAAAAAACGTAAACTTAGAGGTGGAGTGCAGTCAGTTACCAAAAGTTCAGATAGTGACAGTGACGATGGTGATGAAAGGACGAGAAAGCCAAAACCAATACCGGTACGACGTGCAAGTCCGAGAACTAAAAGTGTAGACTCGTGTTGTAGTGAATCGGAAACGGAAAAACGGCCATCGCCACCagtgaaaaaacaaaatcgtGGTAGACCGAGAAAACTTAAACCGGTTATAAGTGGTAGTGGTGGTGGTGAAAAGAAAAGGAAGAGAGGAAGACCACCAAAAGCAAGACCGTCACATCCAAGTAGTACAGATGAAGAAGATGTTATGGAAAAAAGGCCAGCAAGAAGACGAACTGTATCAAAACGAGATGCATCGAGTAGTTCAGATTCAGATAATGAATGTAGATTTGGAACGCCAAAAaagaatgaagaaaaaattaagaaaacgaAACATTCAGATAGTGAAGATGATGAATGGtgtaaagataaaaaagaaaaaaatcaatcattgAAGAAAGAGAATTTTAGGAGAAAAGGACGAACATCGTCGTCACATTTAAAAAGTGCCGAAACTTTACCGACCACAACTGATTCTAGTGATAGTGATTGTAAACCAAGTCCTTGTTCATCAAGAAGTCATAGAAGTAGGTCTTCAGATAGTGACAACGAAAGGATACCTCCAACTGTCAATAAAATCGAAGTTAAAGTTGAAGAAAGTAAAGCGATCAAAGATAAGAATAAAAGTGATACTTTGCGAAAACTATTCACTCCGAAAAGAGATTCGGAAGGTGGAAAAGGAGGAGGCAAAGGTGGTGGTAAAGGAGGAAAAGGTGGAAAAGGTAAAGGTGGTGTAAATGTGATATTTGCTGATGGCGGTGGTAATGAAAGAAGTATATCGCCAGTTGAAGATGAAGTAATGCCAACCATATCCAATCCGAcgcttttatcaccaatcccGAATAAAGAAGCAAAAGCGTCACCATCACCATGTAACGAACCAATCAAATATATAAAGACTGAAATTCAAGACGACATCGATGAAAAGATATCGATGAAAGTCAAAATCAGTTTGAGTAGAATCGACTTGAATGCAATCGTTTGTTTAAAgaacaaattagaaaatttaaaacatccattttttaaagaatggGAAAagaattgtaaaataaaagataaaacattaaaagatagtgatagtgaaaataaaaaaccatggaaaattgaaaaagatacAACAGATTTGAATGAATTAAAACATAAATCGAAAAAACGAAAACGTAGAAATAGTTCAAGTTCGATTTCTTCAATGTCAACAGTTAGTAATATGTCACATAgtagtaaaaaattagaacatAGTAGAAAAGATAGGGACAATCATAAGTCCAAAAGACGAAAAGAagatgttgaaatttatcCAAGATCTCAAAATGATAATATCAGTTTAACGAATGCACCACCGACCAATCATGAGCGGGAAGATAGCAGAAGTCGACAGCTTAATTCACCTGTCGACAAAAATGTCAAGTTGCAAAGCACGAGGGAATATTATTCGTACTTTGAGAAGCCTGACGAACCATTAGAGTGCGAAGAAAGagcTCAAAGCCAGTACCTGAGCGATGCAACTCGATTAAAACACTTAGCTGATAAAGAGACTGATACTACGAAACAGTGTATGCTGTATCTGGAGGCTGtacttttctttttattaacgGGTAATGCTATGGAACTCACTAGAGTTACAGAAAATGCCTGTTTCACTATGTATAAAGACACATTATCGTTAATAAGatacatCACTTCTAAGTTTAGAACTCAACATAATGCGTCTTCAAAGCACAACAAACTCGCTGTATTAagtTATCGGTGCCAAGCACTTCTGTACTATAAACTGTTCAAGATGAAGAAACATGAAGTGAAAGATTACCAGAAGATTCTCAACgaatattttaacaataagGCTGTTTCGATGCCTCCCGAACAGCAGAATCAGCAAGGCCAAGGCACACCGTCCCCCATGTCGCCGACGCCCTCTCCTGCAGGTTCCGTAGGTTCAGTAGGTAGCCAATCATCGGGTTATAGTAGTGGCGAATTGGCAGCACGTGGTAATACTGTACCATCGACTATGCCTTCTTCAACACATACCCAAAATAATATGGGTGCTCATGTTTGGGTTCCTCAAAGCATCTATAATGCCATGCACAAGCAGAACCAAAATTTCACATATCTTCTGTCTTGTCAGGATCTTTGGGATACGGCCGATGCGTTAGTAATCAAAGGCAAACATACTGatttcttTATCGATTTGGATAGGTTATGTAAGCCTTTAACAATGCACAGCTCGCTGATCGACTTGGTGAGGTATATTCGTGAAGGTATAAAACGATTGAATGAGAGTTAG
Protein Sequence: MKIRCEYIYSKRHLLHDQPRIVERDRLRERERQARAQMTSQVDDQGTFLFGAPFRVNPSTTDPVTQQIQSKLGDFQRLKPFLDQKDLIGVDGVPPSPGVPNGPSSRHSNLFASAMASSGGGGGGGGGGGGGGASSRLQPSPESRSEFKKPHHHQLHHQHQRGGYVKPADGKPPYEGRGGYPGQPVKHGSGITNHRSNGILPAKGPPQSSPNSSAALLPSNNSSSSRLHTSGVRNHPRNTFEQNQGPPAGPRESLPSATPNTDMENIFKEMIESRTPITAIAATPRKEPDNKFIFSPGFTKTPCILDIFPIGMQVLTCHFNCSDLRDDLNLSDDSDDEQKCDLQSSKLPVEKMVSPLSATSAVSNFSKMDYVPEPLETAVAATATVSSSSDSGSDSGSESDSSSDDSVEDNVSSSNLIKLNVVTETTPSSPPPELKDKKRWNLGSYLEIDQNNAKADSVLSPKVQTSPLKKITEESDGSDSTKDLDSVVAEALASTQIPLLSSFSTSEDSATERRTKKRKLRGGVQSVTKSSDSDSDDGDERTRKPKPIPVRRASPRTKSVDSCCSESETEKRPSPPVKKQNRGRPRKLKPVISGSGGGEKKRKRGRPPKARPSHPSSTDEEDVMEKRPARRRTVSKRDASSSSDSDNECRFGTPKKNEEKIKKTKHSDSEDDEWCKDKKEKNQSLKKENFRRKGRTSSSHLKSAETLPTTTDSSDSDCKPSPCSSRSHRSRSSDSDNERIPPTVNKIEVKVEESKAIKDKNKSDTLRKLFTPKRDSEGGKGGGKGGGKGGKGGKGKGGVNVIFADGGGNERSISPVEDEVMPTISNPTLLSPIPNKEAKASPSPCNEPIKYIKTEIQDDIDEKISMKVKISLSRIDLNAIVCLKNKLENLKHPFFKEWEKNCKIKDKTLKDSDSENKKPWKIEKDTTDLNELKHKSKKRKRRNSSSSISSMSTVSNMSHSSKKLEHSRKDRDNHKSKRRKEDVEIYPRSQNDNISLTNAPPTNHEREDSRSRQLNSPVDKNVKLQSTREYYSYFEKPDEPLECEERAQSQYLSDATRLKHLADKETDTTKQCMLYLEAVLFFLLTGNAMELTRVTENACFTMYKDTLSLIRYITSKFRTQHNASSKHNKLAVLSYRCQALLYYKLFKMKKHEVKDYQKILNEYFNNKAVSMPPEQQNQQGQGTPSPMSPTPSPAGSVGSVGSQSSGYSSGELAARGNTVPSTMPSSTHTQNNMGAHVWVPQSIYNAMHKQNQNFTYLLSCQDLWDTADALVIKGKHTDFFIDLDRLCKPLTMHSSLIDLVRYIREGIKRLNES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -