Basic Information

Insect: Meteorus colon
Gene Symbol: lilli_1
Assembly: GCA_030523125.1
Location: JAPYZG010000351.1:102192-112151[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.023 4.1e+02 -0.1 0.1 1 26 29 54 29 60 0.82

2 9 3.7e-05 0.65 9.1 0.1 27 82 77 135 68 139 0.77

3 9 1 1.8e+04 -17.8 43.1 444 492 131 176 125 191 0.46

4 9 1.2e-10 2.1e-06 27.3 1.9 346 445 313 407 291 420 0.67

5 9 0.0068 1.2e+02 1.7 11.7 439 476 480 517 461 523 0.57

6 9 1 1.8e+04 -14.0 20.5 80 253 628 801 603 813 0.50

7 9 0.025 4.3e+02 -0.2 20.0 406 502 787 894 762 904 0.58

8 9 0.025 4.4e+02 -0.2 14.9 54 235 1098 1273 1055 1301 0.48

9 9 0.027 4.7e+02 -0.3 0.5 127 219 1335 1428 1303 1463 0.59

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.023	4.1e+02	-0.1	0.1	1	26	29	54	29	60	0.82
2	9	3.7e-05	0.65	9.1	0.1	27	82	77	135	68	139	0.77
3	9	1	1.8e+04	-17.8	43.1	444	492	131	176	125	191	0.46
4	9	1.2e-10	2.1e-06	27.3	1.9	346	445	313	407	291	420	0.67
5	9	0.0068	1.2e+02	1.7	11.7	439	476	480	517	461	523	0.57
6	9	1	1.8e+04	-14.0	20.5	80	253	628	801	603	813	0.50
7	9	0.025	4.3e+02	-0.2	20.0	406	502	787	894	762	904	0.58
8	9	0.025	4.4e+02	-0.2	14.9	54	235	1098	1273	1055	1301	0.48
9	9	0.027	4.7e+02	-0.3	0.5	127	219	1335	1428	1303	1463	0.59

Sequence Information

Coding Sequence: ATGAATTATCAGGCGCAAGGAGCAATTGTAGATGTGCCGTTTTACATGTCTTCACATTATGTCAGTGGTGATGTTGTTTTATGTTACAGCGTGGACCGAGACCGACTTCGGGAGCGTGAGCGACAGGCGCGCGCAGCCATGTCGGTCCAAGCAGAACAGGCAGCAGCAGTTGGAGGCCCCGAAGCTTGTCATACTCACCACAATCATAACAATCATGGAAATTCCCATGTATCAGCGGCGGCCTCACTATTCCGCGCTCCCGTCCGAGTCAATCCTGATGCGTATGACAGTACAACACACCAAATCCAATCGAAGCTTGGTAATTACTCACTGGTGAAGCATTTGTTGGATGAACCGAAAAGGTTGATTGGAATCGAAGGAGTTCCTGCTAGTCCAGCGCCATCAACTGGTTCATCTGTtagatcatcatcatcatcattatcatcgtcatcttcatcatcttcatcatcatcatcttcatcatcatcatcatcatcatcatcattatctgGTTCAAATATGAGTACAGGCATATGCAGAAGTTCACCGTCAACGCAAGAATTCAAAAAGCCTGGTTGTAGTGACCCAAAATCATGTTCGGCATCTTCAAGTCATGGATCCCAGCGTGGTGGGTTTGTTAAACCCGCGGATGGCAAACCTCCATACGGTGGTCGGGGTGGATATCCAGGCCAACCAGTTAAGCATGGTGGCAATAGCAATGATCACAGAAATCATGGACTTTTGCCAGCAAAGGGTCCGCCAACTACCACTATCACGAATGTCAACACCTCTAATGGGAATAACGGCGGTCAAACTTCTTCCGCAAACTGTCCTCCTATTAATGTAACTAATTCCAGTCGAGTTCATGTAGCAGCTTCCAGACCCTCCAGATTACCTCTAGACAATGGTATCAGACAACATGGATCTAGTGAAGGTACAGCAGACttggaaaatattctcaaGGAAATGACAATGCCACCTACTCCACTCACCGCAATTGCGCAAACACCAAGGAAAGAACTCGAATCCAAGTTCACATTCAACCCCGTACTATCTAAAGTGACGGAGGTATCGATGGCGCTGTCATCCAAGCAATCACAACGTGATAGGCATGGTGTTAATAGATTATCTGCTGATTTGGAACGTGATTTGAGTCTTTCTGAAGATAGTGAGGATGAAGGGGTGAAAAGTTCAACTTCGAGATCGAAGAACGAAAATAGAAGCCCAGATTTGACCGTGGACCTCTCAACGCCTCTGATACCAGCGATGACACCCGCGCCCCCTCCTCTTGCACCAATGTCACCTATGGGTATGTCACCATTGGGTCCATTATCGTCACCTGGCCATTCAAGTCCACCGAAACAATCATCACCAATCATAAGGCCATTATCAATTCCGTCCGCAAATTCACCTCGAAAATTTACTTCACCACTAGTGGCGCTGATGAGGCACTCAAGTCCACAGGGACAAGCGCCACAAAGCTCAGCAAGCGCGAGTTCAAGTTCTGATTCCGGTTCGGATTCAGGTACAGACAGTAGCGATGATTCTGAAGACGATGGTGGTGATGTCGGTGGTGGCGGTGATGTGGGTGGTGGTAGTGAAGGTGTGAGGAGTGGTAATGGAACTGGTGTTATTGGTGGTAATGAGAGTGGCAATGTTAGTGGTGAGGGTGACGTTGGCGCACATTCATCTTCTAAGGGCCCCTCTACACCACCTTCGGCTTCACCTAATGCACTTGTCAATGAACCTCCATCTGCCGAAGAGTCTACCAAGACGAGATGGAACCTCGGTAGTTTTTTCAATAAACCAACTGTACATCTGGGGGATCAAGTATCAGAACGCAAACATTGCCAGGATGGTGGTATTACACGTTGTGGGAGTTCACCAGACGTGACATCGCTTGAGAAGCGTAACCGGAGACTAGATATAACACATGTTAATAAAGATTGGCAACTGAATGATACGCAgaagaacaaaagaaacatgaaaatgttaaCAACATTGAGTGATAGTGAACAAAATTCTGAttatgagaagaagaaaaagtcaATAGAAGAATGCAAATTGCCTCGCCAGGACAAAACAAAGGCACCGGACGTTCGAAAGCGTGGTAGACCGCGAAAGACAGTGAAAGACTCGGGACAGCATAGCCCGCGTAACTGTAGAATATCACCGGATGcacaaaaaattatctctAAACGGGGTAATAGACCACGCAGTGGTGGCAgtcctaaaaaaaaatcgctaCCCATTTCCAGATTATTGGTGGTTGGCAATAGTGATGAAGAAGTGAGTGATGTGAGATTACGTGACAGATCGAGTGATTCCGATGAATTTGAGCAATCATCGCGAATTTCTCAAGCCTCCACGATGAATGTCGAAAAGCGACAATCGCAATTGAGTATATCTTCAAGTGATGATGAAACAACAACAAGTAATCTGCATAATGCTTCAGATGATGCACGGAGGCGAAAAATTGCGCCGAAACGTAATAAACTGACAGATTCACCAGTGAAAAAagtcgaaaagaaaaaaagtccaACAAAAGTAAAACCACGGCGTTCGCAGTCACGAGTTAATAACGGCTCAGGCTGTGCATCGGATTCCGATAGTGAATCTGAACCAACGTCACGGAATAGTCGAATTCAAGTAGCAAGAGTGCCACCAAGACCGCGTCAACCTCTGACAAGAACTACGTCTCTTGATAATTCAGATAGTGATAACAGCCCAACGCCAAAACTCCAAGAAGAAGACGCTGGCAACGTGCAGGATAAGAAAAAGAGTGACACTTTGAGGAAGTTATTTTCGAGCGCAAAAAGTGGTGCTAAAGGCGGTGGAAAAGGCGGTAAAGGTGGTAAAGGCGGAAAGGGTGGTAAAGGAGGCAAAGGCGGTGGTAAGTGTGGAATTTATGTTGAGGAATATACGGGTGGCATTGCTAATACGCCTACAGGTAGTGAAAGCCCTTATAAAAGACCACCATCATCGCAAGCTTCAACAAAATCTAATTTGCCGTCGTTAATCTATATCAATGGTATGCCTAGCCTTATATGTAGAATAGAACTCAGTAGAATTCAGCATATACCACAAATGTCAAGAGGTCAACAATTGAGACAGCGGACAGAATTGCCGGATACGAGGCCAGTCCCGGGACAATCTGCAGTTAAAGTAAAGAGTGAAAGGCCATTAACACCAGAGGATGGCGAATTGCGCGATCAGCCTCCAAATCGCCAGTTACCGTCATCCATTGAATATAGAACACAGTATGGTGACACCGAACAGCATCAAGCTGCGTCAACCAACattgaacaaatgaatcaGATTATGTGTTCAAAGAGCAAACAATCAGATATTAGTAAGAGTGATAATATAGAAGCGACGTCCGCTGACAGTGTTCTAAATATTCGAGCTGTAGCTGGCGGTAGTGGAATAACAATGAGTAGTGGCAATATGAATTCAGGTGTGAATACTCTTTGTGGTAATAACATTGATAGTGTACCAAAACGCAAACGAAATCCGAGCAGTAGTTCATTGTCCAGTTTGAGTGTTTGTTCAGTAGACTCCAAAGTTAAATCCAATAATGAacataaagagaagaaaaaacggaAACGAAAACACATTGATAAGGAggcaacaaataattcaagatcCTCCATTCGATATAAAAGTGATGTGCAACCTACAAATCATGAACGGGAAGATAAATCTGATGTGAATTTGTTGCCACCGCCTGCAGCGCCAATTCAAcgtgttttttattcttattttaatCATCAGAATCAAATCTCAGACGATCAAGATAGGGACCAGAATCAACATCTGACTGAAGCCAAAAGATTGAAACGTAGTGCCGATGTAGAATGTGAATTGACAGCACAGGGTATGTTGTACTTGGAGGCAGCATTGTATTTTCTGCTGACTGGTCACGCAATGGAGTCAGATCCGGTAACTGAAAGGGCTTCATTTACAATGTACAAAGACACACTCAGTCTCATAAAGTACATTTCTTCGAAATTCAAGAGCCAACAGAATAATTCTCCAGAGAGTAGCATACATAACAAGTTGGCGATCTTGAGCTTGTGGTGCCAGTCATTAATTTATCTGAAGCTATTCAAGATGCGCAAGCATGAAGCACATGAGTATCAAAAAATTCTCGCAGACTATCATCAAAAACCGGCACAACCAACGCTCGTCCAAACTGAGGGCCAAGGAACGCCATCGTTATCCCCAACACCATCACCGGCTGGTTCGGTGGGTTCTGTTGGTAGTCAGAGTTCCGGATACAGTAGCGGTGAATTGGCGAATCGTGGTATGATTCCGGGGCAACCGTCGGCAGCAACTTACGTCAGTGTTCCACTTGGTATTCATACAGCGATGCAGAAACagaatcatcatttttcattattgatgaattgtcatGAACTTTGGGACCAAGCAACGGCATTAGTAACTGATAAACATCGTGattttttcattgaattagaTGAGAAATTTGGACCGCTAACTTTAAAAAGTTCGTTACACGACTTGGTGCGTTATGTTGAAGctggtataaaaaaattgcgcGCCCTCTGA
Protein Sequence: MNYQAQGAIVDVPFYMSSHYVSGDVVLCYSVDRDRLRERERQARAAMSVQAEQAAAVGGPEACHTHHNHNNHGNSHVSAAASLFRAPVRVNPDAYDSTTHQIQSKLGNYSLVKHLLDEPKRLIGIEGVPASPAPSTGSSVRSSSSSLSSSSSSSSSSSSSSSSSSSSSLSGSNMSTGICRSSPSTQEFKKPGCSDPKSCSASSSHGSQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRNHGLLPAKGPPTTTITNVNTSNGNNGGQTSSANCPPINVTNSSRVHVAASRPSRLPLDNGIRQHGSSEGTADLENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLSKVTEVSMALSSKQSQRDRHGVNRLSADLERDLSLSEDSEDEGVKSSTSRSKNENRSPDLTVDLSTPLIPAMTPAPPPLAPMSPMGMSPLGPLSSPGHSSPPKQSSPIIRPLSIPSANSPRKFTSPLVALMRHSSPQGQAPQSSASASSSSDSGSDSGTDSSDDSEDDGGDVGGGGDVGGGSEGVRSGNGTGVIGGNESGNVSGEGDVGAHSSSKGPSTPPSASPNALVNEPPSAEESTKTRWNLGSFFNKPTVHLGDQVSERKHCQDGGITRCGSSPDVTSLEKRNRRLDITHVNKDWQLNDTQKNKRNMKMLTTLSDSEQNSDYEKKKKSIEECKLPRQDKTKAPDVRKRGRPRKTVKDSGQHSPRNCRISPDAQKIISKRGNRPRSGGSPKKKSLPISRLLVVGNSDEEVSDVRLRDRSSDSDEFEQSSRISQASTMNVEKRQSQLSISSSDDETTTSNLHNASDDARRRKIAPKRNKLTDSPVKKVEKKKSPTKVKPRRSQSRVNNGSGCASDSDSESEPTSRNSRIQVARVPPRPRQPLTRTTSLDNSDSDNSPTPKLQEEDAGNVQDKKKSDTLRKLFSSAKSGAKGGGKGGKGGKGGKGGKGGKGGGKCGIYVEEYTGGIANTPTGSESPYKRPPSSQASTKSNLPSLIYINGMPSLICRIELSRIQHIPQMSRGQQLRQRTELPDTRPVPGQSAVKVKSERPLTPEDGELRDQPPNRQLPSSIEYRTQYGDTEQHQAASTNIEQMNQIMCSKSKQSDISKSDNIEATSADSVLNIRAVAGGSGITMSSGNMNSGVNTLCGNNIDSVPKRKRNPSSSSLSSLSVCSVDSKVKSNNEHKEKKKRKRKHIDKEATNNSRSSIRYKSDVQPTNHEREDKSDVNLLPPPAAPIQRVFYSYFNHQNQISDDQDRDQNQHLTEAKRLKRSADVECELTAQGMLYLEAALYFLLTGHAMESDPVTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLWCQSLIYLKLFKMRKHEAHEYQKILADYHQKPAQPTLVQTEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGMIPGQPSAATYVSVPLGIHTAMQKQNHHFSLLMNCHELWDQATALVTDKHRDFFIELDEKFGPLTLKSSLHDLVRYVEAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00996334;
90% Identity: iTF_00996334;
80% Identity: -