Basic Information

Insect: Osmia bicornis
Gene Symbol: lilli_1
Assembly: GCA_907164935.1
Location: NC:6098764-6167818[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.66 2.3e+03 -2.1 0.1 4 26 28 50 26 56 0.81

2 9 1e-07 0.00036 20.4 0.9 27 129 76 179 59 190 0.64

3 9 7.9e-11 2.7e-07 30.6 1.2 326 433 254 359 247 383 0.72

4 9 0.9 3.1e+03 -2.5 25.6 441 511 449 526 423 529 0.60

5 9 7 2.4e+04 -9.0 14.1 115 249 497 627 489 644 0.54

6 9 5 1.7e+04 -5.0 10.3 427 497 641 714 636 727 0.61

7 9 0.035 1.2e+02 2.1 6.7 438 490 745 795 728 815 0.48

8 9 0.24 8.4e+02 -0.7 4.0 146 204 1062 1120 1028 1173 0.41

9 9 0.23 8.1e+02 -0.6 0.9 131 220 1216 1306 1184 1335 0.57

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.66	2.3e+03	-2.1	0.1	4	26	28	50	26	56	0.81
2	9	1e-07	0.00036	20.4	0.9	27	129	76	179	59	190	0.64
3	9	7.9e-11	2.7e-07	30.6	1.2	326	433	254	359	247	383	0.72
4	9	0.9	3.1e+03	-2.5	25.6	441	511	449	526	423	529	0.60
5	9	7	2.4e+04	-9.0	14.1	115	249	497	627	489	644	0.54
6	9	5	1.7e+04	-5.0	10.3	427	497	641	714	636	727	0.61
7	9	0.035	1.2e+02	2.1	6.7	438	490	745	795	728	815	0.48
8	9	0.24	8.4e+02	-0.7	4.0	146	204	1062	1120	1028	1173	0.41
9	9	0.23	8.1e+02	-0.6	0.9	131	220	1216	1306	1184	1335	0.57

Sequence Information

Coding Sequence: ATGCTCCATTCGAtcgcaacaacaacaacaacagcaacgaTGCATCGTTTCGAATCAAGGAACGCGCTCGTGCCAAGCGTGGACCGGGACCGGCTTCGGGAGCGGGAACGACAGGCCCGCGCGGCGATGTCGGTCCAGGCCGAACAGGCGGCTGCAGGAGGTGGTCCTGACACCAGACACCATCACCATGGCCATCATAACCACGCTCACCACCATGCTAATCCGCATACCGTCGCCGCTCCGCTCTTCCATGCTCCCGTCAGGGTGAACCCTGATGCCCGGGACAGCACGACGCAGCAAATCCAATCTAAATTAGGCAACTATTCACTGGTGAAGCATCTGCTGGACGAGCCTAAACGGCTGATCGGTATCGAGGGTGTGCCACCGAGTCCAGCCCCATCCCCGTCACCCTCGTCCCTTCGAACGAGTTCCAGTTCGATCGGTACGAATTCCAGGAGCTCGCCGTCCTCCCAAGAATTCAAGAAACCCGGAGGACCGAGGACCAGCTCGTCTTCGTCCTCATCGTCGAGCCATCAACGTGGTGGTTTCGTGAAACCAGCCGACGGCAAGCCACCGTACGGTGGCAGGGGTGGTTACCCTGGCCAACCGGTGAAGCACGGGGGTAACAGCAACGATCATCGTAGCCACGGTTTATTACCCGCCAAAGGACCGCCCCCGAATTCACCCGGGAACGGTACGCTCGTTGGCAATTCGAATATCGGGAATTCCAACGGCGGTGGCAGGCTTCACTCTGCTGGCAACAGACTGTCCAGGTTAACTCTCGATAACGGAACAAATTCGAGGCCTGGTCCCACCGAGAATTCGGCAGATGTAGAGAACATTTTGAAGGAAATGACCATGCCACCCACACCTCTCACGGCTATAGCCCAGACACCGAGGAAGGAACTCGAGTCGAAGTTCACGTTCAACCCTGTCCTGGCGAAGTTGACTGAAGTGACGCCGCCGGAAACCGCGAAGCCTCAACGCGAGCGGCACACCGACAGCAGGTTATCCGCGGATTTGGAGCGGGATCTGAGCCTATCCGAGGACAGCGAGGATGAAGTCGGAAAGGAAACGACGTCGCGGACGGCGAGGGGAAACAGAAGTCCTGACCTTACGGTCGATCTGTCAACGCCGTTGATACCGGCGATGACTCCTGCCCCGCCGCCTCTGGCACCCATGTCACCCATGGGTCTGTCACCTGTGGGTACTTTATCACCTACGAGGCCGCTCAGCCCGAGCAGACCGTCGTCACCTCCGAAGCAAATGACACCTGAGCAAGTACTTTCACCTCCACCAGTGAGCCCTTTGCAATCGAAGGGCTCCCCCGTCCCTATCATCCAAAGGCCGCCCAGTCCGCCTGGCCAGGCACCGCAGAGTTCCGGAAGCGCCAGTTCCAGCTCGGATTCCGGTTCTGACTCTGGCTCGGATAGCAGCGACGATTCCGAGGACGAAACGAGCACCCAACCTGCCAAAGGACCTTCGACACCTCCCTCTGTGTCACCAAAGAACGAGAATCTGATCGAGGAACCACCGGCAGCTATCGAGGAATCGAAACACAGGTGGAACCTTGAATCGTTCTTCAACAAGAAGGTGATGCCGCACGGGGAACAGAACGCTGAAAACAAGCAGACGCAGGATTGCAATAGGCAAGATGGTTCCCCAGCAACGACAGCAGACGTCAGAACGCACAGGGATAAGGCAGCTCACGATTGGCAGCTCGACGAAGCCGTGAAGAGGACTCACAATCCGACGATGATCAGCGTGCTCGACAGCGATAGCTATAGATCCTCGGATCAGGAGAAGGGTCAGCCCGTGGAAGAGAATCGTGTTCAAACGGAGAAACCAAAAGTGGCCGATGCGAGGAAACGTGGACGACCTAGAAAACCTACCAAGAGTCCGAAGGGTGGTCATCGGACGTCGGACGAGAGTCTGAAGAATGGCAAGCCTCGTAGTAGAACGAGAGGAGTCAGTAGTCCTATCAAGAGAAAGATACCTCTGTCGAAACCTACCATCACGACCAGTGACGACGGAAGCGACGACCGATCGCAGGATGGTTCCAGCGATTCGGACAGCGATCGACCGACCAGGATATCTCCGGTCGATGCTGCCATCAACGAGAAGAGACGGTCGAGAGTTAGCGGCTCCTCCAGCGAAGACGAGGGTCCTCCTAATGGAAAGAACAACATTGCCTCCGAGGATGATAACACGCGTTGGAGAAGGGTATCCATCAAGAGAAGCAAGCTGGCAGACTCGCCTAAGAAgcaggagaagaagaagagtccCGCCAAAGCCAAACCAAGAAGATCGAATTCGAGGGTGACAAACGTTGGGGGGTCTGATTCTGACAGTGAGTCTGAGATGTCGGTGAGAAATCGCATTCAAGTAGCCAGGGTACCTCCAAGGCCAAGGGCACCTCCAACCAGGACAACTTCCCCGGAAAACTCGGACAGCGACAACAGTCCAGGTCCGAAATTGCAAGAGGAAGATGCTGGTAACGTGCAAGACAAGAAGAAGAGCGACACGCTTCGAAAGGTCTTCTCGTCTTCGATGGGCGGGGGTAAAGTTGGCGGTAAAGGAGGAAAAGGTGGAAAGGGCGGAGGCAAATGTGGCATCTACGTGGAAGAGTACACGACCTCTGCCAATACACCGACCGGCGGGGATAGTCCGTACAAGAGACCGTCGTCCCAAGCATCCAGCATCATTCAATCTTTCCCACCGCTTACCTACGTGAACGGTGTGCCCAGTTTACTCTGCAGGATCGAGCTGAGCAGACTTCCTCATCTATCGCAACTGTCGCGAGGACAGGAATTGAGGCAACGCACGGAGCTACCCGACACCAGGCCATCATCCAGGCAGGCTTCCACCTTGACCGCCCAACCTACTCGACCATCCACGCCCGAGGAGGGAGAGATAATTGACACGCCACCGCCTCAACAGTTACCTACCGACTCGAGGATTCACGGTGACGCGTTGCTAGTCGACGGCGAGCTGAAGAATCGCGCTGTGATCAAAGGGGAACCTATTACGGACTCGAAGAGTAATTGTGGCATCGGACTGGGTGCTGGTCTCGTCGGTGGAGGTGCTAGTGGAAGTGGTAGTGGTGCTAGTGGCGCGGGTAGCGCGCCCAAGAGGAAACGTAATCCGAGTTGTAGTTCTGTGACCAGTTTCAGTACTGTGTGTTCCATAGAGACGAAAGGAAAGGGATCGGGGGAGcacaaagaaagaaagaagagaaagagaaaacaCGCGGACGTTGAAGCTGTCGCATCGAGGTCCTCTTCGAATCAGCAAAGCGACATACAACCAACGAATCACGAACGGGAAGAAAAACCTGACACCAGCTTGTTgccgccaccaccaccgcctCAACGCGTCTATTATTCCTACTTCAATCCTCAGAACGAAGTTTTGGAGGATCAAGATAGGTGGGACCAGAATCAGTACCTGATGGAAGCGAAACGGCTGAAGCACAGCGCCGACAAGGAGTGCGAACTCACGGCGCAGGGTATGCTTTACCTGGAAGCCGTTCTGTGTTTCCTGCTCACTGGCAACGCCATGGAGTCAGATCCTGTCACGGAGAGGGCGTCGTTCACCATGTACAAGGATACTCTCAGTCTCATCAAATACATCTCTTCGAAGTTCAAGAGTCAGCAGAACAACTCGCCAGAGAGCAGTATACATAACAAGCTAGCCATTCTAAGTCTCTTTTGCCAGTCTCTTATATACTTGAAGTTGTTCACGATGCGCAAACATGAAGTGAAGGAGACACAGAAGATCCTCAGCGACTATCATCAGAAACCCGCTCAGGCAACGCCTGTGCAACCGGAAGGTCAAGGAACTCCTTCCCTATCGCCCACCCCGTCGCCGGCCGGTTCCGTGGGCTCGGTTGGCAGTCAGAGTTCCGGATACAGCAGCGGTGAACTGGCGAATCGAGGGGCTGCCTCGGGTCAACCGCAGGCAGCTCCTTACGTTAGCGTTCCGCTGAATGTTCACAACGCGATggtaaaacaaaattatcaCCTTGGCTTGCTGTTTAGTTGTCACGATCTCTGGGACCAGGCCAACGCTCTGGTGACAGAAAAGCATAGAGATTTTTTCATCGAGCTGGATGAAAAACTGGGACCCCTCACGTTGAAAAGTTCGCTACGCGATTTGGTGCGATACGTACAAGCCGGTATAAAGAAGCTTAGAGATCTCTGA
Protein Sequence: MLHSIATTTTTATMHRFESRNALVPSVDRDRLRERERQARAAMSVQAEQAAAGGGPDTRHHHHGHHNHAHHHANPHTVAAPLFHAPVRVNPDARDSTTQQIQSKLGNYSLVKHLLDEPKRLIGIEGVPPSPAPSPSPSSLRTSSSSIGTNSRSSPSSQEFKKPGGPRTSSSSSSSSSHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGLLPAKGPPPNSPGNGTLVGNSNIGNSNGGGRLHSAGNRLSRLTLDNGTNSRPGPTENSADVENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVTPPETAKPQRERHTDSRLSADLERDLSLSEDSEDEVGKETTSRTARGNRSPDLTVDLSTPLIPAMTPAPPPLAPMSPMGLSPVGTLSPTRPLSPSRPSSPPKQMTPEQVLSPPPVSPLQSKGSPVPIIQRPPSPPGQAPQSSGSASSSSDSGSDSGSDSSDDSEDETSTQPAKGPSTPPSVSPKNENLIEEPPAAIEESKHRWNLESFFNKKVMPHGEQNAENKQTQDCNRQDGSPATTADVRTHRDKAAHDWQLDEAVKRTHNPTMISVLDSDSYRSSDQEKGQPVEENRVQTEKPKVADARKRGRPRKPTKSPKGGHRTSDESLKNGKPRSRTRGVSSPIKRKIPLSKPTITTSDDGSDDRSQDGSSDSDSDRPTRISPVDAAINEKRRSRVSGSSSEDEGPPNGKNNIASEDDNTRWRRVSIKRSKLADSPKKQEKKKSPAKAKPRRSNSRVTNVGGSDSDSESEMSVRNRIQVARVPPRPRAPPTRTTSPENSDSDNSPGPKLQEEDAGNVQDKKKSDTLRKVFSSSMGGGKVGGKGGKGGKGGGKCGIYVEEYTTSANTPTGGDSPYKRPSSQASSIIQSFPPLTYVNGVPSLLCRIELSRLPHLSQLSRGQELRQRTELPDTRPSSRQASTLTAQPTRPSTPEEGEIIDTPPPQQLPTDSRIHGDALLVDGELKNRAVIKGEPITDSKSNCGIGLGAGLVGGGASGSGSGASGAGSAPKRKRNPSCSSVTSFSTVCSIETKGKGSGEHKERKKRKRKHADVEAVASRSSSNQQSDIQPTNHEREEKPDTSLLPPPPPPQRVYYSYFNPQNEVLEDQDRWDQNQYLMEAKRLKHSADKECELTAQGMLYLEAVLCFLLTGNAMESDPVTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLFCQSLIYLKLFTMRKHEVKETQKILSDYHQKPAQATPVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGAASGQPQAAPYVSVPLNVHNAMVKQNYHLGLLFSCHDLWDQANALVTEKHRDFFIELDEKLGPLTLKSSLRDLVRYVQAGIKKLRDL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01123054;
90% Identity: iTF_01123054;
80% Identity: -