Basic Information

Insect: Osmia lignaria
Gene Symbol: lilli_1
Assembly: GCA_012274295.1
Location: NW:6904135-6987844[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 1.5e-08 0.00015 20.3 0.9 27 129 34 137 24 148 0.62

2 8 2.2e-12 2.1e-08 33.0 1.1 326 433 212 317 205 341 0.74

3 8 0.19 1.9e+03 -3.1 26.2 441 511 407 484 392 487 0.58

4 8 1 9.9e+03 -11.0 17.2 114 250 454 586 445 629 0.53

5 8 1 9.9e+03 -5.8 12.4 427 497 599 672 594 687 0.61

6 8 0.0051 50 2.1 6.8 438 490 703 753 685 772 0.48

7 8 0.033 3.3e+02 -0.6 4.0 146 204 1020 1078 986 1131 0.41

8 8 0.032 3.2e+02 -0.6 0.9 131 220 1174 1264 1142 1293 0.57

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	1.5e-08	0.00015	20.3	0.9	27	129	34	137	24	148	0.62
2	8	2.2e-12	2.1e-08	33.0	1.1	326	433	212	317	205	341	0.74
3	8	0.19	1.9e+03	-3.1	26.2	441	511	407	484	392	487	0.58
4	8	1	9.9e+03	-11.0	17.2	114	250	454	586	445	629	0.53
5	8	1	9.9e+03	-5.8	12.4	427	497	599	672	594	687	0.61
6	8	0.0051	50	2.1	6.8	438	490	703	753	685	772	0.48
7	8	0.033	3.3e+02	-0.6	4.0	146	204	1020	1078	986	1131	0.41
8	8	0.032	3.2e+02	-0.6	0.9	131	220	1174	1264	1142	1293	0.57

Sequence Information

Coding Sequence: ATGTCGGTCCAGGCCGAACAGGCGGCTGCAGGAGGTGGTCCTGACACCAGACACCATCACCATGGCCATCATAACCACGCTCACCACCATGCTAATCCGCATACCGTCGCCGCTCCGCTCTTCCATGCTCCCGTCAGGGTGAACCCTGATGCCCGGGACAGCACGACGCAGCAAATCCAATCTAAACTAGGCAACTATTCACTGGTGAAGCATCTGCTGGACGAGCCTAAACGGCTGATCGGTATCGAGGGTGTGCCACCGAGTCCAGCCCCATCCCCGTCACCCTCGTCCCTTCGAACGAGTTCCAGTTCGATCGGTACGAATTCCAGGAGCTCGCCGTCCTCCCAAGAATTCAAGAAACCCGGAGGACCGAGGACCAGCTCGTCTTCGTCCTCATCGTCGAGCCATCAACGTGGTGGTTTCGTGAAACCAGCCGACGGCAAGCCACCGTACGGTGGCAGGGGTGGTTACCCTGGCCAACCGGTGAAGCACGGGGGTAACAGCAACGATCATCGTAGCCACGGTTTATTACCGGCCAAAGGACCGCCCCCGAATTCACCCGGGAACGGTACGCTCGTTGGCAATTCGAATATCGGGAATTCCAACGGCGGCGGCAGGCTTCACTCTGCCGGCAACAGACTGTCCAGGTTAACTCTCGATAACGGAACAAATTCGAGGCCTGGTCCCACCGAGAATTCGGCAGATGTTGAGAACATTTTGAAGGAAATGACCATGCCACCCACGCCCCTCACGGCTATAGCCCAGACACCGAGGAAGGAACTCGAGTCGAAGTTCACGTTCAACCCTGTCCTGGCGAAGTTGACTGAAGTGACGCCGCAGGAAACCGCGAAGCCTCAACGCGAGCGGCACACCGACAACAGGTTATCCGCGGATTTGGAGCGGGATCTGAGCCTATCCGAGGACAGCGAGGATGAAGTCGGAAAGGAAACGACGTCGCGGACGGCGAGGGGAAACAGAAGTCCTGACCTTACGGTCGATCTGTCAACGCCGTTGATACCGGCGATGACTCCCGCCCCGCCGCCTCTGGCACCCATGTCACCCATGGGTCTGTCACCTGTGGGTCCTTTATCACCTACGAGGCCGCTCAGCCCGAGCAGACCGTCGTCACCTCCGAAGCAAATGACACCTGAGCAAGTACTTTCACCTCCACCAGTGAGCCCTTTGCAATCGAAGGGCTCCCCCGTCCCTATCATCCAAAGGCCGCCCAGTCCGCCTGGCCAGGCACCGCAGAGTTCCGGAAGCGCCAGTTCCAGCTCGGATTCCGGCTCTGACTCTGGCTCGGATAGCAGCGACGATTCCGAGGACGAAACGAGCACCCAACCTGCCAAAGGACCTTCGACACCACCCTCTGTGTCACCAAAGAACGAGAATCTGATCGAGGAACCACCGGCAGCTATCGAGGAATCGAAACACAGGTGGAACCTCGAATCGTTCTTCAACAAGAAGGTGATGCCGCACGGGGAACAGAACGCTGAAAACAAGCAGACGCAGGATTGCAATAGGCAAGATGGTTCCCCAGCAACGACAGCAGACGTCAGAACGCACAGGGATAAGGCAGCTCACGATTGGCAGCTCGACGAAGCCGTGAAGAGGACTCACAATCCGACGATGATCAGCGTTCTCGACAGCGATAGCTATAGATCCTCGGATCAGGAGAAGGGTCAGCCCGTGGAAGAGAATCGTGTTCAAACGGAGAAACCAAAAGTGGCCGATGCGAGGAAACGTGGACGACCTAGAAAACCTACCAAGAGTCCGAAGGGTGGTCATCGGACGTCGGACGAGAGTCTGAAGAATGGCAAGCCTCGTAGTAGAACGAGAGGAGTCAGTAGTCCTATCAAAAGAAAGATACCTCTGTCGAAACCTACCATCTCGACCAGCGACGACGGAAGCGACGACCGATCGCAGGATGGTTCCAGCGATTCGGACAGCGATCGACCGACCAGGATATCTCCGGTCGATGCTGCCATCAACGAGAAGAGACGGTCGAGAGTTAGCGGCTCCTCCAGCGAAGACGAGGGTCCTCCTAATGGAAAGAACAACATTGCCTCCGAGGATGATAACACGCGTTGGAGAAGGGTATCCATCAAGAGAAGCAAGCTGGCAGACTCGCCTAAGAAgcaggagaagaagaagagtcCCGCCAAAGCCAAACCAAGAAGATCGAATTCGAGGGTGACAAACGTTGGGGGGTCTGATTCTGATAGCGAGTCTGAGATGTCGGTGAGAAATCGCATTCAAGTAGCTAGGGTACCTCCAAGGCCAAGGGCACCTCCAACCAGGACAACTTCCCCGGAAAACTCGGACAGCGATAACAGTCCAGGTCCGAAGTTGCAGGAGGAAGATGCTGGTAACGTGCAAGACAAGAAAAAGAGCGACACGCTTCGAAAGGTCTTCTCGTCTTCGATGGGCGGAGGTAAGGTTGGCGGTAAAGGAGGAAAAGGTGGAAAAGGCGGAGGCAAATGTGGCATCTACGTGGAAGAGTACACGACCTCTGCCAATACACCGACCGGCGGGGACAGTCCGTACAAGAGACCGTCGTCCCAAGCATCCAGCATCATTCAATCTTTCCCACCGCTTACCTACGTGAACGGTGTGCCCAGTTTACTCTGCAGGATCGAGCTGAGCAGACTTCCCCATCTATCTCAACTGTCGCGAGGACAGGAATTGAGGCAACGCACGGAGCTACCCGACACCAGGCCATCATCCAGGCAGGCTTCCACCTTGACCGCCCAACCTACTCGACCATCCACGCCCGAGGAGGGAGAGATAATTGACACGCCACCGCCTCAACAGTTACCTACCGACTCGAGGATTCACGGTGACGCGTTGCTAGTCGACGGCGAGCTGAAGAATCGCGCTGTGATCAAAGGGGAACCTATTACGGACTCGAAGAGTAATTGTGGCATCGGACTGGGTGCTGGTCTCGTCGGTGGAGGTGCTAGTGGAAGTGGTAGTGGTGCTAGTGGCGCGGGTAGCGCGCCCAAGAGGAAACGTAATCCGAGTTGTAGTTCTGTGACCAGTTTCAGTACTGTGTGTTCCATAGAGACGAAAGGAAAGGGATCGGGGGAgcacaaagaaagaaagaagagaaagagaaaacacGCGGACGTTGAAGCTGTCGCATCCAGGTCCTCTTCGAATCAGCAAAGCGACATACAACCAACGAATCACGAACGGGAAGAAAAACCTGACACCAGCTTGTTgccgccaccaccaccgcctcAACGCGTCTATTATTCCTACTTCAATCCTCAGAACGAAGTTTTGGAGGATCAAGATAGGTGGGACCAGAATCAGTACCTGATGGAAGCGAAACGGCTAAAGCACAGCGCCGACAAGGAGTGCGAACTCACGGCGCAGGGTATGCTTTACCTGGAAGCCGTTCTGTGTTTCCTGCTCACTGGCAACGCCATGGAGTCAGATCCTGTCACGGAGAGGGCGTCGTTCACCATGTACAAGGATACTCTCAGTCTCATCAAATACATCTCTTCGAAGTTCAAGAGTCAGCAGAACAACTCGCCAGAGAGCAGTATACATAACAAGCTAGCCATTCTAAGTCTCTTTTGCCAGTCTCTTATATACTTGAAGTTGTTCACGATGCGCAAACATGAAGTGAAGGAGACACAGAAGATCCTCAGCGACTATCATCAGAAACCCGCTCAGGCAACGCCGGTGCAACCGGAAGGTCAAGGAACTCCTTCTCTATCGCCCACCCCGTCGCCGGCCGGTTCCGTGGGTTCGGTTGGCAGTCAGAGTTCCGGATACAGCAGCGGTGAACTGGCGAATCGAGGGGCTGCCTCGGGTCAACCGCAGGCAGCTCCTTACGTTAGCGTTCCGCTGAATGTTCACAACGCGATggtaaaacaaaattatcacCTTGGCTTGCTGTTTAGTTGTCACGATCTCTGGGACCAGGCCAACGCTCTGGTGACAGAAAAGCATAGAGATTTTTTCATCGAGCTGGATGAAAAACTGGGACCCCTCACGTTGAAAAGTTCGCTGCGCGATTTGGTGCGATACGTACAAGCCGGTATAAAGAAGCTTAGAGATCTCTGA
Protein Sequence: MSVQAEQAAAGGGPDTRHHHHGHHNHAHHHANPHTVAAPLFHAPVRVNPDARDSTTQQIQSKLGNYSLVKHLLDEPKRLIGIEGVPPSPAPSPSPSSLRTSSSSIGTNSRSSPSSQEFKKPGGPRTSSSSSSSSSHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGLLPAKGPPPNSPGNGTLVGNSNIGNSNGGGRLHSAGNRLSRLTLDNGTNSRPGPTENSADVENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVTPQETAKPQRERHTDNRLSADLERDLSLSEDSEDEVGKETTSRTARGNRSPDLTVDLSTPLIPAMTPAPPPLAPMSPMGLSPVGPLSPTRPLSPSRPSSPPKQMTPEQVLSPPPVSPLQSKGSPVPIIQRPPSPPGQAPQSSGSASSSSDSGSDSGSDSSDDSEDETSTQPAKGPSTPPSVSPKNENLIEEPPAAIEESKHRWNLESFFNKKVMPHGEQNAENKQTQDCNRQDGSPATTADVRTHRDKAAHDWQLDEAVKRTHNPTMISVLDSDSYRSSDQEKGQPVEENRVQTEKPKVADARKRGRPRKPTKSPKGGHRTSDESLKNGKPRSRTRGVSSPIKRKIPLSKPTISTSDDGSDDRSQDGSSDSDSDRPTRISPVDAAINEKRRSRVSGSSSEDEGPPNGKNNIASEDDNTRWRRVSIKRSKLADSPKKQEKKKSPAKAKPRRSNSRVTNVGGSDSDSESEMSVRNRIQVARVPPRPRAPPTRTTSPENSDSDNSPGPKLQEEDAGNVQDKKKSDTLRKVFSSSMGGGKVGGKGGKGGKGGGKCGIYVEEYTTSANTPTGGDSPYKRPSSQASSIIQSFPPLTYVNGVPSLLCRIELSRLPHLSQLSRGQELRQRTELPDTRPSSRQASTLTAQPTRPSTPEEGEIIDTPPPQQLPTDSRIHGDALLVDGELKNRAVIKGEPITDSKSNCGIGLGAGLVGGGASGSGSGASGAGSAPKRKRNPSCSSVTSFSTVCSIETKGKGSGEHKERKKRKRKHADVEAVASRSSSNQQSDIQPTNHEREEKPDTSLLPPPPPPQRVYYSYFNPQNEVLEDQDRWDQNQYLMEAKRLKHSADKECELTAQGMLYLEAVLCFLLTGNAMESDPVTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLFCQSLIYLKLFTMRKHEVKETQKILSDYHQKPAQATPVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGAASGQPQAAPYVSVPLNVHNAMVKQNYHLGLLFSCHDLWDQANALVTEKHRDFFIELDEKLGPLTLKSSLRDLVRYVQAGIKKLRDL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01122425; iTF_00684157; iTF_00963840;
90% Identity: iTF_01122425; iTF_00963840;
80% Identity: -