Basic Information

Insect: Anoplophora glabripennis
Gene Symbol: lilli_1
Assembly: GCA_000390285.2
Location: NW:218121-306018[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 1.9e-08 0.00028 20.0 0.0 4 69 10 80 8 144 0.79

2 8 1.9e-08 0.00027 20.0 17.1 349 496 236 389 228 419 0.55

3 8 1 1.5e+04 -6.8 15.5 197 483 485 554 426 585 0.47

4 8 1 1.5e+04 -8.0 14.4 422 472 634 681 578 690 0.49

5 8 1 1.5e+04 -5.8 22.0 370 487 685 803 680 815 0.74

6 8 1 1.5e+04 -5.9 2.2 429 467 866 904 858 912 0.51

7 8 0.17 2.4e+03 -2.9 20.9 85 222 967 1106 947 1148 0.48

8 8 0.14 2e+03 -2.6 2.6 177 215 1240 1280 1162 1306 0.49

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	1.9e-08	0.00028	20.0	0.0	4	69	10	80	8	144	0.79
2	8	1.9e-08	0.00027	20.0	17.1	349	496	236	389	228	419	0.55
3	8	1	1.5e+04	-6.8	15.5	197	483	485	554	426	585	0.47
4	8	1	1.5e+04	-8.0	14.4	422	472	634	681	578	690	0.49
5	8	1	1.5e+04	-5.8	22.0	370	487	685	803	680	815	0.74
6	8	1	1.5e+04	-5.9	2.2	429	467	866	904	858	912	0.51
7	8	0.17	2.4e+03	-2.9	20.9	85	222	967	1106	947	1148	0.48
8	8	0.14	2e+03	-2.6	2.6	177	215	1240	1280	1162	1306	0.49

Sequence Information

Coding Sequence: ATGGTACTGGATACATTTTTAAGCGTGGAAAGAGACCGCCTCCGTGAGCGGGAACGGCAGGCGAGGGCCCAGATGTCTTCTCAAGTAGCGGATCAAGAAAGTCCGGGCACTTCCGGAAATTTCTTGTTTAGAGAACCCATAAGGATAAACCCTTCCACTGCCGACCCGGTCACCCAACAGATCCAGAGTAAGCTAGGCGACTTCCAACGGGTGAGACACTTCCTCGACCAAAAAGACTCCGGACTGATCGGCGTGGATGGAGTCCCACCAAGTCCGGGCGGTCCACCTCCACCTCCTCCGAGACATCACATGTCCATGCTTTCTGGACCACCGGTGGCAGGTGCTTCGAGCAGACTCCAGCCGGCGCCCGAATCACGCACGGAATTCAAGAAGCCGAACCATCACCACCTCCACCACCCCCATCAGAGGGGCGGGTATGTCAAGCCGGCCGAGGGCAAGCCGCCCTACGGGGGCCGCGGTGGCTACCCCGGCCAGCCCGTCAAACACGGCAGCGGCACCGTCAGCCACCGATCCAACGGCATCCTGCCGGCAAAGGGACCGCCTCCGTTGTCGCTGTCGTCCAGTTCTTCATCTATTCGCCTCCACGGCATCGACAGAATTCCACGCAGTCCCTACGAGCAGAACCAAGGCCCTACGGCTGGACCGAGGGAAACCCTGCCTTCCGCCACCCCGATTGCCGCTGAAGTGGATCACATATTTAAGGAAATGATAGACCAGAGAACACCACTGACTGCCATTGCGGCGACCCCCAGGATAGAACTCGACAACAAGTACAATTACAATCCGCTTCTTGCCAAGATACACGAGAAGACACCAGCGCCATCTGCAATTAAAAAACGTGATCGTCAACCGGCTCCACGGCCCCAAGAaagCCTAAGAGATGATCTCAACTTATCGGAGGAAAGCGATGATGAACATAAGAAGGAAGCTTTACATTCTTCTAATATAATTGTCGAAAAgatGTTATCGCCTCTAAGTGCTACTCCAGCAATACATAATTCAAAGATGGATGTGCCCGAACCTTTGGCACCCATCCCAACCTCACCGGTAGCTAGTTCTTCTAGTGACTCAGGATCTGATTCGGGGTCAGATAGCGAGTCCAGCAGTGACGATTCCGGAGAGGAAAATGTGACCTCAGTGGACGTACGTTTACAACCGCCACCTACAGAATTGCAGCCAGCGTCACCTCCGTCAGAAGACAGCAAAATTAGGTGGAACCTGGCATCTTTCGTGGGCAACAGCCAAAATATCACAGATCCCCTTACCTCTCCGTTAGTGTCTCCTGTTAAACCGTCTTGTTCGCTGCCAATAAAGACAAGTCCGGACAGTAGGAAAAGGGTTTCTGAGGAGTCGGACACCAGTGATTCCACTAAAGACATTGATGATATAGTGGCCAAGGCAAAAGCGCTAGCTGAATTAAGTAATTTGCCGTTACTGTCCAGTTTCTCTGACTCGGAAAACAGCAGCAAAGAATCAAATTCAAAGAAACAAAAGCATACCGTTCAACCAGTTACCAATCCTAATTTAAGTGACAGTGATTCAGATGTGAAAAGAACTAGTAAAAGAAAACCGGTGATTCGTGCTAGTCCCAGGACAAAATCAGTGGACTCCCACAGTGACTctgattttgaaaataaaacctATAGTGGCTTCGTTAACACCGCCCCCAAACCTATTTCCCCTGTGCCAGTAGTGAACCCAGAGAAAGTTACGAAACCTGGTCGAGGAAGGCCTAGGAAGATTAAACCTCCTAACGGCGATGAAGTGAAGAAACCAAGAGGTCGTCCAAAGAAAACGAGATCCCCTAACACTTCATCGGACGTCGAAAAGAAGAAGCCAAAGAGAGGTCGTCCGCCAAAATCTGTACTTCCACCATGTTCAAGCAGTTCCGACGAGGACGAGAAGTTTGAAAAGCCTCCACCTCCACCACGCCGCAGGACCAAATCAAAAGTGCAGACATCCAGCAGCTCAGATTCGGATAGTCCAGCACCAAGGCGACGAAACTCAAGCAGTTGCAGCAGTATTCGTCACGAGTCAGAAAGagaaattctaaaacatgagTCTCCAAAGAAAAGTTACAAACATAAATCTCCAAGGTCTGAGGAAAGGAAAAAAGCAAAGAAGAGCTCCGATGAAGAATGGGGCGCTGAAAATAAGGCGATCTTAAAAAATCACTTCAGGGATGACTCTATAAAGAAGAAATTGTCGGATAACTCAAAAGATGTCACATCACCGTTTAGGCGAAAAGGTCGACCGCCTTTACCCAAAAAGGAATCAAGTGATATTGAAAAGGTGAAATCTAAAGCTAAAGTAAGCTCATCATCCGAGGACTCTGATAGTGATATTACTTCACCATCGAAGAAAACTCTTAACAAAATAGATTCCACTATAAAGGTGGAAGAGAATAAGACGATAGCAGATAAGAATAAATACGATACCCTCCGTAAACTCTTCACACCTAAAAGGGACTCTGAAGGAGGCAAAGGTGGTGGAAAAGGAGGAGGAAAAGGTGGTGGTAAAGGAAAATGCGGGGTTAATGTGATAATAGTAGATGAAAATTATGAACGCAGTAGTTCATCCGTAGAGGACGAGGCTATGCCAACCATATCAACCAACCCCACCCTGCTGTCGCCTATATCCAATAATGAAGTGAAAAGAAAAAGTTCTGAACTGCCTTCTCATTCATCTTCACCTGTATATAATGACCCAATGAAATGTACGAAGACTGAAATTCCAATTAACGATAATATTGAAAAGATATCACTTTTGGTAAAGATAGATTTAAATCGGTTAGACTTATTTTCTATTCCCGCTTTGAGGAAATATATAGAGAACACTAGAAGGCTAACGGAGCCAAAAAAGGAAAACTTAGATAAGGCCAAAAAGGAAAATTTAGAGAAAACAGGTGACTGTGAAACTGATTTTAAAGTGAAGTCAACGAAGGAAAGTGATAACGAAACAAAAAGGGCGTTGCCACCTAAACTTGATCAGGATCACTCCGAGAGGAAACATAAACTGAAGAAACGCAAAAGGAGAAATAGCTCCAGCTCCATTTCTTCACTTTCGACAGTCAGTAACATGTCTCACAACAGTCACAAGAAAGAACACCAAATTAAAAAGGATAAAGATAATCCAAAATCTAAGAGACGAAGAGAAGACACTGAAGTTGCACGATCTCAAATTGATAATCTCAGTTTAATTAATGCCCCACCAACCAACCACGAACGGGAAGCAAGCAAGACTGTTCAGTACCTTGATGGGTCTATGTCCAGCAATCACACCCAGCCTACTAGAAAGTACCACTCATACTTTGAACCTCCAGAAGAACCATCTGAATATGAGGAGAGGGATCAAAACCAGTACCTGAGCGATGCAAAGAGATTAAAACACATGGCTGATGGAGAGACTGATACTATTAAACAATGTATGCTGTACCTGGAAGCTGTACTTTTCTTCTTGCTTACCGGCAACACCATGGAGCAAGAAagcatttcaaaaaattcagcCTTCACAATGTACAAAGACACACTTTCGTTAATCAAATATATTTCATCTCAGTTTAGGAGCCAGCAAAATGTATCCTCGGTTCATACTAAATTGGCTGTGTTAAGTTATCGGTGCCAAGCTCTGCTGTtttataagttatttaaaatgagGAAGCAGGAATCCAAGGAAGTGCAGAAAATTGTTAGTGATTATTGCAGTAAGAATGCCATTTCTCAAGATCAGCAGAACCACCAACAGGGCCAAGGTACTCCTTCTCCTCTGTCTCCCACCCCTTCTCCCGCCGGTTCCGTGGGTTCGGTGGGCAGCCAGTCCTCCGGGTACAGCAGTGGAGAATTGGCGGCGAGGGGAAACAATGCACTCATTCCTGCGACGCATGCTCAAAACGCCGGGGCATGGCTTCCGCTCTCTGTTTTTAACTCTGTGTCCTTGCAGAACCAGCTCTTCACATATCTAATCTCATTCCAGGATCATTGGGATATGGCCGACTCACTCATTATCAAGGGCAAACTTACAGaCTTCTTTATTGAGCTGGACAGGCAGTGCAGGCCTTTGACGATGCACAGTTCTCTCATAGACTTGGTCAGGTATGTAAGAGAAGGCATAAATCGCCTGAAGAGGGAGAGTTAG
Protein Sequence: MVLDTFLSVERDRLRERERQARAQMSSQVADQESPGTSGNFLFREPIRINPSTADPVTQQIQSKLGDFQRVRHFLDQKDSGLIGVDGVPPSPGGPPPPPPRHHMSMLSGPPVAGASSRLQPAPESRTEFKKPNHHHLHHPHQRGGYVKPAEGKPPYGGRGGYPGQPVKHGSGTVSHRSNGILPAKGPPPLSLSSSSSSIRLHGIDRIPRSPYEQNQGPTAGPRETLPSATPIAAEVDHIFKEMIDQRTPLTAIAATPRIELDNKYNYNPLLAKIHEKTPAPSAIKKRDRQPAPRPQESLRDDLNLSEESDDEHKKEALHSSNIIVEKMLSPLSATPAIHNSKMDVPEPLAPIPTSPVASSSSDSGSDSGSDSESSSDDSGEENVTSVDVRLQPPPTELQPASPPSEDSKIRWNLASFVGNSQNITDPLTSPLVSPVKPSCSLPIKTSPDSRKRVSEESDTSDSTKDIDDIVAKAKALAELSNLPLLSSFSDSENSSKESNSKKQKHTVQPVTNPNLSDSDSDVKRTSKRKPVIRASPRTKSVDSHSDSDFENKTYSGFVNTAPKPISPVPVVNPEKVTKPGRGRPRKIKPPNGDEVKKPRGRPKKTRSPNTSSDVEKKKPKRGRPPKSVLPPCSSSSDEDEKFEKPPPPPRRRTKSKVQTSSSSDSDSPAPRRRNSSSCSSIRHESEREILKHESPKKSYKHKSPRSEERKKAKKSSDEEWGAENKAILKNHFRDDSIKKKLSDNSKDVTSPFRRKGRPPLPKKESSDIEKVKSKAKVSSSSEDSDSDITSPSKKTLNKIDSTIKVEENKTIADKNKYDTLRKLFTPKRDSEGGKGGGKGGGKGGGKGKCGVNVIIVDENYERSSSSVEDEAMPTISTNPTLLSPISNNEVKRKSSELPSHSSSPVYNDPMKCTKTEIPINDNIEKISLLVKIDLNRLDLFSIPALRKYIENTRRLTEPKKENLDKAKKENLEKTGDCETDFKVKSTKESDNETKRALPPKLDQDHSERKHKLKKRKRRNSSSSISSLSTVSNMSHNSHKKEHQIKKDKDNPKSKRRREDTEVARSQIDNLSLINAPPTNHEREASKTVQYLDGSMSSNHTQPTRKYHSYFEPPEEPSEYEERDQNQYLSDAKRLKHMADGETDTIKQCMLYLEAVLFFLLTGNTMEQESISKNSAFTMYKDTLSLIKYISSQFRSQQNVSSVHTKLAVLSYRCQALLFYKLFKMRKQESKEVQKIVSDYCSKNAISQDQQNHQQGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAARGNNALIPATHAQNAGAWLPLSVFNSVSLQNQLFTYLISFQDHWDMADSLIIKGKLTDFFIELDRQCRPLTMHSSLIDLVRYVREGINRLKRES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01226904;
90% Identity: -
80% Identity: -