Basic Information

Insect: Arma custos
Gene Symbol: lilli_1
Assembly: GCA_037127475.1
Location: CM073761.1:4636876-4672536[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 7.8e-11 6e-06 27.9 0.0 4 89 25 113 23 181 0.77

2 6 2.1e-07 0.016 16.6 1.0 324 381 188 242 174 249 0.82

3 6 6.4e-06 0.5 11.6 11.2 465 514 323 374 283 374 0.76

4 6 1 7.7e+04 -6.5 22.6 81 245 496 655 477 672 0.40

5 6 1 7.7e+04 -6.9 25.7 132 248 784 905 746 921 0.36

6 6 0.06 4.6e+03 -1.4 2.2 11 26 923 938 921 948 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	7.8e-11	6e-06	27.9	0.0	4	89	25	113	23	181	0.77
2	6	2.1e-07	0.016	16.6	1.0	324	381	188	242	174	249	0.82
3	6	6.4e-06	0.5	11.6	11.2	465	514	323	374	283	374	0.76
4	6	1	7.7e+04	-6.5	22.6	81	245	496	655	477	672	0.40
5	6	1	7.7e+04	-6.9	25.7	132	248	784	905	746	921	0.36
6	6	0.06	4.6e+03	-1.4	2.2	11	26	923	938	921	948	0.82

Sequence Information

Coding Sequence: ATGGGCTCATGGTCGGACCCCATAAAGGGACAGTTGGGGGTAGAACTGATGGGGGTCGATGACCCGACCATTGAGCGGGACCGACTTCGCGAGCGGGATCGGCAGGCCCGGGCGCTGATGAACTCCGAGCCAAGTCCCACTACAGGCGGCGCCCCTCTCTTTGGCGCACCCGTCAGgGTGAGTCCTTCGCCAGGAGACAGGGTCAAACAAAACATACAGAGTAAATTGGGCGAGTATGACAAGGTGAAGCACTTGCTGGAAGAACCGAAGCAGCTTCTCGGCTTCGATGGCATACCAGCTTCCCCTGCCCCCGTTCAACCACCCCCTTCCAGAACTCATGAGTTCAAGAAGCCTCCGTATCATCCTGCCCCCAGTCGCCCGCCTTACAGGTCTGGGTGCATCAAAACTAACGAGGTTAAGCCGGGCTACAGCTGTGGGCGAGGGTTCTACCCCGGCCAGCCAGTGAAGCATGGGGCCGAGCAGAGGGCCAACGGGGTCGTCAACTCTTCCAAGGTACCTCCGATCCACACTCACCAGAGACCAATAAGCAGGAACCCCCAGCACCGCCCGCACCTCCCGGAACTCATGATGCATAAGGACATGAATCGTTCCACAAACTCGGCTGATGTGGAGCATATACTTAAGGAAATGACAGAAGTAATGACACCTTTGACGGCGATTGCTTCCACTCCAAGGAAAGAAGTGGAGTCCAAGTTTAGCTTTGCTCCTGACTTTTATGgacagTTTCCTGAACCAATGGAGATGCGATCTTCTGCACTGCTATCGCCGCCGAAACCCGATTCTCCTCCGCCACTTCCGCTATCTCCACCTCCAGCCACACCCTGCCCTCAAAAGCAATATAAGCCCCTGGCAGAGCTTAGTAGACATGGGTCTGTTCAGCCAACTTTTCCTTCTGGattaacttCACCAGCTGTGAGTATTATACCTGAGCCAGTGAGACCAATGTCAGTTTCACCAGATGGAAGTTCTTCAAGTAGTGATTCTGGCTCAGACAGTTCTGAGAGTGACTCAAGTACCTCAACTCCTATTCCACAAGAACTTCCCAACCCAGTTCTTCCTGAGCCACCTAGACAAAGTTGGGAATTAAAATCTTTTCTGCAGCCTCCTGCCAATCCAGAAAGAAAACCTACTCCGGAACCTCCACCACCAGTGGTGAAACCATCTAAAATTGAAGATGATTCTGAACCTGAATTGGGTGATGACGTTTTATCCAAGCCATTGCTGTCAAGTTTGTCTGACAGCGACGCAGAAAAAAAGGGGAAGCAAAAGACTGTTGGCCGCCCAAAACgtagaaaaaaaacagttaagagCCTTCCAGTTCAAACTGATAGCGAAGAAGAAAGTGAAGTGGTACAACCTATAATACCTTCTCCTCGTCCTTCTAGGGTTTCGAATAAAACCCCATCTGGAAGTGAAGGTGAAGTGAAAGTTATAAAGAGAGATAAACCGTTTAGAAAGCGTCGGCCTTCTACACCGTCACGGAAGACATCCGCAGAAAGACCTAGAAAAAGGACAACAGCAGCTCCTAATTCACACAACAATTCAAAAAATCCGGAAACTGAATCATTATCTAGGAGAggtagaaaaagaaatataaaaactcCAATAACATCAAGCATTGATGATGATTCTAAAAGAAAGCGTGTCCCTAGCAATTCAGAATCTGATGATGAATCATGGTCTGTTCATTCTAATATTTCGAGGAAAAGGAATAACAGGCGTTCTACAAAAGAGAGTTCCAGTGAGAGAACTAAAAGAGAAGTAGGATGGAATAAATTATCAAGTAGTGATgaagaaacaaataatatagtttCTTCTCCTCTAAAACCTACGTCAAGATTACCACCGGCTCCTGGAAAAAGGCCTCCTAAAGGATCGAGTGAAAGTGAGCCTGATAAAGAAGAGAGTCCGCCCAAATTGGACTCCGATGGGCAAACAATtcaagataaaaagaaaaatgacacACTGCGGAAGCTTTTTTCGAAAAGAGACAATGAGGGTGGTGGTGGAAAGGGGGGAGGTAAAGGAGGTGGCAAAGGTGGTGGTAAAGGTGGAGGAAAGTCAGGAGCAAAAGGAGGTAAATCAGGGATTTCGATCATTGAGTGTGACCCAGAAAGAACTCATGTCACCAAGGTTGATATGACACCCCCACTGATATCCATACCTTCCCAGAATTCACGAATACAAGAAGTATTTGTGGCTGatgaaataaaaccaaaatcTGTTATTATTCCCCCAATAACCTATATTAATGGGAAGCCATCAATAATGTGCAGCTTGGACTTAACAAGGCTACCGCATTTACCTAGTAAACGTAGGTCAGAAGAAATTAGAACTAGAACAGAGCTATCAGATACAAGGCAaagtaaaacaaagaaaaatgagTCTGATTCAAAATCAGATAAAAGAGAGCGCAAATCTTCAGAGAAACATCGTTCAAGAGAGGACAAACTTAAAAAACGTAAGAAATCCCCATCAGCTGAAGTTAAAGAAGAGTTACTGAAGCCTAATCATACAGAAGCAATCAAGCGTTTAACTCCAGAAGTAATTTTAGAACCAGAAAATGCTTCTGTAAGTGCTAATAACCACAAAAAGGATCGTAGATCAAGCACGAGCTCGACGACATCATCACATGCTGGAAATTTACATCACTCCAACTTGCATCAAAGTGTTAAACGGAAGAAACATAGTGAACGCCATGGTTCCAAAAACGAAGGAACACTTGTTGATGCTCCACCTACTAATCATGAACGGGAAAGAAGAgatcaagaaaaagaaaaagacaaagaaaaacgaaaaaatttgCAGTATTTTTCGTACTTCGAACGAGCTGAAGAAACCCAGATATGCGATACTGATGACAAAGATCAGTATTTGTCAGAAGCCAAACGATTAAAAAACGGTGCGGATAGGGAGCAAGATGAGTCTGCTCAAGGGATGCAGTACCTTGAAGCAGTTATGTATTTCCTATTAACAGGAAATACCATGGAACTGGAAAGTGAGACAGAGAAATCTGCTCACACAATGTATAAAGATACATTGAAATTGatcattttgcGTTGTCAATCTCTTCTCCACTTGAAACTGTTCAAAATGAAGAAAGCTGAAGTTaatgatgtaataaaaattgtctCTGATCATATGAATAAGgCAACCCCTACAACACTGGAGCAATGCAGCACTTCAGTTGTTCAAGGACAAGGTACGCCTTCGCCCTTGTCACCAACTCCTTCACCAGCTGGTAGTGTAGGATCTGTAGGCTCCCAATCTTCAGGGTATAATAGTGGTGAACGGGGTGGCACTATACCTCAAGTAACCCCTCATATACCTGTAGCACAATCTGGCCAAATCGTTGCTCTACCCCTTCATGTTCATAATGCATTTCAAAAAGAGCACGTCCACTTCAACTCCTTGGTAGCATCTCATGATCTTTGGGACCAAGCAGATGCTCTCGTACATAAAGGAAAGCATAAAGGTTTGTACAATTATGTTTTTGTAATAATCTATTTCTATCTAGGTTAA
Protein Sequence: MGSWSDPIKGQLGVELMGVDDPTIERDRLRERDRQARALMNSEPSPTTGGAPLFGAPVRVSPSPGDRVKQNIQSKLGEYDKVKHLLEEPKQLLGFDGIPASPAPVQPPPSRTHEFKKPPYHPAPSRPPYRSGCIKTNEVKPGYSCGRGFYPGQPVKHGAEQRANGVVNSSKVPPIHTHQRPISRNPQHRPHLPELMMHKDMNRSTNSADVEHILKEMTEVMTPLTAIASTPRKEVESKFSFAPDFYGQFPEPMEMRSSALLSPPKPDSPPPLPLSPPPATPCPQKQYKPLAELSRHGSVQPTFPSGLTSPAVSIIPEPVRPMSVSPDGSSSSSDSGSDSSESDSSTSTPIPQELPNPVLPEPPRQSWELKSFLQPPANPERKPTPEPPPPVVKPSKIEDDSEPELGDDVLSKPLLSSLSDSDAEKKGKQKTVGRPKRRKKTVKSLPVQTDSEEESEVVQPIIPSPRPSRVSNKTPSGSEGEVKVIKRDKPFRKRRPSTPSRKTSAERPRKRTTAAPNSHNNSKNPETESLSRRGRKRNIKTPITSSIDDDSKRKRVPSNSESDDESWSVHSNISRKRNNRRSTKESSSERTKREVGWNKLSSSDEETNNIVSSPLKPTSRLPPAPGKRPPKGSSESEPDKEESPPKLDSDGQTIQDKKKNDTLRKLFSKRDNEGGGGKGGGKGGGKGGGKGGGKSGAKGGKSGISIIECDPERTHVTKVDMTPPLISIPSQNSRIQEVFVADEIKPKSVIIPPITYINGKPSIMCSLDLTRLPHLPSKRRSEEIRTRTELSDTRQSKTKKNESDSKSDKRERKSSEKHRSREDKLKKRKKSPSAEVKEELLKPNHTEAIKRLTPEVILEPENASVSANNHKKDRRSSTSSTTSSHAGNLHHSNLHQSVKRKKHSERHGSKNEGTLVDAPPTNHERERRDQEKEKDKEKRKNLQYFSYFERAEETQICDTDDKDQYLSEAKRLKNGADREQDESAQGMQYLEAVMYFLLTGNTMELESETEKSAHTMYKDTLKLIILRCQSLLHLKLFKMKKAEVNDVIKIVSDHMNKATPTTLEQCSTSVVQGQGTPSPLSPTPSPAGSVGSVGSQSSGYNSGERGGTIPQVTPHIPVAQSGQIVALPLHVHNAFQKEHVHFNSLVASHDLWDQADALVHKGKHKGLYNYVFVIIYFYLG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01298366; iTF_00763849;
90% Identity: -
80% Identity: -