Basic Information

Insect: Cryptotermes secundus
Gene Symbol: lilli_1
Assembly: GCA_002891405.2
Location: NW:643144-1033465[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 3.6e-13 4.5e-09 35.6 0.0 4 121 21 140 19 159 0.75

2 9 1.2e-06 0.015 14.1 30.4 349 513 242 457 221 458 0.62

3 9 0.18 2.3e+03 -3.0 1.1 434 471 493 527 479 568 0.53

4 9 1 1.2e+04 -12.7 28.0 74 229 575 721 554 755 0.41

5 9 1 1.2e+04 -5.9 13.4 82 232 701 852 695 887 0.54

6 9 1 1.2e+04 -11.0 25.6 377 482 873 993 867 1016 0.60

7 9 0.03 3.8e+02 -0.5 5.2 135 190 1127 1181 1079 1202 0.39

8 9 0.044 5.5e+02 -1.0 29.9 86 255 1261 1424 1237 1439 0.39

9 9 0.74 9.2e+03 -5.1 1.0 149 162 1507 1520 1477 1540 0.36

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	3.6e-13	4.5e-09	35.6	0.0	4	121	21	140	19	159	0.75
2	9	1.2e-06	0.015	14.1	30.4	349	513	242	457	221	458	0.62
3	9	0.18	2.3e+03	-3.0	1.1	434	471	493	527	479	568	0.53
4	9	1	1.2e+04	-12.7	28.0	74	229	575	721	554	755	0.41
5	9	1	1.2e+04	-5.9	13.4	82	232	701	852	695	887	0.54
6	9	1	1.2e+04	-11.0	25.6	377	482	873	993	867	1016	0.60
7	9	0.03	3.8e+02	-0.5	5.2	135	190	1127	1181	1079	1202	0.39
8	9	0.044	5.5e+02	-1.0	29.9	86	255	1261	1424	1237	1439	0.39
9	9	0.74	9.2e+03	-5.1	1.0	149	162	1507	1520	1477	1540	0.36

Sequence Information

Coding Sequence: ATGTCTGGATATTATGACGGTCCAGCCAACCCGCTGCTCAAAGGGACTTTGTCCAGCGTGGAGCGCGACCGACTCCGGGAGCGGGAAAGACAGGCTCGCGCGCAGATGTCATCTCAAGCCGAGCGTGAAGCCGAGAATCTGGGGGCGCCATTCTTCGGGCCGCCTGTCAGGGTGCTCCCCTCAGCTGCTGACAAAGTAACCCGGCAGATACAGAGTAAGTTGGGCGACTATGATGCGGTGCAGCAGATCCTGGAAGATGATTCCAAACGCTTGATTGGAATTGATGGTGTCCCTCCCAGCCCTGCACCTGGGGGCACCCATGCTTTCTTCTCAGCTGCCAGTACACGACTGCAGCAAACTCCGGAATTCAAGAAGCCATCTTCACATCAGCATGGCAGTGTTGTGAGTAACGGGAGGGTGAACAATCATTACCATCCTCACAGTGCTCCTCGAGGTGGGTTTGTGAAGCCTGCAGATGGGAAACCGCCTCATGGGGGTAGGGGCGGATATCCTGGACAACCTGTGAAGCATGGTGGAGGCAGCAATGATCATCGGTCCAATGGTGGCATTGTACCACCAAAAGGACCGCCTCAAGGTGGAGGTGGTAGCAGTAATAGCAGAGTGCAGCAAGTTGCGAGGACTCTTCCAAGATTAAATGTTAACCAGATGTCAGGGCTGGGACAAAGGGAGTCATCACATCTGGGTAGTGCTGGACAGCCTGAAGTTGAATTCATTCTGAAGGAAATGACAGAAGTGATGGAGATGACCCCTATCACTGGTATAGCGACCCCAAGGAAGGAGACTGAAAGCAAGTTTATATTCAATCCTGTTCTTCAGTTGCCGGAGTATGCCATGCCACCGACCCGCCATGCAGACTACAGTAAAACCCaaCGGAGCAGCCAACCGCAATCTCAGATTCCAACGGACGTGGTACCAGATCCACTCTCCGACCTGATCATCTCAGATGACAGTGATGACGAAAAGGTGGTGCTCAACCCCGAGTCCAAGCTCCATGGATCCTCGAACCAAATGGACGAGCCAAGAGGTGGTCCTTGTGCTGCTGCAATATTGACCGCTAGTCCAACCCCTGGCACACTAAGTATTGGCAGTAGACCTACTGAGCCTGTGGCACCCATGTCCCCGGTGGGTCCTCCCCAATCTTCAGGGGCTTGCAGCTCATCCAGCGAGGACGACTCTGATTCTGAATCAGACAGTGAGTCAAGCAGTGAAGAATCGGGGGATGAGGCGTCTCATGAACCTGTGGATTCTGCAAGGGGCACCACTGCCCCACAAGCTCATTTGTCTCCACAAACTATGGAGCCAATGGAAGAGACAAAGCCTCAAGATAGATGGAACTTGGAAAGGTTTCTTAAAAGAGAAACACAGTCTCTTGGAGGAGAGCAGCCAGTAGAAAGTGAACATTCAACACTTTGTAAGcTGGAATTTGTGAAACAGGAGCCTTCCTCAGCAGCAGTAACCACTGCAGTTCCTAGCAGTCTACCAGAGTCAAACCCACAACAGCCTGCAGTTGGGACCAAAGTGAAAATAGCGAGTGGTGCAGTATCAGATGGCAGTGACTCCAACAAAGAGCTGGACAATGTAGTTGAGGCTCTTCAGCGCCCTCCTCTTCCACTCTTGTCTAGTCTCTCTGAATCCGATTCTGCAGACAGCGCTAAGAAGAAACCAGTGCTCACCGATACAAGATCAAGACGGAAACGTCCAACTCTACCCACCCGGGCACCAGAGCTGTcgagtgacagtgacagtgaaagTGTGATGATCATCAGGGAAAAAACCAGGCCGGCCAACCGAAACAAGACACGTCCTAAGAAGGAACCAAGGACCCCAAGTACATCAGATGAAGAGCTGCAGTCTCCAAAACAACCAACTGTAAAGCAGCGAAACAGTAACAGTCACAGTGTTAGGTCAAAACCCTCTCCATCTCCAGCCCGATCTGTGGGTAAGGTAGATGATCAAAGGAAGAAACATGGGGAAAGGACTCCAAAACAAACTCCCAACAGGGCTCAAAAGCAGACTCCTAACAGGACTGTGAAACAAACTCCCAGTGTAAGTAGTGATGTGAGGAAGCCTCCACCTCCATCACCTAGTGAatcagaagacgaggaagcCGTAGTGCCTCAAGGAAGAGGCCAGTCTTCTTCTAGTACATCAGATGGTGAAATTAAGGATTCTAAACCATCAGTGAATGTAAGACCCAAACCACCCCTCTCGGCACCAAGTGGATCAGATGATGATTCAGATGGAGGTAAACAAGGTTCAGGAGCAGTTACCAAGCATGCCAATGCTCACAGCCGCTCTGAAGATGAAACTGCGAGTGTTAAACCAAGAGACCAGCATGCAGCCAGCAGAGAAACTTTCAGTGTAAGGGAAAAACTGCTGTTAAGCCCATCAGATGAGGAAGGTGAAGTTGATAGGAGGAGGGGAAATGTTTCAACAAGCAGGCCAAAACTTCACTCTCCTTTGCCTCTTAGCGGGTCTGAGGAAAGGGATGGTGAGTGGACAAGGAAGAACAGCAAAGTTCAGGGCAATGTTAAGAAGGCTGGTAGAGGTAGAAATAAGGCAAGACCTGGTGGAATGCCAGcacaagaagaaaagaaagctACTGTTCCAAAGAAGGAGAAGGGTCCAAAAGGTTCTGCCACCAGGAAAAGGACTAAGGAAGACGTTACAAGTGGTCCAAAGAAACAGTCTGGGCCTGGGAGGCCTTATGCTAGGAGAGGTCAGAAATCAAAGGCGATGAAAAGTTGTTATACCACAACAGAGTCGTCCTCAGATAGTGATTGTGAGATAGACGTTGTAAACACATCGTCGGAAAAGACTACAAGGTCTTTCAAAGCCAAGAGTCAGCGGAATCACAGTCCCGATTCCAGTTCTGACTCTGGCCAGGGCAGGAagaagtcagccagtctgtctaaGAGGAAGCACTCCTCAGACAGTGACAGGGACAGTGACAGGTCTCGTATTTTGTCCCGCCCACCTATGTCGAAGGTAGAAGAGAGTCCTCCAAAGTTGGATACAGAAGGCAAAGCCATCCAAGACAAGAAGAAAAGTGATACCTTGAGAAAACTTTTCGTTCCTACTAAGGGAGGTGCCAAAGGTGGGGCTAAAGGGGGAGCAAAAGGTGGTGCCAAAGGGGGTATATATTGTGCCAGTGGGGGTGGGAAAGGTGCTGGTGCGAAGGGCAAGGGAGGATCAAAAACTCCCGGTGTTCTTGTAGTGGAGTGCGAGTCAGAAAGGACGTCTTCTTCAGTGGAAGATGAGGGTGTACCAACCCCAGTGAGCCCTTGTTTACTGTCCCCATTATCAGGTAATGACACAGTAAcaacaaacaagcaaggaagTGCAGGTTTTGTTGTAAATTCAAGTCCAGCGAAGACTGATAAGTGCAGTACGACGTCTGGAAAGTCAGGTGCAAGAGCACATAGTTCTGAAAAACCTTCACGGCGAAAGTCCGCAAAAAAAGAGTCTGAAAAACTGTCTAAACATTCTGCAGCAGTCAAAGTCAGGCGTGATACTTCGTCAAACAAGAAAACTGCACAAGACACACCAAAAGTGGAACTTCCTTCAATTGTGTATCGTTCTGATGGAATTCCAAGTATTATCTGTCGTTTGGATCTGTCTAGACTATCTCAAATCCCAATTCCAGGAGGCCCTGGTAAGAGACCTAGTGGGGGTGAAGACGTTAGGGTACGAACAGAATTAGCAGATACAAGGCAACAGGGTGGAAGTGACCCAGACCATAGTAGGAAGGACAAAAAGCAGAGGACTCAGTCACCTACTTGCAAGGAGGGAGACATAGTGATACCAAAGTGTGATAAAAATAAGAACACAGATAAAGTGGTACAGGAACAAGGTTGTGACAGTACGACAGTTAATCATGAGGCTTCCAAGAAGCAAAAGAAGAGGAAAGTTAGCAGAAATACTGACAATTCCAGCACCAAAAACCAACAGGAAATCAGAGATACTACACAGATAGAAGGGAATGTGAAACCTGCTGGTAAATCCAAACATCACAAAAAGAACAGCGATAGTAATGGGCATAAACGTCAACGTGAACGCAAGCCAAGCGGCAGCTCTGTGTCTTCATTGTCAACAGAATGCAGCCGAGTATCGTCACAAGGTGGCAGTGGCCAAAGGCACCGTGAAAGACATAACCGTGAACATGGTTCAAGCAAGCGACGTAAAGTTCAACAGCAGCAACCTGAGGAGTCCAGTGAACATGCCACATTAAGGTTATCTAGTCAAAGCACAGTAGCTCTCAAAGATGTGCCTCCAACAAATCATGAGCGAGAAGATAACAGTGATGAGATGGTAGCTGCAGCTGGAAGCGAATCGCCAGGTTGTTCTCGGCTGCACTATTCTGAGGGTCCTCTGCTAAGTTACCCCATACCTCCTGGACATGGCTATCCCATGTCAGCCATGAACTGGTCACATGCTACACAGAAAGTGTACTTCTCTTATTTTGAACGAGAAGATGACGATGCCTCGGAAGATGAGGACAGGGATCAGAACCAACAGAATCAGTACCTGAAAGAAGCCAAGAGGTTGAAGCATGGGGCTGACAGGGAAAAAGACCACACAGCACAGGGAATGCAGTACCTAGAAGCTGTGCTATTTTTCCTTCTCACCGGGAATGCTATGGAACATGAGAGTTGCACTGAGAAAGCAGCTTTCACCATGTACAAAGACACTCTGAGCCTCATCAAGTACATTTCTTCAAAGTTCCGATCTCAACAGAACAATTCTCCACAAGGCAGCATAGATAACAAACTAGAAGTTTTAAGTCTGCGATGCCAGTCACTGTTGTACCTCAAATTGTTCAAAATGAGAAAACATGAAGTAAAAGAATATCAGAAGGTTCTGGCTGATTATCATCAGAAGGCGGCACAACCAACACCACTGCAGCCAGAACAGTGTGGTGGGCAGGTGGTGGGCGGGCAAGGTACTCCTTCCCCAATGTCTCCTACTCCATCCCCAGCAGGGTCTGTTGGATCAGTAGGAAGTCAGTCATCTGGGTACAACAGCGGTGATGTGGCTGCAGGGAGAATGGGTGGTACAGCAGGAGGCAACAGCATGGGACAGCAGCCCCCGGCTGCCAACATGGGCCCTTGtgttgctgtaccattgttTGTACACTCAGCAATGCAGAAGCAGAACCAGCACTTCACCTACCTGCTGTCATGCCATGAACTGTGGGAGCAAGCAGATACGCTTGTTCACAAGGGCAAACACAAGTATTTCTTCATTCAGCTTGACCAGTGTTGTGGACCTCTTACGTTACATAGTTCTCTGAACGACTTGGTGAAATACGTAAGATTTGGAATTCAGAGGCTGAAGGACGCATGCTGTGGTGATGAGACTGTTCAACTTCAGTGA
Protein Sequence: MSGYYDGPANPLLKGTLSSVERDRLRERERQARAQMSSQAEREAENLGAPFFGPPVRVLPSAADKVTRQIQSKLGDYDAVQQILEDDSKRLIGIDGVPPSPAPGGTHAFFSAASTRLQQTPEFKKPSSHQHGSVVSNGRVNNHYHPHSAPRGGFVKPADGKPPHGGRGGYPGQPVKHGGGSNDHRSNGGIVPPKGPPQGGGGSSNSRVQQVARTLPRLNVNQMSGLGQRESSHLGSAGQPEVEFILKEMTEVMEMTPITGIATPRKETESKFIFNPVLQLPEYAMPPTRHADYSKTQRSSQPQSQIPTDVVPDPLSDLIISDDSDDEKVVLNPESKLHGSSNQMDEPRGGPCAAAILTASPTPGTLSIGSRPTEPVAPMSPVGPPQSSGACSSSSEDDSDSESDSESSSEESGDEASHEPVDSARGTTAPQAHLSPQTMEPMEETKPQDRWNLERFLKRETQSLGGEQPVESEHSTLCKLEFVKQEPSSAAVTTAVPSSLPESNPQQPAVGTKVKIASGAVSDGSDSNKELDNVVEALQRPPLPLLSSLSESDSADSAKKKPVLTDTRSRRKRPTLPTRAPELSSDSDSESVMIIREKTRPANRNKTRPKKEPRTPSTSDEELQSPKQPTVKQRNSNSHSVRSKPSPSPARSVGKVDDQRKKHGERTPKQTPNRAQKQTPNRTVKQTPSVSSDVRKPPPPSPSESEDEEAVVPQGRGQSSSSTSDGEIKDSKPSVNVRPKPPLSAPSGSDDDSDGGKQGSGAVTKHANAHSRSEDETASVKPRDQHAASRETFSVREKLLLSPSDEEGEVDRRRGNVSTSRPKLHSPLPLSGSEERDGEWTRKNSKVQGNVKKAGRGRNKARPGGMPAQEEKKATVPKKEKGPKGSATRKRTKEDVTSGPKKQSGPGRPYARRGQKSKAMKSCYTTTESSSDSDCEIDVVNTSSEKTTRSFKAKSQRNHSPDSSSDSGQGRKKSASLSKRKHSSDSDRDSDRSRILSRPPMSKVEESPPKLDTEGKAIQDKKKSDTLRKLFVPTKGGAKGGAKGGAKGGAKGGIYCASGGGKGAGAKGKGGSKTPGVLVVECESERTSSSVEDEGVPTPVSPCLLSPLSGNDTVTTNKQGSAGFVVNSSPAKTDKCSTTSGKSGARAHSSEKPSRRKSAKKESEKLSKHSAAVKVRRDTSSNKKTAQDTPKVELPSIVYRSDGIPSIICRLDLSRLSQIPIPGGPGKRPSGGEDVRVRTELADTRQQGGSDPDHSRKDKKQRTQSPTCKEGDIVIPKCDKNKNTDKVVQEQGCDSTTVNHEASKKQKKRKVSRNTDNSSTKNQQEIRDTTQIEGNVKPAGKSKHHKKNSDSNGHKRQRERKPSGSSVSSLSTECSRVSSQGGSGQRHRERHNREHGSSKRRKVQQQQPEESSEHATLRLSSQSTVALKDVPPTNHEREDNSDEMVAAAGSESPGCSRLHYSEGPLLSYPIPPGHGYPMSAMNWSHATQKVYFSYFEREDDDASEDEDRDQNQQNQYLKEAKRLKHGADREKDHTAQGMQYLEAVLFFLLTGNAMEHESCTEKAAFTMYKDTLSLIKYISSKFRSQQNNSPQGSIDNKLEVLSLRCQSLLYLKLFKMRKHEVKEYQKVLADYHQKAAQPTPLQPEQCGGQVVGGQGTPSPMSPTPSPAGSVGSVGSQSSGYNSGDVAAGRMGGTAGGNSMGQQPPAANMGPCVAVPLFVHSAMQKQNQHFTYLLSCHELWEQADTLVHKGKHKYFFIQLDQCCGPLTLHSSLNDLVKYVRFGIQRLKDACCGDETVQLQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -