Basic Information

Insect: Cephus cinctus
Gene Symbol: lilli_1
Assembly: GCA_000341935.1
Location: NW:434376-473267[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 0.62 6.7e+03 -4.8 1.1 4 24 7 27 6 31 0.78

2 8 6.4e-05 0.69 8.4 18.2 25 214 55 235 48 261 0.49

3 8 6.6e-10 7.1e-06 24.8 1.5 341 444 284 384 252 393 0.77

4 8 0.14 1.5e+03 -2.6 25.8 443 499 470 524 454 553 0.56

5 8 1 1.1e+04 -9.3 16.5 127 242 564 672 532 696 0.40

6 8 0.93 1e+04 -5.4 15.6 456 501 693 738 673 745 0.54

7 8 0.7 7.6e+03 -5.0 8.8 441 502 782 842 747 848 0.50

8 8 0.018 2e+02 0.2 9.3 119 193 1094 1171 1057 1234 0.39

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	0.62	6.7e+03	-4.8	1.1	4	24	7	27	6	31	0.78
2	8	6.4e-05	0.69	8.4	18.2	25	214	55	235	48	261	0.49
3	8	6.6e-10	7.1e-06	24.8	1.5	341	444	284	384	252	393	0.77
4	8	0.14	1.5e+03	-2.6	25.8	443	499	470	524	454	553	0.56
5	8	1	1.1e+04	-9.3	16.5	127	242	564	672	532	696	0.40
6	8	0.93	1e+04	-5.4	15.6	456	501	693	738	673	745	0.54
7	8	0.7	7.6e+03	-5.0	8.8	441	502	782	842	747	848	0.50
8	8	0.018	2e+02	0.2	9.3	119	193	1094	1171	1057	1234	0.39

Sequence Information

Coding Sequence: ATGAAAAAGCCACGCGTGGACCGGGACCGTCTTCGGGAACGGGAACGACAGATCCGAGCGGCGATGTCGGTCCAGGCGGAGCAAGCGGCTGCTGGAGGAGGTCCTGACAGCCGTCACGGTCACCGTCATCACGGGCATCATCATGGACACCATCATCATTCGAATCCTCTTGCAGCCACCGCTCCGCTCTTCCGTGCTCCCGTGAGGGTTAATCCCGACGCCCAGGATCGCGCCACTCAGCAAATACAATCGAAGCTGGGCAACTACTCGCTGGTGAAGCACTTTGTACTCGACGACTCGAAGAGGCTCATCGGCATCGAGGGCGTCCCTGCGAGTCCGGCGCCGGCCTCAGCCTCCGGCCTCAGGACAAGTTCAAGTTCAGGGACGACCTCGAGAAGCTCACCGTCCGCCCAGGAATTCAAGAAACCTGGCGGTCCACGCACCGGCCCCAGCGGCTCCAGCGGCTCCAGCGGCTCCAGCGGGTCGAGTAGTCACGCTTCTCAGCGCGGTGGGTTCGTCAAACCGGCTGACGGGAAACCACCCTACAGTGGCAGGGGCAGCTACTCGGGACAACCCGTTAAACACGGCGGCAGCAGTAACGATCATCGCAGCCATGGGCTTCTTCCCGCCAAGGGTCCTCCTCCTAattcatcctcctcctcgtcctcctccacCACGTCAAGTATCTCCTCTTCGTCCGGCTCAGCCAATCTCAGTGGAAACGCAAACTTCGACGGCGCCGCTGGAAACGTCAGCGCCGGAAGCACCGGAAGTACCGGAAGCAGGATACACTCGGTGGCTGGTCGACTGCCCAGGCTGCCTCTGGATAACGGAACGAATAGCCGGCACGGAGCTACCGAAAATTCTGCCGACCTTGAAAATATCCTGAAAGAGATGATGATGCCGCCGACTCCGCTGACGGCGATCGCACAGACCCCGAGGAAAGAACTGGAGTCAAAGTTCACTTTCAATCCTGTACTCGCCAAGcTGACCGAAGTCCCACCTGGCGAAGCTGCGAAGCCTCAAAGAGAGAGGCACCCGTCCAACAGGCTGTCTGCGGACTTGGAGCGCGACCTGAGCCTTTCCGAGGACAGCGAGGATGAGGAGGGAGCCAAGGTTGCGTCACCGAGAGCCTCGAGGAACGCGAGAAGTCCGGACCTTATGGTCGACCTTTCGACGCCGCTGATACCGGCCATGACACCCGCTCCACCACCTCTAGCTCCTATGTCGCCGATGGGAATGTCGCCCGTTGGTCCTCTCTCGTCCCCGAGACCTCTGAGTCCTCCTCGAGTATCCTCCCCGACGAAGGAACCAAGCGCGACGGGCGCACTCTCGCCGTCACCGGTGCCGCCAATGCCACAGAGTCCTCTCGACAAGTCAGAAAAGCTCTCGGAACTTTCACCCTTACCGACGGACCAGAGGCCGCCGAGTCCTCCCGTGGAAGCGATGCACCAGAGTTCAGTTAGCGCAAGTTCCAGCTCCGATTCCGGATCGGACTCTGGCTCGGATAGCAGCGACGACTCTGAGGACGAGGTAGCACAACCTCCGCCTAAGGGACCATCAACGCCGCCTTCGGTGTCTCCGTCGGCACCTGCCGAGGAAGCTCCGCCAGCCGTCGAGGAATCGAAACTCCGCTGGAACCTCAGTTCGTTTTTCACGAAACCTCCGCCGCAGCAAGGCGATCAGAATgctgaaaataaatcttcaCAGGACGATGTGCGAGGAGACGGATCACCGAGTGCTGTGTCCTCGGAAACGAGATCTCATCATCGGGATGCTGGACACTCTGGACATTCGGGTCACACGGGGCACGATTGGAAACTCGATGAAGCTCTCAAGAGAACGCACAATTCGGCTATGCTGAGTCTCTTGAGTGACAGCGATCATCATTCCGAATCTGATAAGAGGCAGAGCGTCATCGAGGAGGCTCGTCAACAGACGGAGAAGATTAAGCCTCCGGATGCCAAGAAGAGAGGACGACCGCGTAAACCTACCAAGAGTCCAAAAAGCCATCGGAACTTTGACGACGGTGGTGGAAAGAACAAACGAAGCAGCAGGACGCGCATTAATAATAGTCCAAAAAAGAAGCCGATCTCAAAGCCGACGGTTTCTACTAGCGAGGACGCTAGCGATGCTCAATCGCAGGATGCTTCCAGCGATTCCGACAGCGAGCGTCCAAGTCCACTGAGACATTCAACAGCCTCCCCAGTGTCCCGGAGTGTCAGTGACAAGTGTCGGCCACGGCTGAGTGTCTCCTCGAGCGAGGACGAGGGACCTCCGAGCAAGCACAATGTCCCGGAGGATGTTTCTTGGACGAGGTTGTCGATTAAGAGAAATAAGCTCGCTGAACAGTCGGCAAAGAAggccgagaaaaagaaagcttCGACGAAAACAAAATCCAGGAGGTCGAGACCAAGACTTCCTAGTGCACCTGCCGGTCCCTCGGATTCCGACAGCGAGACCGAAGCGGCCCCAATTAATACTCGTATTCAGGTCGCAAGGGTGCCACCCAGGCCAAGACCTCCTCCCAACAGGACCACGTCACCCGACAATTCTGATAGCGACAATAGTCCAGCCCCGAAGCTCCAGGAGGAAGGAGGAAATGTACAGGACAAGAAGAAGAGTGATACGTTGCGTAAACTCTTTTACGTGAACAAGGGCGGAGCAAAGTGTGGAGGGAAGGGTGCAAAAGGTGGTGGCAAAGTCGGCGGGAAATGCGGAATCTACGTGGAGGAATACACATCAGCTTCGATCCTTACGGGCGGCGAGAGTCCGTACAAGAGGCCCTCCTCGCAGATGTCGATTCCGCCGTTAAGATACGTAAATGGTATTCCGAGTATTATGTGCCGACTGGATCTCAGTCGACTCTCCCACGTGCCCCAGCCATCGCGCGGTCAAGAATTGAGGCAACACACTGAGCTGCCGGACACCAGGCCGTCCTCGAGGCAGGCTGCCATTCTGGCCCCGCCACGACCATCAACCCCTGAGGAGGGCGAAATTGTCGACACTCCTCTGCCTTCGAAAATACGGACTCATAGTGAGAATAGTAATGCCCTTGAGGGCGAGATTCCCGTTAAAATTCGGGGCATTAAAGCCGAACCGATCTCGGACACGAAGAACTTGTTAGGTGGAATCGGTGCTCACAGTGGCGGCGGTAGTGGTTTCGTTGGTCCTGTTTCTGGTATAGCTAGTGCTAGTACTCTTAACGGAAATCCCAGTGCCAGTGCCAGTGGTACCAGTGGTGCTAATGGCAGCAGTACTGGTGCTACTGCCAGTAGCAGTACTGTCGGCGGCGGTAACAGTGGAAGTGCGCGCAAACGGAAACGCAATCTGAGTTGTAGTTCTGTGTCTAGCTTGAGTACCGTATGTTCCGTGGACTCGAAGGCGAAACAGGGTTCCTCCGAGcacaaggagaaaaagaagaggaaacgGAAGCATGCCGATGCCGAATCCCTCACGCCGAGGCCTTCTTCCAGTCAGAGTGACGTTCAGCCTACGAATCACGAGCGGGAAGACAATGCGGACACGAGCCTTCTtccgccaccgccgccacctcaccgtatttattattcttacttCAACCCGCAGAACGAGATTGTCGAGGACCAGGATAGGGACCAGCATCAGTACCTGACGGAAGCTAAACGACTAAAACATAAGGCCGACGAGGAGTGCGACCTGACGGCCCAAGGAATGCTTTATCTCGAGGCTGTACTCTACTTCCTGTTGACCGGCCACGCGATGGAATCCGATCCGTTGACCGAGCGGGCCTCCTTCACCATGTATAAAGACACTTTAAGTCTTATCAAGTATATCTCCTCCAAGTTCAAAAGTCAACAGAACAATTCCCCCGAGAGCAGTATACACAATAAGTTGGCTATTTTGAGcCTATGGTGCCAGTCCCTCATATACTTGAAGCTCTTCAAGATGCGCAAACATGAAGTCAAAGATTATCAAAAACTCCTAGCTGATTATTATCAAAAGGTAATTCATCCTGCTTTAAGAAAAGTGCAAAAAGGATTGAGCATCACTCTTGTCTTTGACTTACAGCTAACTCAGGCATCTTTCGTCCAGCCCGAAGGACAAGGGACGCCATCGCCTTTGTCCCCGACTCCCTCGCCAGCTGGCTCTGTTGGTTCTGTCGGAAGTCAAAGCTCTGGCTACAGCAGCGGCGAGCTGGCTAATCGAGGTGCAGCTGGACAACCTCAGGGTCCTCCTTGCTTAAACGTACCCCTCAGCGTGCACCACGCAATGCAGAAGCAAAATCATCACTTTGGTCTGTTGATGAATTGCCACGAACTCTGGGACCAAGCTAATGCTCTGGTCACGGATAAGCATAGAGATTTCTTTATCGAGCTGGACGAAAGGATAGGTCCGCTCACATTGAAGAGCTCGCTGCGGGATTTAGTTCGCTACGTTCAGGCTGGGATAAAGAAGTTGCGAGCCCTCTGA
Protein Sequence: MKKPRVDRDRLRERERQIRAAMSVQAEQAAAGGGPDSRHGHRHHGHHHGHHHHSNPLAATAPLFRAPVRVNPDAQDRATQQIQSKLGNYSLVKHFVLDDSKRLIGIEGVPASPAPASASGLRTSSSSGTTSRSSPSAQEFKKPGGPRTGPSGSSGSSGSSGSSSHASQRGGFVKPADGKPPYSGRGSYSGQPVKHGGSSNDHRSHGLLPAKGPPPNSSSSSSSSTTSSISSSSGSANLSGNANFDGAAGNVSAGSTGSTGSRIHSVAGRLPRLPLDNGTNSRHGATENSADLENILKEMMMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVPPGEAAKPQRERHPSNRLSADLERDLSLSEDSEDEEGAKVASPRASRNARSPDLMVDLSTPLIPAMTPAPPPLAPMSPMGMSPVGPLSSPRPLSPPRVSSPTKEPSATGALSPSPVPPMPQSPLDKSEKLSELSPLPTDQRPPSPPVEAMHQSSVSASSSSDSGSDSGSDSSDDSEDEVAQPPPKGPSTPPSVSPSAPAEEAPPAVEESKLRWNLSSFFTKPPPQQGDQNAENKSSQDDVRGDGSPSAVSSETRSHHRDAGHSGHSGHTGHDWKLDEALKRTHNSAMLSLLSDSDHHSESDKRQSVIEEARQQTEKIKPPDAKKRGRPRKPTKSPKSHRNFDDGGGKNKRSSRTRINNSPKKKPISKPTVSTSEDASDAQSQDASSDSDSERPSPLRHSTASPVSRSVSDKCRPRLSVSSSEDEGPPSKHNVPEDVSWTRLSIKRNKLAEQSAKKAEKKKASTKTKSRRSRPRLPSAPAGPSDSDSETEAAPINTRIQVARVPPRPRPPPNRTTSPDNSDSDNSPAPKLQEEGGNVQDKKKSDTLRKLFYVNKGGAKCGGKGAKGGGKVGGKCGIYVEEYTSASILTGGESPYKRPSSQMSIPPLRYVNGIPSIMCRLDLSRLSHVPQPSRGQELRQHTELPDTRPSSRQAAILAPPRPSTPEEGEIVDTPLPSKIRTHSENSNALEGEIPVKIRGIKAEPISDTKNLLGGIGAHSGGGSGFVGPVSGIASASTLNGNPSASASGTSGANGSSTGATASSSTVGGGNSGSARKRKRNLSCSSVSSLSTVCSVDSKAKQGSSEHKEKKKRKRKHADAESLTPRPSSSQSDVQPTNHEREDNADTSLLPPPPPPHRIYYSYFNPQNEIVEDQDRDQHQYLTEAKRLKHKADEECDLTAQGMLYLEAVLYFLLTGHAMESDPLTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLWCQSLIYLKLFKMRKHEVKDYQKLLADYYQKVIHPALRKVQKGLSITLVFDLQLTQASFVQPEGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELANRGAAGQPQGPPCLNVPLSVHHAMQKQNHHFGLLMNCHELWDQANALVTDKHRDFFIELDERIGPLTLKSSLRDLVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00295238;
90% Identity: iTF_00253557;
80% Identity: -