Basic Information

Insect: Cyphomyrmex costatus
Gene Symbol: lilli_1
Assembly: GCA_001594065.1
Location: NW:1416489-1631496[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.098 1.2e+03 -2.2 0.2 125 164 21 59 3 79 0.42

2 9 9.3e-06 0.11 11.1 0.1 49 108 84 141 65 177 0.59

3 9 2.6e-10 3e-06 26.2 2.6 349 443 271 361 245 379 0.78

4 9 0.096 1.1e+03 -2.1 26.0 440 503 434 492 421 523 0.53

5 9 1 1.2e+04 -13.8 29.8 99 248 528 670 500 690 0.30

6 9 1 1.2e+04 -9.7 19.1 392 483 630 715 612 728 0.49

7 9 1 1.2e+04 -6.7 14.5 422 488 713 779 677 800 0.44

8 9 0.15 1.8e+03 -2.8 9.2 183 257 1025 1099 911 1159 0.47

9 9 0.02 2.4e+02 0.1 4.9 127 218 1203 1300 1172 1332 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.098	1.2e+03	-2.2	0.2	125	164	21	59	3	79	0.42
2	9	9.3e-06	0.11	11.1	0.1	49	108	84	141	65	177	0.59
3	9	2.6e-10	3e-06	26.2	2.6	349	443	271	361	245	379	0.78
4	9	0.096	1.1e+03	-2.1	26.0	440	503	434	492	421	523	0.53
5	9	1	1.2e+04	-13.8	29.8	99	248	528	670	500	690	0.30
6	9	1	1.2e+04	-9.7	19.1	392	483	630	715	612	728	0.49
7	9	1	1.2e+04	-6.7	14.5	422	488	713	779	677	800	0.44
8	9	0.15	1.8e+03	-2.8	9.2	183	257	1025	1099	911	1159	0.47
9	9	0.02	2.4e+02	0.1	4.9	127	218	1203	1300	1172	1332	0.47

Sequence Information

Coding Sequence: ATGCCGAGCCACAAGCCAGCGCAAGCCATGAAGAAGCCACCACGCGTGGAACGGGACCGGCTTCGGGAGCGAGATCGACAGGCCCGCGCGGCGATGTCGATCCAGGCGGAGCAGGCGGCTGCGGGAAGTGGTCCTGATATGAGACACCATCATCATCACCATAACCACGCGCATCACTCCAGCATACAATTCACCGCGCAGGATGCTCTTTCGCTCTTCCGTGCCCCCGTTAgggTGAATCCTGATCCACAAATCCAGTCTAAGCTGGGTAACTATTCGCTGGTGAAGCATCTACTTGATAAGCCTAAGCGTCTGTTCGGCATCGAACAGAGTGGCATCCCGCAGAGTCCGGCGCCCTTGCCGACGCCTGCCGCCCACAAGTCCGGCACGGACAGCTCCGGCAGAAGCTGTTCCCCGTCCTCGGGGCCGGAGTTCAAGAAGCCTGGTGGACTTCGGGGCACGAGCGCCGCGTCTTCCTCGTCGAGTGCAAGTCATCAGCGCGGCGGCTTCGTCAAACCTGCCGACGGCAAACCGCCTTACGGTGGTCGAGGTGGTTATCCCGGTCAACCGGTTAAGCACGGCGGCAACGATCATCGCAGCCATGGGTTACTTCCGGCTAAGGGTCCACCGCTGCCTCAACCATCCTCCACGGGGGGAAGCAATAGTGCGGTGCCGATCAGCAGTTCCAGCGGAAGTGTTGTCGGTAACCCCGGCGGCAGTCTTTCGAGCCGCACTCAATTCGCCTGCCGACTGAAGCTGATTGAAGTTAACgGGTCTAACTCGCGAGCATCGATTGATACTCCTCCAGATGTAGAAAACATTTTGAAGGAAATGACCGTGCCACTCACACCACTGACGGCGATCGCGCAAACACCGCGGAAGGAGCAGGAGTCCAAGTTCACCTTCAACCCTCAACTGGCGAAGTTGACGGAAGTCGCCCCACCAGAGCCTGTAAAATCTCAACGCCAGCATACCGCCATCAAACCACCTGCGAATATCGCGGAGGATCTGATCCTGTCGGATGAAGAGAGCGAGGATGAGGAGAACAAGGAAACATCATCGAGACCGACGAGAGGAAACAGGAGTCCGGATCTCACGGTCGTTCTATCGGCACCATTAATGACATCGGCACCGCCGCCTTTGACACCTGTGTCGCCCATGATCATGTCACCCGTGGGCCCATTATCACCCTCGCGGCCGATCAGCCCGCCGAGATATCCATCGCCGCTACCAAAACGGGCGACACCGGAGCGAGTGCTGTCTCCTCCGACGGGTGTCAATCATCCCTTGCCATCCGCGTGTTCCCCGACGAATCCGGTCGTCGGCCAACCGTCGAGTCCAGCCGAGGCGCCGCATAGCTCCGGAAGCGCCAGCTCGAGCTCGGATTCCGGTTCAGATTCCGGCTCGGACAGCAGCGATGATTCCGAGGACGAAGATGATCTGACCTcggcacctccaccatctaaGGGGCCTACGACACCGCCCTCGGTTTCACCGAAACAGGACAATTTAGTGGAACCGCCGCCTGCTGAGGAACCCCGTCGTTGGGACCTTATTTCTTTCCTGCAGCAGAACGACAACCAGAATTCCGAATCGAAACCTGCTCAGGAAAACGCTAGGCGAGAGAATACTCTTGAAATAACAACGGAGACCAGATCACACAGGGAACAGTCCCATGATTGGCAGCTCGGTGAGGCCTTGAAGAGGTCTCATAATATGAATTCTCTCAGCGACAGCGATCATCATTCTGATCAGGAGAAAAATCAGCTGATTGAAGACAATCGCGCCCAGACAGAGAAACCGAAAGTGGCCGATACTAAGAAACGCGGACGACCTAGGAAATCCATCAAGAGTCCGAAACGCAGTCACCGGACGTCGGACGAGAATCCGAAGAACAGTAAGTCGCGCAGCCGAACGAGAACTGTAGCTCTTGGCAAGAAAAAGCCACCCAAATCGAAAGAAACGGTGACCTTAACTGACGACGATAATGATTCGAAATCGCAAAGTGATTCCGACAGTGATCGTCGACCTACCAAAGTGTCGGCCGTAGTACCGACAAGAAATGAAAAGAGATCGAGACTGAGTCTATCGTCTAGCGACGACGAGAGTTCGCCACCGAAcaggaaaaataataacagtgCCTCTGAGGACGACACCGCGCGATGGACAAGAGTTCCCCCCCTCAAGCGGAGCAACCTGTTGGACTCGCCGAAGAAGCAAGACCAGAAGAAAAGTTCCGCCAAAGGCAAACCTAGGCAGCCTAGATCTAGAGTGACCAATATTACCGGCGGTTCGGATTCTGACAGTGAATCAGAGGTGTCTGTAAGGAGTAATCGCATCAAAGTCGCTcgAGTGCCACCCAGACCTCGAGCACCACCAACGAGGACGACTTCGCCTGATAATTCTGATAGCGATAACAGCCCGGCGTCGAAATTGCAAGAGGATGACGCCGGCAACGTACAGGACAAGAAGAAAAGCGACACGCTGCGCCACGTCTTCTCGACGTCGAGAGGCATCGGGAAGACGGGTGGGAAAGGTGGGAAAGGTGGAAAAGGCGGTGGTAAATGCGGTATCTACGTAGAAGAGTATACGAGTAATTCTGCTACACACACACCGACGGGCGGGGACAGTCCGTACAAAAGACCGTCCTCGCGGACGTCCAGTGGTGGCAACAATCTTCTCCTACGCTCTCCTCCGGCGCTCACACATGTGAACGGCGTACCAAGTCTCATGTGCAAGATCGAAGTCAGCAGGATATCCTCGcagatattttcaaatctatcgAGGGGACAAGAGCTCAGACAACGCACAGAATTGCCTGACACTAGGCCATCTTCGAGACAAAGGCCGTCCTCCAGTTTGGCGATCTTGCAACCACCGAGGTCGATCACACCGGAAGAGGGTGAGATCATCGATACGCCGCCTCCGCAGCAGCAGGTCGTATCGGATCGTGCGAGAATTCATCGTTCCGACGGGCTGCTAAGCGAGAGTGACGGCAAGATTTCACGTTCTGTGATTAAGGCCCCGATATCGTCGGACTCGAAGAGTGGCGGTACTGTTCTCGGAGGTGCTGGTAGTGCTAATAGTGCCGGTACGCTTGGTAGCGCGCCTAAAAGGAAACGTAATCCGAGTTGTAGTTCTGTGTCTAGTTTGAGCCCTGTTCAGTGTTCGGTAGATGCGAAAACTAAAAGTACCTCCGAGCATAAAGACAGAAGCCGTAAGAGACAACGGAGGCATGCCAACGACGGACTAATGTCCAGTCAGcaGAGTGATATTCAACCGACTAATCATGAAAGGGACGAGAAAGCAGATACTAGTTTATTACCGCCACCTCCTCTCCCAGCTCAGCGCGTCTACTATTCTTACTTCGATCctcaaaatgaaatattagaaGATCAGGATAgGGACCATGACCAGTACCTGACCGAAGCTAAACGATTAAAACACAATGCCGATGAGGAGAGCGATCTTACGGCACAGGGCATGATGTATCTGGAGGCTGCtctgtattttcttttaacagGCGATGCAATGGAATCAGACTCAGTTACGGAAAAAGCTTCGTATACTATGTACAAAGATACTCTTAGTCTCATCAAATACATTTCGTCAAAATTCAAAAGCCAAACGAACAACTCACCTGAGAATAGCATACACACTAAGCTGGCCATCTTGAGCCTTTGGTGTCAGTCTCGTTTGTACTCCAAACTATATAACATGCGCAAACAGGAAATGAAAGAGGTCCAAAAGATCGTCAACGACTTCAATCAAAAGcAATCTCAGCAATCAGTAGCTCAGACAACACCTGCTCAGGCGGAAGGACAGGGCACGCCTTCTCTTTCGCCAACACCGTCGCCTGCCGGTTCTGTAGGTTCCGTCGGTAGTCAAAGTTCCTCTGGATATAGCAGCGGTGGACAACACCCGGCACCACCGGTCAATGGCCAACATATTAGCGTGCCATTGCAGGTCTTCAATGCGATGATCAAGCAAAATCAGTATTCAGGCTTTCTTATGAATGGCCACGACCTATGGGACCTGGCAATAAAGCAGGCGAGACAGGAAGAGAATAGAAGCTTTTTCATCGACTTGGATCGAAGATTGGGACCCTTGACATCGTATAGCTCGCTACGTGAGCTTGTGCGTTACGTTCAAGCGGGTATAAAGAAATTGCGAGCTCTCTGA
Protein Sequence: MPSHKPAQAMKKPPRVERDRLRERDRQARAAMSIQAEQAAAGSGPDMRHHHHHHNHAHHSSIQFTAQDALSLFRAPVRVNPDPQIQSKLGNYSLVKHLLDKPKRLFGIEQSGIPQSPAPLPTPAAHKSGTDSSGRSCSPSSGPEFKKPGGLRGTSAASSSSSASHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNDHRSHGLLPAKGPPLPQPSSTGGSNSAVPISSSSGSVVGNPGGSLSSRTQFACRLKLIEVNGSNSRASIDTPPDVENILKEMTVPLTPLTAIAQTPRKEQESKFTFNPQLAKLTEVAPPEPVKSQRQHTAIKPPANIAEDLILSDEESEDEENKETSSRPTRGNRSPDLTVVLSAPLMTSAPPPLTPVSPMIMSPVGPLSPSRPISPPRYPSPLPKRATPERVLSPPTGVNHPLPSACSPTNPVVGQPSSPAEAPHSSGSASSSSDSGSDSGSDSSDDSEDEDDLTSAPPPSKGPTTPPSVSPKQDNLVEPPPAEEPRRWDLISFLQQNDNQNSESKPAQENARRENTLEITTETRSHREQSHDWQLGEALKRSHNMNSLSDSDHHSDQEKNQLIEDNRAQTEKPKVADTKKRGRPRKSIKSPKRSHRTSDENPKNSKSRSRTRTVALGKKKPPKSKETVTLTDDDNDSKSQSDSDSDRRPTKVSAVVPTRNEKRSRLSLSSSDDESSPPNRKNNNSASEDDTARWTRVPPLKRSNLLDSPKKQDQKKSSAKGKPRQPRSRVTNITGGSDSDSESEVSVRSNRIKVARVPPRPRAPPTRTTSPDNSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSTSRGIGKTGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRTSSGGNNLLLRSPPALTHVNGVPSLMCKIEVSRISSQIFSNLSRGQELRQRTELPDTRPSSRQRPSSSLAILQPPRSITPEEGEIIDTPPPQQQVVSDRARIHRSDGLLSESDGKISRSVIKAPISSDSKSGGTVLGGAGSANSAGTLGSAPKRKRNPSCSSVSSLSPVQCSVDAKTKSTSEHKDRSRKRQRRHANDGLMSSQQSDIQPTNHERDEKADTSLLPPPPLPAQRVYYSYFDPQNEILEDQDRDHDQYLTEAKRLKHNADEESDLTAQGMMYLEAALYFLLTGDAMESDSVTEKASYTMYKDTLSLIKYISSKFKSQTNNSPENSIHTKLAILSLWCQSRLYSKLYNMRKQEMKEVQKIVNDFNQKQSQQSVAQTTPAQAEGQGTPSLSPTPSPAGSVGSVGSQSSSGYSSGGQHPAPPVNGQHISVPLQVFNAMIKQNQYSGFLMNGHDLWDLAIKQARQEENRSFFIDLDRRLGPLTSYSSLRELVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01406484;
90% Identity: iTF_00181953; iTF_01476910; iTF_00181295; iTF_01476163; iTF_00016028; iTF_01261822;
80% Identity: -