Basic Information

Insect: Trachymyrmex septentrionalis
Gene Symbol: lilli_1
Assembly: GCA_001594115.1
Location: NW:2378632-2653655[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 4.4e-06 0.047 12.2 0.1 49 115 91 155 73 182 0.64

2 7 8.3e-11 8.7e-07 27.8 3.1 329 440 262 369 252 389 0.75

3 7 0.28 3e+03 -3.7 25.6 449 503 458 507 437 538 0.51

4 7 1 1.1e+04 -18.9 39.0 69 255 542 693 512 731 0.37

5 7 0.26 2.7e+03 -3.5 11.1 424 487 731 794 700 814 0.43

6 7 0.12 1.3e+03 -2.4 7.7 107 264 967 1122 928 1168 0.47

7 7 0.0081 86 1.4 14.1 126 245 1219 1341 1189 1375 0.44

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	4.4e-06	0.047	12.2	0.1	49	115	91	155	73	182	0.64
2	7	8.3e-11	8.7e-07	27.8	3.1	329	440	262	369	252	389	0.75
3	7	0.28	3e+03	-3.7	25.6	449	503	458	507	437	538	0.51
4	7	1	1.1e+04	-18.9	39.0	69	255	542	693	512	731	0.37
5	7	0.26	2.7e+03	-3.5	11.1	424	487	731	794	700	814	0.43
6	7	0.12	1.3e+03	-2.4	7.7	107	264	967	1122	928	1168	0.47
7	7	0.0081	86	1.4	14.1	126	245	1219	1341	1189	1375	0.44

Sequence Information

Coding Sequence: ATGCCTTCGTCCGGTGGATATTATGACGACAGGAATCCTCTGCTCAAGGGCACCTTATCGAGCGTGGAACGGGACCGGCTTCGGGAGCGAGAACGACTGGCCCGCGTGGCGATGTCGGTCCATGCGGAGCAGGCGACTGCGGGAAGTGGTCCTGATATGAGACACCATCATCATCACCATAACCACGCGCATCATCACTCCAACATACATCTCTCCACGCATGATGCTCTTTCGCTCTTCCGTGCCCCCGTTAGGgtGAATCCTGATCCACAAATCCAGTCTAAGCTGGGCAACTATTCGCTGGTGAAGCATCTACTCGATAAGCCTAAGCGCCTGTTCGGCATCGAGCAGAGTGGCATCCCGCAGAGTCCGGCGCCATCGCCGACGCCCTCCGCCCACAAGTCGGGCACGGACAGCTCCGGCAGAAGCTGTTCCCCGTCCTCGGGGCCGGAGTTCAAGAAGCCTGGTGGACTTCGGGGCACGAGCGTCGCGTCTTCCTCGTCGAGTGCGAGTCACCAGCGGGGCGGCTTCGTCAAACCCGCTGATGGCAAACCGCCTTACGGTGGTCGGGGTGGTTATCCCGGCCAACCGGTTAAGCACGGCGGCAACGATCATCGCAGCCACGGATTACTTCCGGCTAAGGGCCCGCCGCTGCCTCAACCATCCTCCACGGGGGGGAGCAACGGCACGGTGCCGATCGGCAATATCAGCGGAAGCGTTACCAGCGTTACCAGCGTTGCCGGTAACCCCGGCGGCAGTCTTTCAAGCCGCACTCAATTTGCCTGCCGGCTGAAGCTGATTGAAGTTAACGGCTCTGTGCGAACACCGATTGATACTCCAGACgtagaaaacattttaaagGAGATGACCGTACCACTCACACCACTGACGGCGATCGCGCAGACACCGCGAAAGGAGCAGGAGTCCAAGTTCACCTTCAACCCTCATCTGGCGAAGtTGACGGAAGTCGCCCCACCAGAGCCTGCAAAGTCTCAACGCCAGCATACCGCCATCAAACCACCTGCGAATATCGCGGAGGATCTGATTTTGTCGGATGAAGAGAGCGAGGATGAGGAGAACAAGGAAACATCGTCGAGATCGACGAGAGGAAACAGGAGTCCGGATCTCACAGTCGTTCTATCGACACCATTGACCATGATGACTTCGGCGCCGCCGCCTTTGACACCTATGTCGCCCATGATCATGTCACCCGTGGGCCCATTGTCACCCTCGCGACCGATCAGCCCGTCGAGATacccgtcgccgccgccgaaACGGATGACACCGGAGCGAATGCTGTCTCCTCCAGCGGGTGTCAATCATCCTCTGCCATCCGCATGTTCCCCGACGATGAATCCGGTTGTCGTCGGCCAACCGTCGAGTCCAGCCGAGGCGCCGCATAGCTCTGGAAGCGCCAGCTCGAGCTCGGATTCCGGTTCAGATTCCGGCTCGGACAGCAGCGATGATTCCGAGGACGAAGACGACCTGACCTCGGCACCGCCGCCATCCAAGGGGCCTACAACACCGCCCTCGGTTTCACCGAAGCAGGACAATCTGGTGGAACCGCCGCCTGCGGAGGAACCTCGTCGTTGGGACCTAATTTCTTTTCTGCAGCAGAACGGCAATCAGAATGCCGAATCGAAACCTGCTCAGGATAATGCCAGGCGGGAGAATACGCATGAAATAACGACGGAGACCAGATCACACAGGGAACAGTCTCATGATTGGCAGCTCGGCGAGACCTTGAAGAGGTCTCATAACATGAGTTCTCTCAGCGATAGCGATCATCATTCTGATCAGGAAAAGAATCAATTGGTTGAAGATAATCGTGCTCAGACGGAGAAGCCAAAAGTGGCCGATACTAAGAAACGCGGACGACCCAGGAAATCCATCAAGAGTCCGAAACGCAGTCACCGAACGTCGGACGATAAACTGAAGAACAACAAGTCCCGCAGCCGGACGAGAACGGTTGCCACTCCTGGCAAGAAAAAGCTACCCAAATCGAAGGAAACGGTGACCTCAAGTGACGACGACAATGACTCGAAATCGCAAAGTGATTCCGACAGTGATCGTCGACTTACCAAAGTGTCGGCCGTGGTACCAACAAGAAACGAAAAGAGATCGAGACTGAGTGTGTCGTCTAGCGACGACGAGAGTTTGCCACcgaacaagaaaaataataatagtgcCTCCGAGGACGACACCGCGCGATGGACAAGAGTTCCCCCCATCAAGCGGAGCAACCTGTTGGACTCGCCGAAGAAGCAGGATCAGAAGAAAAGTTCTGCCAAAGGCAAGCCTAGGCAGCCCAGATCTAGAGTGACCAATGTAACCGGCGGTTCGGATTCCGATAGTGAATCAGAGATGTCTGTAAGGAGTAATCGCATCAAAGTCGCTcgAGTGCCACCCAGACCTCGAGCACCACCAACGAGGACGACCTCGCCTGATAACTCTGATAGCGATAACAGCCCGGCGTCAAAATTGCAAGAGGATGACGCCGGCAACGTGCAGGACAAGAAGAAAAGCGACACGCTGCGCCACGTCTTCTCGACGTCGAGAGGCATCGGGAAGACGGGTGGTAAAGGTGGGAAAGGTGGTAAAGGCGGTGGTAAATGCGGTATCTACGTAGAGGAGTACACGAGTAATTCTGCTACGCACACACCGACGGGCGGGGACAGTCCGTACAAAAGACCGTCCTCGCGGATGTCTAGTGGTGGCAACAATCCTCTCCTGCGCTCCCCTCCAGCGCTCACACATGTGAACGGCGTACCAAGTCTTATGTGCAAAATCGATCTCAGCAGGATATCTTTGCATCTTTTTTCGAATCTATCGAGAGGACAAGAGCTCAGACAACGCACGGAATTGCCTGACACTAGGCCATCTTCGAGACAAAGACCATCCTCCAGTTTAGCGACTTTGCAACCACCGAGGTCGTCTACACCAGAGGAGGGTGAGATCATCGATACGCCGCCTCCGCAACAGCAGGTCGTGTTGGATCGTGCGAGAATCCATCGTTCCGACGGATTGCTAGGCGAGAGTGATGGCAAGATTTCACGTTCTGCAATCAAGACCCAACCGATATCGTCGGACTCGAAGAGCGGCGGTACTGTTCTTGGAGGTGCTGGTAGTGCTAATAGTGTCGGTACGCTTGGTAGCGCGCCTAAGAGGAAACGTAATCCGAGTTGTAGTTCCGTGTCTAGTTTGAGCCCCGTTCAGTGTTCGGTAGATGCGAAAGTTAAGAATACATCCGAACATAAAGACAGAAGCCGCAAAAGACAACGGAGGCATGCCAACGACGGGCTAATGTCCAGTCAGcAGAGTGATATCCAACCGACGAATCACGAAAGGGACGAGAAACCAGATACTAGTTTATTACCGCCACCGCCTCTCCCAGCTCAGCGCGTCTACTATTCTTACTTCGATCctcaaaatgaaatattagaaGATCAGGATagGGACCATGACCAGTACCTGACCGAAGCTAAGCGACTAAAGCACAATGCCGATGTGGAGAACGATCTTACGGCACAAGGCATGATGTATCTAGAGGCTGCTCTGTATTTTCTTCTAACAGGCGACGCGATGGAATCAGACTCAGTTACAGAAAAAGCATCGTATACTATGTACAAAGATACTCTTAGTCTCATCAAATACATCTCGTCGAAATTTAAGAGCCAACCGAACAATTCACCTGAGAATAGCATACACACTAAACTGGCTATCTTGAGCCTTTGGTGTCAATCACGTTTGTACTCCAAACTATATAACATGCGCAAACAGGAAATGAAAGAGGTTCAGAAGATCGTCAATGACTTCAATCAAAAGcATTCTCAGCAATCAGCAGCTCAAACAACACCTGCTCAGGCGGAAGGACAGGGCACGCCTTCTCTTTCGCCAACACCATCGCCTGCTGGTTCTGTAGGTTCCGTCGGTAGTCAAAGTTCCTCTGGATATAGCAGCAGTggacaacaacaacaacaacaacaacaacaacaatcaTCGGCACAACAACCACCGGTACAACAACCACCGGTACAACAACCACCGGTACAACAACCACCGGTCAATGGCCATATTAGCGTGCCATTGCAAGTCTTCAATGCGATGATAAAGCAAAATCAGTGTTCAGGCTTACTTATGAATGGCCACGACCTATGGGACCAGGCAATAAAGCAGGCGAGACAGGAAGAGAATAGAAGCTTTTTCATCGACTTGGATCGAAGATTGGGACCCTTGACATCGTATAGCTCGCTACGTGAGCTTGTGCGTTACGTTCAAGCGGGTATAAAGAAATTGCGAGCTCTCTGA
Protein Sequence: MPSSGGYYDDRNPLLKGTLSSVERDRLRERERLARVAMSVHAEQATAGSGPDMRHHHHHHNHAHHHSNIHLSTHDALSLFRAPVRVNPDPQIQSKLGNYSLVKHLLDKPKRLFGIEQSGIPQSPAPSPTPSAHKSGTDSSGRSCSPSSGPEFKKPGGLRGTSVASSSSSASHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNDHRSHGLLPAKGPPLPQPSSTGGSNGTVPIGNISGSVTSVTSVAGNPGGSLSSRTQFACRLKLIEVNGSVRTPIDTPDVENILKEMTVPLTPLTAIAQTPRKEQESKFTFNPHLAKLTEVAPPEPAKSQRQHTAIKPPANIAEDLILSDEESEDEENKETSSRSTRGNRSPDLTVVLSTPLTMMTSAPPPLTPMSPMIMSPVGPLSPSRPISPSRYPSPPPKRMTPERMLSPPAGVNHPLPSACSPTMNPVVVGQPSSPAEAPHSSGSASSSSDSGSDSGSDSSDDSEDEDDLTSAPPPSKGPTTPPSVSPKQDNLVEPPPAEEPRRWDLISFLQQNGNQNAESKPAQDNARRENTHEITTETRSHREQSHDWQLGETLKRSHNMSSLSDSDHHSDQEKNQLVEDNRAQTEKPKVADTKKRGRPRKSIKSPKRSHRTSDDKLKNNKSRSRTRTVATPGKKKLPKSKETVTSSDDDNDSKSQSDSDSDRRLTKVSAVVPTRNEKRSRLSVSSSDDESLPPNKKNNNSASEDDTARWTRVPPIKRSNLLDSPKKQDQKKSSAKGKPRQPRSRVTNVTGGSDSDSESEMSVRSNRIKVARVPPRPRAPPTRTTSPDNSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSTSRGIGKTGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRMSSGGNNPLLRSPPALTHVNGVPSLMCKIDLSRISLHLFSNLSRGQELRQRTELPDTRPSSRQRPSSSLATLQPPRSSTPEEGEIIDTPPPQQQVVLDRARIHRSDGLLGESDGKISRSAIKTQPISSDSKSGGTVLGGAGSANSVGTLGSAPKRKRNPSCSSVSSLSPVQCSVDAKVKNTSEHKDRSRKRQRRHANDGLMSSQQSDIQPTNHERDEKPDTSLLPPPPLPAQRVYYSYFDPQNEILEDQDRDHDQYLTEAKRLKHNADVENDLTAQGMMYLEAALYFLLTGDAMESDSVTEKASYTMYKDTLSLIKYISSKFKSQPNNSPENSIHTKLAILSLWCQSRLYSKLYNMRKQEMKEVQKIVNDFNQKHSQQSAAQTTPAQAEGQGTPSLSPTPSPAGSVGSVGSQSSSGYSSSGQQQQQQQQQQSSAQQPPVQQPPVQQPPVQQPPVNGHISVPLQVFNAMIKQNQCSGLLMNGHDLWDQAIKQARQEENRSFFIDLDRRLGPLTSYSSLRELVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01406484;
90% Identity: iTF_00417549;
80% Identity: -