Basic Information

Insect: Trachymyrmex cornetzi
Gene Symbol: lilli_1
Assembly: GCA_001594075.1
Location: NW:32524-305853[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 5.3e-06 0.064 11.9 0.1 49 114 91 154 78 183 0.64

2 8 1.2e-10 1.4e-06 27.2 3.0 339 443 267 367 248 383 0.77

3 8 0.067 8e+02 -1.6 24.1 447 503 449 499 429 530 0.52

4 8 1 1.2e+04 -12.2 25.2 126 250 507 628 488 645 0.39

5 8 0.68 8.2e+03 -4.9 15.3 437 480 639 682 622 698 0.50

6 8 1 1.2e+04 -5.9 13.4 423 488 722 787 685 810 0.44

7 8 0.057 6.8e+02 -1.4 10.3 74 257 926 1106 917 1128 0.47

8 8 0.0024 28 3.2 12.3 126 250 1210 1337 1179 1362 0.55

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	5.3e-06	0.064	11.9	0.1	49	114	91	154	78	183	0.64
2	8	1.2e-10	1.4e-06	27.2	3.0	339	443	267	367	248	383	0.77
3	8	0.067	8e+02	-1.6	24.1	447	503	449	499	429	530	0.52
4	8	1	1.2e+04	-12.2	25.2	126	250	507	628	488	645	0.39
5	8	0.68	8.2e+03	-4.9	15.3	437	480	639	682	622	698	0.50
6	8	1	1.2e+04	-5.9	13.4	423	488	722	787	685	810	0.44
7	8	0.057	6.8e+02	-1.4	10.3	74	257	926	1106	917	1128	0.47
8	8	0.0024	28	3.2	12.3	126	250	1210	1337	1179	1362	0.55

Sequence Information

Coding Sequence: ATGCCTTCGTCCGGTGGATATTATGACGACAGGAATCCTCTGCTCAAGGGCACCTTATCGAGCGTGGAACGGGACCGGCTTCGGGAGCGAGATCGACTGGCCCGCGCGGCGATGTCGGTCCAGGCGGAGCAGGCGGCTGCGGGAAGTGGTCCTGATATGAgacatcatcatcatcaccatAACCACGCGCATCATCACTCCAACATACATCTGTCCACGCATGACGCTCTTTCGCTCTTCCGTGCCCCCGTTAGTgTGAATCCGGATCCACAAATCCAGTCTAAGCTGGGCAACTATTCGCTGGTGAAGCATCTACTCGATAAGCCTAAGCGCCTGTTCGGCATCGAACAGAGTGGCATCCCGCAGAGTCCGGCGCCCTCGCCGACGCCCTCCGCCCACAAGTCGGGCACGGACAGCTCCGGCAGAAGCTGTTCCCCGTCCTCGGGGCCGGAGTTCAAGAAGCCTGGTGGACTTCGGGGCACGAGCGCCGCGTCTTCCTCGTCGAGTGCAAGTCACCAGCGGGGCGGCTTCGTCAAACCTGCCGACGGCAAACCGCCTTACGGTGGTCGGGGCGGTTATCCTGGCCAACCGGTTAAACATGGCGGCAACGATCATCGTAGCCACGGGTTACTTCCGGCTAAGGGCCCGCCGCTGCCTCAACCATCCTCCACCGGGGGAAGCAACGGCACGGTGCCGACCGGCAATTCCAGCGGAAGTGTTGCCGGTAACCCCGGTGGCAGCCTCTCAAGCCGCACTCAATTCGCCTGCCGACTGAAGTTGATTGAAGTTAACGGGTCTAACTCGCGAGCATCGATTGATACTCCAGACGTAGAAAACATTCTGAAGGAGATGACTGTGCCACTCACACCACTGACGGCGATCGCACAGACACCGCGAAAGGAGCAGGAGTCCAAGTTCACCTTCAACCCTCATCTGGCGAAGttGACGGAAGTCGCCCCGCCAGAGCCTGCAAAGTCTCAACGCCCGCATACCGCCATCAAACCACCTGCGAATATCGCGGAGGATCTGATCTTGTCGGATGAAGAGAGCGAGGATGAGGAGAACAAGGAAACATCATCGAGACCGACGAGAGGAAACAGGAGTCCGGATCTCACGGTCGTTCTATCGACACCATTGATGACATCGGCACCGCCGCCCTTGACACCTATGTCGCCCATGATCATGTCACCCGTGGGCCCATTGTCACCCTCGCGGCCGATCAGCCCGCCGAGATACCCGTCGCCGCCACCGAAACGGGCGACACCGGAGCGAGTGCTGTCTCCTCCAGCGGGTGTCAATCATCCCCTGCCATCCGCGTGTTCCCCAACGAATCCGGTTGTCGTCGGCCAACCGTCGAGCCCAGTCGAGGCGCCGCATAGCTCCGGAAGCGCCAGCTCGAGCTCGGATTCTGGTTCAGATTCCGGCTCGGACAGCAGCGATGATTCCGAGGACGAAGACGACCTGACCTCGGCACCGCCGCCATCCAAGGGGCCTACGACACCGCCCTCAGTTTCACCGAAGCAGGACAATCTGGTGGAACCGCCGCCTGCTGAGGAACCTCGTCGTTGGGACCTCATTTCTTTTCTGCAGCAGAACGGCAATCAGAACGCCGAATCGAAACCTGCTCAGGATAATGCCAGGCGGGAGAATACGCATGAAATAACGACGGAAACCAGATCACATAGGGAACAGTCTCATGATTGGCAGCTCGGCGAGGCCTTGAAGAGGTCTCATAACATGAGTTCTCTCAGCGACAGCGATCATCATTCTGATCAGGAAAAGAATCAATTGGTTGAAGACAATCGCGCCCAGACGGAGAAGCCAAAAGTGACCGATACCAAGAAACGCGGACGACCCAGGAAATCCATCAAGAGTCCGAAACGCAGTCACCGGACGTCGGACGAGAATCTGAAGAATAGCAAGTCCCGCAGCCGGACGAGAACGGTCGCCACTCCTGGCAAGAAAAAGCCACCCAAATCGAAGGAAACGGTGACCTCAAGTGACGACGACAATGACTCGAAATCACAAAGTGATTCCGAAAGTGATCGCCGACCTACCAAAGTGTCGGCCGTAGTACCAACCAGAAACGAAAAGAGATCGAGACTGAGTCTGTCGTCTAGCGACGACGAGAGTTCGCCACCGAAcaggaaaaataataatagtgcCTCCGAGGACGACACCGCGAGATGGACAAGAGTTCCCCCCATCAAGCGGAGCAACTTGTTGGACTCGCCGAAGAAGCAGGATCAGAAGAAAAGTTCCGCCAAAGGCAAACCTAGGCAGCCCAGATCTAGAGTGACCAATATAACCGGCGGTTCGGATTCCGATAGTGAATCAGAGGTGTCTGTAAGGAGTAATCGCATCAAAGTCGCTcgAGTGCCACCCAGACCTCGAGCACCACCAACGAGGACGATCTCGCCTGATAACTCTGATAGCGATAACAGCCCGGCGTCAAAATTGCAAGAGGATGACGCCGGCAACGTGCAGGATAAGAAGAAAAGCGACACGCTGCGCCACGTCTTCTCGACGTCGAGAGGCATCGGGAAGACGGGTGGTAAAGGTGGGAAAGGTGGAAAAGGCGGTGGTAAATGCGGTATCTACGTAGAGGAGTACACGAGTAATTCTGCTACGCACACACCGACGGGCGGGGACAGTCCGTACAAAAGACCGTCCTCGCGGACGTCCAGTGGTGGCAACAATCCTCTCCTGCGCTCCCCTCCAGCGCTCACACATGTGAACGGCGTACCAAGTCTTATGTGCAAGATCGATCTCAGCAGGATATCCTCGCAAATTTTCTCGAATCTATCGAGAGGACAAGAGCTCAGACAACGCACGGAATTGCCTGACACTAGGCCATCTTCGAGACAAAGACCGTCCTCTAGTTTGGCGACCTTGCAACCACCGAGGTCGTCCACGCCGGAGGAAGGTGAGATCATCGATACGCCGCCTCCGCAACAGCAGATTGTGTCAGATCGTGCGAGAATCCATCGTTCCGACGGACTGCTAAGCGAGAATGACGGCAAGATTTCACGTTCTGTGATCAAGGCCCAACCGATATCATCGGATTCGAAGAGCGGCGGTACTGTTCTCGGAGGTGCTGGTAGTGCTAATAGTGCCGGTACGCTTGGTAGCGCGCCTAAGAGGAAACGCAATCCGAGTTGTAGTTCCGTGTCTAGTTTGAGCCCTGTTCAGTGTTCGGTAGATGCGAAAACTAAGAATACATCCGAGCATAAAGACAGAAGCCGCAAAAGACAACGGAGGCATGCCAACGACGGGCTAATGTCCAGTCAGAGTGATATCCAACCGACGAATCACGAAAGGGACGAGAAACCAGATACTAGTTTATTACCGCCACCGCCTCTCCCAGCTCAGCGCGTCTACTATTCTTACTTCGATCctcaaaatgaaatattagaagATCAGGATAGGGACCATGACCAGTACCTGACCGAAGCTAAGCGACTAAAGCACAATGCCGATGAGGAGAGCGATCTTACGGCACAAGGCATGATGTATCTGGAGGCCGCTCTGTATTTTCTTCTAACAGGCGACGCGATGGAATCAGACTCAGTTACAGAAAAAGCCTCGTATACTATGTACAAAGATACTCTTAGTCTCATTAAATACATTTCGTCGAAATTTAAGAGCCAATCGAACAACTCACCTGAGAATAGCATACACACTAAGCTGGCTATCTTAAGCCTTTGGTGTCAATCACGTTTGTACTCCAAACTATATAACATGCGCAAACAGGAAATGAAAGAGGTCCAGAAGATCGTCAATGACTTCAATCAAAAGCAATCTCAGCAATCAGCAGCTCAGACAACACCTGCTCAGGCGGAAGGACAGGGCACGCCTTCTCTTTCACCAACACCATCGCCCGCTAGTTCTGTAGGTTCCGTCGGTAGTCAAAGTTCCTCCGGATATAGCAGCGGTGGACAACACCCGgcacaacaacaacaacaacaacaaccacCGGCACAACAACCACCGGTACAACAACCACCGGTACAACAACCACCGGTACAACAACCACCGGTACAACAACCACCGGTCAATGGCCATATTAGCGTGCCATTGCAAGTCTTCAATGCGATGATAAAGCAAAATCAGTGTTCAGGCTTACTTATGAATGGCCACGACCTATGGGACCAGGCAATAAAACAGGCGAGACAGGAAGAGAATAGAAGCTTTTTCATCGACTTGGATCGAAGATTGGGACCCTTGACATCGTATAGTTCGCTACGTGAGCTTGTGCGTTACGTTCAAGCGGGTATAAAGAAATTGCGAGCTCTCTGA
Protein Sequence: MPSSGGYYDDRNPLLKGTLSSVERDRLRERDRLARAAMSVQAEQAAAGSGPDMRHHHHHHNHAHHHSNIHLSTHDALSLFRAPVSVNPDPQIQSKLGNYSLVKHLLDKPKRLFGIEQSGIPQSPAPSPTPSAHKSGTDSSGRSCSPSSGPEFKKPGGLRGTSAASSSSSASHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNDHRSHGLLPAKGPPLPQPSSTGGSNGTVPTGNSSGSVAGNPGGSLSSRTQFACRLKLIEVNGSNSRASIDTPDVENILKEMTVPLTPLTAIAQTPRKEQESKFTFNPHLAKLTEVAPPEPAKSQRPHTAIKPPANIAEDLILSDEESEDEENKETSSRPTRGNRSPDLTVVLSTPLMTSAPPPLTPMSPMIMSPVGPLSPSRPISPPRYPSPPPKRATPERVLSPPAGVNHPLPSACSPTNPVVVGQPSSPVEAPHSSGSASSSSDSGSDSGSDSSDDSEDEDDLTSAPPPSKGPTTPPSVSPKQDNLVEPPPAEEPRRWDLISFLQQNGNQNAESKPAQDNARRENTHEITTETRSHREQSHDWQLGEALKRSHNMSSLSDSDHHSDQEKNQLVEDNRAQTEKPKVTDTKKRGRPRKSIKSPKRSHRTSDENLKNSKSRSRTRTVATPGKKKPPKSKETVTSSDDDNDSKSQSDSESDRRPTKVSAVVPTRNEKRSRLSLSSSDDESSPPNRKNNNSASEDDTARWTRVPPIKRSNLLDSPKKQDQKKSSAKGKPRQPRSRVTNITGGSDSDSESEVSVRSNRIKVARVPPRPRAPPTRTISPDNSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSTSRGIGKTGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRTSSGGNNPLLRSPPALTHVNGVPSLMCKIDLSRISSQIFSNLSRGQELRQRTELPDTRPSSRQRPSSSLATLQPPRSSTPEEGEIIDTPPPQQQIVSDRARIHRSDGLLSENDGKISRSVIKAQPISSDSKSGGTVLGGAGSANSAGTLGSAPKRKRNPSCSSVSSLSPVQCSVDAKTKNTSEHKDRSRKRQRRHANDGLMSSQSDIQPTNHERDEKPDTSLLPPPPLPAQRVYYSYFDPQNEILEDQDRDHDQYLTEAKRLKHNADEESDLTAQGMMYLEAALYFLLTGDAMESDSVTEKASYTMYKDTLSLIKYISSKFKSQSNNSPENSIHTKLAILSLWCQSRLYSKLYNMRKQEMKEVQKIVNDFNQKQSQQSAAQTTPAQAEGQGTPSLSPTPSPASSVGSVGSQSSSGYSSGGQHPAQQQQQQQPPAQQPPVQQPPVQQPPVQQPPVQQPPVNGHISVPLQVFNAMIKQNQCSGLLMNGHDLWDQAIKQARQEENRSFFIDLDRRLGPLTSYSSLRELVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01406484;
90% Identity: iTF_00417549;
80% Identity: -