Basic Information

Insect: Acromyrmex heyeri
Gene Symbol: lilli_1
Assembly: GCA_017607565.1
Location: JAANIB010010267.1:1907036-2055535[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 3.4e-06 0.031 12.5 0.1 49 114 90 153 35 182 0.70

2 7 9.3e-11 8.5e-07 27.6 3.0 339 443 266 366 246 382 0.76

3 7 0.24 2.2e+03 -3.4 25.8 448 503 471 521 451 552 0.50

4 7 1 9.1e+03 -17.7 37.8 69 254 556 706 526 741 0.39

5 7 0.11 1e+03 -2.3 9.6 425 501 746 821 722 831 0.48

6 7 0.054 5e+02 -1.3 6.6 91 250 967 1128 940 1150 0.45

7 7 0.0068 62 1.7 4.3 127 222 1232 1334 1201 1368 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	3.4e-06	0.031	12.5	0.1	49	114	90	153	35	182	0.70
2	7	9.3e-11	8.5e-07	27.6	3.0	339	443	266	366	246	382	0.76
3	7	0.24	2.2e+03	-3.4	25.8	448	503	471	521	451	552	0.50
4	7	1	9.1e+03	-17.7	37.8	69	254	556	706	526	741	0.39
5	7	0.11	1e+03	-2.3	9.6	425	501	746	821	722	831	0.48
6	7	0.054	5e+02	-1.3	6.6	91	250	967	1128	940	1150	0.45
7	7	0.0068	62	1.7	4.3	127	222	1232	1334	1201	1368	0.47

Sequence Information

Coding Sequence: TTACCCATATCTTGTATGAATACATTTGGAACTAACCGGACGATAATTTTGGTTTTCAGCGTGGAACGGGACCGGCTTCGGGAGCGAGATCGACTGGCCCGCGCGGCGATGTCGGTCCAGGCGGAGCAGGCGGCTGCGGGAAGTGGTCCTGATATGAGACACCATCATCATCACCATAACCACGCGCATCATCACTCCAACATACATTTCTCCACGAATGATGCTCTTTCGCTCTTCCGTGCTCCTGTTAGggtGAATCCTGATCCACAAATCCAGTCTAAGCTGGGCAACTATTCGCTGGTGAAGCATCTACTCGATAAGCCTAAGCGCCTGTTCGGCATCGAACAGAGTGGCATCCCGCAGAGTCCGGCGCCCTCGCCGACGCCTTCCGCCCACAAGTCGGGCACGGACAGCTCCGGCAGAAGCTGTTCCCCATCCTCGGGGCCGGAGTTTAAGAAGCCTGGTGGACTTCGGGGCACGAGCGCCGCGTCTTCCTCGTCGAGTGCAAGTCACCAGCGGGGCGGCTTCGTCAAACCTGCCGACGGTAAACCGCCTTACGGTGGTCGGGGTGGTTATCCTGGCCAACCGGTTAAGCACGGCGGCAACGATCATCGCAGCCACGGGTTACTTCCGGCTAAGGGCCCGCCGCTGCCTCAACCATCCTCCACCGGGGGAAGTAACGGCACGATACCGATCGGCAATTCCAGCGGAAGTGTTGTCGGTAACCTCGGCGGCAGCCTCTCAAGCCGCACTCAATTTGCCTGCCGACTGAAGCTGATTGAAGTTAACgGGTCTAACTCGCGAGCATCAATTGATACTCCAGACGTAGAAAACATTTTGAAGGAGATGACCGTGCCACTTACACCACTGACGGCGATTGCGCAGACACCGCGAAAGGAACAGGAATCCAAGTTCACCTTCAACCCTCATCTGGCGAAGTTGACGGAAGTCGCCCCACCAGAGCCTGCAAAGTCTCAACGCCAGCATACCGCCATCAAACCACCTGCGAATATCGCGGAGGATCTGATTTTGTCGGATGAAGAGAGCGAGGATGAGGAGAACAAGGAAACATCATCGAGACCGACGAGAGGAAACAGGAGTCCGGATCTCACGGTCGTTGTCTCGATACCTTTATCGAAAATCACGATGTCCAATTTTGAGCATCGTTTGATCAAACATCCTTACAGTCTATCGACACCATTGATGACATCGGCGCCGCCGCCTTTGACACCTATGTCGCTCATGATCATGTCACCCGTGGGCCCATTGTCACCCCCGCGGCCGATCAGCCCGTCGAGATACTCGTCGCCGCCGCCGAAACGGACGACACCGGAGCGAGTGCTGTCTCCTCCAGCGGGTGTCAATCATCCCCTGCCATCCGCGTGTTCCCCGACGAATCCGGTTGTCGTCGGCCAACCGTCGAGTCCAGCCGAGGCGCCGCATAGCTCCGGAAGCGCCAGCTCGAGCTCGGATTCCGGTTCAGATTCCGGCTCGGATAGCAGCGATGATTCCGAGGACGAAGACGACCTGACCTCGGCACCGCCGCCATCCAAGGGACCTACGACACCGCCCTCGGTTTCACCGAAGCAGGACAATCTGGTGGAACCGCCGCCTGCTGAGGAACCTCGTCGTTGGGATCTCATTTCTTTTCTGCAGCAGAACGGCAACCAGAATGCCGAATCAAAACCTGCTCAGGATAATGCCAGGCGGGAAAATACGCATGAAATAACGACGGAGACTAGATCACACAGAGAACAGTCTCATGATTGGCAACTCGGCGAAACCTTGAAGAGGTCTCATAACATGAGTTCTCTCAGCGACAGTGATCATCATTCTGATAAGGAAAAGAATCAATTGGTTGAAGACAATCGCGCCCAGACGGAGAAGCCAAAAGTGGCCGATACTAAGAAACGCGGACGACCCAGGAAATCCATCAAGAGTCCGAAACGCAGTCACCGGACGTCGGACGAGAATCTAAAGAACAGCAAGTCCCGCAGCCGGACGAGAACGGTCGCCACTCCTGGCAAGAAAAAGCCACCCAAATCGAAGGAAACGGTGACCTCAAGTGACGACGACAATGACTCAAAATCGCAAAGTGATTCCGACAGTGATCGTCGACTTACCAAAGTGTCGGCCGTAGTACCAACAAGAAACGAAAAGAGATTGAGACTGAGTCTGTCGTCTAGCGATGACGAGAGTTTGCCATCgaataggaaaaataataatagtgcCTCCGAGGACGACACTGCGCGATGGACAAGAGTTCCCCCCATCAAGCGGAGCAACCTGTTGGACTCGCCAAAGAAGCAGGACCAGAAGAAAAGTTCCGCCAAAGGCAAGCCTAGGCAGCCCAGATCTAGAGTGACCAATGTAACCGGTGGTTCGGATTCCGATAGTGAATCAGAGGTGTCTGTAAGGAGTAATCGCATCAAAGTCGCTcgAGTGCCACCCAGACCTCGAGCACCACCAACGAGAACGACTTCGCCTGATAACTCTGATAGCGATAACAGCCCGGCGTCAAAATTGCAAGAGGATGACGCCGGCAACGTGCAGGACAAGAAGAAAAGCGACACGCTGCGCCACGTCTTCTCGACGTCGAGAGGCATCGGGAAGACGGGTGGTAAAGGTGGGAAAGGTGGAAAAGGCGGTGGTAAATGCGGTATCTACGTAGAGGAGTACACGAGTAATTCTGCTACGCACACACCGACGGGCGGGGACAGTCCGTACAAAAGACCGTCCTCGCGGACGTCCAGTGGTGGCAACAATCTTCTGCTGCGCTCCCCTCCAGCACTCACACATGTGAACGGCGTACCAAGTCTTATGTGCAAAATCGATCTCAGCAGGATATCTTTGCAAATTTTCTCGAATCTATCTAGAGGACAAGAGCTCAGACAACGCACGGAATTGCCTGATACTAGGCCATCTTCGAGACAAAGACCATCCTCCAGTTTGGCGACCTTGCAACCACCGAGGTCGTCCACGCCGGAGGAAGGTGAGATCATCGATACACCGCCTCCGCAACAGCAGGTCGTGTCGGATCGTGCGAGAATCCATCGTTCCGATGGACTGCTAGGCGAGAGTGACGGCAAGATTTCACGTTCTGTGATCAAGGCCCAACCGATATCGTCGGACTCGAAGAGCGGCGGTACTGTTCTTGGAGGTGCTGGTAGTGCTAATAGTGTCGGTACGCTTGGTAGCGCGCCTAAGAGGAAACGTAATCCGAGTTGTAGTTCCGTGTCTAGTTTGAGCCCTGTTCAGTGTTCGATAGATGCGAAAACTAAGAATATATCCGAGCATAAAGACCGCAAGAGACAACGGAGGCATGCCAACGACGGGCTAATGTCCAGTCAGCAAAGTGATATCCAACCGACGAATCACGAAAGGGACGAGAAACCAGATACTAGTTTATTACCGCCACCGCCTCTCCCAGCTCAGCGCGTCTACTATTCTTACTTCGATcctcaaaatgaaatattagaaGATCGGGATAggGACCATGACCAGTACCTGACCGAAGCTAAGCGACTAAAGCACAATGCCGATGAGGAGAACGATCTTACGGCACAAGGCATGATGTATCTAGAGGCTGCTCTGTATTTTCTTCTAACAGGCGATGCGATGGAATCAGACTCAGTTACAGAAAAAGCATCATATACTATGTACAAAGATACTCTTAGTCTCATCAAATACATCTCGTCGAAATTTAAGAGCCAACCGAACAACTCACCTGAGAATAGCATACACACTAAGCTGGCTATCTTGAGCCTTTGGTGTCAATCACGTTTGTATTCCAAACTATATAACATGCGCAAACAGGAAATGAAAGAGGTCCAGAAGATCGTCAATGACTTCAATCAAAAGcAAACTCAGCAATCAGCAGCAGCTCAGACAACACCAGCTCAGGCGGAAGGACAGGGCACGCCTTCTCTTTCGCCAACACCATCGCCTGCTGGTTCTGTAGGTTCCGTCGGTAGTCAAAGTTCCTCCGGATATAGCAGCACCACCAGCCATATTAGCGTGCCATTGCAAGTCTTCAATGCGATGATAAAGCAAAATCAGTGTTCAGGCTTACTTATGAATGGCCACGACCTATGGGACCAGGCAATAAAGCAGGCGAGACAGGAAGAAAATAGAAGCTTTTTCATCGACTTGGATCGAAGATTGGGACCCTTGACATCGTATAGCTCGCTACGTGAGCTTGTGCGTTACGTTCAAGCGGGTATAAAGAAATTGCGAGCTCTC
Protein Sequence: LPISCMNTFGTNRTIILVFSVERDRLRERDRLARAAMSVQAEQAAAGSGPDMRHHHHHHNHAHHHSNIHFSTNDALSLFRAPVRVNPDPQIQSKLGNYSLVKHLLDKPKRLFGIEQSGIPQSPAPSPTPSAHKSGTDSSGRSCSPSSGPEFKKPGGLRGTSAASSSSSASHQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNDHRSHGLLPAKGPPLPQPSSTGGSNGTIPIGNSSGSVVGNLGGSLSSRTQFACRLKLIEVNGSNSRASIDTPDVENILKEMTVPLTPLTAIAQTPRKEQESKFTFNPHLAKLTEVAPPEPAKSQRQHTAIKPPANIAEDLILSDEESEDEENKETSSRPTRGNRSPDLTVVVSIPLSKITMSNFEHRLIKHPYSLSTPLMTSAPPPLTPMSLMIMSPVGPLSPPRPISPSRYSSPPPKRTTPERVLSPPAGVNHPLPSACSPTNPVVVGQPSSPAEAPHSSGSASSSSDSGSDSGSDSSDDSEDEDDLTSAPPPSKGPTTPPSVSPKQDNLVEPPPAEEPRRWDLISFLQQNGNQNAESKPAQDNARRENTHEITTETRSHREQSHDWQLGETLKRSHNMSSLSDSDHHSDKEKNQLVEDNRAQTEKPKVADTKKRGRPRKSIKSPKRSHRTSDENLKNSKSRSRTRTVATPGKKKPPKSKETVTSSDDDNDSKSQSDSDSDRRLTKVSAVVPTRNEKRLRLSLSSSDDESLPSNRKNNNSASEDDTARWTRVPPIKRSNLLDSPKKQDQKKSSAKGKPRQPRSRVTNVTGGSDSDSESEVSVRSNRIKVARVPPRPRAPPTRTTSPDNSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSTSRGIGKTGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRTSSGGNNLLLRSPPALTHVNGVPSLMCKIDLSRISLQIFSNLSRGQELRQRTELPDTRPSSRQRPSSSLATLQPPRSSTPEEGEIIDTPPPQQQVVSDRARIHRSDGLLGESDGKISRSVIKAQPISSDSKSGGTVLGGAGSANSVGTLGSAPKRKRNPSCSSVSSLSPVQCSIDAKTKNISEHKDRKRQRRHANDGLMSSQQSDIQPTNHERDEKPDTSLLPPPPLPAQRVYYSYFDPQNEILEDRDRDHDQYLTEAKRLKHNADEENDLTAQGMMYLEAALYFLLTGDAMESDSVTEKASYTMYKDTLSLIKYISSKFKSQPNNSPENSIHTKLAILSLWCQSRLYSKLYNMRKQEMKEVQKIVNDFNQKQTQQSAAAQTTPAQAEGQGTPSLSPTPSPAGSVGSVGSQSSSGYSSTTSHISVPLQVFNAMIKQNQCSGLLMNGHDLWDQAIKQARQEENRSFFIDLDRRLGPLTSYSSLRELVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01406484;
90% Identity: iTF_00417549;
80% Identity: -