Basic Information

Insect: Pogonomyrmex barbatus
Gene Symbol: lilli_1
Assembly: GCA_000187915.1
Location: NW:133762-296042[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 0.0026 28 3.1 9.9 49 137 79 167 15 231 0.71

2 8 5.9e-11 6.3e-07 28.3 2.5 345 443 277 371 261 396 0.76

3 8 0.83 8.9e+03 -5.2 29.2 442 504 470 527 449 558 0.54

4 8 1 1.1e+04 -9.0 18.4 99 183 569 648 530 678 0.31

5 8 0.0061 65 1.8 12.9 425 480 667 722 662 727 0.68

6 8 0.0086 91 1.3 8.6 422 502 759 839 725 848 0.65

7 8 0.016 1.8e+02 0.4 4.0 133 254 1093 1148 978 1172 0.58

8 8 0.016 1.7e+02 0.5 3.4 169 219 1313 1363 1235 1403 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	0.0026	28	3.1	9.9	49	137	79	167	15	231	0.71
2	8	5.9e-11	6.3e-07	28.3	2.5	345	443	277	371	261	396	0.76
3	8	0.83	8.9e+03	-5.2	29.2	442	504	470	527	449	558	0.54
4	8	1	1.1e+04	-9.0	18.4	99	183	569	648	530	678	0.31
5	8	0.0061	65	1.8	12.9	425	480	667	722	662	727	0.68
6	8	0.0086	91	1.3	8.6	422	502	759	839	725	848	0.65
7	8	0.016	1.8e+02	0.4	4.0	133	254	1093	1148	978	1172	0.58
8	8	0.016	1.7e+02	0.5	3.4	169	219	1313	1363	1235	1403	0.47

Sequence Information

Coding Sequence: ATGCCGAGCCACAAGCCAGCGCAAGCCATGAAGAAGCCGCCACGTGTGGACCGGGAACGGCTTCGGGAGCGAGAGCGACAGGCCCGCGCGGCGATGTCGGTCCAGGCGGAGCAGGCGACTGCGGGAGGCGGTCCTGATACGAGACACCATCATCACCACAACCATACGCATCATCATCCCATGGTCAGCGCGCCGAACCTCTTCCGTGCCCCAGTCAGGgtGAATCCTGATCCAGAAATCCAGTCTAAACTGGGCAACTATTTGTTGGTGAAGCACCTGCTCGACGACTCTAAGCGCCTAATTGGCATCGATGGAATTCCGCCGAGTCCAGCTCCTCCCACCCCGACAAGTCCGCCCTCCACCCACAAGAGTGGTAGCTCTAGTGGTAGTAGCTCCAGCAAGAGGGATTGTTCCCCGTCTTCGGGGCAGGAGTTTAAGAAACCCGGTGGTTTCCGTAGCACGAGTAGCTCGAGCGCGTCTTCCTCTTCGAGCGCGAACCACCAGCAGCGGGGTGGTTTTGTCAAGCCCGCCGACGGAAAGCCGCCCTACGGTGGACGGGGCGGCTATTCCGGCCCGTCTATCAAGCACGGCGGCGGCAGCAATGATCATCGCAGTCATGGTTTACTTCCGGCCAAGGgcccgccgccgtcgtcgtcgtcccaGCCGCACCCACCCTCTCCTGTAGGGAGCAGCGGCACCCTGCCCATTGGCAATTCTAGCGGAAGTGTCGGCAATCCCGGTACCAGTAGTGGCCTCGCGAGCCGCACTCAATTCGCCGGCCGATTGAAGCTGATCGAAGTTAACggATCTAGTTCTCGACCGACGATCGACACTCCGGATGTAGAGAACATTCTGAAGGAGATGACCGTGCCACTCACACCATTGACGGCGATCGCACAGACACCGCGGAAAGAGCACGAGTCCAAGTTCACCTTCAACCCCCATCTGGCTAAGTTGACGGAAGTCACGGCGCCAGAGCCTGCGAAGCCTCAACGCCAGCATGCCCCCAACAGACTGTCTGCCGATCTCGCCCGGGATCTAAGTCTGTCGGACAGCGAGGATGAAGAGAATAAGGAAACATCGTCGAGACCGACGAGAGGAAACAGGACTCCGGATCTCACGGTCGTTGTTTCCATACCTTTATCGCAAATCACGATGTCCAATTCTGAGCATCGCTTGATCTCGCGTCCTTACAGTTTATCGACGCCGTTGACGTCAGCGCCGCCGCCTTTGACAGCCATGTCGCCCATAGTCATGTCACCCGTGGGGTCATGTCCGCTGTCACCCCCACGGACGATATCTGTCAGCCCGCCTAGATACTCGTCGCCTCCGCCGAAGCGGACGACTCCGGAGCGAGTGCTGTCTCCTCCACCTGTTGTCGATCATCCCTTGCAAACCACGTGCTCCCCTATGAATCCGGTCATGGGCCAATCGTCGAGTCCAGCCGAGGCGCCGCAGAGCTCCGGAAGTGCTAGCTCGAGCTCGGATTCTGGCTCGGATTCCGGCTCGGATAGCAGCGACGACtccgaggacgaggacgaccCGACGTCGGCGCCACCGCCGTCCAAAGGGCCAACGACGCCACCCTCGGTTTCACCGAAGCAGGACAATCTGGTCGAGGAACCGCCGCCCGCCGTGGAAGAGCGTCGCTGGGATCTTAGCTCTTTCTTCAATAAAACAGCGGTGCCGCATGGAGAACAAAACTCCGAATCAAAGCCGGCTCAGGATAATGCCAGACGAGAAAACACGCTTGAGACAACGACGGAGACTAGCAGATCGCACAGGGAGCAGTCTCGCGATTGGCAGCTCGATGAGGCCTTGAAGAGGACTCACATGAGTTCTCTCAGCGACAGCGATCACCATTCCGACCAGGACAAAGTTCGTCAGCTGGTCGAGGATAATCGCTCTCAAAGCGAGAAACCGAAGGCAGCCGATACCAGAAAACGCGGGCGACCCAGGAAATCTATCAAGAGCCCGAAACGTGGCCATCGGACGGACGAGAATCTGAAGAAGCAGCACACCACGCAGTCACGCAGGCCATGCAGCCGGACGAGAACGGTTGGTACTCCCAACAAGAAAAGCAACAAGCAACCTAAATCGAAGGAAACGGTGACTACGAGTGACGACGACAGCGATTCGAGATCGCAGAGTGACTCTGACAGCGATCGTCGGCCTACCAAGGTTGTGGTGCCGACAAGAAACGAAAAGAGACCGAGACTGAGTTTGTCGTCCAGCGACGATGAAAGTTCGCCAccgaataagaaaaataataacagtgCCTCCGAAGACGATGCCGCGCGGTGGACAAGAGTGCCTCCCATTAAACGGAACAACCTGTTGGACTCGCCGAAGAAGCAAGATCAGAAAAAGAATTCTGCCAAGGGTAAGCCCAGGCAGTCGAGGAGAGTGACCAACGTTACCGGTGGCTCGGACTCTGATAGCGAATCCGAGGAGGTATCTGTGAGGACCAGCAATTGCATCAAAGTTGCTcgggTACCCCCCAGACCTCGAGCACCACCAACGAGGACAACCTCGCCTGATAACTCCGATAGCGATAATAGTCCGGCGTCGAAGCTACAAGAGGACGACGCCGGCAACGtgcaagataaaaagaaaagcgaCACGCTGCGCCACGTCTTCTCGACGTCAAAAGGCGGCGGGAAGGGTGGTGGGAAAGGTGGGAAAGGTGGGAAAGGCGGTGGTAAATGCGGCATCTACGTGGAAGAGTATACTAGTAATTCTGCTACGCACACGCCGACCGGCGGGGACAGTCCTTACAAAAGACCATCCTCGCGGACGTCGAGTGGTGGTAACAATATTCTTTTACGCTCGCCTCCGGCACTCACTCATGTCAATGGTGTGCCAAGTCTCCTATGCAAGATCGATCTTGGCAGAATATCTTCgcaaatattgcaattatcaAGAGGGCAAGAGCTCAGACAACGCACGGAATTACCTGATACCAGGCCGTCTTCGAGGCAAAGGCCATCCTCCAGTTTGGCGACCTCGCAACCGGCGAGACTTTCCACACCGGAGGAAGGTGAGATCGTCGACACGCCGCCATCGCAACAGATCGTGTCGGATCGCGCGAGGATCCACCCGCGAGGTTCGGACGGACTGCTGGGCGATGGTGATGTCGGCAGAAGTTCACGTTCCGTGATCAAGGGCCAGCCGATATCATCGGACTCGAAGAGCGGCGGTACAGCTCTCGGAGGTGCTGGTAGTGCTAGTGGTACCGGTGCGATCGGTAGCGGTAGCGCGCCCAAGAGAAAACGTAATCCGAGTTGTAGTTCCGTGTCCAGTTTGAGTCCTGTTCAGTGTTCAGTGGACGCGAAAACCAAGAGTTCTTCTGAACATAAAGATAGAAGTCAACGCAAGAGACAACGGAGACATGGCGCGAATGACGGGCTGATGTCCAGTCAGAGTGATATTCATCCGACGAATCACGAAAGGGACGAGAAACAAGATACGAGTTTATTACCGCCACCCCCTCTCCCAGCACAGCGCGTCTACTATTCTTACTTTGATcctcaaaatgaaatattggaGGATCAGGATAGCGTACCCTTATATTTGTGTCTCAGGGACCACGATCAGTACCTGACTGAAGCTAAACGACTAAAGCACAATGCCGATGAGGAAAATGATCTTACGGCACAAGGTATGATGTATCTGGAGGCCGCTCTGTACTTCCTCCTAACTGGCGACGCGATGGAATCAGACCCACTTACGGAAAAAGCCTCGTATACTATGTACAAAGATACCCTCAGTCTTATCAAATACATCTCGTCAAAATTCAAGAGCCAATCCAACAATTCACCCGAGAATAGTATACACACTAAACTCGCCATCCTGAGTCTTTGGTGCCAGTCACGTTTGTATTCCAAGCTCTACAACATGCGAAAACAGGAAGTGAAAGAGGTTCAAAAAATCATCAGCGATTTTAATCAAAAGcaaGCAGCTCAACAATCAGCAGCAGCTCAGACAACGCCCGCTCAGACTGAGGGACAGGGTACACCTTCTCTTTCGCCTACTCCGTCGCCTGCCGGTTCCGTAGGTTCTGTCGGTAGTCAAAGTTCTTCTGGATATAGTAGCGGTGGACAACACCCGACAACGGGTGTCGTCAACGGCCAATATATCAGCGTACCGATGCATGTCTACAACGCAATGTTGAAGCAGAATCAGTATTCAGGTTTACTTACTAACGGACACGACCTGTGGGATCAGGCATTAAAGCAAGCGAAGCAGGAAGAGAACAGAAACTTTTTCATCGACTTGGACCGAAGATTGGGACCCCTGACATCATACAGCTCGTTACGCGAGCTCGTACGTTACGTTCAAGCGGGTATAAAGAAATTGCGAGCTCTCTGA
Protein Sequence: MPSHKPAQAMKKPPRVDRERLRERERQARAAMSVQAEQATAGGGPDTRHHHHHNHTHHHPMVSAPNLFRAPVRVNPDPEIQSKLGNYLLVKHLLDDSKRLIGIDGIPPSPAPPTPTSPPSTHKSGSSSGSSSSKRDCSPSSGQEFKKPGGFRSTSSSSASSSSSANHQQRGGFVKPADGKPPYGGRGGYSGPSIKHGGGSNDHRSHGLLPAKGPPPSSSSQPHPPSPVGSSGTLPIGNSSGSVGNPGTSSGLASRTQFAGRLKLIEVNGSSSRPTIDTPDVENILKEMTVPLTPLTAIAQTPRKEHESKFTFNPHLAKLTEVTAPEPAKPQRQHAPNRLSADLARDLSLSDSEDEENKETSSRPTRGNRTPDLTVVVSIPLSQITMSNSEHRLISRPYSLSTPLTSAPPPLTAMSPIVMSPVGSCPLSPPRTISVSPPRYSSPPPKRTTPERVLSPPPVVDHPLQTTCSPMNPVMGQSSSPAEAPQSSGSASSSSDSGSDSGSDSSDDSEDEDDPTSAPPPSKGPTTPPSVSPKQDNLVEEPPPAVEERRWDLSSFFNKTAVPHGEQNSESKPAQDNARRENTLETTTETSRSHREQSRDWQLDEALKRTHMSSLSDSDHHSDQDKVRQLVEDNRSQSEKPKAADTRKRGRPRKSIKSPKRGHRTDENLKKQHTTQSRRPCSRTRTVGTPNKKSNKQPKSKETVTTSDDDSDSRSQSDSDSDRRPTKVVVPTRNEKRPRLSLSSSDDESSPPNKKNNNSASEDDAARWTRVPPIKRNNLLDSPKKQDQKKNSAKGKPRQSRRVTNVTGGSDSDSESEEVSVRTSNCIKVARVPPRPRAPPTRTTSPDNSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSTSKGGGKGGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRTSSGGNNILLRSPPALTHVNGVPSLLCKIDLGRISSQILQLSRGQELRQRTELPDTRPSSRQRPSSSLATSQPARLSTPEEGEIVDTPPSQQIVSDRARIHPRGSDGLLGDGDVGRSSRSVIKGQPISSDSKSGGTALGGAGSASGTGAIGSGSAPKRKRNPSCSSVSSLSPVQCSVDAKTKSSSEHKDRSQRKRQRRHGANDGLMSSQSDIHPTNHERDEKQDTSLLPPPPLPAQRVYYSYFDPQNEILEDQDSVPLYLCLRDHDQYLTEAKRLKHNADEENDLTAQGMMYLEAALYFLLTGDAMESDPLTEKASYTMYKDTLSLIKYISSKFKSQSNNSPENSIHTKLAILSLWCQSRLYSKLYNMRKQEVKEVQKIISDFNQKQAAQQSAAAQTTPAQTEGQGTPSLSPTPSPAGSVGSVGSQSSSGYSSGGQHPTTGVVNGQYISVPMHVYNAMLKQNQYSGLLTNGHDLWDQALKQAKQEENRNFFIDLDRRLGPLTSYSSLRELVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01406484;
90% Identity: -
80% Identity: -