Basic Information

Insect: Odontomachus brunneus
Gene Symbol: lilli_1
Assembly: GCA_010583005.1
Location: NW:2135068-2428333[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.79 9e+03 -5.2 1.8 4 22 23 41 22 45 0.78

2 9 1.3e-07 0.0015 17.2 1.9 25 152 67 188 61 256 0.65

3 9 3.2e-10 3.6e-06 25.9 3.8 340 441 271 368 246 385 0.73

4 9 0.032 3.7e+02 -0.6 23.0 433 510 443 517 435 541 0.55

5 9 1 1.1e+04 -9.1 29.2 86 256 541 709 511 720 0.49

6 9 0.1 1.2e+03 -2.2 8.6 424 482 694 750 688 757 0.54

7 9 1 1.1e+04 -7.6 17.7 419 476 728 808 725 832 0.55

8 9 0.046 5.2e+02 -1.1 5.2 148 198 1077 1120 1046 1183 0.43

9 9 0.00021 2.4 6.6 11.5 101 219 1267 1377 1252 1406 0.57

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.79	9e+03	-5.2	1.8	4	22	23	41	22	45	0.78
2	9	1.3e-07	0.0015	17.2	1.9	25	152	67	188	61	256	0.65
3	9	3.2e-10	3.6e-06	25.9	3.8	340	441	271	368	246	385	0.73
4	9	0.032	3.7e+02	-0.6	23.0	433	510	443	517	435	541	0.55
5	9	1	1.1e+04	-9.1	29.2	86	256	541	709	511	720	0.49
6	9	0.1	1.2e+03	-2.2	8.6	424	482	694	750	688	757	0.54
7	9	1	1.1e+04	-7.6	17.7	419	476	728	808	725	832	0.55
8	9	0.046	5.2e+02	-1.1	5.2	148	198	1077	1120	1046	1183	0.43
9	9	0.00021	2.4	6.6	11.5	101	219	1267	1377	1252	1406	0.57

Sequence Information

Coding Sequence: ATGCCTTCGCCCGGCGGATATTATGACGATAGGAATCCTCTGCTCAAGGGCACCTTATCGAGCGTGGACCGGGACCGGCTCCGGGAGCGAGAACGACAGGCCCGCGCGGCAATGTCGGTCCAGGCCGAGCAGGCGGGTGCGGGAGGTGGTCCTGATCCCAGACACCATCACCACGGCCACCATAACCACGTGCACAGCAACCTGCACGCGTCTAACTCATCGCTCTTCCGTGCTCCCGTCAGGGTGAACTCTGATAATCAGGATCGCACCACGCATGAGATCCAATTGAAGCTGGGCAACTACTCGCTGGTGAGGCACCTGCTGGACGATCCGAAGCGCCTCATCGGCATAGATGGTATCCCGCCGAGCCCAGCGCCCGTATCCTCGTCCTCTCCTAATCCTTCCGTATACAAGAGCGGCTCCACCTCCAGGAGTTCACCGGCTCCGCAGGAGTTCAAGAAGCCCAGTGGACTCAGAGCGAGCACCTCGTCTTCCACCTCTGGCGCCAGCATCTCCGGCGCCAGCACCTCCGGCAACAGCGCCTCTGGCGCCAGCACCTCCGGCCACCAACGAGGCAGTTTCGTCAAACCTGCCGACGGTAAGCCGCCCCACGTCTCCAGGGGCGGCTACCTTGGTCACGCGGTCAAGCACGCCGGCAACAGCGGCAATGATCATCGCAACCACGGCTTGCCTCCAACCAAGGGCCCACCACCTCCGCACATCTCGTCGGTGACCGTCAACAGCCGCATTCACACGTACGGCGAACGACTGCCCAGGTTACCTCTCGATAACGCGTCAAATTCGCGCTACGAGCCAGTGGGGAATTCGACGGCGGACgtggaaaatatattaaagGAGATGACAGTGCCACTCATGCCTTTGACAGCGATCGCGCAAACACCACGGAAGGAGCTCGATTCCAAGTTCACCTTCAACACCCATCTGCCGAAGTTGCCGGAGTACATGCTGGAGCTGTCCAAACCACAACGAGAGAGGCACGCCACCAGCAGACCCTCCGCTGATCTCGAGAAGGATCTGAGCTTGTCCGAGGACAGCGAGGATGAGGAGAACAAGGAAATATCGACGAGAACGCCGAGAGAAAACAGGAGCCCAGACCTTTCGGTCAAACTGGCACCGCCGGTAATGCTGGCGATGACaccggcgccgccgccgcctgtGGCGCCTATGTCGCCCATGGGAATATCACCCATGCGTATGTCACCGGCACAACTCAGCCCACACCGGTACCTGTCATCCCCGAAGCAAgtagcggcgacgacgacgattccgGAAGTAACGTTGTCCCCTCCAGCGGCTGACACTCTGCCGCCCAAATGCTCGCCACCGGCAAACCTGGCGAACCATCACCAGAGACCACCCAGTCCACCCGGTCAGGCGCCGCCGAGTTCCGGAAGCGCCAGCTCGAGCTCGGACTCCGGCTCGGATTCCGGCTCGGACAGCAGCGACGATTCCGAGGATGACGACGACAGGTCGGCGACACAGCCGGCCAAGGGACCGTCGACGCCACCGTCGGTGTCACCGAAGCTGGATAATCTCGTGGAGGAACCACCGCCTGCCGTGGAGGAGTCAAAGCGTCGCTGGGATCTCAGTTCCTTCTTCAACAAGAACCCTGCTTCGGTGCAGCATGGAGAACAGAATCCTGAGACTAAACCCGCCCAGgacaacgccaggcgaGAAGGTACTCCCGAGGCGACGAAGGAGACCAGACCGCATAGAGAACAACCCCACGACTGGAAACTAGACGAGGCCTTAAAGAGAACTCACAACGCGACGATGATAAGCCTTCTGAGCGATAGCGACCATCAGTCCGATCAGGGCAAGAGTCAGCTGGCCGAGGGCAATCGATCGCAGACAGAGAATGCGACGAAGGTCACCGATAACAAAAAACGCGGCCGGCCCAGAAAATCCATCAAGAGCCCGAAGCGCAACGAGCGCGCGTCAGATGAGAGCCTGAAGAGCAGCAAACCATCGCGCAGCAGGACGAGAGTtgtcaacaacaacaacaactcCGTTAAGAAAAAGCAACCCAAGTCGAAGGCGACGTTACACACGAGCGACGATGAAAGTGACAGTGACACGAGATCCCAGGGTGTGTCCAGCGGTTCCATCAGTGATCATCAGAACAACGTGCCGGTCGTGGGAGCAGCAAAGAGAAGCAGACTGAGCTTGTCGTCCAGCGAAGATGACACATCAAACCGAAAGAACAACAATAGTGCCTCCGAGAACGAGTCCGCGCGATGGAGAGGAGTCGCCGTCAAAAGGAACAAGCTGACGGATTCCCCGAAGAAGCAAGACAAGAGAAAGAGTTCGACCAAGGCCAAACCGAATAGAAGACCAAGGTCCAGAATGAACAACGGTGACTCGGATACTGAGAGCGAGTCCGAGATGTCCACAAGGAGTAATCGCAAACAGGTGGCTCGAGTCCCACCCAGACCTCGAGCGCCTCTCACCAGGGCGACGTCATTGGACAACCTGTCAGACAGTGACAACAGCCATGCTCCCAAGCTACAAGAGGAGGACGCTGGTAACGTACAGGACAAAAAGAAGAGTGACACGCTGCGTAAGCTCTTCTCATCGTCGAAAGGTGGCGGTAAAGGTGGCGGTAAGGGTGGAAAAGGTGGTAAAGGTGGTGGCAAATGCGGTATCTACGTGGAGGAATACACCAGCTCGGTGAACACACCGACCGGCGGGGACAGCCCGTACAAGAGGCCGTCGTCGCGTACATCATCCGGCAGCGTCGTACATTCGTTCCCGCCGCTTACCTACGGCGTGAACGGCGTACCACGACTGATATGCAAAATCGATCTCAACAAACTACCGCAGAATTGCGTGTCGCAATTATCGAGGGGTCAGGAACTCAGGCAGCGTACCGAATTGCCCAATACCAGGCCGTCTTCGAGGCAGGCTTCCAACTTGGCGACGCAACCGAGACCACCCACACCGGAGGAGGGTGAGATCGTCGACACGTCGTCACCCCAGCAGGTTATTCACCACACCGATGGGCTGCTGGGTGACGGTGATGTCAGGACTCGTACTGTGATCACGACCGAGCTGATATCGTCGGACTCAAAGAGCGGCGGTGCTTTGCTCGGTGGTGCTGGTGGTGCTAGTGGTGCCAGTATTGGTGGTAACGCGCTCAAAAGAAAACATATTCCGAGTTGTGGTTCTATAACTTTAAGTACTGTGTGTGCGGACACGAAAGCGAAAAGCTCGTCTGAGCGTgacaggaaaaagagaaaaagagagcatcCTGAAAAGGACGGTCAACCATCCAGATCTTCATCAAGTCAGCAGAGTGATATTCAGCCGACGAATCACGAAAGGGACGAAAAACAAAATATGAGTTTGTTGCCACCACCGGCGCCGTTGCAGCGCGTCTACTATTCTTATTTCAATACACAGAATGATGTCTTGGAGGACCAGGAGAGtatGCACGATTCGTGTCTCAGGGACCAGAACCAGTACCTGACCGAAGCTAAACGACTAAAGCATAGCGCCGACACAGAGTGCGAGCTTACGGCCCAGGGCATGTTGTACCTGGAGGCTGTTCTATACTTTCTGCTGACTGGCCACGCTATGGAGTCGGACCCTGTCACAGAAAGAGCGTCCTTCACCATGTACAAGGATACTCTTAGTCTCATCAAATACATCTCGTCGAAATTTAAAAGCCAACCGAATGACACTACTGAGAACAGTATACACAACAAGTTGGCCATCCTGAGTCTCTGGTGCCAGTCCCTCATATACTTGAAACTCTTCAAGATGCGCAAACAAGACATGAAGGAGTACCAAAAGATAATCAACGAGTACCAACAGAAGCCGCCATCGGCTCAGACGCCGCAGGGACAACAAGAAGGACAGGCGACCCCTTCCTTGTCGCCCACACCATCGCCTGCCAGTTCAGTAGGGTCTGTCGGCAGTCAAAGTTCTGGATACAGCAGCGGCGAACTGGCCAATCGAGGCGCGCAACAGAACCAACAGAATCAGCAGAATCAGCAGAATCAGCAGAACCAGCAGAATCAGAATCAGAACCAAAACCAGAATCAACCAGCAGTCCCATTTGTCAGCGTGCCACTGTCCGTTCATAACGCGATGGCGAAGCAGAGTCATCACTTCAGTTTCCTGATGAACTGTCATGACCTGTGGGACCAGGCAAACGCTATGGTTACAGATAATCATAGAGATTTCTTTATTGAGCTGGACGAGAAGCTGGGACCTCTAACGTTGAAAAGTTCGCTGCGCGATCTTGTGCGTTACGTTCAAGCCGGTATAAAGAAGTTACGAGCTCTCTGA
Protein Sequence: MPSPGGYYDDRNPLLKGTLSSVDRDRLRERERQARAAMSVQAEQAGAGGGPDPRHHHHGHHNHVHSNLHASNSSLFRAPVRVNSDNQDRTTHEIQLKLGNYSLVRHLLDDPKRLIGIDGIPPSPAPVSSSSPNPSVYKSGSTSRSSPAPQEFKKPSGLRASTSSSTSGASISGASTSGNSASGASTSGHQRGSFVKPADGKPPHVSRGGYLGHAVKHAGNSGNDHRNHGLPPTKGPPPPHISSVTVNSRIHTYGERLPRLPLDNASNSRYEPVGNSTADVENILKEMTVPLMPLTAIAQTPRKELDSKFTFNTHLPKLPEYMLELSKPQRERHATSRPSADLEKDLSLSEDSEDEENKEISTRTPRENRSPDLSVKLAPPVMLAMTPAPPPPVAPMSPMGISPMRMSPAQLSPHRYLSSPKQVAATTTIPEVTLSPPAADTLPPKCSPPANLANHHQRPPSPPGQAPPSSGSASSSSDSGSDSGSDSSDDSEDDDDRSATQPAKGPSTPPSVSPKLDNLVEEPPPAVEESKRRWDLSSFFNKNPASVQHGEQNPETKPAQDNARREGTPEATKETRPHREQPHDWKLDEALKRTHNATMISLLSDSDHQSDQGKSQLAEGNRSQTENATKVTDNKKRGRPRKSIKSPKRNERASDESLKSSKPSRSRTRVVNNNNNSVKKKQPKSKATLHTSDDESDSDTRSQGVSSGSISDHQNNVPVVGAAKRSRLSLSSSEDDTSNRKNNNSASENESARWRGVAVKRNKLTDSPKKQDKRKSSTKAKPNRRPRSRMNNGDSDTESESEMSTRSNRKQVARVPPRPRAPLTRATSLDNLSDSDNSHAPKLQEEDAGNVQDKKKSDTLRKLFSSSKGGGKGGGKGGKGGKGGGKCGIYVEEYTSSVNTPTGGDSPYKRPSSRTSSGSVVHSFPPLTYGVNGVPRLICKIDLNKLPQNCVSQLSRGQELRQRTELPNTRPSSRQASNLATQPRPPTPEEGEIVDTSSPQQVIHHTDGLLGDGDVRTRTVITTELISSDSKSGGALLGGAGGASGASIGGNALKRKHIPSCGSITLSTVCADTKAKSSSERDRKKRKREHPEKDGQPSRSSSSQQSDIQPTNHERDEKQNMSLLPPPAPLQRVYYSYFNTQNDVLEDQESMHDSCLRDQNQYLTEAKRLKHSADTECELTAQGMLYLEAVLYFLLTGHAMESDPVTERASFTMYKDTLSLIKYISSKFKSQPNDTTENSIHNKLAILSLWCQSLIYLKLFKMRKQDMKEYQKIINEYQQKPPSAQTPQGQQEGQATPSLSPTPSPASSVGSVGSQSSGYSSGELANRGAQQNQQNQQNQQNQQNQQNQNQNQNQNQPAVPFVSVPLSVHNAMAKQSHHFSFLMNCHDLWDQANAMVTDNHRDFFIELDEKLGPLTLKSSLRDLVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00452568;
90% Identity: -
80% Identity: -