Basic Information

Insect: Diachasma alloeum
Gene Symbol: lilli_1
Assembly: GCA_001412515.3
Location: NW:288797-396187[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.11 1.3e+03 -2.3 0.2 4 25 23 44 21 50 0.81

2 9 4.3e-08 0.0005 18.8 0.1 24 127 68 168 59 180 0.66

3 9 9.8e-11 1.2e-06 27.5 2.5 344 445 266 362 252 377 0.68

4 9 0.0082 96 1.4 26.6 431 513 432 517 420 518 0.72

5 9 1 1.2e+04 -9.0 16.1 413 502 514 606 500 611 0.58

6 9 1 1.2e+04 -7.1 13.8 428 499 622 689 615 695 0.64

7 9 0.015 1.8e+02 0.5 12.3 422 506 710 791 693 797 0.55

8 9 0.0058 68 1.9 7.6 89 207 963 1079 898 1130 0.44

9 9 0.083 9.8e+02 -1.9 0.9 131 220 1172 1262 1141 1299 0.54

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.11	1.3e+03	-2.3	0.2	4	25	23	44	21	50	0.81
2	9	4.3e-08	0.0005	18.8	0.1	24	127	68	168	59	180	0.66
3	9	9.8e-11	1.2e-06	27.5	2.5	344	445	266	362	252	377	0.68
4	9	0.0082	96	1.4	26.6	431	513	432	517	420	518	0.72
5	9	1	1.2e+04	-9.0	16.1	413	502	514	606	500	611	0.58
6	9	1	1.2e+04	-7.1	13.8	428	499	622	689	615	695	0.64
7	9	0.015	1.8e+02	0.5	12.3	422	506	710	791	693	797	0.55
8	9	0.0058	68	1.9	7.6	89	207	963	1079	898	1130	0.44
9	9	0.083	9.8e+02	-1.9	0.9	131	220	1172	1262	1141	1299	0.54

Sequence Information

Coding Sequence: ATGCCGTCCTCCGGTGGTTATTATGATGATAGGAACCCGCTCCTCAAGGGCACATTATCGAGCGTGGACCGGGACCGGCTTCGAGAGCGTGAGCGTCAGGCACGCGCGGCGATGTCGGTCCAGGCAGAGCAGGCGGCGGCGGGCGGTGGTCCGGACTCCCGCCACGGCCACCACAACCACGGCCACCATCATCATCACGCCAATTCCCACGCATCCTCTGCCTCCTCGCTCTTCCGTGCCCCCGTCAAGGTTAATCCTGACGCGCAAGATCGTGCCACCCAGCAGATCCAGTCAAAATTGGGCAATTACTCGCGCGTGAAGCACCTACTGGTCGAGCCTCAGATGCTCTTCGGTGTTGTTGATGTACCACCGAGTCCAGCGCCAGCATCAGGTGCACCACCGCGATTACAAAGTAGAAATAATTGTCCAAATTCACCGTCAACCCAGGAATTCAAGAAACCCGGTTGCAATGGTCCACGGGGTGCATCATCAACCAGTCACACATCACAAAGAGGTGGTTTTGTTAAACCAGCTGATGGTAAGCCACCCTATGGTGGACGCGGTGGTTATCCAGGCCAACCAGTTAAACATGGTGGTAATAGCAATGATCACAGAAGCCACGGTATTATACCAGCAAAGGGACCACCACTTGGGACTGGTGGCAATTCAGCCGGAAACAGCTCTGGCCCTGCCTCTTCCGGTAACTGTCCTCCTTTGACTGGTAACACGAGAATTCACGCTGCTGGATCCAGGCCTGCCAAGCTGCCCATTGATAATGGAATGAGACACGATCTCAATGATAGTGCCGACCTCGAGAATATTCTCAAGGAAATGACGATGCCGCCCACACCTCTGACGGCAATCGCACAGACTCCCAGGAAAGAAACCGAGTCTAAGTTTACATTTAATCCGGTTCTTGCTAAGctGACTGAAGTGCCACCAACGGACTCTTCCAAACCACCACAACGCGAGAGACATGGGAGCAGATTGTCTTCTGATCTGGCACGTGATTTAAGCCTCTCCGAGGACAGCGACGACGATGGTCTCAAGCAGGGTACGACATCAAGGTCACAAAGGCCCAGATCTCCCGTGCCAAGTATCGACTTGTCATCAGCACTCCTCCCCCCAATGATGCCAGCGCCTCTTCCCCTGGCGCCAGTGGAGACATCCTCAATGGAGATGTCTCCACTGGGTCCCCTGTTGCTCCCTCGTCCCCTATCGCCGCCAAGAGCGACTCCCCCAAAACAATTATCACCGGAGCGTGTGCTGTCACCACTAGCCTCATCCCCTCGAAAGCACTCTCAGAGTCCTGGTGTCCAGTTGCGACCCCCAAGTCCACCTGGCCACGCACCCCAGAGCTCTGGATCAGCCTCGTCGAGTTCTGACTCGGGTTCAGACTCCGGATCAGACAGTAGTGATGATTCTGAAGACGAGAGTGCACCGGTGCCAGCTAAAGGTCCTAGTACACCTCCACCAGCATCGCCAAGGGCACCACTGGAGGAGCCACCAGCTGAGGAATCCAAGCCCCGTTGGAACCTGAGCAGCTTCCTTGACCAGAAGGCAGTGCAATCCGACCAGAATTCCGAGAACAAATCCTCCCAGGACGCGCCGGGACGGGACAGTTCACCGGAGGAAGTGCCAAAGGACTCGAGGACAAGTAGATCAGATGGCGATGACGACTGGCAGGAGAACGAGGCGATAAAGAGAACAAGAAGTTCAACCCTAGCAGCCTTGAGCGACAGCGATCACACCTCCGATACAGACAAGAAGAAGATCGAAGAGCCCAGAGTGCTGATACCGGAGAAACCGAAACCCCCAGATGTGCGTAAACGTGGACGACCGAGAAAATCGGTCAAAGAGTCTGTCAAGAGTCCAAAGAGCCACAGAACGATTACCGAGGAGACTAAACCGAGCTCAAAGCGCAACAGGCAGCGGAGTGTCAGTAGTCCCAAGAAGAAGCCACCAGTGACCAAAGCCACTGTCGAAAGCAGCGAGGACGAAGCCAGTGATGTCAGATCAAGTGACTCCGAATGCGACCAGAGGATTCCTCCACCAGCCGCACTCCCGGAGAAGCGTAAATCCCGACTGAGTTTATCATCAAGTGAAGATGAGAGACCAACAAAGCACAGTGCCTCTGAGGACGAATCCGACTGGAGAAGACTTCCCACAAAGCGTTCAAAATTGATGGACTCACCAAAGAAacaggagaagaagaagagtcCAACGAAGGGGAAGCCTCGACGTCCCCGATCTCGTGTGACAAACACCTCAGGTTGTGCGAGTGATTCGGACAGTGAATCTGAAACAGCTCATCGAAACAATAGGCAAATAGCGAGGGTACCACCGCGTCCACGAGTCCCCCCAACACGTGCAACATCGCTTGATAATTCTGACAGTGACAACAGCTCAGCGCCAAAACTCCAGGAGGAGGACGGTGGTAATGTACAAGACAAGAAGAAGAGTGACACATTGAGAAAGCTCTTTTCAACGGCCAAGGGTGGTGCAAAGGGCGGTGGTAAGGGTGGTAAAGGTGGCAAGGGTGGTGGTAAATGTGGTATTTACGTTGAAGAGTACACAGGCTCAGCAAACACACCAACGGGCAGTGAAAGCCCGTACAAAAGGCCTTCATCGCAGGCTTCCACATTACCAAGTTTTCCATCCCTGACGTATGCCAATGGTATACCAAGTTTAATATGTAAAATCGATTTAAATAGAATTCCCCACATACCCCAATCGTCGAGGGGACAGGAGCTCAGAGAGAGAACTGAGTTGCCTGACACAAGGCCACCATCACGACAATCTAATGTTAAAACAGAGCGTCCACCAACACCTGAAGAGGGCGAAATTGTTGATACAGTGTCACCAACGGACTACAGAACTCACGGTGATAACAATGAGATTGATGATAAAGTTAAACGTACAATTAAAAGTGATAATGATAGTAAAAATAGAGCGGGTCCCAGTGGTAGTGGTACAAGTGGTGCTAGTGGATTGAACGGTAATGCACCTAAACGAAAACGTAATCCAAGTTGTAGTTCTGTTTCGAGTGTTAGTGTTTGTTCGGTTGAGTCTAAAGTTAAGTCTGAGCacaaggagaagaagaagaggaaacGGAAACACGGGGACAAGGAGGCGGCAACGGGGAGACCTGCTTCACGACAGAATGATGCACAACCAACTAATCACGAACGGGAAGACAAGCCTGATATTCACCTGCTGCCACCACCGGCAGCGCCACCCCAGAGGGTATTCTTCTCCTACTTCAATCCCCTGAATGAAGTTCAAGAGGACCAGGTTCGGGACCAAAATCAGTACCTGACAGAAGCTAAAAGATTGAAGCACAGTGCAGACCAAGAGTGTGAATTAACAGCCCAGGGTATGTTGTACTTGGAGGCAGTCCTGTACTTCCTTTTAACCGGTCATGCTATGGAGTCCGATCCCGTAACTGACAGGGCCTCCTTCACCATGTACAAGGACACACTCAGTCTCATCAAGTACATCTCTTCCAAATTCAAGAGCCAACAGAACAATTCACCCGAGAGTAGTATACACAACAAGTTGGCGATCTTGAGTTTATGGTGCCAGTCCCTTATTTACTTGAAACTCTtcaaaatgaggaaaaatgaaaccAAAGAGATTCAGAAGATCGTTGGTGATTATCATCAAAAGCCAACACAGCCAACTGTTGTACAGCCTGAGGGCCAAGGTACTCCCTCTCTCTCGCCCACCCCATCGCCAGCAGGCTCGGTTGGGTCAGTTGGTAGTCAGAGCTCGGGTTACAGCAGTGGTGAATTAGCAAATCGTGGGGCTGCAACTGGACAACCACCAGCAGCAATGTACGTCAGTGTTCCATTAAATGTTCATTCGGCTATGCAGAAATTGACTCATCAGTTTTCATTACTTATGAGTTGCCATGAACTTTGGGATCAGGCTAATGCACTTGTGACTGATAAGCATCGCGaatttttcgtCGAATTGGATGAGAAACTCGGTCCCCTAACATTGAAGAGCTCCCTGCGAGACCTAGTGCGTTACGTGCAAGCTGGAATAAAGAAACTACGAGCCCTCTGA
Protein Sequence: MPSSGGYYDDRNPLLKGTLSSVDRDRLRERERQARAAMSVQAEQAAAGGGPDSRHGHHNHGHHHHHANSHASSASSLFRAPVKVNPDAQDRATQQIQSKLGNYSRVKHLLVEPQMLFGVVDVPPSPAPASGAPPRLQSRNNCPNSPSTQEFKKPGCNGPRGASSTSHTSQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGIIPAKGPPLGTGGNSAGNSSGPASSGNCPPLTGNTRIHAAGSRPAKLPIDNGMRHDLNDSADLENILKEMTMPPTPLTAIAQTPRKETESKFTFNPVLAKLTEVPPTDSSKPPQRERHGSRLSSDLARDLSLSEDSDDDGLKQGTTSRSQRPRSPVPSIDLSSALLPPMMPAPLPLAPVETSSMEMSPLGPLLLPRPLSPPRATPPKQLSPERVLSPLASSPRKHSQSPGVQLRPPSPPGHAPQSSGSASSSSDSGSDSGSDSSDDSEDESAPVPAKGPSTPPPASPRAPLEEPPAEESKPRWNLSSFLDQKAVQSDQNSENKSSQDAPGRDSSPEEVPKDSRTSRSDGDDDWQENEAIKRTRSSTLAALSDSDHTSDTDKKKIEEPRVLIPEKPKPPDVRKRGRPRKSVKESVKSPKSHRTITEETKPSSKRNRQRSVSSPKKKPPVTKATVESSEDEASDVRSSDSECDQRIPPPAALPEKRKSRLSLSSSEDERPTKHSASEDESDWRRLPTKRSKLMDSPKKQEKKKSPTKGKPRRPRSRVTNTSGCASDSDSESETAHRNNRQIARVPPRPRVPPTRATSLDNSDSDNSSAPKLQEEDGGNVQDKKKSDTLRKLFSTAKGGAKGGGKGGKGGKGGGKCGIYVEEYTGSANTPTGSESPYKRPSSQASTLPSFPSLTYANGIPSLICKIDLNRIPHIPQSSRGQELRERTELPDTRPPSRQSNVKTERPPTPEEGEIVDTVSPTDYRTHGDNNEIDDKVKRTIKSDNDSKNRAGPSGSGTSGASGLNGNAPKRKRNPSCSSVSSVSVCSVESKVKSEHKEKKKRKRKHGDKEAATGRPASRQNDAQPTNHEREDKPDIHLLPPPAAPPQRVFFSYFNPLNEVQEDQVRDQNQYLTEAKRLKHSADQECELTAQGMLYLEAVLYFLLTGHAMESDPVTDRASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLWCQSLIYLKLFKMRKNETKEIQKIVGDYHQKPTQPTVVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGAATGQPPAAMYVSVPLNVHSAMQKLTHQFSLLMSCHELWDQANALVTDKHREFFVELDEKLGPLTLKSSLRDLVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00728649;
90% Identity: -
80% Identity: -