Basic Information

Insect: Fopius arisanus
Gene Symbol: lilli_1
Assembly: GCA_000806365.1
Location: NW:2459914-2523296[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.072 7.3e+02 -1.7 0.2 4 28 23 47 21 51 0.81

2 9 1.8e-07 0.0018 16.8 0.0 24 109 67 152 59 178 0.65

3 9 4e-11 4.1e-07 28.8 0.4 326 439 250 356 240 374 0.66

4 9 0.53 5.4e+03 -4.6 22.6 441 501 439 496 426 517 0.66

5 9 1 1e+04 -19.4 32.7 102 255 543 697 513 709 0.36

6 9 0.02 2.1e+02 0.1 15.7 421 506 690 784 684 790 0.59

7 9 0.19 1.9e+03 -3.1 4.8 430 479 960 1009 923 1028 0.60

8 9 0.092 9.4e+02 -2.1 4.2 193 264 1045 1118 1021 1163 0.52

9 9 0.079 8e+02 -1.8 0.7 131 220 1209 1299 1179 1336 0.54

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.072	7.3e+02	-1.7	0.2	4	28	23	47	21	51	0.81
2	9	1.8e-07	0.0018	16.8	0.0	24	109	67	152	59	178	0.65
3	9	4e-11	4.1e-07	28.8	0.4	326	439	250	356	240	374	0.66
4	9	0.53	5.4e+03	-4.6	22.6	441	501	439	496	426	517	0.66
5	9	1	1e+04	-19.4	32.7	102	255	543	697	513	709	0.36
6	9	0.02	2.1e+02	0.1	15.7	421	506	690	784	684	790	0.59
7	9	0.19	1.9e+03	-3.1	4.8	430	479	960	1009	923	1028	0.60
8	9	0.092	9.4e+02	-2.1	4.2	193	264	1045	1118	1021	1163	0.52
9	9	0.079	8e+02	-1.8	0.7	131	220	1209	1299	1179	1336	0.54

Sequence Information

Coding Sequence: ATGCCGTCCTCCGGGGGTTATTATGATGATAGGAACCCGCTTCTCAAGGGCACCTTATCGAGCGTGGACCGGGACCGGCTTCGAGAGCGTGAGCGTCAGGCACGCGCAGCGATGTCGGTCCAGGCAGAGCAGGCGGCGGCGGGCGGTGCTCCGGACACCCGCCACGGTCACCACAACCACGGCCACCATCATCACGCCAATTCCCACGCATCCTCTGCCTCTTCGCTCTTCCGTGCCCCCGTCAAGGTGAATCCTGACGCGCAAGATCGTGCCACCCAGCAGATTCAGTCCAAGTTGGGGAATTACTCACGTGTGAAGCACTTACTGGTCGAGCCCCAGATGCTGTTTGGTGTTGTTGATGTACCACCGAGTCCAGCGCCACCAGGATCAGGTGGTACAACAAGATTACAAGGTCGAAACAATTGTCCAAGCTCACCGTCAACCCAGGAATTTAAGAAACCCGGTTGCAATGGTCCGCGGGGTGCATCAGCAACGAGTCACACGTCACAGAGAGGTGGTTTTGTTAAACCAGCTGATGGTAAGCCACCCTACGGTGGACGTGGTGGTTATCCAGGCCAACCTGTTAAACATGGTGGTAATAGCAATGATCACAGAAGCCACGGTATTATACCAGCAAAGGGACCACCACTTGGTACTGGTGGGAATTCAGCCGGAAACAGCTCTGGCCCTGCCTCTTCCGGTAACTGTCCTCCTTTGACTGGTAACACGAGAGTTCACGCTGCTGGATCCAGGCTTACCAGGCTACCTATTGATAATGGAATGAGACATGATCTCAACGATAGCGCCGACCTCGAGAATATTCTCAAGGAAATGACGATGCCACCTACACCTCTGACGGCAATTGCGCAGACACCCAGGAAAGAACCAGAATCTAAGTTCACGTTTAATCCGGTTCTTGCTAAGctgACTGAAGTGCCACCAGCGGACTCTTCCAAACCACCACAGCGTGAGAGGCACGGGAGCAGACTGTCTTCTGATCTGGCACGTGACCTGAGCCTCTCCGAGGACAGCGATGATGATGGCCTCAAGCAGGGCACGCCATCAAGGTTGCAAAGGTCCAGATCTCCAGGCCCAACTATCGATTTGTCGTCAGCATTACTTCCCCCACTGATGCCACCAGCGCCTCTGCCGTTGGCTCCACCATCCCCAATGGAAATGTCTCCTCTGGGTCCTCTGTCGCCCCCTCGTCCACTGTCGCCCCCGCGTGCAACACCCCCTAAGCAATTATCACCGGAGCGTCTGCTCTCGCCTATAGTCTCGTCCCCTCGAAAACACTCGAGTCCAGGGATCCTTCGACCCCCGAGTCCCATAGGTCAGGCACCCCAGAGCTCTGGCTCAGCCTCATCGAGCTCAGATACTGGCTCAGAATCGGGAACAGATAGTAGTGATGACTCGGAGGACGAGAGTGCAGGGGGACAGGCACAAGCCAAAGGCCCTAGTACACCTCCACCAACATCACCTAGAGCTTCACTCGACGAGCCCCCAGTTGAGGAGTCCAAACCTCGTTGGAATCTCAGCAGCTTTATGTATCCCCCCAAGGCTGTCCAGTCCGATCGAATCGAGAACAAACTCTCCCAGGATGCCACCAGGCGTGATAGCTCCCCCGAAGAAGTTCAGGCTCATGGCAACAATTGGCAGATGGAcgaaaccattaaaaaaacgagaagCTCTACACTAGCTGCTCTCAGTGACAGCGATCATACTTCTGACACGGATAAGAAAAAAGTAGAGGATGAAGAGCCACGAGTCGTCCTACCTGACAAACCCAAACCCCCCGATGTACGGAAGCGTGGTAGACCAAGAAAGTCAGTTAAGGAGTCCGTCAAGAGTCCCAAGAGCCACAGAGCGCTATCTGAAGAGGCCAAGACCACCTCAAAGCGTAACAGGCAGCGCAGCGTCAGCAGCCCTAAGAAGAAACCAGTGGCCAAAGCCACTGTTCACAGTAGTGATGACGAGGCCAGCGATCTCAGATCGAGTGATTCGGAATGTGAACGTCGAATTGAACGTCCAGCCTCGATACCGGAGAAGCGTAAATCCCGGCTGAGTCTGTCTTCGAGTGAAGACGAGAAATCAACGAGAAAGCACAGTGCCTCTGAAGACGAGTCCGACTGGAGACGAATTCCTACCAAGCGTTCCAAGTTGATGGACTCACCAAAGAAAcaagagaagaagaagagtcCAACAAAGGCTAAGCCGAGACGACCACGATCGCGGGTGACAAACACCTCTGGCTGTGCCAGTGATTCAGACAGTGAGTCTGAAACAGCCCACAGGAACAACAGGCAGATAGCGAGGGTGCCACCAAGACCTCGAGTTCCCCCGACAAGAGCCACATCCCTCGATAATTCGGACAGTGACAACAGCTCAGCACCAAAACTCCAGGAGGAAGACGGTGGTAACGTCCAGGACAAAAAGAAGAGCGACACGCTAAGGAAGCTCTTCTCCACAGCGAAAGGTGGAGCCAAGGGCGGTGGTAAGGGTGGAAAAGGTGGAAAGGGGGGTGGCAAGTGTGGTATTTACGTTGAAGAGTACACAGGCTCGGCAAACACACCAACGGGCAGTGAAAGCCCGTACAAGAGGCCTTCGTCACAAGCTTCCGCACCAACAAATTTTCCATGCCTCACTTATAGCAATGGCATTCCGAGCTTAATGTGCAAAATCGACTTGACTAGGATTCCTCACATACCGCAGGCGTCGAGGGGTCAGGAAATTAGAGAGAGAACTGAGCTGTCTGATACCAGGCCAATATCGAGACAATCTAGTGGTAAAAATGAACGTCCATCGACACCTGAGGAGGGAGAAATCATCGATACAGTGTCTCCAACTGACTACAGGACTCACGGTGATAATGAGATTGATGATAAAGTTAAACGTACTGCTAAAagtgataatgataaaaatagagCCGGCCCAAGTGGCAGTGGCAGTAGCATTGGCAGTGGCAGTGGCATTGGCAGTGGCATTGGCAGTGGCAGTGGCAGTGGCAGTGGTAGTGGCAGTGGCAGTGGCATTGGCAGTGGAAATGCCAGTGGCAGCGGCAGTGGAGGTGGTAGTGGCAATGCAAGTGGTACCAGTGGTGCTAGTGGATTTAATGGTAATGCACCCAAACGAAAACGTAATCCAAGTTGTAGTTCCAGTGTTAGTGTTTGTTCGGTTGAGTCAAAAGTTAAGGGAGAGCACAAGGAGAAGAAGAAACGGAAAAAGAAACATGGAGACAAGGATGGGGCCATCAAGAGGCCACCTCCACGACAGAATGATGCACAACCAACTAATCACGAGCGGGAAGACAAGCCTGATGTTCATCTGCTGCCACCACCGGCAGCGCCACCCCAGAGGGTATTCTTCTCCTACTTCAATCCTCTCAATGAAGTTCAAGAGGACCAGGTTCGGGACCAAAATCAGTACCTGACAGAAGCAAAGAGGTTAAAGCACAGTGCAGACCAAGAGTGCGAATTAACAGCCCAGGGCATGTTGTACTTGGAGGCAGTTCTGTACTTCCTTTTAACGGGCCATGCAATGGAGTCTGATCCCGTAACCGACAGGGCCTCCTTCACCATGTATAAGGACACACTCAGCCTCATCAAGTACATCTCTTCGAAATTCAAGAGTCAACAGAACAATTCACCCGAGAGTAGTATTCACAACAAGTTGGCTATCTTGAGTTTATGGTGCCAGTCCCTTATTTACTTGAAACTCttcaaaatgagaaaaaacgaAACCAAAGAGATTCAGAAGATCGTTGGTGATTATCATCAAAAGCCAACACAACCAACTGTTGTACAGCCTGAGGGTCAGGGCACCCCCTCACTCTCGCCCACCCCATCACCAGCAGGCTCAGTTGGTTCAGTTGGTAGTCAGAGCTCGGGTTACAGCAGTGGTGAATTAGCAAATCGTGGCGCTGCTACTGGACAACCACCAGCAGCAATGTACGTCAGTGTTCCCTTAAATGTTCATTCGGCCATGCAGAAATTGACACATCAGTTTTCATTACTCATGAGTTGTCACGATCTCTGGGATCAGGCTAATGCTCTTGTCACTGATAAGCATCGAGaattttttgtCGAATTGGACGAGAAATTGGGTCCTCTAACTCTCAAGAGCTCACTGCGAGATCTGGTGCGTTACGTACAAGCTGGAATAAAGAAATTACGAGCCCTCTGA
Protein Sequence: MPSSGGYYDDRNPLLKGTLSSVDRDRLRERERQARAAMSVQAEQAAAGGAPDTRHGHHNHGHHHHANSHASSASSLFRAPVKVNPDAQDRATQQIQSKLGNYSRVKHLLVEPQMLFGVVDVPPSPAPPGSGGTTRLQGRNNCPSSPSTQEFKKPGCNGPRGASATSHTSQRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGIIPAKGPPLGTGGNSAGNSSGPASSGNCPPLTGNTRVHAAGSRLTRLPIDNGMRHDLNDSADLENILKEMTMPPTPLTAIAQTPRKEPESKFTFNPVLAKLTEVPPADSSKPPQRERHGSRLSSDLARDLSLSEDSDDDGLKQGTPSRLQRSRSPGPTIDLSSALLPPLMPPAPLPLAPPSPMEMSPLGPLSPPRPLSPPRATPPKQLSPERLLSPIVSSPRKHSSPGILRPPSPIGQAPQSSGSASSSSDTGSESGTDSSDDSEDESAGGQAQAKGPSTPPPTSPRASLDEPPVEESKPRWNLSSFMYPPKAVQSDRIENKLSQDATRRDSSPEEVQAHGNNWQMDETIKKTRSSTLAALSDSDHTSDTDKKKVEDEEPRVVLPDKPKPPDVRKRGRPRKSVKESVKSPKSHRALSEEAKTTSKRNRQRSVSSPKKKPVAKATVHSSDDEASDLRSSDSECERRIERPASIPEKRKSRLSLSSSEDEKSTRKHSASEDESDWRRIPTKRSKLMDSPKKQEKKKSPTKAKPRRPRSRVTNTSGCASDSDSESETAHRNNRQIARVPPRPRVPPTRATSLDNSDSDNSSAPKLQEEDGGNVQDKKKSDTLRKLFSTAKGGAKGGGKGGKGGKGGGKCGIYVEEYTGSANTPTGSESPYKRPSSQASAPTNFPCLTYSNGIPSLMCKIDLTRIPHIPQASRGQEIRERTELSDTRPISRQSSGKNERPSTPEEGEIIDTVSPTDYRTHGDNEIDDKVKRTAKSDNDKNRAGPSGSGSSIGSGSGIGSGIGSGSGSGSGSGSGSGIGSGNASGSGSGGGSGNASGTSGASGFNGNAPKRKRNPSCSSSVSVCSVESKVKGEHKEKKKRKKKHGDKDGAIKRPPPRQNDAQPTNHEREDKPDVHLLPPPAAPPQRVFFSYFNPLNEVQEDQVRDQNQYLTEAKRLKHSADQECELTAQGMLYLEAVLYFLLTGHAMESDPVTDRASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLWCQSLIYLKLFKMRKNETKEIQKIVGDYHQKPTQPTVVQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRGAATGQPPAAMYVSVPLNVHSAMQKLTHQFSLLMSCHDLWDQANALVTDKHREFFVELDEKLGPLTLKSSLRDLVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00438070;
90% Identity: -
80% Identity: -