Basic Information

Insect: Dinocampus coccinellae
Gene Symbol: lilli_1
Assembly: GCA_963920625.1
Location: OY987186.1:8685621-8698915[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.024 3.5e+02 -0.1 20.5 27 124 31 130 22 137 0.60

2 7 1.3e-11 2e-07 30.4 18.4 343 481 252 469 223 480 0.81

3 7 1 1.5e+04 -14.5 25.2 105 254 598 729 507 760 0.39

4 7 1 1.5e+04 -11.2 26.2 78 248 635 805 605 815 0.45

5 7 0.048 7.1e+02 -1.1 9.8 400 495 753 843 726 857 0.50

6 7 1 1.5e+04 -5.6 21.3 80 261 1012 1201 987 1222 0.43

7 7 0.034 5e+02 -0.6 0.6 127 220 1292 1386 1261 1423 0.66

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.024	3.5e+02	-0.1	20.5	27	124	31	130	22	137	0.60
2	7	1.3e-11	2e-07	30.4	18.4	343	481	252	469	223	480	0.81
3	7	1	1.5e+04	-14.5	25.2	105	254	598	729	507	760	0.39
4	7	1	1.5e+04	-11.2	26.2	78	248	635	805	605	815	0.45
5	7	0.048	7.1e+02	-1.1	9.8	400	495	753	843	726	857	0.50
6	7	1	1.5e+04	-5.6	21.3	80	261	1012	1201	987	1222	0.43
7	7	0.034	5e+02	-0.6	0.6	127	220	1292	1386	1261	1423	0.66

Sequence Information

Coding Sequence: ATGTCGGTCCAGGCCGAACAAGCAACAGCGGGTGGTGGTCCGGAAGCCTGCCATACTCATCACAATCATAACAATCATGGCAATTCTCATGTATCTGCAGCGGCATCACTTTTTCGCGCTCCTGTCCGAGTTAATCCTGATGCACATGATCGTACGACACAACAAATTCAATCAAAGCTTGGAAATTATTCGTTGGTAAAGCATTTATTGGATGAACCAAAGAGATTAATTGGAATTGAAGGAGTCCCCGCTAGTCCTGCACCATCGTCCGGATCATCTGCGaggtcatcatcatcatcgtcatcatcgtcatcatcatcTTCGCCATCAACGCAAGAATTCAAAAAGCCTGGTTGTAGTGGTCCACGTTCGTCAACCACGTCATCAAGTCATGGTTCACATAGAGGCGGTTTTGTTAAACCCGCGGACGGTAAACCTCCATATGGTGGCCGTGGTGGATATCCAGGTCAACCTGTCAAACACGGTGGCAATAGTAATGACCACAGAAGTCATGGTATTTTACCTGCAAAAGGTCCACCATCGTCCATCACTCCAAATGttaatactactactactaccactactactactattactactattactactactactactaccggAAACAATGGTGGATCGAATTCTTCCGGAAATTGTCCTCCTCTCCCTATGAGTAACACTAACTCTGGTAGAATACACGTGGCAGCTTCCAGACTTTCTAGATTACCCCTTGACAATgGAATGAGGCATGGGTCCAATGAAGGCACCGCAGACTTGGAAAATATTCTCAAGGAAATGACGATGCCGCCCACTCCACTCACTGCAATTGCACAGACACCAAGAAAAGAACTTGAATCCAAGTTCACATTCAACCCCGTACTATCAAAGttGACAGAGGTATCATTGACAACACCTTCCAAACAATCACAACGTGAGAGACACGGAACTAACAGATTGTCTGCagATTTAGAACGTGATTTGAGTCTTTCGGAagatagtgatgatgatggtggtagtggtggtggtggtggaggtggtgcCAAAATTTCAACTACAAAATTaccaaaaaatcaaaatagaaGTCCAGACTTGACAGTCGAcCTCTCGACACCATTGATACCAGCCATGACACCAGCGCCCCCACCTCTTGCACCAATGTCACCCATGGGAATGTCGCCTCTGGGTCCATTGTCGTCACCAAATCCACCAAAACAAATATCACCAGCACGATCTGGGTCAATTTTACCTGTAGGTTCGCCgcgaaaatatataacatctCCGGTCATGTCGATAAGGCCCCCAAGTCCACCAGGACAGGCACCACAAAGCTCAGCAAGCGCTAGCTCAAGTTCAGACTCAGGATCAGATTCAGGTTCAGATAGCAGTGATGACTCTGAGGAtgaaggtggtggtggtagtggtagtggtagtggtagcgGTAGCGGTGGCGGTGGCGATGGtgctgatggtggtggtggtggtagtaatGGCAGTAATGGCAGTAATGGCAGTAATGGTCGCACCAATGAATTACATTTATCTGGTAAAGGCCCGTCTACACCCCCTTCAGTTTCGCCAAATGCTCTTGCAGAGGAGCCAGAACTCCCTCCTCCCGCTGAAGAATCAACAAAGACTAGATGGAATCTCGGGAGCTTTTTTAGGAAAACCCCAATGCAGACAGGCAGTGATCAAGCATTAGAAAGTAAATCATGTCAGgATGGAGTAACGCGATGCAACAGTTCTCCAGATGTGACATCACTTGACAAACGAACACGAAGACCAGACGCAACGCACAGCAATAAAGATTGGCAATTCGACGAcgtattgaagaaaaatcgaAATACAACAAAATTAACTCATTTAAGTGATAGTGAACAAAATTCCGATtgtgaaaaaaaggaaaaatcaattgaagaaataaaatcacaagGACAAGACAAACCAAAGCCACCAGACGTTCGAAAACGTGGTCGACCTCGAAAAACTGTAAAAGAATCGATAAAAAGTCCACGTAATCATAGAATATCACCAGAAATACCAAAAACATCATCTGCAAAACGAAGTAATAGGCCACGCAGTAGTGGTAGccccaaaaaaaaagtgtcatCGATATCTAGGTTATCAATGATGGGTAATAGTGATGAGGAAACGAGTGATGTGAGATTACATGAAAGATCAAGTGATTCAGATGAATTTGAATCATCATCGAGGATTTCACAAGCATCAATAATGGCAGTTGAAAAACGACGATCACGTTTGAGTATTTCTTCGAGTGATGATGAAAGAACAATAACCAAACAGCACATTGATGATCGTCATACTTCAGAGGATGATGCATTGTGGCGAAAAGCAGCACCAAAACGCAATAAATTAACCGACTCACCTGTGAAAAAacttgagaaaaagaaaagtccGACAAAAGTGAAACCCCGACTTTCTCAATCACGAGTTACAAATATATCAGGCTGTGTCTCAGATTCCGATAGTGAATCGGAAATAACATTACGAAATAATCGAATACAGGTAGCTCGGGTACAACCGAGACCACGTGCGCCCTTAACGAGAGCTACATCCCCTGATAATTCCGATAGTGACAATAGCCCAACGCCAAAGCTTCAGGAAGAAGACGCTGGAAACGTACAAGATAAGAAAAAGAGTGATACCCTAAGAAAATTGTTTTCCAGTGCAAAAGGAGGTGCTAAAGGTGGTGGAAAGGGTGGTAAAGGTGGTAAAGGTGGTAAGGGTGGTGGTAAATGTGGAATTTATGTTGAGGAGTATACAAGTGGTACGGTGAATACACCTACTGGTGGTGAAAGTCCATATAAGAGACCACCATCATCACAATCTTCAATTATCCCAAGTATACCATCACTCACATACATCAATGGTTTACCAAGTCTTATGTGTAGAATTGAACTCAATAGAGTTCAACATGTAGCACAATTATCTAGAGGTCAAGAATTAAGACAGCGAACAGAATTGTCAGATACAAGGCCAGCTTCGAGGCAAtctaatgtaaaaattaaaccGGAACGACCATCTACGCCGGAACGAACATCTACACCGGAAGACGGTGAAATAGTAGATCAATCTTCAATTTGTCAACCACCCCTGTCTACTGAATATAGAACCCAATATAGTGATACTCAACATCATCAAGCTGCTCCAATTCATATTGACCAAGTTAATCAGATTATGTGTACAAAGAATAAACAATCAGATACTAATAAGAGTGAACGTATACAAGCAACATCTGTTGATGTAACTGTGAAAAATCGCACTGTGTCTGGTGATAGTGGAACAACAATAAGtggaaataatacaaattcagGTTTAATTATTGCGAGtggtaatattattgataatgcaCTGAAACGTAAACGTAATCCTAGCTGCAGTTCGTTATCCAGTCTAAGCGTTTGTTCGATAGATTCCAAAGTTAAGTCTACTAATGAacacaaagaaaagaaaaaacgaaagagaaaACATACTGATAAAGATTCAAATACCTCGAGGACCTCTAAccgatataaaaatgatgtacAACCGACAAATCACGAGAGGGAAGATAAATCAGATAGTAATTTGTTGCCACCTCCTGCAGTGCCACTCCAACGCgtcttttattcttatttcaatCATCAAAATCAAGTTTTAGACGATCAAGATAgGGACCAAAATCAGCACTTGACTGAAGCAAAACGATTGAAGCACAGCGCTGATGAAGAATGCGAATTGACAGCACAAGGTATGTTGTACTTGGAGGCGGCATTGTACTTTTTACTGACGGGTCACGCAATGGAGTCTGATCCAGTAACCGAGAGAGCTTCATTCACGATGTACAAAGACACACTCAGTCTCATAAAatACATTTCTTCAAAATTTAAAAGCCAACAGAATAATTCACCAGAGAGTAGTATCCATAATAAATTGGCGATCTTGAGtttATGGTGCCAGtcgttaatttatttgaaattattcaaaatgcgCAAACATGAAGCACatgaatatcaaaaaatacttGCAGATTATCATCAAAAGcCCGCACAACCGACGCTTGTGCAAACTGAGGGACAGGGAACACCGTTATTATCACCAACACCATCGCCGGCAGGTTCGGTAGGTTCGGTTGGTAGTCAAAGTTCCGGATATAGCAGTGGTGAATTAGCAAATCGTGGTTTAGTCTCGGGACAACCATCTGCGGCAACATATGTTAGTGTTCCACTTGGTATCCACACAGCAATGCAgaaacaaaatcatcatttttcattattaatgaattgtcATGAATTATGGGACCAGGCAACTGCATTAGTGACAGACAAACATCGggacttttttattgaattggatgaaaaatttggGCCGTTGACATTGAAAAGTTCATTGCATGACTTGGTGCGTTATGTTGAAgctggaataaaaaaattgcgtgCCCTCTGA
Protein Sequence: MSVQAEQATAGGGPEACHTHHNHNNHGNSHVSAAASLFRAPVRVNPDAHDRTTQQIQSKLGNYSLVKHLLDEPKRLIGIEGVPASPAPSSGSSARSSSSSSSSSSSSSPSTQEFKKPGCSGPRSSTTSSSHGSHRGGFVKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGILPAKGPPSSITPNVNTTTTTTTTTITTITTTTTTGNNGGSNSSGNCPPLPMSNTNSGRIHVAASRLSRLPLDNGMRHGSNEGTADLENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLSKLTEVSLTTPSKQSQRERHGTNRLSADLERDLSLSEDSDDDGGSGGGGGGGAKISTTKLPKNQNRSPDLTVDLSTPLIPAMTPAPPPLAPMSPMGMSPLGPLSSPNPPKQISPARSGSILPVGSPRKYITSPVMSIRPPSPPGQAPQSSASASSSSDSGSDSGSDSSDDSEDEGGGGSGSGSGSGSGGGGDGADGGGGGSNGSNGSNGSNGRTNELHLSGKGPSTPPSVSPNALAEEPELPPPAEESTKTRWNLGSFFRKTPMQTGSDQALESKSCQDGVTRCNSSPDVTSLDKRTRRPDATHSNKDWQFDDVLKKNRNTTKLTHLSDSEQNSDCEKKEKSIEEIKSQGQDKPKPPDVRKRGRPRKTVKESIKSPRNHRISPEIPKTSSAKRSNRPRSSGSPKKKVSSISRLSMMGNSDEETSDVRLHERSSDSDEFESSSRISQASIMAVEKRRSRLSISSSDDERTITKQHIDDRHTSEDDALWRKAAPKRNKLTDSPVKKLEKKKSPTKVKPRLSQSRVTNISGCVSDSDSESEITLRNNRIQVARVQPRPRAPLTRATSPDNSDSDNSPTPKLQEEDAGNVQDKKKSDTLRKLFSSAKGGAKGGGKGGKGGKGGKGGGKCGIYVEEYTSGTVNTPTGGESPYKRPPSSQSSIIPSIPSLTYINGLPSLMCRIELNRVQHVAQLSRGQELRQRTELSDTRPASRQSNVKIKPERPSTPERTSTPEDGEIVDQSSICQPPLSTEYRTQYSDTQHHQAAPIHIDQVNQIMCTKNKQSDTNKSERIQATSVDVTVKNRTVSGDSGTTISGNNTNSGLIIASGNIIDNALKRKRNPSCSSLSSLSVCSIDSKVKSTNEHKEKKKRKRKHTDKDSNTSRTSNRYKNDVQPTNHEREDKSDSNLLPPPAVPLQRVFYSYFNHQNQVLDDQDRDQNQHLTEAKRLKHSADEECELTAQGMLYLEAALYFLLTGHAMESDPVTERASFTMYKDTLSLIKYISSKFKSQQNNSPESSIHNKLAILSLWCQSLIYLKLFKMRKHEAHEYQKILADYHQKPAQPTLVQTEGQGTPLLSPTPSPAGSVGSVGSQSSGYSSGELANRGLVSGQPSAATYVSVPLGIHTAMQKQNHHFSLLMNCHELWDQATALVTDKHRDFFIELDEKFGPLTLKSSLHDLVRYVEAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -