Basic Information

Insect: Microchrysa polita
Gene Symbol: lilli_1
Assembly: GCA_949715475.1
Location: OX454418.1:68424275-68445684[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 2.1e-07 0.0085 16.6 11.8 6 220 5 202 1 236 0.48

2 7 4.9e-11 2e-06 28.5 15.7 334 512 234 403 229 405 0.71

3 7 1 4.1e+04 -10.2 16.3 141 275 494 628 419 639 0.42

4 7 1 4.1e+04 -14.2 34.5 426 481 737 798 717 812 0.40

5 7 1 4.1e+04 -12.1 20.6 72 205 849 980 839 1076 0.45

6 7 1 4.1e+04 -7.8 9.3 125 199 996 1068 940 1156 0.35

7 7 0.085 3.5e+03 -2.0 1.8 361 406 1250 1297 1209 1330 0.72

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	2.1e-07	0.0085	16.6	11.8	6	220	5	202	1	236	0.48
2	7	4.9e-11	2e-06	28.5	15.7	334	512	234	403	229	405	0.71
3	7	1	4.1e+04	-10.2	16.3	141	275	494	628	419	639	0.42
4	7	1	4.1e+04	-14.2	34.5	426	481	737	798	717	812	0.40
5	7	1	4.1e+04	-12.1	20.6	72	205	849	980	839	1076	0.45
6	7	1	4.1e+04	-7.8	9.3	125	199	996	1068	940	1156	0.35
7	7	0.085	3.5e+03	-2.0	1.8	361	406	1250	1297	1209	1330	0.72

Sequence Information

Coding Sequence: ATGGAGGATTGCAGACGTATGGAAAAACGGGAACGTGACAAAAGGGCACGACAGCAAATTCAAAATACACGACCCGAAGCATCGTTGTTTCCGGAACCAGTTCGAGTCGAAGGTGACTCCTCCATCGATTCGAAATTGGGCGACTATGATGCCGCTCGTAGTCTATTCCTTGAGCCTAAACAGGCACGTATTATCGGCATCACAACATCAGTCACAAATACCCCACAACCACCGGTGCAACGAATACCGCCGCCTCAGCAACAACCTTATCCGGTTGTTGGTCTAGGTTCCTCATCGACATCATCATCCGGCTTTGCACCGCCACCGTCACAAAACAATCGTATTGTCCCGCCCTCTTCGTCACATCGCTATCATCCACCGCATACGTCGTCGCTCTCGTCAtcacagcagcagcagcagagtCGAAATAGTAGCAGCGGAACCTACTTAAAACAACTCGACCCCAAAGTTACGCACAATGGCCGCTATCCGGCTCCACCAAACAAACATGACACCCATCAAAAAAGCAGTGGTGGTAGTAGTGGCCTGGGGCCACCTCAACCGCCTCAAAGTTCGTCCGCCATGATGCCGAACGGTCGACTGTCGAATGACAAAGTTGTAGGTAGCTCGGCGAACAATACTACTAGCGGATCAAATCCTAATGGGCGATTTCAAGTTCCTCAAGCGCCGCCCAAGCAACATAGTCGCTACATAGAACCGCCATCTCCGTCGCGCGTTGGCGATGTCGATTCTATATTGAAGGAGATGACAAGACCACATCAGCCCTTGACGTTGATAGCGGCGACACCTCGCAaagaatttgaaaataaattcagTTTCGGTCAGAAGAATAATCACGTATATGCCTCATTGCCCCCTGCGTTAACGGATACATTAACGAGACAACGCGATAAAACTTTTAATGTGCCTACATCGAAGCTCGAAAATGATCTAGAATTATCCGAGAGCGATGATGACCACAAGAAACAAACGTCTACCGGACGTGCCTCTCCTACGAATGACAATTCGAGCGACAGTTCAGATTCCGGTTCTAGCGACTCGGAAAGTGAAGAATCCACGATCGGCGCACGTCAAGGCGGTGGTGCTGATGCCAATAACCGTaagttgacaaattgcaaccggGTAGAAGAGTCTGCGATAGCATCGGGTAGTGTGCCAGAGACAAATGCTTGGAATTTGAGCAAATACTTTCTCAAGGAAAAATCTGTCGGTCTCGATGGCGGTTGTCACGATAATATTAAGCATGAGCCACCGAATCGTTTAGACGATAGCTCATCGCCAGCACCGTCGCCGACAACATTTACACGCCACGAGATCATCACTCCAATCAATCCAATTTCACCCATTGACATTAAGACAGAAAGTTTGGCGCAGGATTTCAGCAAGGCAAATAGTAATAATAATTGTTTACAACTTCAGCCCGATCAAATCAAAAGCGAAACTTTCGAGAAAAGTCCGTCAAGTAGCCCGGAAAAAGTCCAGCACTCGGACACAGTCGAGTCAGATCAAATCGAAAGTGTTTTGGCCGAAGCAAAAGGTTTGGCCGAAATCAAACCGGTGTCGGATCTGGGTTCGAGTTCCGATGCGGACGATACGAAACCAAAACCTCTACCCTTGCCGGTTAGCAAATCGCCGGCTAAGAAGCCGGTGAAGCGCAGGCGAAAAGTACAAAAAGACAAAAAGATCCCTAACAGTGATTCGAGTGATGAGGATTGTGATTTATCAAGTGCAAATAATTTGTCCGATCGCAGTCGCTCTGTTGAGAAGGAGAAGAAAGGTCGCGGCCGGCCCCGCAAAAACCCTGTCGCTGCTCCATCAACAGTGTCGACTAACAAATCTCCGGCAGTGACGCCCGTCAAAAATGCATTGGCTAACAAGCGCGATCCAGCTGTCCGAAAGGGCGGTCCAGGACGTAGAACATCACGACAAAATTCCACGGCCATTCCCATAAGCCGGGAAATTTTGGAAACTACTACAGATTCATCGTCGGATGATGATCGACCGCCGCCAACGAAATCATCGATTCTACCGTCACCCACATTGTCCGCTTCGGCACAAGTTATTCCAGCAAAACTTGCGGAAATTGGCAGTAGAGGAGGCAGTGCTTCAGGCGTACCAGTCGTAAAGCCTCACACAAAAGTTGATAACAATGTGTCGGTAGCCACGTCAAAGTCGagcgatgatgatgacgacgacgatgatgacgacgatTCGTCCAGTTCATCAGATAATAGCGATGACGAGCGAGTACCGTCATTGCGCGATCGAGCATCACCTCGCCAACAATCCCTATCGGAACATCACAGTTCCTCACCAAGTCATCACTCCACATCGTCGTCTAGTGAAGATCATTCCGATAGCGATAGTGAATCACCTCCGCGGGAGGACAAGAAAATTCGTGACAAAACAAAAAGTGATAAACTCAAAAGTGATACTTTACGTAAATTATTTATTGGTTCAAATCGAGGAGAGGGCGGAGCCAAAGGAAAAGGTCAAGTGCTTATTGTTGATCAGTCGGAGGAGTCGCAAAATCATCCCGCAAAGGATGCCCCACCAATTCATCACGAGAAAATTTTATCGCCCATTGCCTTTAAGCAACACaataacaacaataataatagcAACAGTAACAATGATATGCAGCCAGTTCCATTGACGCCCACATCGAACATAACAACGACAAGCAATCATTTGAAATCCCCGCGAACATCGGCAGCAGCCGTCTTGATTGGCGGCACGACGCCAACCTCGGGAAATGCCGTATCCTCTGTCAGCAGCAATAATACGAGCAATAGTAAATCACCGGCGCTTCGGACCCCGGAACGGATGCCTGCAATGAGTATAAATAGTAAAATTCATAGTGTTAATAACAATAGTAACGTTAGCAATAGCAATGTACACACCATAAGTTCGCCAATTATTTGTCGAATTGATTTGTCCCGGGTGCAAATACCAAAGGCATGGCTACAGAACTCGCAACGAATGCGGGACAATACTAGCAATTCGAATGGCTCCACCCAAATCCAAAGTGCTCCTCATAGTGATGATGATCGATTAAGAAGTCCCAAATTGCCGCTTACGCCCCGGTGTGGTACCAATAGCAGCAGTAAGCTAAATCACAAAATATTGGATAGCGGCGGCAGTGTAAACAGTAGTCCTAGCATGAATTCAAGACTGGTAAATAGTGATTCGATAGGAAATCAAATAGCTACAACGGCCTCGTCGCCGGTGTCTTCGCGATATGGAGACGGAGGCGGCCTAAACAGTAAGAACAATTACAACGTAGATAACGTAGGAAAGGGGCATAGTAATGTCCCAAATTACCCATACAATGTAGATAATCATCGTCTGTCAAACAACAATTCGGATCGGTTGAGTCCCGCCCTACAGCCACCCATGACTCAGTTGCATCCATCGTTGGTTTCTCCCAAACGTGAGCTTTTCCTTCATGCCGCCGCCCAAATGAATTCCAATTCGAGCGGTAGTATTAAGCACGAGCCCATCAAATCCGAGTTCACAACCGACGAATACATGAGTTCAAAGTCACAGACGCTTCTCGAAAACAAATGCAACCTCTACAATAATCCCAAGCTGGTGGGACGTAACAATAACGTGATCGTCAAGACGGAatgtaaaaatttatttattggcAACGATTGTGATCGCTCGAATCAAACACAAGCATCACCAATTGATCCGATTGGAGGTGGTGCCCACGGCACCGTACCGCCTCCAATGACAACGATCAATGCGGCCGCTTTAAGGGCGCTATCGCCCAGTGATGAGCCTATTCCAAAGAATCGACGTAAACGCAGCTCAAGTTCGAGTAGTAGTCCGTACAAGGAGAAAAAGAGGAAAAAGACGACGACTGGTGCACCGCTTCAGAACGAAGCCTTCGAACAATTACCCCCCACAAATCACGATCGGTTATCCGATAAATATTCACCACCATCGCCTATCGTCCAGACAGTGTACAAGTCATACTTTGAACGTGAAGGCGATGATGCGATATCAGGCCAAGACCAAGAGGTATACCTCCAAGAAGCAAAACGTCTCAAACATTTAGCAGATCGCGAGAGCGGTCATTTCAATCAGGTTGCATTGTATTTGAAGGCTGTATTATATTTTCTATTGTCGGCGACACGTATGGAACAAAGCGATCGAATTCCCTCGGCATTTACAATATACAAGGACACATTGTCACTAATCAAATTTATATCGTCGAAATTTATTATGCATCCACCCCAGCATGGTATTGACAATACTAATAAGGTGTCGGTATTAAGtcTGCGTTGTCAATCGTTGATTTCACTCAAACTCTACACCTTGAAGCGCGGTGAAAGCAAAGAGGCCCAAAAAACCATCTCACATTTCATCAATAAAGCTCCCGAAATCATTAACGGTAACACGCCATCGATTTCACCCAGTTCAGTATCATCGCTTGGCTCTGGTTCGAATACGCCGCCACTACATGTAGTTCCAGGACGATATCCATCGGTGCATCACTTTCCAAAATATTCGGCGGAAACAACATATCCATTTGAGGTGCATGCAGCGTACCAAAAACAAGCTCTCGCATTTAATTATCTATCGAGTGCACATGAACTATGGGAACAAGCGGACAATATAGTTAAGAAAGGAAATCACATGGACTTTTTCATCGATCTGGATCGTGTGAATGGACCACTGTCATTACACAGCTCAATGTATGAAATATTTAAGTACGTTCAGTATGGTTTGCAGAAACTCAAGGAAATGTGA
Protein Sequence: MEDCRRMEKRERDKRARQQIQNTRPEASLFPEPVRVEGDSSIDSKLGDYDAARSLFLEPKQARIIGITTSVTNTPQPPVQRIPPPQQQPYPVVGLGSSSTSSSGFAPPPSQNNRIVPPSSSHRYHPPHTSSLSSSQQQQQSRNSSSGTYLKQLDPKVTHNGRYPAPPNKHDTHQKSSGGSSGLGPPQPPQSSSAMMPNGRLSNDKVVGSSANNTTSGSNPNGRFQVPQAPPKQHSRYIEPPSPSRVGDVDSILKEMTRPHQPLTLIAATPRKEFENKFSFGQKNNHVYASLPPALTDTLTRQRDKTFNVPTSKLENDLELSESDDDHKKQTSTGRASPTNDNSSDSSDSGSSDSESEESTIGARQGGGADANNRKLTNCNRVEESAIASGSVPETNAWNLSKYFLKEKSVGLDGGCHDNIKHEPPNRLDDSSSPAPSPTTFTRHEIITPINPISPIDIKTESLAQDFSKANSNNNCLQLQPDQIKSETFEKSPSSSPEKVQHSDTVESDQIESVLAEAKGLAEIKPVSDLGSSSDADDTKPKPLPLPVSKSPAKKPVKRRRKVQKDKKIPNSDSSDEDCDLSSANNLSDRSRSVEKEKKGRGRPRKNPVAAPSTVSTNKSPAVTPVKNALANKRDPAVRKGGPGRRTSRQNSTAIPISREILETTTDSSSDDDRPPPTKSSILPSPTLSASAQVIPAKLAEIGSRGGSASGVPVVKPHTKVDNNVSVATSKSSDDDDDDDDDDDSSSSSDNSDDERVPSLRDRASPRQQSLSEHHSSSPSHHSTSSSSEDHSDSDSESPPREDKKIRDKTKSDKLKSDTLRKLFIGSNRGEGGAKGKGQVLIVDQSEESQNHPAKDAPPIHHEKILSPIAFKQHNNNNNNSNSNNDMQPVPLTPTSNITTTSNHLKSPRTSAAAVLIGGTTPTSGNAVSSVSSNNTSNSKSPALRTPERMPAMSINSKIHSVNNNSNVSNSNVHTISSPIICRIDLSRVQIPKAWLQNSQRMRDNTSNSNGSTQIQSAPHSDDDRLRSPKLPLTPRCGTNSSSKLNHKILDSGGSVNSSPSMNSRLVNSDSIGNQIATTASSPVSSRYGDGGGLNSKNNYNVDNVGKGHSNVPNYPYNVDNHRLSNNNSDRLSPALQPPMTQLHPSLVSPKRELFLHAAAQMNSNSSGSIKHEPIKSEFTTDEYMSSKSQTLLENKCNLYNNPKLVGRNNNVIVKTECKNLFIGNDCDRSNQTQASPIDPIGGGAHGTVPPPMTTINAAALRALSPSDEPIPKNRRKRSSSSSSSPYKEKKRKKTTTGAPLQNEAFEQLPPTNHDRLSDKYSPPSPIVQTVYKSYFEREGDDAISGQDQEVYLQEAKRLKHLADRESGHFNQVALYLKAVLYFLLSATRMEQSDRIPSAFTIYKDTLSLIKFISSKFIMHPPQHGIDNTNKVSVLSLRCQSLISLKLYTLKRGESKEAQKTISHFINKAPEIINGNTPSISPSSVSSLGSGSNTPPLHVVPGRYPSVHHFPKYSAETTYPFEVHAAYQKQALAFNYLSSAHELWEQADNIVKKGNHMDFFIDLDRVNGPLSLHSSMYEIFKYVQYGLQKLKEM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -