Basic Information

Insect: Drosophila nigromelanica
Gene Symbol: lilli_1
Assembly: GCA_004149445.1
Location: SCDR01000284.1:26303-35533[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 1.1e-09 2.9e-05 24.1 12.6 5 247 6 230 2 261 0.52

2 8 1 2.7e+04 -10.5 26.1 431 487 416 469 410 480 0.54

3 8 1 2.7e+04 -8.4 19.2 139 184 472 516 464 547 0.38

4 8 0.41 1.1e+04 -4.2 0.2 494 511 592 609 580 612 0.62

5 8 0.0014 36 4.0 7.0 424 476 691 744 646 755 0.45

6 8 0.075 2e+03 -1.8 8.1 107 206 786 888 774 905 0.44

7 8 1 2.7e+04 -10.6 23.5 72 200 841 971 833 1006 0.41

8 8 1 2.7e+04 -6.0 18.7 102 183 1051 1131 1018 1167 0.43

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	1.1e-09	2.9e-05	24.1	12.6	5	247	6	230	2	261	0.52
2	8	1	2.7e+04	-10.5	26.1	431	487	416	469	410	480	0.54
3	8	1	2.7e+04	-8.4	19.2	139	184	472	516	464	547	0.38
4	8	0.41	1.1e+04	-4.2	0.2	494	511	592	609	580	612	0.62
5	8	0.0014	36	4.0	7.0	424	476	691	744	646	755	0.45
6	8	0.075	2e+03	-1.8	8.1	107	206	786	888	774	905	0.44
7	8	1	2.7e+04	-10.6	23.5	72	200	841	971	833	1006	0.41
8	8	1	2.7e+04	-6.0	18.7	102	183	1051	1131	1018	1167	0.43

Sequence Information

Coding Sequence: ATGGAGGATCCCGAGCGGCGGCGAAGACGCGAGCGCGAGAAAATTGAACGGCAACAGGGCATCCAGAGCGACGATCGGGAGACGAGTCTGTTTGGGGAGCCGCGTCGCCTGAATCCCAGCGAGGGTGATCCGAATATAACCGCCGCTTTGGGTGACTACACCGATGCCCGGGATTACATGAACTCTTCCACGGTGGGCATTTACAGGCAGACGCCGGGCGCGTCGAATGCGCGGCTGCAGGCGCTGCCGAAGGGTTTtggcagcgccgccgccatcaGCTCCACCTGCTCCACATCCGCCTCCtccacatcagcagcagcagcagctgcagcagcagcatcagcagcagcagccgccgcatcagcatcagcctcATCCGCCTCGGTGCCcacatcacagcagcagcagcagcagcaacaacaacactatcagcagcagcagcgggcgcCCACCTATCTGAAGCAGGCGGACAACAAGCCGCCCTACAATGGGCGTGGCGGCTATCCCGGGCAGCCGATGAAGAACGACATACCCTCGAGTAGCGGCATGGCGCCGCCTCGCGGCCCGCCCAGATcgtccgccagcagcagcagcaacaacaactcgtcCAGCGCCACAAACAATGcctcagcggcagcgacgtcagcgtcaACGTCCTCGCCCCTCGGCCCGCCCATGTCCACGCAAATGCCGAACGGCCGAGAGAAATCGTTTCTGGggccgccggcgccggcgctgccCAACGGCGGACGCTTCGTGCCGCCAGCGGCCAGCAGCAAGCGACCCAGCGGCACCACCGCCGGACTGCAGCCACCGCCACCAGAGAAGGATATTAGCAAAATAATCACCGAAATGACCAACAATTATCGTGTGACCCCGCTGACCTCGATCGCGGCGACGCCGCACGCTCCGATGCGCGAGAACTACAACCTGAATGGGCCCAATAAGTTTAAGTATGCATTTGACGCGGTGGATCCCATCAGTTCCCCGCCGGCGGCGAGCGCCTCCTCGCTGATGACGCCGCTGCTGACGCCGATAGCGCCGATCACATCGCCGATCGCCCCGCTGCTGACAACGCCGCCGCAGGCCACCCAGCTGCCACTGCCCGCCATGGTGGGCGCCACAACGCTGCCCACCTCCATGGCCATGGCCGCCGTCGTCACGCCCATTCAGCAACTGACGCCGACGCCCCCAAAAGCGTCGCCTACGCCGCCAGCGATAAAGCCGCTAAAAACGGAAAAGAATCACACGCTGGAGAAACAGGATTCATGCCTCGAGAACGATTTAGAGCTCTCCGAATCCGAAGATGAACGCAAAAAGGATGGTCGGTcagctggcaacagcagcaacagttccgAGTCGGATTCCAGCGAATCGGGCAGCGAGGCGAGCAGCAAAGGCGAcgcacagcatcagcagcagcagcacctgctgcaccagcaacagttgctgctgcaacagcaacaacaacaccaacaacaccaacaacaacagcagcagcagcagcagcagcagcagcagcaacgtctCGCGggcagcaaaaagaaatacagCCAGACGATAATTGCGAGCGGTGCGAACACGATCAGCGGTCTGCTCACCTCGAGTGGTTTGGGCggtgcagcaactgttgctgctgccgctgctgcggctgctgctggtgctggtgtcGGTGGCAATGTGAACGCTGcgtgtgttgttgctggcggcggcggcggcagcactGGCGGCGGTTCAACCTGCTCCGGCATGGGCACACTGAGCAGCTCCAGTTCGTCGAACAAGACGCCCTCGCCGACGGACAGCAACCGCTGGAATCTGTCCCGTTTCTTTCCGAAGCCGGCGAATCAAAATGCCGCCGAAAGCGTCTCCCCCGGCAACGTTGGCAACGTGAGCATGAAGGTGCCGGGCATCCTGCCCGGCGGTGCGCAGATCATACCCGAGTCCATCGAGGTGACCACGGCGATTGTGAAGAACGAGCAGCTGCACGAGGATGTGCGCCAGGTGGGCGTGGACGAGGAGGCGGGCGTGGAAGCTGAGcgctacagcagcaacatgagcGTAACTGTGAAGAAGGAgcaactggagcagcagcagcagcagcaacagcagcagcaacagttgctgacGGCGGAACAGCTGACGGCGAATCAAATCAAGCGCGAGTCGCGTCTGTCCGAttccgccagctgcagcagcgccaccggcagcagcagcagcagcagcagcgacggcgccgagttgccgctgccgctgcccggGCCCGGCGAAACGCTGCAGATACCCGGCGTGCCGGCGGCGATAACCAGCGTGCTGCGCCTGCCGCCCGCCACGGTGCACAAGGCGCCGCCCAACCACGTGACCTTGACGCCCATCGGACCGCTGCCGGCGTCGCCGAAGCAGCGCCAGAAAAAGCcgcgcaaaaagaaaatCGGCAAGCGCAAAAGTGATAAGAAGAAGATTTGCACGCTGACGCGCATCTTCAATCCCAAAGAGGGCGGCGCCAAGAAGCAGGGCCAGGTCGTGATCATTGATCAGtccgaggagcagctgcagcagcagcaacaacaacagcagcagcaacaacagcagcaggccaaaGAGTTTAAGGcgcgtgccacgcccacacagctGCTGGGCGCCACGCTGGCGTCGCCGGCGCGCACAACAACCCCTCATCTCACCTCGCTGATGTGCAAAATCGATCTGACAAAGTTGGCGCGAGTGCCGCCCGAATGGTATCAGAACAGCTACCGATTGTACGCGGACAACCACCAacatcaacaccaacaccaacaccaacatcagcagcaacatttggaGAGACTAAAGACGCAACAAAACGGGCATCTCAGCGGTCGCTCGCccaaggagcagctgcagcagcaacagcagcagcatttgctgcagcagcaacatgcgcAATATGCGCCCAATGGCTatgtgacagcagcagcagcaactgttgccgcTGTCTCCAAGCTGCTCGGCGGCGTCAAGCACGAGCACGGCGTCAAGCCAGAGCCGGAGCTGGACGCCGGCTATGCGGAGGCCAAATTCAAGCCGAATCACGTCAAGCAGGAGTTCCTTTTGAAACAGGagctgccggcggcggcgcgaCGACGCAAacgcagctccagctccagttcgagTCCCTACAAGGAGAAGAAGCGGAAAAAGGAGAAGCCCGAAAAGGAGCTGCCGGTTCTGCTGCCCGCCAACAATCACGAGCGATTATCGCGCGACAAGCTCGAGCTGCTCGAATCGGCAGCCAACGGCAGTCCCAAcaagccgcagcaacaacatcagcagcaacatcagcatcagcaacagcagcgccaattGCCCATGtcacaaacacaacagcaacagcagcaaccaacagcagcaacagcagcagcagcagcgccgctgccggcaactgttgccgctgttgttgcagccacACAACTGCCAACCACCTGCAGCGAAGCGGTGCAAacgacgccgccgccagcggcgccccctcccgccccccgCCTCATCTACCGCTCCCACTTCGACAACGAGGAGGAACACGCCGGCGACGACACCCTCAGaAAAAACGATCTGTTGCTGCAGGAGGCAATCCGGAGAAAGCGTGCCGCAGATTCGGAGCCTGATTCCTTCAACCAGATGACGCTTTACCTGGAGGCCATTGTCTACTTCCTGCTAACCGCCGATGCGATGGAACGTTGCAACATGGAGGCCACGTGGACCATGTACAAGGACACCCTGTCGCTAATTAAATACATTTCCTCGAAGAATCGACCCTATCAGCAGCTAACGAATGGCAAGCACGCATCGCACAATATAGTGGCCATACTCAGTTTGCGCTGCCAATCGCTGATATCCCTGAAACTTTACAAACTGCGCCGTGCAAATTGTCGAGCTATCATCACCAACTGCACGGAATTCTTTCGCACGGGCAGGGGGGATATATTAAATGGCAATACGCCGTCCTCCATATCACCGTCGAACTCGGTGGGCTCTCAGgGCTCCGGTTCGAATACGCCGCCTGGCAAAATAGTGCCTCAAGACATACACAATATGCTGTGCAAGCAGAACGAGTATCTCACCTATGTGAATAGCGCTCATGAGCTGTGGGATCAAGCCGATCGATTGGTGCGAACCGGCAATCATATAGacTTTATACGCAAACTGGATCACGAGAACGGGCCGCTGACGCTGCATAGCACGATGCACGAGGTGTTTCGCTACGTGCAGGCGGGCTTGAAGACGCTACGCGATGCAGTCTCGTATCCACAGTCGCAGTAG
Protein Sequence: MEDPERRRRREREKIERQQGIQSDDRETSLFGEPRRLNPSEGDPNITAALGDYTDARDYMNSSTVGIYRQTPGASNARLQALPKGFGSAAAISSTCSTSASSTSAAAAAAAAASAAAAAASASASSASVPTSQQQQQQQQQHYQQQQRAPTYLKQADNKPPYNGRGGYPGQPMKNDIPSSSGMAPPRGPPRSSASSSSNNNSSSATNNASAAATSASTSSPLGPPMSTQMPNGREKSFLGPPAPALPNGGRFVPPAASSKRPSGTTAGLQPPPPEKDISKIITEMTNNYRVTPLTSIAATPHAPMRENYNLNGPNKFKYAFDAVDPISSPPAASASSLMTPLLTPIAPITSPIAPLLTTPPQATQLPLPAMVGATTLPTSMAMAAVVTPIQQLTPTPPKASPTPPAIKPLKTEKNHTLEKQDSCLENDLELSESEDERKKDGRSAGNSSNSSESDSSESGSEASSKGDAQHQQQQHLLHQQQLLLQQQQQHQQHQQQQQQQQQQQQQQRLAGSKKKYSQTIIASGANTISGLLTSSGLGGAATVAAAAAAAAAGAGVGGNVNAACVVAGGGGGSTGGGSTCSGMGTLSSSSSSNKTPSPTDSNRWNLSRFFPKPANQNAAESVSPGNVGNVSMKVPGILPGGAQIIPESIEVTTAIVKNEQLHEDVRQVGVDEEAGVEAERYSSNMSVTVKKEQLEQQQQQQQQQQQLLTAEQLTANQIKRESRLSDSASCSSATGSSSSSSSDGAELPLPLPGPGETLQIPGVPAAITSVLRLPPATVHKAPPNHVTLTPIGPLPASPKQRQKKPRKKKIGKRKSDKKKICTLTRIFNPKEGGAKKQGQVVIIDQSEEQLQQQQQQQQQQQQQQAKEFKARATPTQLLGATLASPARTTTPHLTSLMCKIDLTKLARVPPEWYQNSYRLYADNHQHQHQHQHQHQQQHLERLKTQQNGHLSGRSPKEQLQQQQQQHLLQQQHAQYAPNGYVTAAAATVAAVSKLLGGVKHEHGVKPEPELDAGYAEAKFKPNHVKQEFLLKQELPAAARRRKRSSSSSSSPYKEKKRKKEKPEKELPVLLPANNHERLSRDKLELLESAANGSPNKPQQQHQQQHQHQQQQRQLPMSQTQQQQQQPTAATAAAAAPLPATVAAVVAATQLPTTCSEAVQTTPPPAAPPPAPRLIYRSHFDNEEEHAGDDTLRKNDLLLQEAIRRKRAADSEPDSFNQMTLYLEAIVYFLLTADAMERCNMEATWTMYKDTLSLIKYISSKNRPYQQLTNGKHASHNIVAILSLRCQSLISLKLYKLRRANCRAIITNCTEFFRTGRGDILNGNTPSSISPSNSVGSQGSGSNTPPGKIVPQDIHNMLCKQNEYLTYVNSAHELWDQADRLVRTGNHIDFIRKLDHENGPLTLHSTMHEVFRYVQAGLKTLRDAVSYPQSQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -