Basic Information

Insect: Ecdyonurus torrentis
Gene Symbol: lilli_1
Assembly: GCA_949318235.1
Location: OX439128.1:35218107-35256781[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.3e-10 3.1e-06 27.1 5.2 3 153 9 164 7 219 0.60

2 4 1 2.3e+04 -16.0 45.2 355 500 221 430 219 470 0.64

3 4 0.0022 50 3.3 16.6 108 291 549 725 514 732 0.60

4 4 1 2.3e+04 -5.8 21.3 76 270 914 1115 891 1157 0.41

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.3e-10	3.1e-06	27.1	5.2	3	153	9	164	7	219	0.60
2	4	1	2.3e+04	-16.0	45.2	355	500	221	430	219	470	0.64
3	4	0.0022	50	3.3	16.6	108	291	549	725	514	732	0.60
4	4	1	2.3e+04	-5.8	21.3	76	270	914	1115	891	1157	0.41

Sequence Information

Coding Sequence: ATGTGTTTGTTTGATTGTTTCAGCGTGGAGCGCGACCGTCTCCGCGAGCGGGAGCGGCAGGCACGAGCGCAAATGTCCTCGCAGGCAGCTGAGAGGGAGGACTCACTGCCCGCAGCCTCCGCCGCCATGGGGGGTGCACCGCTATTTGACGCCCCTGTCCGGGTGACGCCGTCGTCCACAGATCATGTGACGAAGCAGATCCAGAGTAAGTTGGGCAGTTACGAGCACGTGCGTCACTTACTAGATGAGCCTAAACGTCTGATAGGCGTGCAGACTGCATCAGCACACGCTGCTGCTGCTGCAGCAGCCGCCATGGAAGCTGCAAAGCGAGGACAACAACAACCGCCCTCGTCAGAGTTCCTCGTACCGAAACAGAAACTCGCGTCCTCTGCACCTCACAATGGTCGCACGCACCACCATCATACGAGCAGCAGTAACAGCGGCTCGTCACGCTATCCCAAGCCGGACTCGGGCAAGCAGCCATACGCACCACCAAGACCTTTGCTGCCAACCCCTCCAGGATCCTCGTCACAACATTCGCAGCCCACCAACAACCGTCCTAATGGTGCATTATCCAAAACTTCTGCTCATTTGCCGCCTTCACAGAGCAATCGGATTAGCCAGGTCGCCAAAACTTTACCAAAGTTAGAGGATCCTTCGgAGATGACAGAGATACTGCCTCCCCCTCTGTCCGGTATCATCACTCCTCGTAAGGAGCACCCTGATTCTCGTTTTAGCTTTGATCACCACCGCGCAGCACAGATCAAGCTGCGAGAAATACCTCCCCCTACGGCCACTGTCTCACAACCACCGCCAGAACCAAAGTCTACACCCACAGatcGCAGACTTCCACCCTCTGCTTCCAGTGTaacacaaaataacaacaacaattcATCTTCATCTTGCATTCTTGGAGATTTGAGCGTATCAGATTCAGATTCAGATGATGATGCACCACGAAATACAACTAAACAACCACCCCCACCAccgatAAAGAGAACAAGTAATAATAGTTCAGCTTCTTCCACCCCCAACGTATCTGCAACTACAAATAGGTTGCAGGTGTCTCCAGCCCTGAGTGCCGCTACCACCCCGAGTCACGCGGCGGCGGCTCCACCCCCGCTGCTCAGTCCATTTGCACCGGCCAGTGTGCGGATGGCGACCCCCTCGGCGATCGCTCCTGCCTCGGATAGTGGCACGTCCAGTGAGGAATCGAGCTCCAGCTCGGGCTCCGAGTCGAGTAGCgaagaagaggaggaggaaAGCGCTGTTGCACCCCCGGCCCCCGCAGTCGCCGCAGCTACCACCCCGCGACCCGCCCTTACTGCCGCATCACCACCCCGACCCCCGTCGCCCAAGGCGGAGGCACCCGAGTTAGAGCAGCGTAGCTGGAAGCTCGAGTCTTTCTTCAAGACAGATCGCGTCAAAGAGGAAGATACCAAGAGTGCCAAGTTGCCACAGGTGGCGACCAAGGCCGGTCAAGGACTTACTTCTCCTGCGCGCAGTGGTGAGTCGAGCGGACGTCGCGGTGCACCCCCGCTCAGCGATGACGAGGATGACGCGAGTGAAGAGGACCGCGGGCGTGACCTCGCGCCGGTTGAGCCTCCCACGCCACTTCAGCCTCTTCTTTCTGGACTCTCCAGCTCGGACTCTGACCGAGATCCACCCCCAAGAAAAAAGGCCCTTGATGCCCGACGTCGACAAACTCGCAAGAAGCGTAATTCAAGAAGTAGTAGTGAAGAAAGTGGAAAAGTGAGCAAAGTTGTTGATTCTGAGGATGAGGAAGAATGGAATACAACAGCTAAAAATCGTCCTCCTCGGCGAAGCAAAGCACGAGGCGAAGAATCTCGTCGCAGTGTCGATTCTCCTGCAGCTAGAAAGCAGCGTCGCACGCTTTCAAGGGAAGAAATCAAACCTAAGAAACCTGCTGGTCCTCCTCCAACGAAAACTCCAGTTAGTCGTGCTCGTACGAACCCCAAAGCCAAAGTTGTTAAAAGTGTTCAACAATGCCCGACTTCTGGAAGCAGTGATAGTGAGATTGACGTTGTGAACTCGGATGCCCCAAGTAAAAAACAACCTACACCACCACCACCTCCTACGTTCAACAAGAAACCACCATGGACAAGTGTTGTAACTCAAGCTAAGCCTTCAGCTGTGGTGGCTCCAAGGAAAGGGGTGGCCACAGGAAGCAAGGGCCGTACACAACATCTCATGAGCTCCACCAGCTCTGAATCAGATGAGGAAGAGTGTAAGCCAGAGACAGGTGGTCTCGGCAAGAAGGACGAGAGTCCACCAAAACTAGACACAGAGGGAAAGACTGTCCAAGATAAAAATAAGACCAGAATGGTTGCTAGACTCTTCCGTAAGAAGGATGATGGTGGTAAAGGTGGCAAAGGTGGTGCTAAGGGAGGTAAAGGCAAGGGTACTCCAGCTATCAAAGTTGAATGTCGTTCAGAACGCACCCTAGTTGAAGAGGACCCCTTGCCTATGATGAGCCCTGACAAAATGCTTCTCTCTCCTCTGCCAAGCCATGACACAACAAGAAGAGGTCGCAGTATTGAACCCCCTCCCCCTGCTCCAGCCCCTGTACCCAGTGTATCCCCAGTGCGCTCAAGATCTCCTCTGCGTATCATGTGCAGAATTGATCTTAACAGAATACGCTGTTTACCTAAGAAATCCTCAGAAATAAGAACTCGTACAGAATTAGCTAATACAAGGCAAGAGCTAGAAGACTCTGTACCTAAATCTCAAGTGTTATCTCGACTGTATGATACTAATAAAAGTGAATCCTCTCCTGCACATAACACCCCTCCATTAGCTCCTAGTGTTGGTCCTAGCAAGGGCAAGAAACGTAATCATGAGACTGAAGGAGCTAAGGGCGGAGAGAAGAGGAAGAAATCAGAGCGAGAGCGCAGACCTAGCGCCAGCTCTGTATCGTCCATTTCAACAGTGAGTAGCCGCATGTCAAACACGAGCACACGACCAGGAGGCACTGAAGAAGATCGGAGACATCACAGGCGCAGTGGCAGGCACAGAAACCACGACGATGAGGAGGCAGTGAGGAAAAGGAGGGTAGCTGAGGAGCCACCACCTAGCAAACTGTCTAGTCAGagTCAGGAAGGAAGCTGGGCACCTCAACCCTCACCGACCAATCACGACAGGGTGTCGCACAGCTTTTGCAGTGACGAAGGAGAACTGACAGCCCCTAAAGCTCCTCTGCTGTCTCCACTGGCTTCCCCCAACGAAATGTTCCACTCTCACTCACCTGCATTCGCTGCTGCCTCTACTGCAAGCTCACATGGTGGCAGCGCATGGCGAGGATCCTCCCAGGAGTGGCCAACACCCTCAACATCACGCACCTACTTCTCGTACCTGGAGCATGCCGAAGATGATGCCACAGATGAGGAAAAGGATCAGAACAGGTACCTGATGGAAGCAAAGCGTCTGAAACATGCTGCTGATCGAGAACAAGATCACACAGCTCAAGCCATGATGTACTTAGAGGCAGTGCTATATTTCCTATTGACAGGAAATGCAATGGAGACAGAAAGTGTAACTGAGAAAGCAGCATTCACCATGTACAAGGATACTCTTAGCCTTATCAAgtaCATTTCTTCAAAGTTCCGAAATCAACCACAGCACAACTCAGCTCAAGCAAGCATAGACAACAAACTCAATGTTTTGAGtCTGAGATGTCAGTCGTTGTTGCATCTGAAACTCTTCAAGATGAGGAAGCACGAAGTAAAAGAGTACCAGAAGATTCTGGGAGAATATCACCAAAAgGTTGGACCCAGTGCACCTACTATTGCTGGTGGTCCCGAAATGTGGGGTACTGTACGTACATCAGAAACCCCCTCCCCTCAGTCCCCCACCCCCTCCCCCGCAGGTTCTGTGGGTTCAGTGGGCAGCCAGAGCTCTGGCTATAGCAGTGGCGAGTTGGCACGACCCTCAGGTCAACCAGGTGCGGCTCCAGCACCCCCCAGCCAGCCCCCTGCAGCCAACATGGGCCCATGTGTTGCCATTCCTCTTGGAGTGCACTCTGCCATGCAGAAGCAGAATCAGCACTTCATTTACCTTCAGAGCTGCCATGAGTTGTGGGATCAGGCAGATTCTCTTATACACAAAGGCAAATCCATTGATTTCTTCATTGCCCTGGACAATGAGTGTGGGCCACTAACTCTGCACAGTTCTCTCAACCACCTGGTTCGCTACGTCAGAAGAGGAATCAAGCACCTCAAAGACGTGTAG
Protein Sequence: MCLFDCFSVERDRLRERERQARAQMSSQAAEREDSLPAASAAMGGAPLFDAPVRVTPSSTDHVTKQIQSKLGSYEHVRHLLDEPKRLIGVQTASAHAAAAAAAAMEAAKRGQQQPPSSEFLVPKQKLASSAPHNGRTHHHHTSSSNSGSSRYPKPDSGKQPYAPPRPLLPTPPGSSSQHSQPTNNRPNGALSKTSAHLPPSQSNRISQVAKTLPKLEDPSEMTEILPPPLSGIITPRKEHPDSRFSFDHHRAAQIKLREIPPPTATVSQPPPEPKSTPTDRRLPPSASSVTQNNNNNSSSSCILGDLSVSDSDSDDDAPRNTTKQPPPPPIKRTSNNSSASSTPNVSATTNRLQVSPALSAATTPSHAAAAPPPLLSPFAPASVRMATPSAIAPASDSGTSSEESSSSSGSESSSEEEEEESAVAPPAPAVAAATTPRPALTAASPPRPPSPKAEAPELEQRSWKLESFFKTDRVKEEDTKSAKLPQVATKAGQGLTSPARSGESSGRRGAPPLSDDEDDASEEDRGRDLAPVEPPTPLQPLLSGLSSSDSDRDPPPRKKALDARRRQTRKKRNSRSSSEESGKVSKVVDSEDEEEWNTTAKNRPPRRSKARGEESRRSVDSPAARKQRRTLSREEIKPKKPAGPPPTKTPVSRARTNPKAKVVKSVQQCPTSGSSDSEIDVVNSDAPSKKQPTPPPPPTFNKKPPWTSVVTQAKPSAVVAPRKGVATGSKGRTQHLMSSTSSESDEEECKPETGGLGKKDESPPKLDTEGKTVQDKNKTRMVARLFRKKDDGGKGGKGGAKGGKGKGTPAIKVECRSERTLVEEDPLPMMSPDKMLLSPLPSHDTTRRGRSIEPPPPAPAPVPSVSPVRSRSPLRIMCRIDLNRIRCLPKKSSEIRTRTELANTRQELEDSVPKSQVLSRLYDTNKSESSPAHNTPPLAPSVGPSKGKKRNHETEGAKGGEKRKKSERERRPSASSVSSISTVSSRMSNTSTRPGGTEEDRRHHRRSGRHRNHDDEEAVRKRRVAEEPPPSKLSSQSQEGSWAPQPSPTNHDRVSHSFCSDEGELTAPKAPLLSPLASPNEMFHSHSPAFAAASTASSHGGSAWRGSSQEWPTPSTSRTYFSYLEHAEDDATDEEKDQNRYLMEAKRLKHAADREQDHTAQAMMYLEAVLYFLLTGNAMETESVTEKAAFTMYKDTLSLIKYISSKFRNQPQHNSAQASIDNKLNVLSLRCQSLLHLKLFKMRKHEVKEYQKILGEYHQKVGPSAPTIAGGPEMWGTVRTSETPSPQSPTPSPAGSVGSVGSQSSGYSSGELARPSGQPGAAPAPPSQPPAANMGPCVAIPLGVHSAMQKQNQHFIYLQSCHELWDQADSLIHKGKSIDFFIALDNECGPLTLHSSLNHLVRYVRRGIKHLKDV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -