Basic Information

Insect: Copidosoma floridanum
Gene Symbol: lilli_1
Assembly: GCA_000648655.2
Location: NW:1799172-1897708[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 8.6e-09 9.9e-05 21.1 2.3 32 158 90 214 85 269 0.69

2 7 8.1e-09 9.2e-05 21.2 2.1 324 433 301 409 290 433 0.63

3 7 0.00034 3.9 6.0 16.5 433 495 508 567 453 578 0.67

4 7 0.082 9.4e+02 -1.9 25.9 110 248 658 793 635 809 0.52

5 7 0.0095 1.1e+02 1.2 9.6 434 499 907 969 827 987 0.64

6 7 0.99 1.1e+04 -5.5 12.6 142 206 1076 1132 1046 1146 0.36

7 7 1 1.1e+04 -7.9 25.8 91 275 1168 1362 1145 1367 0.41

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	8.6e-09	9.9e-05	21.1	2.3	32	158	90	214	85	269	0.69
2	7	8.1e-09	9.2e-05	21.2	2.1	324	433	301	409	290	433	0.63
3	7	0.00034	3.9	6.0	16.5	433	495	508	567	453	578	0.67
4	7	0.082	9.4e+02	-1.9	25.9	110	248	658	793	635	809	0.52
5	7	0.0095	1.1e+02	1.2	9.6	434	499	907	969	827	987	0.64
6	7	0.99	1.1e+04	-5.5	12.6	142	206	1076	1132	1046	1146	0.36
7	7	1	1.1e+04	-7.9	25.8	91	275	1168	1362	1145	1367	0.41

Sequence Information

Coding Sequence: ATGTACATAGAACCACGAGCCCAGGACGATTTGCCATTTACGCATTACTTCGACATCGCCTTAGAAACAAGCACAGCGTTTTATTGCTTTGAACCAGTTTTCGTGGACAGGGACCGGTTACGGGAGCGCGAACGACAAGCCCGCGTGGCCATGTCGGTCCAAGCTCAGCAGGCCGCGGTCCTGGCGGACCCGGACACCAGTCACGGCCACCACCATCATAGCCATCACAACCTCGGCCGACAGATCGGGCCAGATCTCGCGATCGAGTCGCTCTTCCGCGCCCCAGTCAGGGTGAACCCAGACGCGCACGACCGCACTACCCAGCAGATCCAATCGAAGCTGGGCAACTACTCGATGGTCAAGCATCTGCTCGAGGAGCCCCGCCGGCTGTACGGAATCGACCAGCACGGAGTCCCGCCCTCGCCTGTCTCGGCTTCCTCGGGCAGACTCAACGCGTCCTCCGCCCATAACACCCCGTCGAGTCTCAGGCTGAACTCCTCGACGAACCGCAACTCGCCGTCCTCGCAAGAGTTCAAGAAACCCGGTGGTCCCCGCTCCTCGACCGCCGCCCCACCCCCGCCCTCGTCTTCCGTGACGTCATCGTCTTCGACGTCGTCGACGACCCTGTCGTCCCACCAGCACCGAGGCGGCTTCGCCAAGCCTCCGGACGGCAAGCCTCCCCACGGCGGCCGGGTCGGCTATCCCGGTCAGCCCGCCAAGCACGGCGAGCACCGCGGCCACGGCGCCATGCCCCCCAAGGGCCCACCGCCGCCCCCACCCTCGTCGGCGCTGGCCCCCTCGACTTCTTTGGGCCCTCAAGGAATGCCAGTGATCGCCGGCGCGGTCCAGCAGCAGCCCGGAATCCCAGGGCACGGCTCGCAGGGCAGACTGCAGCATACCGCCAGCGTTAGGCTGCCCAAGCTGCCCATCGATACGGGATCGAGCTCGAGGCACATGAGCAGTAGTAGCACGCCAGAGGTGGAGACGATTTTCAAGgaaATGGGCATGCCACCGACGCCGTTGACCGCCATCGCCCAGACGCCCCGAAAAGAGTTCCCCGAGCCGAAGTTCAGCTTCAATCAAGTTTACACCAAGctggCTCAAGCACCGTCCCAGGATATCACGAAGCCTCAACGTGAAAGGCACCAAAATCGCAGGCTGTCTGCCGATCTGGAGCGAGACTTGAGTCTATCGGAGGACAGCGAAGACGATGAAGCTCCAAAGACGGTACCTTCAAGGCCAGTGAGAGATGGAAGGAGCCCCATGTCAGCCGATTTATCGGCGCCGCTGATCCCGAAGATGACTACGGCGCCGCTGATCCCGAAGGTGACTACGGCGCCGCTGATCCCGAAGATGACTACGGCGCCGCTCCCCATGGTCCCGATGTCCCCGATGGCCATGTCGCCCATGGGCCCAATGTCCCCGGCGAACGCACGGGGTCCCTCGCAACAGCAAGCACAGTCGAGCCTCGCGGCCAAACCGAGCCCGAAGCCGGCCGCCCCGACCCAGCCGAGGCACGCGGCCGATAGTCCCGTCGACGCCAGCAATAACCAGACGCACCAAAGACCGCCGAGCCCACCTGGCGAGGCGCCCGCTAGCTCGGGCAGCGCGAGCTCGTCCTCCGACTCGGGCTCGGACTCCGGCTCGGACTCGACCGACGACGACAGCGACGGGGAGGTGAGCGAGCCGTGCCAGAGCAGCGATCGGGCAGCGACGGCCACAACCGGTAACAACAACGCGTCGAGCAAGGGCCCGACTACGCCCCCGGTTGTGGTGGGGTCGCCGGGCGGGGCGCCGGTCGAGGAGCTGCCGCCCGCGGTCGAGGAGTCCAAGCCCAGGTGGAACTTGGGCTCGTTCCTGGTTAAGGCTGAGCCGCAGAACGGCGACGGTGGCAAGTCGGTGAGCGCCGGGGGTACCGGGGGCGCTGGCAATAACGgcaagaagaaggaggaggtcGCGAGGCGCGAGGAGGCGCCGGTCGTGGAGCCGGAGAGGCGCTCCTCGAGGCACTCGGAGACCAAGGAGTGGAGGCTGAGCAGTAGCCTCAGCGAGAGCGAACAGCCGAGCAGCGAGGCCGAGGCCAAGACGCCTAGCAacgagcaacaacaacagcagcagcagcagcagcagcaaccgTCGTCCTCGTCCAGGCCACAGGCGAAGCAGCAGGACAAACCAAAGCCCGTGGATGTGCGAAAACGGGGTAGGCCGCGCAAAACGGACAATAACCCGAAAGCCGCTCCGGCCGTAGTCCAGTCCCAGTCCGTAGTCACTAGCAACGCCGAGGAGTCGACCAAGTTGGCGGCAACGAAGCGCAGTAGGAAGCGCACGAACCAGGGCAGCAGTCCCTCTGCCCGGCGTAACAAGAAGCCACCACCGCCCTCGAAACCTATTCTGACGACGACGACCAGCGAGGAGGATAGTGACGGAGATCGACGGGGCGCCGATGGTGCCGGTGGAGTAATCTACAGCGACTCGGACTCCGAGCCGGCAGGGATCGCGCGTAGGCCCGTCGCGCCATCGTCTCTGTCCCAGACTGGCGCCGCGTCTCCCGCAAACGGAGGAAAGAGGCACAAAAGGCCGAGATTGGAGTTGTCGAGTAGCGGCGAGGATAGTCATGGACTCGATAACGAGAAAGCCATCGATGAGAGGCAACAGCACAAGCGGGGTAAACGATCGCGCGAGGATGACGCGTGTTTGGGAAGGTTGCCACAGGCAAAGCGAAGTAGAAAGGTAAGCGAATCGTCGAAGAAGGTCCAGGACAAGAAGAAGAGGACTACGAAAGTGAAGCCCAAAAGGCGAAGATCGCGGGTTACTCGAGTCTCGGAGTGTCCCTCGGAGTCGGACAGTGAGTCAGAAATTACCCATAGGACCAACCGAAAGATTGCTCGGGTGCAACCGAGGCCACGGCGACCGCCAACGCGCGCAACTTCGACCAACAACTCGGACAGTGATAACGGTCCGGCCTCCGTTAAAGCTCAAAAAGAAACAGGTGGCGGTGGTAAGGGCGGTGTTGTCGCTCAGGACAACAAAAAGAGTGCCCTGCGCCGTCTCTTCGTCGATTCTCGTGCCAAAGGAGGCAAGGGTGGTAAGGGCGGCAAAGGTGGCAAGGGTGGCGGCAAGTGTGGCATCTACGTCGAGGAATACACCGGGAACACGCCAACGCGCAGCGAGAGCCCGTACAAGCGCCGGCCGTCCCCGGCAGCTACCGCGCCGGCTGCCACAGTGGTCAGCAGTCAAGTCAGTCACGAAGacaaacagcagcagcagcagcagctgcagaAACCCCCCaagccgcagcagcagcagaaaccCCCCcagccgcagcagcagcaaccgCCGCAGCCGCAGCAACAGGACCAATTGCCCCCATCCTCGAGCAGCACCCCCGTACTTCCCATGACTGATGAAAATGTTACGCCAAGAATGGTCTGCAAGATAGATCTGACTAAGCTGCCTTGCATGTCCCTAGTGTCCAAGGGCCAAGAGATGAGACAGAGAACCGAGATGCCCAACACCAGGCCGTCCTCTAGGCAAAAATCGAGCTCGAGTCAGATTAAAAAGCAGAGACCCTCGACGCCTGAGGAGGGCGAGATCGTCGAGTCGATGCCAGGCTCCGGACGTGCCGAGAACAGCGACTCGAGCCCAAATCCAAACATCAAGAACAGCGGTAGCTCGAGCAACTCGAACGGTGGTAGGAAAGGTGCGAGCAGCAGTAGCAAGAGCAGTCGCTCGATTATGATCAAGTCCAAGCCTAAGAACGTTAAGTCAAGTGACACGAAGTTGCTCGAGGGCAAGCCGAGAAACGATGATATTAGCAACGGTGCTCGTAAAGCATCAAAGAGGAATCGCAAGGCAAGCAGCAGTTCGGTCTCGAGTCTAGACACGAGAGTCAAGATCGAGATCAAGgatgagaagaaaaagaagaagaggaaactCGAGGAGCTCGAAAACATTAGGTTTTCGTCCAGTCAGAACGATGTACTGCCGACGAATCACGAGCGGGAATCGAATCCCGACATGGGTCTGGCGCTGCAGCCTCTGCAACCTCAGCGTGTTttctattcaaatttttactcCCAGCCGAATGATTTGTCCGAAGACATGTATCATGAGCAATACCTGGCCGAAGCCAAGCGGTTAAAGCATAGTGCAGACGAGGAGGCTGACGTTACGACGCAATGTATACTCTACCTCGAAGGTGCAATTTATTTTATCCTCACAGGCCAGGCCATGGAATCTGCTCATGCACACATATCTGCTGGAGCTGCCTTTCGCATGTACAGAGATACTCTTTCCATTATCAAaTTCATTGCAACAAAATTCAACCCGCACGAAAATAATTCAGCCGAAAGTGAGATTCACACGAAGCTGCTTATCTTTAGTTATTGGTGCCAGGCATTGATATACCAGAAAATGTACTCCCTCAGAAAAACCGAAATCAAAGAAAACTGGGGTACTCTAGGGAGATACTTTGCTaaaCAGGTGCAACTGATACAGTCGGAGCCAAATCAAGGTACTCCATCGTTATCGCCTACACCCTCGCCAGCTGGCTCTGTGGGCTCGGTTGGTAGTCAAAGCAGTGGTTATAGTAGCGGCGAACTTGCCAATCGCAGCTTAGCCAATGGCCAGATGCCGGTACCAATTAATACCCACACGTGTGCCAGTGTGCCTCTCCACACTTATAATCTCATGCACAAGCTTCACGACGACATGTTCATGATTTTAAGCGCGCATGACAAGTGGGAGAAGGCCTGCTCCCTCGTCACCGATAAACATCGCGACTTTTTCATCCAGTTGGACGAAACACTAGGTCCACTGTCGCCACGCAGTTCGCCCTCAGACCTTGCTCGCTACGTGACAGCCGGCATAAAGAAACTGCGTTCCCTTTGA
Protein Sequence: MYIEPRAQDDLPFTHYFDIALETSTAFYCFEPVFVDRDRLRERERQARVAMSVQAQQAAVLADPDTSHGHHHHSHHNLGRQIGPDLAIESLFRAPVRVNPDAHDRTTQQIQSKLGNYSMVKHLLEEPRRLYGIDQHGVPPSPVSASSGRLNASSAHNTPSSLRLNSSTNRNSPSSQEFKKPGGPRSSTAAPPPPSSSVTSSSSTSSTTLSSHQHRGGFAKPPDGKPPHGGRVGYPGQPAKHGEHRGHGAMPPKGPPPPPPSSALAPSTSLGPQGMPVIAGAVQQQPGIPGHGSQGRLQHTASVRLPKLPIDTGSSSRHMSSSSTPEVETIFKEMGMPPTPLTAIAQTPRKEFPEPKFSFNQVYTKLAQAPSQDITKPQRERHQNRRLSADLERDLSLSEDSEDDEAPKTVPSRPVRDGRSPMSADLSAPLIPKMTTAPLIPKVTTAPLIPKMTTAPLPMVPMSPMAMSPMGPMSPANARGPSQQQAQSSLAAKPSPKPAAPTQPRHAADSPVDASNNQTHQRPPSPPGEAPASSGSASSSSDSGSDSGSDSTDDDSDGEVSEPCQSSDRAATATTGNNNASSKGPTTPPVVVGSPGGAPVEELPPAVEESKPRWNLGSFLVKAEPQNGDGGKSVSAGGTGGAGNNGKKKEEVARREEAPVVEPERRSSRHSETKEWRLSSSLSESEQPSSEAEAKTPSNEQQQQQQQQQQQPSSSSRPQAKQQDKPKPVDVRKRGRPRKTDNNPKAAPAVVQSQSVVTSNAEESTKLAATKRSRKRTNQGSSPSARRNKKPPPPSKPILTTTTSEEDSDGDRRGADGAGGVIYSDSDSEPAGIARRPVAPSSLSQTGAASPANGGKRHKRPRLELSSSGEDSHGLDNEKAIDERQQHKRGKRSREDDACLGRLPQAKRSRKVSESSKKVQDKKKRTTKVKPKRRRSRVTRVSECPSESDSESEITHRTNRKIARVQPRPRRPPTRATSTNNSDSDNGPASVKAQKETGGGGKGGVVAQDNKKSALRRLFVDSRAKGGKGGKGGKGGKGGGKCGIYVEEYTGNTPTRSESPYKRRPSPAATAPAATVVSSQVSHEDKQQQQQQLQKPPKPQQQQKPPQPQQQQPPQPQQQDQLPPSSSSTPVLPMTDENVTPRMVCKIDLTKLPCMSLVSKGQEMRQRTEMPNTRPSSRQKSSSSQIKKQRPSTPEEGEIVESMPGSGRAENSDSSPNPNIKNSGSSSNSNGGRKGASSSSKSSRSIMIKSKPKNVKSSDTKLLEGKPRNDDISNGARKASKRNRKASSSSVSSLDTRVKIEIKDEKKKKKRKLEELENIRFSSSQNDVLPTNHERESNPDMGLALQPLQPQRVFYSNFYSQPNDLSEDMYHEQYLAEAKRLKHSADEEADVTTQCILYLEGAIYFILTGQAMESAHAHISAGAAFRMYRDTLSIIKFIATKFNPHENNSAESEIHTKLLIFSYWCQALIYQKMYSLRKTEIKENWGTLGRYFAKQVQLIQSEPNQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELANRSLANGQMPVPINTHTCASVPLHTYNLMHKLHDDMFMILSAHDKWEKACSLVTDKHRDFFIQLDETLGPLSPRSSPSDLARYVTAGIKKLRSL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -