Basic Information

Insect: Ooceraea biroi
Gene Symbol: lilli_1
Assembly: GCA_003672135.1
Location: NC:6881002-7008953[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 9.1e-09 0.0001 21.0 1.2 31 130 41 147 28 185 0.70

2 9 1.8e-11 2.1e-07 30.0 1.1 345 438 246 337 229 359 0.75

3 9 0.02 2.3e+02 0.1 22.6 445 503 419 475 395 489 0.54

4 9 1 1.1e+04 -9.9 26.4 98 250 519 669 489 685 0.37

5 9 0.12 1.3e+03 -2.4 6.5 453 487 685 719 664 727 0.68

6 9 1 1.1e+04 -8.9 14.2 98 235 692 827 679 841 0.31

7 9 0.068 7.8e+02 -1.6 2.8 446 487 968 1009 936 1013 0.70

8 9 0.55 6.3e+03 -4.6 9.9 134 214 1038 1117 1017 1163 0.39

9 9 0.026 2.9e+02 -0.2 3.1 126 243 1197 1314 1167 1337 0.50

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	9.1e-09	0.0001	21.0	1.2	31	130	41	147	28	185	0.70
2	9	1.8e-11	2.1e-07	30.0	1.1	345	438	246	337	229	359	0.75
3	9	0.02	2.3e+02	0.1	22.6	445	503	419	475	395	489	0.54
4	9	1	1.1e+04	-9.9	26.4	98	250	519	669	489	685	0.37
5	9	0.12	1.3e+03	-2.4	6.5	453	487	685	719	664	727	0.68
6	9	1	1.1e+04	-8.9	14.2	98	235	692	827	679	841	0.31
7	9	0.068	7.8e+02	-1.6	2.8	446	487	968	1009	936	1013	0.70
8	9	0.55	6.3e+03	-4.6	9.9	134	214	1038	1117	1017	1163	0.39
9	9	0.026	2.9e+02	-0.2	3.1	126	243	1197	1314	1167	1337	0.50

Sequence Information

Coding Sequence: ATGTCGGTCCAGGCGGAGCAGGCGGCTGCGGGAGGCGGTCCTGATACGAGacaccatcaccatcatcatcataatCATGTGCATCATCACCACTCCAACGTGCATGTCTCCGCAGTTACGCCCAACTTGTTCCGCGCTCCAGTTAGGGTGAACCCGGACGCTCATGATCGTACCACGCAGCAAATTCAGTCCAAGCTAGGCAACTACTCGCTGGTGAAGCACCTCCTGGACGAGCCTAAGCGTCTGATCGGTATCGATGGCATCCCAGCGAGCCCGGCGCCGTCGCCGACGCCCTCTCCGCACAAGAGCAGCTCCAGCAGCTCCGGCAGCTCCACCAGGAGTTGTTCCCCGTCCTCGGTTCAGGAGTTCAAGAAACCCGGTGGACTCAGGGGCTCGTCGTCTTCCTCTTCCGCCAGCTCGTCCGCGAGCCATCAGCAGCGGGGTGGTTTCGTCAAGCCTGCTGATAGCAAGCCACCCTACGGCGGCCGTGGCGGTTATCCGGGCCAACCGGCAGTGAAACACGGTGGCAGCAATAGCAACGATCACCGTAGTCACGGCTTACTTCCGGCCAAGGGCCCGCCGCCACCGGCATCGCAGCCCACCAATTCTCCCGTGGGGACCGCGCCACCGATTGGCAATTCCGGCAGTTCCGGTGGCAGCCTCGCGAGCCGCGCTAACTTCGCTGGACGACTGAAGTTAATCGACGTCAACGGGTCTAACTCGAGGACGATCGACAATTCTCCGgatgtagaaaatattttgaagGAGATGACAGTGCCGTTCACGCCGTTGACAGCAATCGCGCAGACCCCGCGGAAGGAGCAGGAATCCAAGTTCACCTTCAACCCCCATCTGGCGAAGTTGACGGAAGTTACTCCGCCAGAGACCGTGAAGCCCCAACGCGAGAGGCACAACGACAGCAGACTGCCCACCGATCTCGAGCGGGATCTGAGTCTTTCTGAGGATAGCGAAGATGACGAGGGCAAGGAAACATCGTCGAGGCCGACGAGGGGCAACAGGACTCCGGATCTCCCGGCTGAtctGTCAACGCCATTGATCTCGGCTATGGCAGCAGCCCCACCTCCACCTCTGGCACCGGTATCACCGATAGACATGTCGCCCATGGGGCCACTGTCACCGTCACGACCGATCAGTCCGCCTAGATACTCATCACCACCACCGAAGCGGTCGACGCCGGAACGAGTGTCTCCTGCACCTGTCAATCCCTTGCAATCCGCGTGCTCTCCAGTTAACGCAGCCGTCGCCGGCCATCAGAGGCCACCGAGTCCGGCCGGTGAGGCGCCTCAAAGCTCGGGCAGCGCCAGTTCAAGCTCAGACTCGGGCTCGGATTCCGGTTCGGACAGCAGCGATtccgaggacgaggacgaccgTGCGTCCGCTCCACCGCCTACTAAGGGTCCCACGACACCGCCTTTGGCGTCGCCTAAACTGGAGAACGTAGTTGAGGAGCTGCCACCCGCTGTTGAAGAGTCCAAGCGCCGATGGGATCTCAGCTCGTTTTTCAACAAGACGGCGGTGCAACATGGTGATCAGAATTCGGAGTCCAAGCCGGCTCAGGATAATGCTAGGCGAGACGATACGCTTGGAGCGACAACGGAAACCAGCAGACCGCACAGAGAACAGTCTCACGATTGGCAGCTTGACGACGGAGCTCTGAAGAGGACGCACAACACGTCGATGAGGAATCTCCTCAGCGACAGTGATCATCACTCCGAGGAGAAAAATCGTCAGCTGATCGAAGATAATCGCGCCCAGGCGGAGAAGCCGAAAGCAGCCGATACTAGAAAGCGGCCAGGGCGACCCAGGAAGTCTGTCAAGAGTCCCAAGCGCAGCCACCGTACCTCAGACGAGAGTCTGAAGAACAGCAAATCACGCAGTCGGACGAGAACGGTCGCAACCTCCAGCAAGAAGAAGCAACCGATTTCGAAGGCCACGGTGGCCACTAGCGACGACAACAGTGACTTCAGGTCGCACGTTGCTTCCAGCGATTCCGACAGCGACCGTCGTGCGGCAAATGTGGCGGCCACAGTACCGGCGATCaccgagaaaagaaagagagtgagtgCATCGTCGAGCGACGACGAGAGCTCACCACCGAGTAGGAAGAACAATAATAGTGCCTCCGAGGATGACGCCGCGCGATGGAGAAGGGTCGCCATCAAGCGGAACAAGTTGTCGGACTCTCCGAAGAAGCAGGACAAGAAGAAGAGCCCGTCCAAAGGTAAACCGAGGCGGCCCAGGTCTAGAGTGAACAACGTTTCTGGCGTTCCAGACTCGGACTCTGAGGCTGAGATCGATTTGGAGGCAGTCATAAGAAACAATCGCATCCAAGTTGCGAGAGTGCCTCCTAGGCCACGAGCACCACCCACGAGGGCAGCCTCACCCGAAAATTCGGACAGTGATAACAGTCCGGCATCCAAGTTGCAAGAAGACGATGCTGGCAACGTTCAGgataagaaaaaaagtgaCACGTTGCGCCACGTCTTTTCCAAGAGCGGCGGAAAGGGTGGGGGGAAAGGTGGAAAAGGTGGTAAGGGCGGTGGTAAATGTGGCATTTACGTAGAGGAGTATACAAGTAACTCAGCAACGCACACACCGACAGGCGGAGACAGTCCCTACAAGAGACCGTCCTCGCGAATGTCCAGTGCCGTACTGAATTCCCTTCCGCCGGTCGTTCATTTGAACGGCACGCCGAGTCTTTTATGTAAAGTTGATCTTAGCAAGCTTCCGCACATATCGCAATTATCGAGAGGACAGGAATTGAGGCAGCGCACGGAATTACCGGACACCAGGCCGTCTTCGAGGCAGCGACCGTCTTCCAGACTGGCGGCGCAACCGCCGAGACCGCCAACGCCAGAAGAGGGCGAGATTGTTGACACCCCGCCATCGCAGCAAGTCTCATCGGACCACTTGAGAATCCATCGCGACGGACTGCTGACTGCTAGCGACGCCGGCAGAAGTTCACGTTCAGTGGTGAAGACCGAGTCGATCGCATCGGACTCGAAGAGCGGTGCTGTGCTCGGCGGTGCTAGTGGTGCTGGTGCGATTGGCCGCGGTAGTGGATCCAAGAGGAAACGTAATCCAAGTGGTAGTTCTATATCCAGTATGAGTCCTGTTCAATGTTCGGTGGACGCGAAAACCAAGAGCTCGTCCGATCATAAGGACAGGAAGAGACAAAGAAGACACGCAACGAACGACGATCCATCGTCCAGAACCGTGTCGAGTCAGcAGAACGACATCCAGCCAACAAATCATGAAAGGGTGGACAGGCAAGATGCGAACTTGCTGCCGCCACCGCCTGTTCCACCGCACCGCGTCTTTTATTCTTACTTTGATCCTCAAAATGAAGTCCCAGAGGATCAGGAGAGGGACCAGAACCAGTACCTGACAGAAGCTAAGCGATTGAAGCATAATGCCGACGAGGAAAACGATCTTACAGCACAGGGCATGATGTATCTAGAAGCGGCATTATACTTCCTTCTAACTGGCGACGCGATGGAAACCGACTCGGTTACGGAGAAGGCGTCGTATACCATGTTTAAGGACACTCTTAGTCTCATCAAATACATCTCGTCGAAATTCAAGAGTCAATCCAACAACTCACCTGAAAGCAATATACACACAAAGCTGGCTATACTAAGCCACTGGTGTCAATCCCTGCTATATCAAAAACTCTTTAATTTACGAAAGCAGGAAGTAAAGGAAATACAAAAGATTATGGCCGACTACAATCAAAAGCCTGCTCAAACGACGACACCGATGCAGCCCGAGGGACAGGGTACACCATCCCTGTCGCCTACGCCTTCGCCTGCTGGTTCTGTTGGCTCCGTTGGAAGCCAGAGTTCTGGATATAGCAGTGGTGAATTGGCACatcgtggtgcaacgtcgggGCAGGGTCCATCCGGACAATCTGTCAATTTGTCTGTACATGTTCATAATGCGGCGATTAAGCAAAGTCAACATTTGGGTCTCCTTATGAACAGCTTGGAACTGTGGGATCAGGCAATAAACAAGGCGAAGGAAGAGGAGCATAGAGAATTTTTCATCGACTTGGACCAGCGATTGGGACCCTTGACGCAGAGCAGCTCGCTACGCCAACTGGTGCGTTACGTTCAAGCGGGCATAAAGAAATTACGAGCCCTCTGA
Protein Sequence: MSVQAEQAAAGGGPDTRHHHHHHHNHVHHHHSNVHVSAVTPNLFRAPVRVNPDAHDRTTQQIQSKLGNYSLVKHLLDEPKRLIGIDGIPASPAPSPTPSPHKSSSSSSGSSTRSCSPSSVQEFKKPGGLRGSSSSSSASSSASHQQRGGFVKPADSKPPYGGRGGYPGQPAVKHGGSNSNDHRSHGLLPAKGPPPPASQPTNSPVGTAPPIGNSGSSGGSLASRANFAGRLKLIDVNGSNSRTIDNSPDVENILKEMTVPFTPLTAIAQTPRKEQESKFTFNPHLAKLTEVTPPETVKPQRERHNDSRLPTDLERDLSLSEDSEDDEGKETSSRPTRGNRTPDLPADLSTPLISAMAAAPPPPLAPVSPIDMSPMGPLSPSRPISPPRYSSPPPKRSTPERVSPAPVNPLQSACSPVNAAVAGHQRPPSPAGEAPQSSGSASSSSDSGSDSGSDSSDSEDEDDRASAPPPTKGPTTPPLASPKLENVVEELPPAVEESKRRWDLSSFFNKTAVQHGDQNSESKPAQDNARRDDTLGATTETSRPHREQSHDWQLDDGALKRTHNTSMRNLLSDSDHHSEEKNRQLIEDNRAQAEKPKAADTRKRPGRPRKSVKSPKRSHRTSDESLKNSKSRSRTRTVATSSKKKQPISKATVATSDDNSDFRSHVASSDSDSDRRAANVAATVPAITEKRKRVSASSSDDESSPPSRKNNNSASEDDAARWRRVAIKRNKLSDSPKKQDKKKSPSKGKPRRPRSRVNNVSGVPDSDSEAEIDLEAVIRNNRIQVARVPPRPRAPPTRAASPENSDSDNSPASKLQEDDAGNVQDKKKSDTLRHVFSKSGGKGGGKGGKGGKGGGKCGIYVEEYTSNSATHTPTGGDSPYKRPSSRMSSAVLNSLPPVVHLNGTPSLLCKVDLSKLPHISQLSRGQELRQRTELPDTRPSSRQRPSSRLAAQPPRPPTPEEGEIVDTPPSQQVSSDHLRIHRDGLLTASDAGRSSRSVVKTESIASDSKSGAVLGGASGAGAIGRGSGSKRKRNPSGSSISSMSPVQCSVDAKTKSSSDHKDRKRQRRHATNDDPSSRTVSSQQNDIQPTNHERVDRQDANLLPPPPVPPHRVFYSYFDPQNEVPEDQERDQNQYLTEAKRLKHNADEENDLTAQGMMYLEAALYFLLTGDAMETDSVTEKASYTMFKDTLSLIKYISSKFKSQSNNSPESNIHTKLAILSHWCQSLLYQKLFNLRKQEVKEIQKIMADYNQKPAQTTTPMQPEGQGTPSLSPTPSPAGSVGSVGSQSSGYSSGELAHRGATSGQGPSGQSVNLSVHVHNAAIKQSQHLGLLMNSLELWDQAINKAKEEEHREFFIDLDQRLGPLTQSSSLRQLVRYVQAGIKKLRAL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -