Basic Information

Insect: Blattella germanica
Gene Symbol: lilli_1
Assembly: GCA_003018175.1
Location: PYGN01000177.1:616106-964492[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 4.2e-11 1.2e-06 28.8 0.0 4 114 27 133 26 154 0.77

2 8 9.2e-07 0.026 14.4 30.2 343 513 245 460 228 461 0.61

3 8 1 2.8e+04 -13.9 23.6 84 229 509 669 479 686 0.34

4 8 1 2.8e+04 -12.5 27.2 433 494 659 723 645 734 0.65

5 8 1 2.8e+04 -16.8 29.2 99 255 721 872 698 891 0.43

6 8 1 2.8e+04 -15.0 29.6 89 269 800 987 763 994 0.43

7 8 0.016 4.4e+02 0.5 4.8 113 190 1088 1164 1066 1184 0.33

8 8 0.02 5.6e+02 0.1 29.6 94 250 1257 1409 1228 1423 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	4.2e-11	1.2e-06	28.8	0.0	4	114	27	133	26	154	0.77
2	8	9.2e-07	0.026	14.4	30.2	343	513	245	460	228	461	0.61
3	8	1	2.8e+04	-13.9	23.6	84	229	509	669	479	686	0.34
4	8	1	2.8e+04	-12.5	27.2	433	494	659	723	645	734	0.65
5	8	1	2.8e+04	-16.8	29.2	99	255	721	872	698	891	0.43
6	8	1	2.8e+04	-15.0	29.6	89	269	800	987	763	994	0.43
7	8	0.016	4.4e+02	0.5	4.8	113	190	1088	1164	1066	1184	0.33
8	8	0.02	5.6e+02	0.1	29.6	94	250	1257	1409	1228	1423	0.52

Sequence Information

Coding Sequence: ATGGAGGgacaccaccaccatcatcaacACCATCGTAGTCATCATGCAGGAGGGCGTCACCATGGCATGGCATTcgtGGAGCGCGACCGTTTACGGGAGCGAGAGAGACAGGCGCGTGCGCAGATGTCATCTCAAGCAGAGCGCGAAGCCGAGGGGGCACCACTCTTCGGGGCTCCCGTCAGGgtCCAGCCCACGCAGGTGACCCGCCAACTCCAGAGCAAGTTGGGCGACTATCAAGTGGTGCAACAGATGTTGGTAGACGACTCGAAGCACTTGATAGGAATTGACGGCGTCCCCGCAAGCCCAGCACCTGGAGGAGGAAGTCACCCTTTCTTCCCGCCTGCCTCTTCCAGACTCCAGCCATCGGCGGAGTTCAAGAAACCCTCTACGCATCATAGTTCGGGGAACAACGGAAAAGTTAATAATCACTATCCACCTCATCCTCCTCATACCCGCGGTGGCTTCGTTAAACCAGCTGATGGGAAACCACCACACGGGGGCAGAGGAGGATTCCCTGGACAACCTGTGAAGCACGGAAGTGGCAGTAACAACGACCGGTCCAATGGTGGAATTGTACCACCGAAAGGACCACCTCAAGGCGGGGGTGGCGGAgggggtggtggtggtggtggcggCGGAAATAGCAGGGTTCATAATGCAGCAAGAAATCTCCCAAGAATTAATGTTAATCAGCTCCCTGGTCCAGGCCAGAAAGACTCATCTCAGCTGGGCAGTGCAGGTCAAAATGAAGTAGAAAGTATTCTTAAGGAAATGGTGATGGAGATGACCCCTATCAATATTGCAGGCATTGCGACACCGAGGAAGGAGTTGGAATCAAAATTTACCTTCAATCCCTTTCCCCCTAAGGTACCAGAACACCCAGCTCCCCGACAACCGGATTATACGAGTAGAAATCaaCGCAATACCATCCAACCGCCTCCGCCGCAGGTCCCAACGTGGGTTGACGACCTATCTATTTCTAGTGAAGATGAAGACGACAATAAGGAAGTGCAGAAACCTGTGGGTACTAGACTCAGTGGACCATCGGATAAATTGGAAGAATCaagATTGAGTGCTAGTCCTACACCTAGCGCCTTTGGGGCTATTGGCAGTAGACCTCCAGAGCCGTTGGCACCAATGTCCCCAGTGGTCCCTTCTCAGTCTCCAGGGGCCTGCAGCTCATCTACAGATTTGGATTCAGAAAGTGGGTCTGCATCAGATAGCGAAACAAGTAGCGAGGAATCAGGGGATGAGGCTCCTAATGAACCTGTGGAATCTACAGGGAGCAACACCGCTCCACAGTCTCACCTATCTCCACTGCCTTTGGAACCAATGGAAGAGCCTAAGCCACAAGACAGGTGGAATTTGCGGAGATTTCTGCAAACGGAAACGCAGCCACCTGGAGCAGAACAACAGGGAGAAAATGATTCTTCTAAACTTGGCAAGTCTGAATCGTCGCCAGTGACGACATCGGCAGTTCCTACCCATTTATCAGATCCAAGCATTCAGCAGCTGTCAAATGGGGCCAAAGGAAAAGTTGAAAGTGGTGCAGTTTCAGATGGAAGTGATTCAATtaaagaatttgaaaatgttGTCGAGGATCTGCAGCATCCTCCTCCATTAGTATCTAGTTTCTCTGATTCAGAGTCAGATGCGGAAGACAGCACAAAGAAGAAACAGCCTGTCGTCGAACAGAGAGTTAGAAGAAAGCGCCCAACTCTACCTACTCGACAACCGGAGCTGTCCGATAGCGAAAGTGAGGATAGCGATGATGGGATTAGGGAAAAAGGCAGACTTGCGAAAAGAAACGCAACTCGTTCCAAAACCAGTTCAAGATCTCAAAATTCATCTGATGAAGAACCAACAGTGGAACCCCCAAAGCCTCAAATAGTAAAACAACAAAATGGTGGTAATAGTGCAAGATCTAAACCTTCTCTGTCTCCGTCTCCTGCTCGGTCAGTGGGGGATGGTAAGAAAAGGAAGAGGAAAGGTGAAAGGACTCCAAAGCAAACCCCTAGTAGAACTAGTGAAGTTGTGAAGAAACCTACAtcgtcttcttcatcatcatcttcgtcGTCATCTTCTGATGAAGATGAAAGACCGCAGCCAAAACATGCACGGTCTTCTTCAAGTTCATCAGAAGGTGAAATAAAAGACCCCAAACCTATAAGCAATTCAGCTAATAATGTAAGGTCTAAACAAGTGGCATCCAATCACAGTGACTCCGATGATTCAGACGTTGGGAGTAAAGTGAAAAGAAGACCCAGAATTTCTGCTAAACCAACAGTTACCCAGAATCGATCTGAAGACGAATTGCCAAGTATTAAACCAAATAATCGACGTAGGAATAGTAGAGATAAATTTGGCAAGAAAGGTAAAGTAGTTTTAAGTGAGTCTGATGATGATAGTGCACCAGAAAAGGGAAAGAACTTCACTAAAGCCAAACCAAAAGCAGTCTCCCCTCCAGTGCGCAGCGAGTCTGAAGAAAGGGAAGAATGGACAAAGACGAGTACTAAGACTCAAAACAGTGCAAAGAAACCAGGTAGAGGAAGAAGTAAGGCTAAAACTGGTGATAAAAATAACAGTATGACTGTTCAGGAAGAAAAGAAAGCTCTTGCCACAAAGGAAAAGAAAGTTCCAAAGGCTTCTAACAAGAAGCGAACTAAGGAAGAAGGTGGAACTGGCCCAAAGAAACAATCTGGACCTGGAAGGCCTCCTGGTGGTGGTTTTCGAAAgcataaattaaagataataaaaagtGAACCTCTCTGTCCAAACACATCTTCAGATAGTGAATCTGAAACAGTTACTTCTGCTAAACCTCCTCTAAATAAAAACCAGCGAGCAGCAAGTCCTGATTCTAGTTCTGATTCAGATAAAGGCAAACCTGAAGCGATAAAGAGGAAAGTGTCTTCAGATAGCGATAACAGCGAAGGATCGCCAGTTGTAACGCGCCCTCCGGTTTCAAAAATTGAAGAGAGTCCTCCTAAACTGGACACCGAAGGTAAAGTCCCTCAAGACAAGAAGAAAAGTGACACCTTGAGGAAACTTTTTGTTCCAACAAAGGGTGGTGCCAAAGGAGGTGGTAAAGGTGGTGCTAAAGGGGGTGCTAAAGGAGGGATATACTGTGCCAATGGGGGTGGGAAGGGGAAAGGTGTTGGGGCTAAGGGTAAAGGAGGATCGAAGACGCCCGGTGTTATAGTGGTGGATTGTGAATCTGAAAGGACGTCTTATCCAGAAGATGAGAATATGCCAAGACAAGTAAGTCCTCCTGTACCATCACCAATACCAAATGATGATTCCTCGAGTAAACTCGCTACTGTTAATTTTGAGTTAACGTCGAGTTCAAGCAAGGCTGAAAAAAGTGGTGCCACCCCTGGAAAGGCGAGTACTAGGGGACACAATTCTGATAAACCTTCACGAAGAAGATCTTCAAAGAAGGATTTGCAGAAATCCTCTAAACAGTCTGCAACTGCAGAAGCTGCACACGATGCTAATATGAATAAGAAAAATGCATCGGATATCCCTCAAGTGGACCTTCCTCCACTTGTGTATCGTGACGACGGATTTCCAAGTCTCATATGTCGTTTGGATCTATCAAGACTCTCGCAGATCCCCGTTTCTGGGGGTCCTGGTAAGAGGCCTAGTGGGGGGGAAGATATCAGGGTAAGGACAGAGCTGGCAGATACTAGGCAAGCGTGTGGAAGTGAAATAGAACATTCTAGTAAGGGTAAAAAGCAGCGGACTCAGTCGCCTACTTGTGAATCTCCTGAAGAAGGAGAGATAGTGATACCAAAGTGTGATAAGAAGAACTCGGATGAAGTGCTGGGTGAAAATGGTTGTGACAGTGTGACACGTAATCGTAGTGCTTCTAAAAAGCAGAAGAAGAGGAAAAGCAATAGAAGCAGGGAAGACTCCAGCTCTGTGAACCAGTCGGAAGTCAAAGATGGTACTCAAACTGAAGGGAATGAAAAATCTACCAGCAAATCATCCTCTAAACATCACAAAAAGAACAATGGTGGTGGGCATAAACGAGAACGCAGGCCCAGCGGTAGCTCTGTCTCATCTTTATCAACGGAATGCAGTAGAGTATCTTCTCAAGGCGGCAGCAACCATAGACATAAAGAAAGGCGTAGTCGTGACCATGGTACCAGTAAAAGACGTAAACTACATCAGCACACAGAAGAATCCAATGATCCTGCCACAAAATTATCTAGTCAAAGCACAGTTGCACTCACAGACATGCCTCCAACAAACCATGAACGAGAAGAAAATGGTGAAGAGATAGCAACTGCAGGTGGGGGAGAGTCACCTAGCTGTTCAGACCTACATTATCCTCCTGAACTTGCTGGAGTAAGCCAGCCAGGCTACTCACTACCTCCTGGTCATCCATATCCTGTACAAGACATGAACTGGCAACCTAAAGTATACATCTCATATTTTGAAAGAGGAGAGGATGATGAAGCTTCAGACGACGAGGACAGAGATCAGAATCAGTACCTTACTGAGGCAAAGAGATTGAAGCATGGAGCTGATACGGAAACAGACCACACAGCTCAAGGACTGCAGTACCTGGAAGCTGTGTTATTCTTTCTTCTCACTGGCAATGCCATGGAGCATGAGAGCGTGACAGAAAAAGCGGCTTTTACTATGTATAAGGACACTTTAAGTCTCATCAAGATTGGGTATGAATCAATTCAAAATTTCATTGAATTGCCTAAAATTCAAAGTGGCGGTGTATTTGAAGAAGAGACAGGTGTACATCAAGATGTAACAAACGTCAACAGGTACATTTCTTCAAAGTTTCGTAGTCAGCAGAACAATTCTCCACAAGGCAGCATAGACAACAAATTAGCGGTTTTAAGTTTAAGATGCCAGTCATTGTTGTAtctgaaattattcaaaatgcGGAAGCATGAAGTGAAGGAGTATCAGAAAGTTTTGGCAGACTATCATCAGAAGACTACTCAGCCTACACCGTTGCAGCCTGAACAATGTGGAGGCCAAGGtactccatcaccattatcaccAACACCCTCGCCAGCCGGGTCTGTGGGATCTGTTGGCAGCCAGTCATCTGGATATAGCAGTGGTGAACTGGCTGGAAGAACGGTGGGAAATGGTGTAGGCGGTGTCAGTGGCGTAGGGCAGCAGCCTCCAGCAGCCAACATGGGACCATGTGTTGCCGTGCCTCTGTCAGTGCATTCTGCAATGCAGAAACAGAACCAGCACTTCAGCTACCTTCTTTCATGCCATGAGTTATGGGAGCAAGCGGATGCACTTGTCTACAAGGGCAAACACAGAGatTTCTTCATTGAACTGGACCATTATTGCGGGCCTCTGACGATGCATAGTTCTCTAAATGACCTAGTGAGATACGTGAGAATTGGCATACAGAGGTTGAAGAAAATGTTCGACGAAGTGAGTTTGTGTGTTCCCATGAAGACACAGGAGTTCAAATAA
Protein Sequence: MEGHHHHHQHHRSHHAGGRHHGMAFVERDRLRERERQARAQMSSQAEREAEGAPLFGAPVRVQPTQVTRQLQSKLGDYQVVQQMLVDDSKHLIGIDGVPASPAPGGGSHPFFPPASSRLQPSAEFKKPSTHHSSGNNGKVNNHYPPHPPHTRGGFVKPADGKPPHGGRGGFPGQPVKHGSGSNNDRSNGGIVPPKGPPQGGGGGGGGGGGGGGNSRVHNAARNLPRINVNQLPGPGQKDSSQLGSAGQNEVESILKEMVMEMTPINIAGIATPRKELESKFTFNPFPPKVPEHPAPRQPDYTSRNQRNTIQPPPPQVPTWVDDLSISSEDEDDNKEVQKPVGTRLSGPSDKLEESRLSASPTPSAFGAIGSRPPEPLAPMSPVVPSQSPGACSSSTDLDSESGSASDSETSSEESGDEAPNEPVESTGSNTAPQSHLSPLPLEPMEEPKPQDRWNLRRFLQTETQPPGAEQQGENDSSKLGKSESSPVTTSAVPTHLSDPSIQQLSNGAKGKVESGAVSDGSDSIKEFENVVEDLQHPPPLVSSFSDSESDAEDSTKKKQPVVEQRVRRKRPTLPTRQPELSDSESEDSDDGIREKGRLAKRNATRSKTSSRSQNSSDEEPTVEPPKPQIVKQQNGGNSARSKPSLSPSPARSVGDGKKRKRKGERTPKQTPSRTSEVVKKPTSSSSSSSSSSSSDEDERPQPKHARSSSSSSEGEIKDPKPISNSANNVRSKQVASNHSDSDDSDVGSKVKRRPRISAKPTVTQNRSEDELPSIKPNNRRRNSRDKFGKKGKVVLSESDDDSAPEKGKNFTKAKPKAVSPPVRSESEEREEWTKTSTKTQNSAKKPGRGRSKAKTGDKNNSMTVQEEKKALATKEKKVPKASNKKRTKEEGGTGPKKQSGPGRPPGGGFRKHKLKIIKSEPLCPNTSSDSESETVTSAKPPLNKNQRAASPDSSSDSDKGKPEAIKRKVSSDSDNSEGSPVVTRPPVSKIEESPPKLDTEGKVPQDKKKSDTLRKLFVPTKGGAKGGGKGGAKGGAKGGIYCANGGGKGKGVGAKGKGGSKTPGVIVVDCESERTSYPEDENMPRQVSPPVPSPIPNDDSSSKLATVNFELTSSSSKAEKSGATPGKASTRGHNSDKPSRRRSSKKDLQKSSKQSATAEAAHDANMNKKNASDIPQVDLPPLVYRDDGFPSLICRLDLSRLSQIPVSGGPGKRPSGGEDIRVRTELADTRQACGSEIEHSSKGKKQRTQSPTCESPEEGEIVIPKCDKKNSDEVLGENGCDSVTRNRSASKKQKKRKSNRSREDSSSVNQSEVKDGTQTEGNEKSTSKSSSKHHKKNNGGGHKRERRPSGSSVSSLSTECSRVSSQGGSNHRHKERRSRDHGTSKRRKLHQHTEESNDPATKLSSQSTVALTDMPPTNHEREENGEEIATAGGGESPSCSDLHYPPELAGVSQPGYSLPPGHPYPVQDMNWQPKVYISYFERGEDDEASDDEDRDQNQYLTEAKRLKHGADTETDHTAQGLQYLEAVLFFLLTGNAMEHESVTEKAAFTMYKDTLSLIKIGYESIQNFIELPKIQSGGVFEEETGVHQDVTNVNRYISSKFRSQQNNSPQGSIDNKLAVLSLRCQSLLYLKLFKMRKHEVKEYQKVLADYHQKTTQPTPLQPEQCGGQGTPSPLSPTPSPAGSVGSVGSQSSGYSSGELAGRTVGNGVGGVSGVGQQPPAANMGPCVAVPLSVHSAMQKQNQHFSYLLSCHELWEQADALVYKGKHRDFFIELDHYCGPLTMHSSLNDLVRYVRIGIQRLKKMFDEVSLCVPMKTQEFK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -