Basic Information

Insect: Alloplasta piceator
Gene Symbol: -
Assembly: GCA_946863875.1
Location: OX333079.1:11431308-11457771[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 6.5e-08 0.0019 18.2 8.4 43 240 106 297 103 322 0.43

2 3 1.4e-08 0.00042 20.4 0.6 324 382 322 381 315 411 0.82

3 3 0.075 2.2e+03 -1.8 0.0 362 407 381 426 380 433 0.68

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	6.5e-08	0.0019	18.2	8.4	43	240	106	297	103	322	0.43
2	3	1.4e-08	0.00042	20.4	0.6	324	382	322	381	315	411	0.82
3	3	0.075	2.2e+03	-1.8	0.0	362	407	381	426	380	433	0.68

Sequence Information

Coding Sequence: ATGGTGGAGATATGTCGTCTGGATTGTATTTCGGTAAAATTATTCGACGGTTCAGTTACAATCGGTAGAGATGCGAATGTGCCGAACAACTTACGATGCATCAAATGTATATACGTGTGTATACGGGTATCAAAGGAAAGTGGAAAGAGCCGAAAGCGAGCGAAAGAGCAAAGGGGTTTCAAGGGTGAAGATGAGATCGGTGCCATAGCGGCGGTAACTCCCTCACAATGTCGCGGTTCAGACGAAAGAGAAGATCCACAGAGTAAAACGACGAGAGCTTGCAGCGTCGACCGAGCTTCCGTTAATCCGAGTGCTCAGGACCGGACGAGTCAGCAGATACAATCGAAACTGGGCAATTATTCGTTGGTGAAGCATTTGCTGGACGAGCCAAAACGTCTGATCGGTATCGAGGGTGTACCGGCTAGTCCGGCGCCATTGAACGCGTCGTCGATCGTAAGGATACCCTTGGCCGCAAATCCATGTCGAAATTCACCTTCGTCCCAGGAGTTCAAGAAGCCCGGGAGCGGGGGACCGAGATCATCGTCGAGCTCATCCTCGTCATCGGCGACGAACATGAATACCGGGACAACGACGAACGCCGCGGGCTCGAGCGTCTCGAGTCACGCGTCTCAGCGAGGTGGATTTATAAAGCCGGCAGACGGTAAACCACCGTACGGGGGTAGAGGTGGATATCCTGGTCAACCGGTCAAACACGGTGGTAACAGCAACGATCATCGGAGCCACGGTCTCCTTCCGGCAAAGGGTCCACCGCCTCCTCCTCCGCCTCCTTCTTCTTCTTCTTCTATCTCGTCGTTGTCCTCCACTTCGTCGTCAACGACTGCCGTCAATTCTCATACCGGCACGTTGGGCTCCGTCGGGAGCCTCGTTACTTCCGGTAACGGGTCTTCCACCGTTACAAACAGCAGCGTTGTTACTCCTGTCAACACGAACCGAGCCCACTCGGCAGGTTCCAGACTGTCGAGGCTACCCCTCGACAATGGTACCATTTCCCGGCACGGCGTCAACGAGAATTCAGCCGATCTGGAGAACATTCTCAAGGAAATGACGATGCCGCCCACACCGCTCACAGCCATAGCCCAGACACCGAGGAAGGAGCTCGAGTCCAAGTTCACATTCAATCCAGTGCTCGCTAAGCTGACCGAGGTGTCATCGAACGAGCCATCAAAGCCACCACTTTTTGTTCGAAGCGTCGAAAAGCTCTCCTCCTCGCTTCATTGTCCTGTGACTGTGAATACGGTTAACGATAGCTCGCAAACGTCGACGTTGCCCGATCGATTAAACGGAGGAACAAAGAAATAG
Protein Sequence: MVEICRLDCISVKLFDGSVTIGRDANVPNNLRCIKCIYVCIRVSKESGKSRKRAKEQRGFKGEDEIGAIAAVTPSQCRGSDEREDPQSKTTRACSVDRASVNPSAQDRTSQQIQSKLGNYSLVKHLLDEPKRLIGIEGVPASPAPLNASSIVRIPLAANPCRNSPSSQEFKKPGSGGPRSSSSSSSSSATNMNTGTTTNAAGSSVSSHASQRGGFIKPADGKPPYGGRGGYPGQPVKHGGNSNDHRSHGLLPAKGPPPPPPPPSSSSSISSLSSTSSSTTAVNSHTGTLGSVGSLVTSGNGSSTVTNSSVVTPVNTNRAHSAGSRLSRLPLDNGTISRHGVNENSADLENILKEMTMPPTPLTAIAQTPRKELESKFTFNPVLAKLTEVSSNEPSKPPLFVRSVEKLSSSLHCPVTVNTVNDSSQTSTLPDRLNGGTKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -