Basic Information

Insect: Ochlodes sylvanus
Gene Symbol: -
Assembly: GCA_905404295.1
Location: FR990124.1:1-32573[-]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.1 8.8e+02 0.7 0.0 15 30 138 153 126 161 0.77

2 5 0.008 69 4.2 0.0 15 37 407 429 404 431 0.90

3 5 0.0063 55 4.6 0.0 14 37 652 675 649 677 0.89

4 5 0.019 1.6e+02 3.0 0.0 15 37 854 876 850 878 0.88

5 5 0.013 1.1e+02 3.5 0.0 14 32 1130 1148 1127 1154 0.80

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.1	8.8e+02	0.7	15	30	138	153	126	161	0.77
2	5	0.008	69	4.2	15	37	407	429	404	431	0.90
3	5	0.0063	55	4.6	14	37	652	675	649	677	0.89
4	5	0.019	1.6e+02	3.0	15	37	854	876	850	878	0.88
5	5	0.013	1.1e+02	3.5	14	32	1130	1148	1127	1154	0.80

Sequence Information

Coding Sequence: ATGCGATTTGTGGAGGAGACACATGGAGCCGCGGAGGAGTCTGACTCGTCCGTGGCGACCATGGTGTCTGTGTCGTCTGCGGACGACGCAACGGGGGGATTCTGGCGCTCTGCGCGAAAACGCGGGCCCCCAGCGCCCCAAAAGGGTGACGAGGAGGAGGCGGAGTCCGAGTCGTCGTCGCTGCCAGGCGGCGAACTCGGGGACTCGACATCGGAGCTCAAAAAGAAGGCGGCAGACAGCGTGCTCCTAATTCAGGCGGTTGCCAGGAAGTCGAAAAACCTGAAGGGCACGCTGCAGAAGGAGCTCAAGGAGGCCTCTGCCAACCTAGGGGCGATCGTGGCGGAGCTGGCAGAGCGCTCCGCCTCGGAGGAGACGGCTCGGCTCGAAAGGGCCAATGCCCGCCTGCAAGGCGAGGTCGCTGAGCTCCGCAAGGAGGTCGCGGACCTGCGGGCGAGCCTTGTGGGCTTGCCCAAAGAGCCGAGCGGAGCCGTCGGAGCCGTCAGCGATGTCTCGTCGCTGACGCGTTCGATCATGAAGGAAGTGGGGGACATGATCGGCGCTAGGCTCGAGGCACTCGAGAGGCGGCTCCCTCCCCAGCCGATCGTCCGGCCGCCTTTGGCTGCCGACAGGGCGAGGGATGCGGTTGCGCCCCCCGCCGCCGCTCCTGCGGCCGGTGAGGCTGGGCCAGGCAGCCGGAAAAGGAAGGAGAAGGCGCCTCCTAAGGCTTACGCCGAGGCGGCAGCGCCGAAAGCCGGCGCCCCGAAGCCCCCGACGGCCCCCTCCGAGGAGTGGAGCACGGTGGTCAAGCGGGGCAAGCGGGGCAAGGTAAAGAAGGGCAGCGCACCGCCGGACAGGGCAAGGAGCTCTCGTCGGCAACCCGCCGGCCTTCGTCAACACGACCAACGCACACCCATACCGGATACCGATGTCCTGCGAACGGAGGAGGAGACACATGGAGCCGCGGAAGAGTCTGACTCGTCCGTGGCCACCATGGTGTCTGTGTCGTCTGCGGACGATAGCACGGGGGGATTTTGGCGCTCTGCGCGAAAACGCGGGCCCCCAGCACCCCAAAAGGGTGACGAGGAGGAGGCGGAGTCGGCCAAGAGAGACTTGAAAGAGGCCTCCGCCAACCTGGCGGCGATCGTGGCGGAGCTGGCGGAGCGCTCCGCTACCGAGGAGACAGCTCGGCTCCAAAGGGCCAATGCCCGCCTACAGGGCGAGGTCGGCGAGCTTCGTAAGGAGGTCGCAGACCTGCGGGCGAGCATGGCAAGCCTGCCCAAGGAGTCGAGCGGAGCCGTCGGAGACGACGTAGCCTCGCTGACGCGCTCGATCATGAAGCAAGTGGGCGACATGGTCGGCGCTAGGCTCGAGGCGCTCGAGAGGCGGCTCCCTCCCCAGCCGATCCTCCGGCCGCTTTTGGCCGCGGACAGGGCGAGGGATGCGGCTGCGCCCCCCGCCGGCGCTCCTGCGGCCGGTGAGGCCGGGCCAGGCAGAAAGAAGAAGGAGAAGGCGCCTCCTAAGGCTTACGCCGAGGTGGCAGCGCCGAAAGCCGGCGCCCCGAAGCCCCCGACGGCCCCCTCCGAGGAGTGGAGCACGGTCAAGCGGGGCAAGCGGGACAAAGTGAAGAAGGGCAGCGCACCGCCGGACAGGCCGGCAAAGTTGGAGGAGACCCCCGATACGGCTGGCGTGTTGAGTGTTCCGGCACGCCAGGTGAAAGGTCGGCAAACCGCCGACCTTCGTCAACACGACTTAAGCACACCCATACCGGATACCGATAGCATGCGATTTGTGGAGGAGACACATGGAGCCGCGGAGGAGTCTGACTCGTCCGTGGCGACCATGGTGTCTGTTTCGTCTGCGGACGACGCCACGGGGGGATTTTGGCGCTCTGCGCGAAAACGCGGGCCCCCAGCACCCCAAAAGGGTGACGAGGAGGAGGCGGAGTCGGCCAAGGGCGAGGTCGGCGAGCTTCGTAAGGAGGTCGCAGACCTGCGGGCGAGCATGGCAAGCCTGCCCAAGGAGTCGAGCGGAGCCGTCGGAGATGACGTAGCCTCGCTGACGCGCTCGATAATGAAGCAAGTGGGCGACATGGTCGGCGCTAGGCTCGAGGCGCTCGAGAGGCGGCTCCCTCCCCCGCCGATCGTCCGGCCTTCTTTGGCTGCCGACAGGGCGAGGGATGCGGCTGCGCCCCCCGCCGCCGCTCCTGCGGCCGGTGAGGCCGAGCGAGGCGGCCGGAAGAAAGAAAAGGCACCTCCCAAGGCTTACGCTGAGGGCCGGCCCGCGCGGATAGGTGGTTGCGGGCTGGCGAGGTGGTCGCTCCCAGCAGGCTTGGCGCGACAAGCCTGCTTGGGATGCGCAAGGTGGGGACCGCAGAGGAAGGTTGTCCTTCCTCTGCGGCCGAGGCGGAGCCGCTCCGATTCGCGGCCGGAGCGGCATTGGTGGGGCCGCAGGGGAAGAGGAATGCCGGTATTACGGTGCGCCGCTTTCCCTGTCCTCTGCGGCCGAGGTGTGGTTGGCGGTGGAGCCACAGATCTGATCCACCGCCGGGTGCTGGAGGGCGAGGTTGCCGAGCTTCGGAAGGAGGTCGCTGACCTGCGGGCGAGCATGGTTAGCCTGCCCAAGGAGTCGAGTGGAGCCGTCGGAGCCGTCAACGATGTCGCCTCGCTGACGCGTGCGATCATGAAGGAAGTGGGGGACATGGTCGGCGCTAAGCTCGAGGCACTCGAGAGGCGGCTCCCTCCCGCGCCGATCCTCCGGCCGCCTTTGGCCGCCGACAGGGCGAGGGATGCGGCTGCGCCCCCCGCCGCCGCTCCTGCGGCCGGTGAGGCCGGGCCAGGCAGCCGAAAGAAGAAGGAGAAGGCGCCTCCTAAGGCTTACGCCGAGGTGACAGCGCCGAAAGCCGGCGCCCCGAAGCCCCCGACGGCCCCCTCCGAGGAGTGGAGCACGGTCAAGCGGGGCAAGCGGGGAAAGCCGGATAAGAAGAAGGGCAGCGCACCGCCGGACAGGCCGGCAGCGCCCAAGAAGAGGGACCCGGCGGCGAAGCTTCGCCCCCCGCGCTCGGCTGCGGTTACAATAACCATCCAGCCGGGCGCCACCTTGGAGGAGACCCCCGAGACGGCTGGCGTGTTTGGTGTTCCGGCACGCCAGGTGAAAGGTCGGCAAACCGCCGACCTTCGTCAACACGACCAATGCGAACGCTTAACGGATTCCGATAGCATACGATTTGAGGAGACACATGGAGCCGCGGAGGAGTCTGACTCGTCCGTGGCCACCATGGTGTCTGTTTCGTCTGCGGACGACGCCACGGGGGGATTTTGGCGCTCTGCGCGAAAACGCGGGCCCCCAGCACCCCAAAAGGGTGACGAGGAGGAGGCGGAGTCGGCCAAGGGTGAGGTCGCTGAGCTCCGCAAGGAGATCGCGGACCTGCGGGCGAGCCTTGTGGGCTTGCCCAAAGAGCCGAGTGGAGCCGTCGGAGCCGTCAACGATGTCGCCTCGCTGACGCGCTCGATCATGAAGGAAGTGGGGAACATGATCGGCGCTAGGCTCGAGGCACTCGAGAGGCGGCTCCCTCCCCAGCCGATCGTCCGGCCGCCTTTGGCTGCCGACAGGGCGAGGGATGCGGCTGCGCCCCCCGCCGCCGCTCCTGCGGCCGGTGAGGCCGGGCCAGGCAGCCAAAAGAAGAAGGAGAAGGCGCCTCCTAAGGCTTACGCCGAGGTGGCAGCGCCGAAAGCCGGCGCCCCGAAGCCCCCGACGGCCCCCTCCGAGGAGTGGAGCACGGTGCTCAAGCGGGGCAAGCGGGACAAAGTAAAGAAGGGCAGCGCACCGCCGGACAGGCCGGCAAAG
Protein Sequence: MRFVEETHGAAEESDSSVATMVSVSSADDATGGFWRSARKRGPPAPQKGDEEEAESESSSLPGGELGDSTSELKKKAADSVLLIQAVARKSKNLKGTLQKELKEASANLGAIVAELAERSASEETARLERANARLQGEVAELRKEVADLRASLVGLPKEPSGAVGAVSDVSSLTRSIMKEVGDMIGARLEALERRLPPQPIVRPPLAADRARDAVAPPAAAPAAGEAGPGSRKRKEKAPPKAYAEAAAPKAGAPKPPTAPSEEWSTVVKRGKRGKVKKGSAPPDRARSSRRQPAGLRQHDQRTPIPDTDVLRTEEETHGAAEESDSSVATMVSVSSADDSTGGFWRSARKRGPPAPQKGDEEEAESAKRDLKEASANLAAIVAELAERSATEETARLQRANARLQGEVGELRKEVADLRASMASLPKESSGAVGDDVASLTRSIMKQVGDMVGARLEALERRLPPQPILRPLLAADRARDAAAPPAGAPAAGEAGPGRKKKEKAPPKAYAEVAAPKAGAPKPPTAPSEEWSTVKRGKRDKVKKGSAPPDRPAKLEETPDTAGVLSVPARQVKGRQTADLRQHDLSTPIPDTDSMRFVEETHGAAEESDSSVATMVSVSSADDATGGFWRSARKRGPPAPQKGDEEEAESAKGEVGELRKEVADLRASMASLPKESSGAVGDDVASLTRSIMKQVGDMVGARLEALERRLPPPPIVRPSLAADRARDAAAPPAAAPAAGEAERGGRKKEKAPPKAYAEGRPARIGGCGLARWSLPAGLARQACLGCARWGPQRKVVLPLRPRRSRSDSRPERHWWGRRGRGMPVLRCAAFPVLCGRGVVGGGATDLIHRRVLEGEVAELRKEVADLRASMVSLPKESSGAVGAVNDVASLTRAIMKEVGDMVGAKLEALERRLPPAPILRPPLAADRARDAAAPPAAAPAAGEAGPGSRKKKEKAPPKAYAEVTAPKAGAPKPPTAPSEEWSTVKRGKRGKPDKKKGSAPPDRPAAPKKRDPAAKLRPPRSAAVTITIQPGATLEETPETAGVFGVPARQVKGRQTADLRQHDQCERLTDSDSIRFEETHGAAEESDSSVATMVSVSSADDATGGFWRSARKRGPPAPQKGDEEEAESAKGEVAELRKEIADLRASLVGLPKEPSGAVGAVNDVASLTRSIMKEVGNMIGARLEALERRLPPQPIVRPPLAADRARDAAAPPAAAPAAGEAGPGSQKKKEKAPPKAYAEVAAPKAGAPKPPTAPSEEWSTVLKRGKRDKVKKGSAPPDRPAK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01082172;
90% Identity: iTF_01082172;
80% Identity: iTF_01082172;