Basic Information

Insect: Heteropelma amictum
Gene Symbol: bun_1
Assembly: GCA_959613375.1
Location: OY390722.1:200356-203301[-]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1 1.9e+04 -9.1 8.4 38 49 330 341 308 353 0.55

2 5 1 1.9e+04 -7.5 7.0 43 57 351 365 331 370 0.66

3 5 1 1.9e+04 -13.8 14.7 50 50 430 430 406 449 0.48

4 5 1 1.9e+04 -8.3 6.1 44 52 568 575 546 580 0.54

5 5 1.4e-30 2.8e-26 91.6 1.4 1 55 745 799 745 801 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1	1.9e+04	-9.1	8.4	38	49	330	341	308	353	0.55
2	5	1	1.9e+04	-7.5	7.0	43	57	351	365	331	370	0.66
3	5	1	1.9e+04	-13.8	14.7	50	50	430	430	406	449	0.48
4	5	1	1.9e+04	-8.3	6.1	44	52	568	575	546	580	0.54
5	5	1.4e-30	2.8e-26	91.6	1.4	1	55	745	799	745	801	0.97

Sequence Information

Coding Sequence: ATGGCGGAGAATGCGCACAAAAAGTCCTACACTCAGTTGGAGAGCggtagaaaaatatcaatgcCGGTCCATCGTACGACCAGCGAGACGATAAGACTGGGCGAACAGCCGGACAGGAGCAGCCTGTCCACGGCTAACGTCAATGCGAATCAGAACAATCAgtgcaaaaagaaaacatcgtCGTTCCAGATAATCAGCGTGACGATAGGCCCTCGGAGCAGTAACGACGCCGGCGATGATTCCAACGACGATCTGGACGAGTCGCACACCGACGATAATTCCGTGGAGTTTTCCAGGGTCACGGATCTGGACGTCGAAACACCGAGCTATTCGGAGGATACTTTTTCCAAAGAGGATGTATTCTTCAACCCGAGTAACGCCGCGCAGAATACAGCGCCGGTGATTCCGACGAGTTCGCAGTACGGTCTGGCGATCGTTCCGTCGGACGTTGGCATCGTCGTAAACGCGAGCAACGACGTTATAACCAACGCGACGGACGATAAGTCGGTTATCGACAATAATAACATAAATTCCCAGCCGATAAGTACGAAGCAGGAGGCGGACATAAGAGAGGCACATTCCCACGGTAGGAGCGAAAGATTCAAGGTCGTCAAGATCGAGAGCACCGAGCCGTTCAAGAGAGGAAGATGGACGTGCATGGATTATCTGGATCAAACGCTGGTGAATCAGCCGAGCGTCATTGGCGCCTCGAAGCTGTCGGACCCGAACGAGGTTTGTATCTCGTACGGAGTTACCGACAGCGGTACCGTTGTTAAGACGACGAGACAGAACAGCATCGTCGCGAACAACGAGAGCAAACAAACGATCGACATGAACGGTCACGTTACCCGTCAGGAAGTAGCGCCGTTGAGCTCGGTCGTTTTATCCATGGGTGGTGTTGCCGTTGGCAACGCGAACATCCAGAATGctcagcagcaacagcagcaacaacagtcGCAGccgcaacaacagcagcagcagcagcatcaacaAATGCAACAACACtttcagcagcagcagcagcagcagcagcagcagcagcagccgcaGCAACAGCAACCGCCACAACTGGCGCAATTGCAAGCGCAACAGCAGCTGTCGCAGCAACAACAGCCCGGCGTCAATCAATTGTTGCCGCAGACACAGGTGAGCAATCAACAAGTACCCCAATACGTCCAGTTTGCCAGCCAGGCACAGCAATCGCTCGGATTACCGCAGCAGCCGCAGCAGTATCAGCAGCAGGCCCAACAACAACAATATCAgacgcagcagcagcagcaacagcagcagcagcagcaacagcagcagcagcagcagcagcagcagcagcagcagcaacagcaacagcagccaGGTGGAGCGCAACAAGGAATGACTTTACCCTCGAACCTTCGGCCAATCAGCGCTAACAATCTGGGACAGCCGCAGAGCATGCCGCACGGCTCTATTCCTATTATTAGACAGTCTAATAATAACTATGTTTTGCCACAACAAAACGTGAATCATACGCAAGAAGATACGTACGTTACGATACCGGCGCAGAATCAATTATTGCCCGGACAGAACGTTTGTCAGTCGTCGGTGCCGCAGCCTGTCGGTTTCGTAACGCAGCCCAATATCCTCATTACGCAGCATCTGcctcagcagcagcagcagcagcagcaaccaTCGCCTCTCCAACAATCGCAACCGCAACAACAGTCATCGtcacagcagcagcagcagcaacaacaacaacaaattGCTCCGCAACAACCGCACCAACAGGGATTAACGCCGCAGATACAGATGACGCAAATCTCCGAGCCAATAAACGCCATGCAGAGTATGCAGGGCATACAAAACGTTCACAATGTTCCTCAAACGGTTGTCCAACAGGCGCCACCGACGGTCGTTCACGGTCAAGGATTAGCGAGGACGCAAGTCATGCCCGTGGGACAAGTTCAGCCGCAATCGAGCTTTGGCAATACTCAGGTGCAGATGAGCCAAATGCCACCGAGCGGACAGAGCATCGTCGGTGGTACCGGTGCCAGCGGGGGCGGTAACGTTCAGCAGCAAGGTAGCGTGAATTTTAATCAGCCGGAAACGGAGCAGGGCTCCGCTACGAGCGTCGCAGTAGCGTCACAATCGACCGAAGCCAGACAGAACAACGATGACCATCACAAACTCGAGGACAATGAAAGTATGTCGGGGACGAGTGCCATAGCGATCGATAACAAGATTGAGCAGGCTATGGACCTGGTGAAGAGTCATCTCATGTTCGCCGTACGCGAGGAGGTCGAAGTGCTGAAGGAGAAGATTGCCGAGCTGATGGGCCGGATAAATCAGTTGGAAGCGGAAAATTGGATTCTCAAGCTGCACGCCTCGCCCGAGACGCTCGCCCAACTGAATCAGACGATAACCAAATTTTCCCAAAACAATTTAGGAAGCGGTCAGTAG
Protein Sequence: MAENAHKKSYTQLESGRKISMPVHRTTSETIRLGEQPDRSSLSTANVNANQNNQCKKKTSSFQIISVTIGPRSSNDAGDDSNDDLDESHTDDNSVEFSRVTDLDVETPSYSEDTFSKEDVFFNPSNAAQNTAPVIPTSSQYGLAIVPSDVGIVVNASNDVITNATDDKSVIDNNNINSQPISTKQEADIREAHSHGRSERFKVVKIESTEPFKRGRWTCMDYLDQTLVNQPSVIGASKLSDPNEVCISYGVTDSGTVVKTTRQNSIVANNESKQTIDMNGHVTRQEVAPLSSVVLSMGGVAVGNANIQNAQQQQQQQQSQPQQQQQQQHQQMQQHFQQQQQQQQQQQQPQQQQPPQLAQLQAQQQLSQQQQPGVNQLLPQTQVSNQQVPQYVQFASQAQQSLGLPQQPQQYQQQAQQQQYQTQQQQQQQQQQQQQQQQQQQQQQQQQQQQPGGAQQGMTLPSNLRPISANNLGQPQSMPHGSIPIIRQSNNNYVLPQQNVNHTQEDTYVTIPAQNQLLPGQNVCQSSVPQPVGFVTQPNILITQHLPQQQQQQQQPSPLQQSQPQQQSSSQQQQQQQQQQIAPQQPHQQGLTPQIQMTQISEPINAMQSMQGIQNVHNVPQTVVQQAPPTVVHGQGLARTQVMPVGQVQPQSSFGNTQVQMSQMPPSGQSIVGGTGASGGGNVQQQGSVNFNQPETEQGSATSVAVASQSTEARQNNDDHHKLEDNESMSGTSAIAIDNKIEQAMDLVKSHLMFAVREEVEVLKEKIAELMGRINQLEAENWILKLHASPETLAQLNQTITKFSQNNLGSGQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -