Basic Information

Insect: Argyra leucocephala
Gene Symbol: bun_1
Assembly: GCA_963942445.1
Location: OZ012680.1:101576562-101579408[-]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.073 2.9e+03 -0.4 0.2 23 54 344 376 335 379 0.78

2 3 1 4e+04 -54.6 58.2 55 55 751 751 678 814 0.70

3 3 6.6e-28 2.7e-23 83.0 3.5 1 54 861 914 861 916 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.073	2.9e+03	-0.4	0.2	23	54	344	376	335	379	0.78
2	3	1	4e+04	-54.6	58.2	55	55	751	751	678	814	0.70
3	3	6.6e-28	2.7e-23	83.0	3.5	1	54	861	914	861	916	0.98

Sequence Information

Coding Sequence: atggccgAAAACCAAGTACATGAAAAAACATTTCATAAAGTACATAAAACTTCTCATGGATCAGCAGTAGGTAATAagcaatatgaaaaaaatgtagcTGGTGAGAATAAAACTGGTTCAAAATCGTTAGACGGTAAACAtcttacaaatataaaaaacgcAAGTGAAACTTTAAAATTAGGTGCAGCAAATGGAACTGGTGCATATAGAAATGGAACTGGTAATATGACAATTCAACAGTTACATATGAGTGCCGCACCAGCAGGAACCACTGTTGGAAGTATTACATGCGGTAATACATCACAACGTAAACCAAAATCATCATTTCAAATAACATCaatcacaataaataataaaagtgctGATAATGGAGATGATTCAGCTGATGATTTAGATGAATCTCATACAGATGAAAGTAGTCGTATTACAGATTTTGAAAACGAAACACCTAGTATATCAGATGATACATTTTCTAAGGAAgatgtatttttttcaaatcatgcATTAGGAACTGCACCAGTAATACCAACAAGTTCTCAATATGGACTTGTTGTAGTTGATCCAGAAGTGGGTGGAACTGGACAGAATAATTCACAAAATGTTCATGTTAGTGGCTGTGATGCTGGTATTAACATTGTTGGTCCAAGTGAAAAGGAAGTACAACGTCGGAGTAATAGATTCAAAGTTGTTAAAATAGAATCAACTGAGCCCTTTAAAAGAGGTCGTTGGATGTGTATGGATTACTTAGATCATACAACAAAAGGGACTGGAGATACTTCAACTGAAAATactaatgatattaaaaaatttggtgaAAATAATTCTAGTTTCAATACCCGCACGGGTAATAGCAATGATAATACAggtaaaaaatcaaatgaaagcAATTTAGATAAAACTAAAGCGAATGACGGTAGTAATAGTGGTGTTGGTGGTAAAACATCCAAGCAATCTTCCCCTGGACAAAGTTTGAAAACCCCAGCGTCACTGCCATCTAAAAAAAATCCTGTTGATGTTTCCGCTACAAATatcgaaaatatcaaaatgaacaaaatgtcaaatgttCATCAAAATTCTCAACAAGTTAAAACTAGTATGCCATCAAATACTACAAATATAAGGCATTCGGTACAGCAAACTGTTCACGGTCAAAGCTTACCACAGGTTCAAATCCAACAAATGCAACCACAACAAATAAATCAACAACAGCAAGTAGATATTGCAAATGTGGTAACAAGTGGATCATATATACCGGGTCAGTCGCAACCAATGCCAGTAGTATTTATGAACATgtcaaaatcagatcaattgcATGGTGCAACATTTCCATCTAATATTCAAAtgcaaaaaattgttataccaGATCAAATGCTTAATAATCAACAAAATCCCCAAATGAATACGGGAATTGTTATTCCTGCATCTTCAATGCCGTCTGATATTCAACAACATCAAATTACTGTATTGAGGCAAAGTATGCCACAAGGTGCGATGACCGGTgttgttttacaaaatcaacCGCAACAATCCAATATTCCAGGTGAAATGTATCATCAACAGCAACTTCAATCCCATAATATGCCACAAGTGTATCCATCCactataattaatcaaaatcctCAAGCAACAACTTTGACAGGAACTTATCATGATACGAGTGCAATGGGTGCCGTTGTTTTAcaaagtcaacaaccacaatgtAATATAACCAGTAAAATTTATCAGCAACAATATCAACCACATACCATGCCACAAGTATATCCATCCACCATGATTAATCAAAATGCTCAAGGAGCTGCTCTTCCAACAACTTATCATGATTTCAGGCAAGTGAACGAAATGATTCAAAATCAACGACAACAAATGATCAATGATGGTATAATACAACAACATCCACAAGTAAATATAGGACAAACTGAAATGCAATTGATAAATCAAGAGGGCTTACTGGCAAATTATAATGCATCAACATTAACTAATCAACGTTCTAATTCGGCACCTCAAACACTAAATGAAGCTGCTGTTATTATTGCAAATTCAATACAACAAGTTCAGCAAATGCAGCAACAACAActtcaacaacaacagcagcaaacACAACAACATcagcatcaacaacaacaacatcagcaACAACAAAGTCACCAACAGCAACTTCAGCAATTGCaagaacaaaagcaaaaaattatacaacaacaacaacaacaacaacaacaaatacaacaacagcagcagcaacaacaacaacaacagcaacaacaacaacaacaacaacaaaagcaaaaacaacagcaacaacaacaacaacaacaacaacaacaacaacaacaacaacaacaaaaacaacagcaacaacaacaacagcaacaacaacaacaacagcaacaactacaacaaaaacaacaacaacaacaacaacaacaacaagtaaaacaacaacaaacaccatcatcatcaacagaagttaataaaataaaaccgcAGCATGTTGAACCTGTTAAGACTGTTACTGCAACTGCTACACCTTGCGATAGTGTAGCAGCAAATCAAGTTgctattgataataaaattgaacaagcTATGGATTTAGTTAAATCACATTTGATGATTGCCGTTCGTGAAGAAgttgaaatattgaagaaaaaaatagccAAACTTATGGAACGGATCGATCGTTTAGAAGCTGAAAATACTTTCCTGAAGGCAAATGCCTCACAAGAGACTTTATTACAATTACAACAAGGACTGCCGCCTCCAGTTAATATGTCATCAAATCCTACTACACAGCAAcaattgcaacaacaacaaccacagcaaccgcaacagcaacaacaaaatttgctaTAA
Protein Sequence: MAENQVHEKTFHKVHKTSHGSAVGNKQYEKNVAGENKTGSKSLDGKHLTNIKNASETLKLGAANGTGAYRNGTGNMTIQQLHMSAAPAGTTVGSITCGNTSQRKPKSSFQITSITINNKSADNGDDSADDLDESHTDESSRITDFENETPSISDDTFSKEDVFFSNHALGTAPVIPTSSQYGLVVVDPEVGGTGQNNSQNVHVSGCDAGINIVGPSEKEVQRRSNRFKVVKIESTEPFKRGRWMCMDYLDHTTKGTGDTSTENTNDIKKFGENNSSFNTRTGNSNDNTGKKSNESNLDKTKANDGSNSGVGGKTSKQSSPGQSLKTPASLPSKKNPVDVSATNIENIKMNKMSNVHQNSQQVKTSMPSNTTNIRHSVQQTVHGQSLPQVQIQQMQPQQINQQQQVDIANVVTSGSYIPGQSQPMPVVFMNMSKSDQLHGATFPSNIQMQKIVIPDQMLNNQQNPQMNTGIVIPASSMPSDIQQHQITVLRQSMPQGAMTGVVLQNQPQQSNIPGEMYHQQQLQSHNMPQVYPSTIINQNPQATTLTGTYHDTSAMGAVVLQSQQPQCNITSKIYQQQYQPHTMPQVYPSTMINQNAQGAALPTTYHDFRQVNEMIQNQRQQMINDGIIQQHPQVNIGQTEMQLINQEGLLANYNASTLTNQRSNSAPQTLNEAAVIIANSIQQVQQMQQQQLQQQQQQTQQHQHQQQQHQQQQSHQQQLQQLQEQKQKIIQQQQQQQQQIQQQQQQQQQQQQQQQQQQQKQKQQQQQQQQQQQQQQQQQQKQQQQQQQQQQQQQQQLQQKQQQQQQQQQVKQQQTPSSSTEVNKIKPQHVEPVKTVTATATPCDSVAANQVAIDNKIEQAMDLVKSHLMIAVREEVEILKKKIAKLMERIDRLEAENTFLKANASQETLLQLQQGLPPPVNMSSNPTTQQQLQQQQPQQPQQQQQNLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -