Basic Information

Insect: Agrotis clavis
Gene Symbol: -
Assembly: GCA_954870645.1
Location: OX940931.1:16685-52631[+]

Transcription Factor Domain

TF Family: TSC22
Domain: TSC22 domain
PFAM: PF01166
TF Group: Basic Domians group
Description: These proteins are highly similar in a region of about 50 residues that include a conserved leucine-zipper domain most probably involved in homo- or hetero-dimerisation. Drosophila protein bunched [1] (gene bun) (also known as shortsighted), a probable transcription factor required for peripheral nervous system morphogenesis, eye development and oogenesis.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 7e-05 0.39 12.3 0.2 14 44 136 166 135 168 0.94

2 4 0.0003 1.7 10.3 0.3 15 44 370 399 366 419 0.66

3 4 0.0003 1.7 10.3 0.3 15 44 671 700 667 720 0.66

4 4 0.023 1.3e+02 4.3 0.3 17 34 979 996 974 1006 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	7e-05	0.39	12.3	0.2	14	44	136	166	135	168	0.94
2	4	0.0003	1.7	10.3	0.3	15	44	370	399	366	419	0.66
3	4	0.0003	1.7	10.3	0.3	15	44	671	700	667	720	0.66
4	4	0.023	1.3e+02	4.3	0.3	17	34	979	996	974	1006	0.87

Sequence Information

Coding Sequence: atggtgctcgagtcggactccgactcgggATCAGACGCCACaagcttccagagcgtaggctctgggagcgcagcgaggaggagTGAGGGGAGCGCCAACAGGAGGACcgagttcctcaagcgccccCGAGAAGAACtatcctcgtctgaggagggtcCTGCCTCGGGCCCCAAGATCCCGACAAGTGTTCGGGGTAACggccgaggcgggacgtgcggTAGAGGGCGGGAAGCTGAGCCCTCCCTGGAAAAATTGGTGGAGAACGCCATCCGCACCATTAAGGCCAAGCCTGGCAGGCCCGGTAAGAAGGCCACAAAGGACTTGGCCATAAGTAAGGCCACGGCCACTATAATGGCGGCGGTGTCGGGCGGCATCGGACGGCCTCCGCCCGCATCAAGCCCACCGGACGAAGTGTCCCAAATGCGGGAGGAGCTCGCCAAGCTCACGGCGGCAATGGAGGCTCTCCGTAAGGAGAACCTCCAGCTGAAAGCGGAGCTGGCCGGACTGAGGAGAGGGCGAAGCCGAGAGGAGGTCCCGCAGGCGCGGACACCGGCGCAGGCGCAAACGCGGCAGAaagagccgccggcgaagcccgcaccgATAGACGACAGCAGTAACGCTGTCctaaatctggtgcggcaggagctagcggccttcaaccagcgctttacagcgctggagaaccgcgtcttgcgccccccgctcgcttcctcctacgcggccgtagcggcttccGCGCCGCCCAGGCCAGCCCCGGAGAGGCGGGCCACGGCGAATGCGGCGAATGCGAAGCCGACACCGCCCAAACAGGCCACGGCGAGAGcggctccggcggcggcggcaccggctGGAGCGAAGGCGGCCCCGCAGAAGTCGGGGAAGAAAAagggtgttccggcggcggcggcgagtcaGCCAGGGAGGGAGCTTGATCCCTCTGTCGAGGTGGAGAGGCGTGTCCAAGACGCCATCCGTACCCTGGGCCGACATGGCGGGCCCGGTAAAAAGGGTACGAAGGATAAGGCCATGATAAAAGCCAAGGCCACCATCATGGCAGCGGTGGCAGACAGCCTCAGCCGGCCTCCTCCCGCATCGACAGCAGCGGACGAAATGTCCcaaatgcgggaggaggtcgccaagctcacggcggcgatggatGCTCTCCGTAAGGAGAACATCCAGCTGAAAGAGGAGCTGGCCGGACTGCGGAAGGGGGGCCGCCGAGAGGAGGTCCCGCAGGCACGAACGCAGACGCAGGCGCAGACGCGGCAgaaggagccgccggcgaagcccgcaccaaAAGACGACAGCAACGCTGTCTtaaatctggtgcggcaggagctggcggccttcaaccagcgctttacagcgctggagaaccgcgtcttgcgccccccgctcgcgTCATCCTATgcggccgtagcggcttccGCGCCGCCCAGGCCAGCCCGGCGACAGCGACGACGGCAGCtcgccgcaacgAGCCAaggaggctcacgtgcccgtgaggaggagtcactggacttgtccagtacgtgcTCCTCACCGGCACCAACCACCGAGCGGGCACAGGGTGCCGCTCCGCGAAAGGGgggggcgatggtgctcgagtcggactccgactcgggatcagacgccacgagcttccagagcgtaggctctgggagcgcagcgaggaggagTGAGGGGAGCGCCAACAGGAGGACcgagttcctcaagcgccccCGAGAAGAACtatcctcgtctgaggagggtcCTGCCTCGGGCCCCAAGATCCCGACAAGTgttcggggtaaaggccgaggcgggacgtgcggCAGAGGGAGGGAGCTTGATCCCTCTGTCGAGGTGGAGAGGCGTGTCCAAGACGCCATCCGTACCCTGGGCCGACATGGCGGGCCCGGTAAAAAGGGTACGAAGGATAAGGCCATGATAAAAGCCAAGGCCACCATCATGGCAGCGGTGGCAGACAGCCTCAGCCGGCCTCCTCCCGCATCGACAGCAGCGGACGAAATGTCCcaaatgcgggaggaggtcgccaagctcacggcggcgatggatGCTCTCCGTAAGGAGAACATCCAGCTGAAAGAGGAGCTGGCCGGACTGCGGAAGGGGGGCCGCCGAGAGGAGGTCCCGCAGGCACGAACGCAGACGCAGGCGCAGACGCGGCAgaaggagccgccggcgaagcccgcaccaaAAGACGACAGCAACGCTGTCTtaaatctggtgcggcaggagctggcggccttcaaccagcgctttacagcgctggagaaccgcgtcttgcgccccccgctcgcgTCATCCTATgcggccgtagcggcttccGCGCCGCCCAGGCCAGCCCGGCGACAGCGACGACGGCAGCCCACCAGACCTGTAcgaccctccctttacaaggGTATGTCTGTGTGCGCCCAAATGGTCACCCCCGACCCACACGACGTCCCGTATGAGCAGCTGTCGACGGGTGGGTCCTTGGGGGACCTGTTGCTTCCCATGTTGAGACATGAGCACGTCATGAGGCGGATCTCCTTCGAGGACGCCACCCCTCCTGACCCCATCGAGGTCTTCGCCACGCCAAAGGGGCGCCCGCGTCCTGTGGCCGCCACCAGACCGCTCGAGGGGACTATGGCCGAGCGCTGCAATCGTCTTGAGGAGGCGAGAGCGTGCCTAGAGAAAGCGAAGGAGAGCCTGGGCAGCTCTCGCAACCTCAAGACTAACATTAAAAATGCGGTGCTGGAGGCCCTAGACCGGCTCTTCGAGCTGATCGAGGACGCGGAGCTTGAGCGggccgccaccgccaccgccaccgccaccgccaccgctACCACAGCTATACCAGAGCCGACTCCCGCCGCGTCCACCGCTGTCCATGTTCCCCTGCCCGTCCCCAGTGAGATTCTTGCTGGCCAGGCTGAGCTCCTTAATACGCTTAAGGAGCACATCTCGGAGTTGAAAGACCACTCCGAGAAGATGGATAGACTCCGAGACAGTCTGGCTAGCAAGGAAAACGTGGGGGTGACAACCTACGCGAGTGTTGCGTCAACGACACGCCGCCATACCGGGATTCAAGCCCTGGAGCGAACGACGCTGCACTCGGTGGTTGTCTCCTCCACGGACGAGATGGATACGGGGGACCAGGTCCTTGAAAAGGTCAGGAGAGCGGTGGATGCGAAGGAGGGCTGGGTAAGGGTCGAACGTGTCAGGAAAGCGAAGGACAAGAAGATTATCGTCGGCTGCGCAAATGAGGAAGAGAGGCGcaaggtgagggagcgcctgcGGGCGGCCGGGGAGTGCCTCGTCGTCGAGGACGTAAAAAACCGGGACCCGCTTCTGGTTCTTAAGGAGGTGCTTGTAGTGCACAGTGACGAAGAGTTGCTGAAAGCCCTTAGAAACCAGAACCGGGAGATCTTTTGCGACCTTGGGGACGAGGAAAATAGAATGACTGTGCGATATAAAAAGAAATGCCGAAACCCTCATGTTAACAGCGTTGTGCTCAGCGTGTCCCCCACGATCTGGAGACGCGCGCTTAAAGTAGGCAAGCTGAGGATAGACCTCCAAAGAGTGCGCGTCGAGGACCAGACGCCTCTTGTGCAGTGCACCCGCTGCCTAGCCTTCGGGCACGGGAAGCGCCTGTGCTCGGAGCCAGCCGATCTGTGCAGTCACTGCGGCGGCCTGCACCTCAGTGTGGATTGCCCCGAGAAACAGATCGGCACAGCAGCGGTGTGCGTAAACTGCACAAGGGCCAAACTGGGGGCCGCTGGGCACAGCGCTTTTAACATTGAATGCCCGGTACGCAGGAAGTGGGACGCGTTCGCGAGAGCTGCAATATCATATTGCTAA
Protein Sequence: MVLESDSDSGSDATSFQSVGSGSAARRSEGSANRRTEFLKRPREELSSSEEGPASGPKIPTSVRGNGRGGTCGRGREAEPSLEKLVENAIRTIKAKPGRPGKKATKDLAISKATATIMAAVSGGIGRPPPASSPPDEVSQMREELAKLTAAMEALRKENLQLKAELAGLRRGRSREEVPQARTPAQAQTRQKEPPAKPAPIDDSSNAVLNLVRQELAAFNQRFTALENRVLRPPLASSYAAVAASAPPRPAPERRATANAANAKPTPPKQATARAAPAAAAPAGAKAAPQKSGKKKGVPAAAASQPGRELDPSVEVERRVQDAIRTLGRHGGPGKKGTKDKAMIKAKATIMAAVADSLSRPPPASTAADEMSQMREEVAKLTAAMDALRKENIQLKEELAGLRKGGRREEVPQARTQTQAQTRQKEPPAKPAPKDDSNAVLNLVRQELAAFNQRFTALENRVLRPPLASSYAAVAASAPPRPARRQRRRQLAATSQGGSRAREEESLDLSSTCSSPAPTTERAQGAAPRKGGAMVLESDSDSGSDATSFQSVGSGSAARRSEGSANRRTEFLKRPREELSSSEEGPASGPKIPTSVRGKGRGGTCGRGRELDPSVEVERRVQDAIRTLGRHGGPGKKGTKDKAMIKAKATIMAAVADSLSRPPPASTAADEMSQMREEVAKLTAAMDALRKENIQLKEELAGLRKGGRREEVPQARTQTQAQTRQKEPPAKPAPKDDSNAVLNLVRQELAAFNQRFTALENRVLRPPLASSYAAVAASAPPRPARRQRRRQPTRPVRPSLYKGMSVCAQMVTPDPHDVPYEQLSTGGSLGDLLLPMLRHEHVMRRISFEDATPPDPIEVFATPKGRPRPVAATRPLEGTMAERCNRLEEARACLEKAKESLGSSRNLKTNIKNAVLEALDRLFELIEDAELERAATATATATATATTAIPEPTPAASTAVHVPLPVPSEILAGQAELLNTLKEHISELKDHSEKMDRLRDSLASKENVGVTTYASVASTTRRHTGIQALERTTLHSVVVSSTDEMDTGDQVLEKVRRAVDAKEGWVRVERVRKAKDKKIIVGCANEEERRKVRERLRAAGECLVVEDVKNRDPLLVLKEVLVVHSDEELLKALRNQNREIFCDLGDEENRMTVRYKKKCRNPHVNSVVLSVSPTIWRRALKVGKLRIDLQRVRVEDQTPLVQCTRCLAFGHGKRLCSEPADLCSHCGGLHLSVDCPEKQIGTAAVCVNCTRAKLGAAGHSAFNIECPVRRKWDAFARAAISYC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00039536;
90% Identity: iTF_00039536;
80% Identity: iTF_00039536;