Basic Information

Insect: Catocala nupta
Gene Symbol: -
Assembly: GCA_963675205.1
Location: OY776106.1:968050-985393[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 9.7e-15 5.7e-11 44.4 0.0 3 89 221 294 219 294 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	9.7e-15	5.7e-11	44.4	0.0	3	89	221	294	219	294	0.90

Sequence Information

Coding Sequence: ATGATTACCTCATCGGACGAAGTCCTAGCCATCAACGATAAGGTGGTTCTCCGCGCAGACGACCTGCTGAGCTGGATCTGTACTGGCACCGAGTGGCGCTGGGGGCTGCGGGCCGTGTGGCGAGGAGCCTGCGCCCCTCCGGCCGACCCGCGGCACACCTCGCCGCTACATCATACCAAGCTCGACTTCAGCGATGTGGATAACGAGAAGAATACTATTGCGATAGACGCCGATGCACCAGGCGTCGTGGTCTTCTCGTACCCTCGGTACTGTCGCTACCGGGCGCTGCTGTCCCGCCTAGAGGGTATCCAGGCTGACTGGCTAAGAGACTCCCTTGTCGCGGCGCTGGGAGGGTATGCGGCTCCCACCAACAATACTAGGATACTATATTGTAAGGATACGTTCGAATACCCAGAGCTGGAAGGTCATGAGTTCGTGTGCAACCACCTGGCCCCTCGGCTTAAGGGGAGGCCTCGCGGACGCAGGAGACGCGCCCCCCACTCCCCCTCCCCTGACAGGACCGACAGATCAGCCACCGAGTCGCCGCCGGCGCTCTCACCGCCGACGCCGCGCCGACTCTCCCTCCGAAACGGCGGGCCAGACAAGCAAAGCGAAGACGAGGAAGAAGACTGCAAGAGAGTAGAAGAAAGCACAGAAGACCGCGCATTCCTACAGTCGCTGAAACAGTTCTACAAAGATAGGAGTGAACCGTTCAAAAGCGGACACACGCTGAAAGACCTGTCCCTCCGAGCGCTGTACGTGTCGGTGGTGTCCCGTGGGGGGTACGAGGCGGTGTGCAGACACAAGCTATGGCGCGCGCTCGCACACGACCAGCCGGCCAGGACCCGCAGACACTATGAGAGATTCCTCCTACCATACGAGAACCACGAACGCCGCAACGGCGCAGCATCCCTTTTCAAAATAAACGGCAAACTGGACATCGAACCGCAAACGATCGCAACAATAGACGTAACAGACTCCCCACTACGCGACGACGAACATTCAGACAAAATACTACGCACACCATCACCTAAACTCGAAAAATACAACTCAGAAAACGAAATTTCCAAAGACGAACTCATTACGACTAAAAACGCTGAAGAACTCAACAGAGAATTCCTAGATTCCTTACCGAAAGAAGAGAAACCGGTGAAGATTTCGGTGAAACCGGTGGAGAAATTGATTCAGCCGCATGTGGTGAAACTTTTTGAGGAGAATAGCGTGGTGGACGCGACGAAATGCGGCTTGGAACTGACTAAGATGGAGGATGTTAAGGATATGACGCAGAGTAATCTGTTCCTGAGTGATATCAATAAGATTAATATGGCAGATCCTCTGAGTCGCGGCGCACCTGCGCCACTCAACGGTCACGCGCCGCCTGCCATCGACCTGAAGGCGTCCCGCCCGGCGGGCCGCAGTTCCCTGCGCGCCGTGCGCGTGAAGCCGGCGCGCCCGCTGCAGCACGCCGCCGCCACTACTCCTCCTAACCCTCTCCGGCCAGACTCAGCGTCGTCCTCCCCTCCACTGTCCAGCTCGCTGCCCTCCAACGTGGGGATGAGTAGCAACCCCCCCGTATCACTCAGCAGTAATCCCCCCGTCACCAATTTCGGGATACACCACCCCCCACCACCTCAACATCACAGCGATGACGATATTGTAGAGGTTCCTTATAAACCGAAGACCCCAGAGATAATTGACCTCGACGAATACCCGGAAAGCCCTCAAGCCGTCAAGAAAAAGAAGCTGGACATCCTCAAGGAACGAGGCCTGGAAGTCACTGCCCTACCCCCATGGAACCCCATGCCCCCTATGATTAACCCCCCCATGATCTTAAATCCAGCCATGCAACACCAGATCATGACCCAAGCACAGCTATTCCAAATGTATAACATCATACCCCCGAATTATGCCAACGGGATTCAACCCCCAAAGGTTATTCAAGGGTCCTCAATCTTCGGCAATATGGGACCAGAGAAGACCGTCTATGGAAACCCAAAAGACCCTTTCATGCCTCCGCCACACATACTTCACGGGGCACCAGTCAAACCTCTAAGAAATATCCCCACCACAAATCCGACTCCCCAGGACATCCTAGACTTGACTTGCAAATCAGCCAGTCCACCTCCTCAGAAACCAGCAGTGGAAATCTTAAGAGTATCCTGCCCCTCGCCGAAGTCTACCGCACAGAATTTATCCAAAAACTACACTTTACTAGATGGCAAGGCTGTAGTGGGATCCAATTTAGAAATAACTTTAGTCAACAAAGCTCACAGCCCCACCAAAACTGGTCCTAGACCCCCACAAAAGAGGTCTTCTAACGGCAAGTTCATGTCTACAAAGACCCCTACACCCCCCAAAGACTACAAGTTCCCAAGTTCCCAACCTTCAAATATGCAGAAGAAACCAGCGATCACGATCCCGAATTACCAGATTAGGGAATCATCGTCTCCTACAGGATCTTCTCAAAAGCAGGCCCCGTTCAAAGGTCCAAGTGCACCCGTAGCACAAATTATGGACCTTCAGAAAGGGTCTGGTCCCATGTCGTCGTTCATAGACCCTTACACCGTGGCGCTGTACAGCAGTCTAGCCGGTCAGATGGACCAGAGACAATTGGCTATGTATAGAGATTTAATGGCTAACCAATTCAGAGGTTACCCTGGTCTGTTAAATTTAGGAGTATCAAACACACCTACAACGAAAAATTAG
Protein Sequence: MITSSDEVLAINDKVVLRADDLLSWICTGTEWRWGLRAVWRGACAPPADPRHTSPLHHTKLDFSDVDNEKNTIAIDADAPGVVVFSYPRYCRYRALLSRLEGIQADWLRDSLVAALGGYAAPTNNTRILYCKDTFEYPELEGHEFVCNHLAPRLKGRPRGRRRRAPHSPSPDRTDRSATESPPALSPPTPRRLSLRNGGPDKQSEDEEEDCKRVEESTEDRAFLQSLKQFYKDRSEPFKSGHTLKDLSLRALYVSVVSRGGYEAVCRHKLWRALAHDQPARTRRHYERFLLPYENHERRNGAASLFKINGKLDIEPQTIATIDVTDSPLRDDEHSDKILRTPSPKLEKYNSENEISKDELITTKNAEELNREFLDSLPKEEKPVKISVKPVEKLIQPHVVKLFEENSVVDATKCGLELTKMEDVKDMTQSNLFLSDINKINMADPLSRGAPAPLNGHAPPAIDLKASRPAGRSSLRAVRVKPARPLQHAAATTPPNPLRPDSASSSPPLSSSLPSNVGMSSNPPVSLSSNPPVTNFGIHHPPPPQHHSDDDIVEVPYKPKTPEIIDLDEYPESPQAVKKKKLDILKERGLEVTALPPWNPMPPMINPPMILNPAMQHQIMTQAQLFQMYNIIPPNYANGIQPPKVIQGSSIFGNMGPEKTVYGNPKDPFMPPPHILHGAPVKPLRNIPTTNPTPQDILDLTCKSASPPPQKPAVEILRVSCPSPKSTAQNLSKNYTLLDGKAVVGSNLEITLVNKAHSPTKTGPRPPQKRSSNGKFMSTKTPTPPKDYKFPSSQPSNMQKKPAITIPNYQIRESSSPTGSSQKQAPFKGPSAPVAQIMDLQKGSGPMSSFIDPYTVALYSSLAGQMDQRQLAMYRDLMANQFRGYPGLLNLGVSNTPTTKN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00282053; iTF_01491663; iTF_00636056; iTF_01151847; iTF_01332330; iTF_00932203; iTF_00677328; iTF_00888978; iTF_00908598; iTF_00869408;
90% Identity: iTF_00282053;
80% Identity: -