Basic Information

Insect: Ptychoptera albimana
Gene Symbol: ARID5B_1
Assembly: GCA_961205885.1
Location: OY540802.1:14860515-14880650[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 10 1.4e+04 -4.4 0.8 54 85 697 727 673 728 0.60

2 5 5.7e-19 8.1e-16 57.9 0.3 2 89 749 835 748 835 0.89

3 5 1.3 1.8e+03 -1.0 0.0 19 41 1326 1348 1308 1367 0.77

4 5 10 1.4e+04 -23.7 26.8 7 68 1506 1567 1500 1608 0.44

5 5 10 1.4e+04 -5.2 1.3 4 25 1675 1693 1671 1698 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	10	1.4e+04	-4.4	0.8	54	85	697	727	673	728	0.60
2	5	5.7e-19	8.1e-16	57.9	0.3	2	89	749	835	748	835	0.89
3	5	1.3	1.8e+03	-1.0	0.0	19	41	1326	1348	1308	1367	0.77
4	5	10	1.4e+04	-23.7	26.8	7	68	1506	1567	1500	1608	0.44
5	5	10	1.4e+04	-5.2	1.3	4	25	1675	1693	1671	1698	0.47

Sequence Information

Coding Sequence: ATGGTTGTTGGTAGTCCATGCGGATCACATGGTCCTTATACGTTTTATAAAGGTTTGCGAATCGTTACCATAAcagcagtaacaacaacatcatTGTCATCAGCATCCTCATCATCTTGTTTCGATAATAACAGGGCATcaataacagcagcaacaacaaccacaccACCTCCCCCAACATCACAAACagcaattataaataacaataataataattttaacataaataataacaatacacaaataaaattacaaaaccaatatgataataataatataaaaaatgaaataatgttaaatgatgaaaatttaattaatttaaataatgattttatgagtaataaaattaatcgaaaattattaaatgaaagaagGGAATCATTTTCCGAAATGAGTTCAATCTCTGgtgatgataatttaattattggaaatcGTAAATCGATAATATTAGGATTAGGCGATTGTATACCAGTTCGTCCATGGTCCGATTCACCAATTGCATGTTTAGCTGAGTTAAGAATGATATGGAAGGATAGAAATGAACAGTGTTTATTGGTTAGTTTGCGGTTATATTTTCTACCGGAAAATACACCAATGGGAAGAAATTGTCATGGCGaggatgAAGTTATTGCTATATCTGATAAAGTTGTTATACGAGCTGATGATTTATTAACATGGTTATATGATGATCTTGAATGGAATTGGGGTCTAAAAGCAGTATATACAGCAAAaccagcaacaataataacaccaACAACATCAAATGAATCGACAccaattaaaaaggaaatgattatagcaacaacaactacaacaacaacgacaacaacagtaATTTCATCATTAACATCAACtccaaaaattgaatttaaaaatgagCAAACTGAGGAGGATTCAGATGGTGCTGATGTCGATGATGCTAGTGCAGATTCTGTTAGAGAGGAtattaaagatataaaaacaataaaaacgttaaacataaataatgttattaaaaaattaaatgagaataattataataataataataacaacaatataaataacaataataatgataatgaggttaaactgttaattaaaagtaataataataaggaagaAAAGGATACAAATGAGGATAATATTCGTGATGATAAAGACAATATTAATGATGACGGTGCCGATGACTATAATGGGGATGAAGATGATAAAACTTTAGTAATGCCAtctattttgataaataataataatcaggaTATTAATGAAACTAAAACAAGTCCAATAACACGGGGTGGCCTATTAAATTCACATTTAGATTTCACTGATATTGATAAAGTGAAACAAAATGAGAGTTCAACAAGACCAATTGTTGCTGTATTAAGTTATTCACGTTATTGTCGTTATCGTGCAACAATGGTACGTCTTGAAAGTGTTGAAGATGAATGGCTACGAAATCAATTAGTAGAAGCTTTAAGTGGTTATGTAGCACCTACAGCAAATACAAAAGTTATGTTTTGCAAGgAAACATTTGATTATCCTGAATTAGAAACGCATGAGTTATTATGTAATCATTTGGCACCTAAGCTAAAAGGTCGCCCTCGTGGACGTCGTAAAAAGACTATTTCAAGTTCTGAGACAATAACATCATTAAAACGTACAGGCTCACCTTTAAGTGATTCAAATGATTCTGATTTATCACTAGATAGTTCAAATATAAGTGATAAAATGTTAACACCAATTAGAACACCATTAATAAATCCAAGaaataatcttaataaattgaataaaataatacggCCACAATTACGTTATAATCATCGTCCAGCAAGATCAACGAATGATAAGCCGTTTATAAATGATAGCAAGAGATTATTAAGAAAGTATATAAGTGATACAGAGactgatgttgatgatgatgatagtgatgatgatgattattatacGTCAGATGATGATGTGGCTAATAACAAAATGAGATTattacagcagcaacaacaacaatacaatcatcatcatcaacagcatcagagaaataaattgtataatagcaataataataaacgtgattatacaaaattaaaattatcgaaaaaagatACAGACGATGATTGGAATAGACGCTACATGCATACAagtaaacagcaacaacaagctaaacaacaccaacaacaattgCATCAAATGCAACAAcgttatttgaataaaaatttaaatacaaatcaattacaatctattaataatttgatagATGATAAACAGAATGAACGTTTgttcttaaaaaaattacatgaatTTATGAATGAGCGTCAAACACCGATTCCTAAAGTTTTATGGTTATCCTTAAGAAATGttaatctTTATGCAATCTATaatcaagtaaaaaaattgGGCGGCTATGAAACTGTGtgctcaaataaaaaatggaaaaatttgtttaatattaatataaatggaaaaattaatggcgataatttaaatacaataacaCAAAAGCACTATGAGCGCATATTGCTGCCATTAGAAAAGTATGAACGTaacattgaattaataaacaaatataatatgcATAATagtcataatataaataatatgctattaatgaaaaatgattatgAATTAACAATTGAAGAGATGACCGAGatacagaataaaattaaggaaaatgaaaaacatgatataaatataaacaatgatggtttacatttaaatatgtCATCCACAAGTAATTTGCCTGTAACAGTAATTGTCGGTGGTGCCTCCAATGTTGATTCAAAgatgacATCTCCATCGTCTCAAATTCATATTAAACAGCCACATACTACTATAACTGTGCATCAAACAACAATACATCCTAAACAttccacaaataataatataaataataatgttaattcgATAAATTCACTTGGAAATGCAGCaaatatgattaataataataccaataataataataatagtaataataatcaagaaaTTCATTcgaattctataaaaataacaaatcaaatacaaatacaacaaataacaacattgaataatagtaataataatgatagcaATGCTATAAATTcagcaaataataaagtaacatCACCACTACGTTATATACGTGTAAAACCagataaaaatttactaacaaatataaatattgaaaataaagaaaaggaaaattataataatataaatataaatcatagtagtggtaataataatagcaataatgaaaatataaatataaaaacaacagaaataattgaattaattgatAGTGACAGTGATAACAGTAATTCTatggttataaataataataataacggcAGTAACAGCAAGATAATGCCACCaatgaaaaagagaaaattagaTATATTAAAAGAAGGTGGTCTAGAAGTAACACCAATTAGTTCAATGAATAATCTAACTAATAATActataaataatagtaataataataacagtactattagtaacaataataataataatattaataataataataataataataataacaataatagcaatagtaatattattaataataataataataatgatataaatataagtaataatttatctaatattaataattttaataataatggtatTAAAATAACTGGTAAATCTTATTCACCAGCAAGTATAAGTCCAGTTGTTAGTaatagtaatattaataatactagCAATAAtgtaagtaatttaaataataataattcaagtgGACAAACTGGTCTAAGtggtataaattataatataaataataataataacaatactaataataatttaaaaataataaataatacaaataaaacagttagtagtaataataataataataatacaagtaataaacgtaaattaagtaaaacaaataattcattatttcaaCAATATCCAAGTAAtggtattattaaaaaaccaaaatatcaAAGTTATTGTATGTTTTCtacgcaaataaaaatatttggtaATCCTAAAGATGTTCTACCAATAATACTTATaccaaataatgataataatccattagatttaagaaaattacacCCAAGCATTACTAATATTAATAgtaatatcaataataacattattagtaataatttaaataatttacatagtaaaaattcaattattagtaataataatataaatagtaaaaatagtattagtaataataatagtaataatactaTAAATACAGCTGGtaataatgatattaaaaatccAATTGATTATAgtaaagcaaatataataaatgttaatgataataaaaaaataatgaatattgCATCGTTGATcgataaacaacaacagcaacaccatcagcagcaacaccaacagcaacaacaatcacaAAATTCGCCAACATATGTACAAAATGTGCACAATTctcaaaatcataatttaacaacaaaaaaagcacgattatataataatgaatatagtttattaatacaacagcaacatcaacaattgcaacaacaacagcaacaatataataaacataataatagtgagaagaaaaaatataatgcaTTATTGCAGcaacatcagcaacaacaaaaacaacagcagcaacagcaacaacaacaacttcaTCAGCAACAATTGTTACaattacaacaacagcatcaaaaacaacagcaacaacaacaacagcagcagcaacaacaacaacaacaacagcagcagcagcagcaacaacaacagcaacaacagcagcagcagcagcagcagcagcagcagcagcaacagcagcagcagcaacagcagcaacaactacagcagcaacagcagaaaCAACAATCTATGAATATGTCACAACATTATAAGTCTGCAGCAGCATCAACGTCATCGACTAAAACATCAACGACTGCAACAAATGCTACATCTTCGACAGTACCGGAAACTACAACACAAATGATACGCAATCATCAAGAGtcacaaaaattatcaatGGCTAAAAGTTATGCAGAATCCTTaacaaaatcatcatcatctaagTATTCAATGTCATCATATATGcgtcaacaacagcaacaactacAGCAattgcagcagcagcagcaacaacaacaacaacagtcacCTACATCACAACAAGCAAAAGCACTAGCACAAGCAGAGGCACAGGCACAAGTTGAAGCTCAAGTTCAAGCTCatttattgaatgaaaaacTGTTTGCGTCACAACATTCTTTATTATATCAAACTCCGCAAAGTTTGCACGAAGTCATTCAACAGCAGCAACgccaacatcaacaacagcaacagttgcaacaattacaattacaacaacaattatCACCACATTTGTTGAATGCAGCAGCGAATAGTGCTAATCGTGATGGTCGCGATAGCCGTGATAGTCGTGATAGTCGAGATAGTCGTGatgctaataatttattaacacagcatttagcaaatcaacaacaacaacaacaatcatcACTAATTGCACCACCGCCACCCCATTTCTATCCAATGCTCGATCCAATTTATCTATCATCACTATACGCTAGCCAAGGTCTATATTTGCCACcagatttattacaattttataagACACCTAAAATGGCTGTACCGGTATCGAAAGGTTAA
Protein Sequence: MVVGSPCGSHGPYTFYKGLRIVTITAVTTTSLSSASSSSCFDNNRASITAATTTTPPPPTSQTAIINNNNNNFNINNNNTQIKLQNQYDNNNIKNEIMLNDENLINLNNDFMSNKINRKLLNERRESFSEMSSISGDDNLIIGNRKSIILGLGDCIPVRPWSDSPIACLAELRMIWKDRNEQCLLVSLRLYFLPENTPMGRNCHGEDEVIAISDKVVIRADDLLTWLYDDLEWNWGLKAVYTAKPATIITPTTSNESTPIKKEMIIATTTTTTTTTTVISSLTSTPKIEFKNEQTEEDSDGADVDDASADSVREDIKDIKTIKTLNINNVIKKLNENNYNNNNNNNINNNNNDNEVKLLIKSNNNKEEKDTNEDNIRDDKDNINDDGADDYNGDEDDKTLVMPSILINNNNQDINETKTSPITRGGLLNSHLDFTDIDKVKQNESSTRPIVAVLSYSRYCRYRATMVRLESVEDEWLRNQLVEALSGYVAPTANTKVMFCKETFDYPELETHELLCNHLAPKLKGRPRGRRKKTISSSETITSLKRTGSPLSDSNDSDLSLDSSNISDKMLTPIRTPLINPRNNLNKLNKIIRPQLRYNHRPARSTNDKPFINDSKRLLRKYISDTETDVDDDDSDDDDYYTSDDDVANNKMRLLQQQQQQYNHHHQQHQRNKLYNSNNNKRDYTKLKLSKKDTDDDWNRRYMHTSKQQQQAKQHQQQLHQMQQRYLNKNLNTNQLQSINNLIDDKQNERLFLKKLHEFMNERQTPIPKVLWLSLRNVNLYAIYNQVKKLGGYETVCSNKKWKNLFNININGKINGDNLNTITQKHYERILLPLEKYERNIELINKYNMHNSHNINNMLLMKNDYELTIEEMTEIQNKIKENEKHDININNDGLHLNMSSTSNLPVTVIVGGASNVDSKMTSPSSQIHIKQPHTTITVHQTTIHPKHSTNNNINNNVNSINSLGNAANMINNNTNNNNNSNNNQEIHSNSIKITNQIQIQQITTLNNSNNNDSNAINSANNKVTSPLRYIRVKPDKNLLTNINIENKEKENYNNININHSSGNNNSNNENINIKTTEIIELIDSDSDNSNSMVINNNNNGSNSKIMPPMKKRKLDILKEGGLEVTPISSMNNLTNNTINNSNNNNSTISNNNNNNINNNNNNNNNNNSNSNIINNNNNNDINISNNLSNINNFNNNGIKITGKSYSPASISPVVSNSNINNTSNNVSNLNNNNSSGQTGLSGINYNINNNNNNTNNNLKIINNTNKTVSSNNNNNNTSNKRKLSKTNNSLFQQYPSNGIIKKPKYQSYCMFSTQIKIFGNPKDVLPIILIPNNDNNPLDLRKLHPSITNINSNINNNIISNNLNNLHSKNSIISNNNINSKNSISNNNSNNTINTAGNNDIKNPIDYSKANIINVNDNKKIMNIASLIDKQQQQHHQQQHQQQQQSQNSPTYVQNVHNSQNHNLTTKKARLYNNEYSLLIQQQHQQLQQQQQQYNKHNNSEKKKYNALLQQHQQQQKQQQQQQQQQLHQQQLLQLQQQHQKQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQLQQQQQKQQSMNMSQHYKSAAASTSSTKTSTTATNATSSTVPETTTQMIRNHQESQKLSMAKSYAESLTKSSSSKYSMSSYMRQQQQQLQQLQQQQQQQQQQSPTSQQAKALAQAEAQAQVEAQVQAHLLNEKLFASQHSLLYQTPQSLHEVIQQQQRQHQQQQQLQQLQLQQQLSPHLLNAAANSANRDGRDSRDSRDSRDSRDANNLLTQHLANQQQQQQSSLIAPPPPHFYPMLDPIYLSSLYASQGLYLPPDLLQFYKTPKMAVPVSKG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -