Basic Information

Insect: Amyelois transitella
Gene Symbol: Rfx2_1
Assembly: GCA_032362555.1
Location: CM063554.1:1622101-1640828[-]

Transcription Factor Domain

TF Family: RFX
Domain: RFX domain
PFAM: PF02257
TF Group: Basic Domians group
Description: RFX is a regulatory factor which binds to the X box of MHC class II genes and is essential for their expression. The DNA-binding domain of RFX is the central domain of the protein and binds ssDNA as either a monomer or homodimer [1]. It recognize X-boxes (DNA of the sequence 5'-GTNRCC(0-3N)RGYAAC-3', where N is any nucleotide, R is a purine and Y is a pyrimidine) using a highly conserved 76-residue DNA-binding domain (DBD) [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.082 5.7e+02 1.8 0.0 3 17 184 198 182 203 0.86

2 7 0.17 1.2e+03 0.8 0.0 3 17 212 226 210 231 0.85

3 7 0.17 1.2e+03 0.8 0.0 3 17 240 254 238 259 0.85

4 7 0.17 1.2e+03 0.8 0.0 3 17 268 282 266 287 0.85

5 7 0.17 1.2e+03 0.8 0.0 3 17 296 310 294 315 0.85

6 7 6.8e-37 4.7e-33 114.2 0.1 3 78 324 399 322 400 0.97

7 7 4 2.8e+04 -4.0 0.1 25 33 728 736 726 741 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.082	5.7e+02	1.8	0.0	3	17	184	198	182	203	0.86
2	7	0.17	1.2e+03	0.8	0.0	3	17	212	226	210	231	0.85
3	7	0.17	1.2e+03	0.8	0.0	3	17	240	254	238	259	0.85
4	7	0.17	1.2e+03	0.8	0.0	3	17	268	282	266	287	0.85
5	7	0.17	1.2e+03	0.8	0.0	3	17	296	310	294	315	0.85
6	7	6.8e-37	4.7e-33	114.2	0.1	3	78	324	399	322	400	0.97
7	7	4	2.8e+04	-4.0	0.1	25	33	728	736	726	741	0.77

Sequence Information

Coding Sequence: ATGGCGGCGCGGCTTGCGGGACCCGCTCAGGGAGCGGGTACAGGCGCGGGCGGGACATCCCCGAGTGCAGTGCGAGAGCTGATCGTCATACCGGAGATACCCAACTCCATACATCTGCAGCACGCTATACATCAGGTGACAAACAATGTGGTGGAAGTGAACGGTGACAGTTCGGGCCACTCCAGCCCCACTGCGGAGGCGCAGCATACGTACATTACGGTATCAATGCAGGGGGCATGGCAGCAGCCGAACGTCAAAGCGGAGATCAGCAGTGAGGAAGaaaGCGAGGGCGGCAATGGAGTCAACTACCACGTGCAGTATGTGGAACCGCAGGAGATCTACACGCAGAATCATCAGCAACATctCGAGCCGCTACGGTCATACCCGGTGTACAGCGTGACGGCGGTGGCTGACGATCCCGCCGCCGAGGCGTGGCCCGCTGCCGagttctctgcctacccccatgTGGTGGCAGGCGAGGAGGCTGAAACGGCTTCGTCGCCGGCGACTCCTGCTCGTGAGGCTCCACAGCCGCCGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACTGCCGAGGGTGAGTGTGGCATCATGTCTCCTGTAGCAGACacagcgcccgccgccgcgcagtgGCTGCTCGACCACTACGAGACTGCCGAGGGTGAGTGTGGCATCATGTCTCCTGTAGCAGACacagcgcccgccgccgcgcagtgGCTGCTCGACCACTACGAGACTGCCGAGGGTGAGTGTGGCATCATGTCTCCTGTAGCAGACacagcgcccgccgccgcgcagtgGCTGCTCGACCACTACGAGACTGCCGAGGGTGAGTGTGGCATCATGTCTCCTGTAGCAGACacagcgcccgccgccgcgcagtgGCTGCTCGACCACTACGAGACTGCCGAGGGTGAGTGTGGCATCATGTCTCCTGTAGCAGACacagcgcccgccgccgcgcagtgGCTGCTCGACCACTACGAGACTGCCGAGGGCGTTTCCCTCCCCCGCTCCACACTGTACGCCCACTACCTGCGCCACTGCACCTCCCACCGGCTGGACCCGGTGAACGCGGCCTCCTTCGGGAAACTCATCCGGTCCGTCTTCATCGGGCTGCGGACCAGGAGGCTGGGCACCAGGGGGAACTCCAAGTACCATTACTACGGCATCAGGGCGAAGGCGAATGTCAATGATTCCCCGCCCAGGCAGGATATGGGCGACGATAAAGGGGAGATATCGGATCAACAGGAGCCCCGTGAACGCGAAGCGGAGTCAACCCCGGCGGGCCTGGCGGGGCTCGCACACAGGCAGTTCCTGGGCCCCATCACAGCGCCCGAGCCGCCCGAGCTGGTGGTGGAAGATCTGCCCGAAGATGTTCCCGCTTCGGCCATCGAAGCTCTGAGAGATCATCATAGGGCGCACGGCGTGGAGTTCCTGGAGGCCGTGAGCGCGCTGGACACGGGCGCCGTggagcgcgcgcgccgcgccttCTGGCGGGGCGGCCTGTGTCGCCGCGCGCTGGCCCGGCTCGCCACCAGGGCGGACGTGGCGAACTGGTTGCGACGTGCCGACTTGGTTCTATACCAGGCCGCTGTGGATTTGCTGCTGCCCGACGTACTGCGGCCCATACCGCCGCAACTCACGCAGGCGATCCGCAACTTCGCGAAGAGCCTGGAAGGCGCGCTGTCGGCGGGCGGCAGCGGAGCCCCCAGCGCAGCCGCccgcgcggcggcgggcgcggccggAGCGCTGGCGGCCGCGCTGCGCCGCTACACGTCGCTCAACCACCTGGCGCAGGCCGCGCGCGCCGTGCTCAACAACCAGCTGCAGATACAGCAGATGCTGGCGGACTTGAACCGCGTCGACTTCCGCGTGGTCCGCGAACAAGCCGCGTGGGCGTGCTCCTGCGGCAGCTCCTCCACTGCGCACCGGCTGGAAGTCGATTTCAAGGCGACGCTGGGGCGCGGCGCGTCGCTGGAGCAGTGGGCGGCGTGGCTGGAGCGCTGCGTGGCGGGCGCGCTGGCGCCGCACGCCGCGCGGTCCGACTTcacggcgcgcgcgcgccgcctgcTGCTCGACTGGTCCTTCTACTCCTCGCTCGTCATCCGCGAGCTCACGCTCAGGTCGGCGGCGTCGTTCGGCTCGTTCCACCTGCTGCGGCTGCTGTACGACGAGTACGTGTCGTACCTCATCGAGCGGCGCGTGGCGCGCCACCACGGCACGCCGCCCATCGCCGTCATGCAGCGGCAGCTGGAGGAAGATTTGACGGACGAGAACGGTCGCACGGCCGAGGACGACGACAACGAGTGGGAGTGGGAGGACGACGACGATGACTCTGACGACCCCGTCCCCGACAAGAAACACAAGATGGAGTGA
Protein Sequence: MAARLAGPAQGAGTGAGGTSPSAVRELIVIPEIPNSIHLQHAIHQVTNNVVEVNGDSSGHSSPTAEAQHTYITVSMQGAWQQPNVKAEISSEEESEGGNGVNYHVQYVEPQEIYTQNHQQHLEPLRSYPVYSVTAVADDPAAEAWPAAEFSAYPHVVAGEEAETASSPATPAREAPQPPRMPPATVQWLLDHYETAEGECGIMSPVADTAPAAAQWLLDHYETAEGECGIMSPVADTAPAAAQWLLDHYETAEGECGIMSPVADTAPAAAQWLLDHYETAEGECGIMSPVADTAPAAAQWLLDHYETAEGECGIMSPVADTAPAAAQWLLDHYETAEGVSLPRSTLYAHYLRHCTSHRLDPVNAASFGKLIRSVFIGLRTRRLGTRGNSKYHYYGIRAKANVNDSPPRQDMGDDKGEISDQQEPREREAESTPAGLAGLAHRQFLGPITAPEPPELVVEDLPEDVPASAIEALRDHHRAHGVEFLEAVSALDTGAVERARRAFWRGGLCRRALARLATRADVANWLRRADLVLYQAAVDLLLPDVLRPIPPQLTQAIRNFAKSLEGALSAGGSGAPSAAARAAAGAAGALAAALRRYTSLNHLAQAARAVLNNQLQIQQMLADLNRVDFRVVREQAAWACSCGSSSTAHRLEVDFKATLGRGASLEQWAAWLERCVAGALAPHAARSDFTARARRLLLDWSFYSSLVIRELTLRSAASFGSFHLLRLLYDEYVSYLIERRVARHHGTPPIAVMQRQLEEDLTDENGRTAEDDDNEWEWEDDDDDSDDPVPDKKHKME

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -