Basic Information

Insect: Cydalima perspectalis
Gene Symbol: Rfx1_1
Assembly: GCA_951394215.1
Location: OX596205.1:2259178-2273920[-]

Transcription Factor Domain

TF Family: RFX
Domain: RFX domain
PFAM: PF02257
TF Group: Basic Domians group
Description: RFX is a regulatory factor which binds to the X box of MHC class II genes and is essential for their expression. The DNA-binding domain of RFX is the central domain of the protein and binds ssDNA as either a monomer or homodimer [1]. It recognize X-boxes (DNA of the sequence 5'-GTNRCC(0-3N)RGYAAC-3', where N is any nucleotide, R is a purine and Y is a pyrimidine) using a highly conserved 76-residue DNA-binding domain (DBD) [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 4.8e-37 4.2e-33 114.3 0.0 3 78 226 301 224 302 0.97

2 8 2.5 2.2e+04 -3.3 0.0 24 33 631 640 619 647 0.70

3 8 3 2.6e+04 -4.2 0.1 25 35 671 681 669 686 0.76

4 8 3 2.6e+04 -4.2 0.1 25 35 710 720 708 725 0.76

5 8 3 2.6e+04 -4.2 0.1 25 35 749 759 747 764 0.76

6 8 3 2.6e+04 -4.2 0.1 25 35 788 798 786 803 0.76

7 8 3 2.6e+04 -4.2 0.1 25 35 827 837 825 842 0.76

8 8 3 2.6e+04 -4.2 0.1 25 35 866 876 864 881 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	4.8e-37	4.2e-33	114.3	0.0	3	78	226	301	224	302	0.97
2	8	2.5	2.2e+04	-3.3	0.0	24	33	631	640	619	647	0.70
3	8	3	2.6e+04	-4.2	0.1	25	35	671	681	669	686	0.76
4	8	3	2.6e+04	-4.2	0.1	25	35	710	720	708	725	0.76
5	8	3	2.6e+04	-4.2	0.1	25	35	749	759	747	764	0.76
6	8	3	2.6e+04	-4.2	0.1	25	35	788	798	786	803	0.76
7	8	3	2.6e+04	-4.2	0.1	25	35	827	837	825	842	0.76
8	8	3	2.6e+04	-4.2	0.1	25	35	866	876	864	881	0.76

Sequence Information

Coding Sequence: atgtctgaGATGGGGTTTGAGAACGTGTTTTACCTGGAGAATTTTGAGTGCGGCGACGAAGTGTTAGTGGAATCGTCGCCGCCCGCCTCGCCCGACATGGCGACGCGGCTTGCGGCCCCTGCCCAGGGAGCTACCGGCGGAACTGGCGGAGGCGCGTCCCCCAGCACCGTGCGCGAGCTCATCGTGATCCCCGAGATACCCAACTCAATACATCTACAACACGCCATACAGCAGGTGTCGAGCACGGTGGTGGAGGTGAACGGCGACAGCTCGGGACACTCCAGCCCCACCACGGAGGCGCAGCACACCTACATCACCGTCGCTATGACGGGGGCATGGAGGGAAGGCGGCCCGGTGTCCGTCAAGACCGAGGATCACAGTGACCAAGAAAGCGAGGGTGGTAACGGCGTCAACTACCATGTGCAGTACGTGGAGCCGCAGGAGATATACGCGCAGGGACACCAGCCGCAAATGGAGACCCTCCGCTCGTACCCGGTGTACGGCGTGGCGACGGTGGGCAGCGCgggcgccgacgccgcgcccgccgacgGCGCCTGGCCGGCCGGCGCCTCCGCCGAGTACACGGCCTACGGGGTAGTGGTCGCGGGCGACGAGGCAGAGGCGCCGGCGTCGCCCGCCacgccggccgccgcgccgctgcCGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTGGACCACTACGAGACCGCAGAGGGCGTGTCGCTGCCGCGCTCGACGCTGTACGCGCACTACCTGCGCCACTGCGCCGCGCACCGGCTGGACCCCGTCAACGCGGCGTCGTTCGGCAAGCTCATCCGCTCCGTGTTCATCggcctgcgcacgcgccgcctcGGCACGCGCGGCAACTCCAAGTACCACTACTACGGCATCCGTGCCAAGGCCAGCGCTGGCGACTCGCCGCCTGCGCCCGACGCCGCCGACGACAAGACCGACGTCGCCGACCATCAGGAGAACCGTGAGCCGGAGCGCGAGCGCGAGGCGGCGTCCAGCCCGGCCGGGCTCGCGGGCCTGGCGCACCGCCAGTACCtgggcgcggccggcgcgcccgACCCGCCGCCGCTCGAGCTGCGCGACCTGCCGCgcgacgcgccgcccgccgcgctgcacgcgctGCGCGACCAGCACAGGTCCCACGGCGTGGAGTTCCTGGAGGCGGTGGCGGCGCTGGACACGGGCGCGGTggagcgcgcgcggcgcgcgttCTGGCGGCgggcgcccgccgccgcgcgccgcctggcCGCGCGCCGCGACGTGGCCGCTTGGCTGCGCGCCGCCGACCTGCGCCTCTACCAGCAGGCCGTCGAGCTGCTGCTGCCCGACGTGCTGCGCCCCATCCCGCCGCAGCTCACGCAGGCCATCCGCAACTTCGCGAAGAGCCTGGAGTCGGCgctggcggcgggcgcggcgggcgcgccggcggcggcggcgcgcgcgcaggcggcggcggcggcggcgctgtCGGCCGCGCTGCGCCGCTACACGTCGCTCAACCACCTGGCGCAGGCCGCGCGCGCCGTGCTCACCAACCACCACCAGATACAGCAGATGCTGTCGGACCTGAACCGCGTGGACTTCCGCGTGGTGCGCGAGCAGGCCGCCTGGGCCTGTTCCTGCGGCAGCGCCGCCACCGCGCACCGCCTTGAGGCAGACTTTAAGGCGACGCTGGGGCGCGGCGCGACGCTGGAGCAGTGGGCGGGCTGGCTGGAGGCGTGCGTGCGCGACGCGCTGGCGGCGCACGAGCGGCGCGCCGACTacacggcgcgcgcgcgccgcctgctGCTCGACTGGTCCTTCTACTCGTCGCTCGTCATCCGCGAGCTCACGCTGCGGTCGGCGGCGTCGTTCGGCTCGTTCCACCTGATCCGGCTGCTGTACGACGAGTACGTGTCGTACCTAATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGTGAGCGCCGCACCCATACATACTGTGCTGTACGACGAGTACGTGTCGTACCTGATCGAGCGGCGCGTGGCGCAGCACGCGCGCAGCCCGCCCATCGCCGTCATGCACCGCGCCACGGACGACGACGAGGATATCCCGGAGGAGCCGGCGCGCGAGGAGCCCGACGAGGACGAGCCGGAGCCGGAGCCGGAGCAGGAGCAGGAGCAGGAGTGGGACTGGGaggacgacgacgacgacgacgacgagcCCGACGCCAAGAAGCTCAAGATGCCCATCGAGCAGTAG
Protein Sequence: MSEMGFENVFYLENFECGDEVLVESSPPASPDMATRLAAPAQGATGGTGGGASPSTVRELIVIPEIPNSIHLQHAIQQVSSTVVEVNGDSSGHSSPTTEAQHTYITVAMTGAWREGGPVSVKTEDHSDQESEGGNGVNYHVQYVEPQEIYAQGHQPQMETLRSYPVYGVATVGSAGADAAPADGAWPAGASAEYTAYGVVVAGDEAEAPASPATPAAAPLPRMPPATVQWLLDHYETAEGVSLPRSTLYAHYLRHCAAHRLDPVNAASFGKLIRSVFIGLRTRRLGTRGNSKYHYYGIRAKASAGDSPPAPDAADDKTDVADHQENREPEREREAASSPAGLAGLAHRQYLGAAGAPDPPPLELRDLPRDAPPAALHALRDQHRSHGVEFLEAVAALDTGAVERARRAFWRRAPAAARRLAARRDVAAWLRAADLRLYQQAVELLLPDVLRPIPPQLTQAIRNFAKSLESALAAGAAGAPAAAARAQAAAAAALSAALRRYTSLNHLAQAARAVLTNHHQIQQMLSDLNRVDFRVVREQAAWACSCGSAATAHRLEADFKATLGRGATLEQWAGWLEACVRDALAAHERRADYTARARRLLLDWSFYSSLVIRELTLRSAASFGSFHLIRLLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATVSAAPIHTVLYDEYVSYLIERRVAQHARSPPIAVMHRATDDDEDIPEEPAREEPDEDEPEPEPEQEQEQEWDWEDDDDDDDEPDAKKLKMPIEQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -