Basic Information

Insect: Perizoma affinitatum
Gene Symbol: rfx3_1
Assembly: GCA_961405105.1
Location: OY560195.1:1933402-1955024[-]

Transcription Factor Domain

TF Family: RFX
Domain: RFX domain
PFAM: PF02257
TF Group: Basic Domians group
Description: RFX is a regulatory factor which binds to the X box of MHC class II genes and is essential for their expression. The DNA-binding domain of RFX is the central domain of the protein and binds ssDNA as either a monomer or homodimer [1]. It recognize X-boxes (DNA of the sequence 5'-GTNRCC(0-3N)RGYAAC-3', where N is any nucleotide, R is a purine and Y is a pyrimidine) using a highly conserved 76-residue DNA-binding domain (DBD) [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.093 7.8e+02 1.2 0.0 3 17 203 217 202 223 0.85

2 10 0.093 7.8e+02 1.2 0.0 3 17 248 262 247 268 0.85

3 10 0.093 7.8e+02 1.2 0.0 3 17 293 307 292 313 0.85

4 10 0.093 7.8e+02 1.2 0.0 3 17 338 352 337 358 0.85

5 10 0.093 7.8e+02 1.2 0.0 3 17 383 397 382 403 0.85

6 10 0.093 7.8e+02 1.2 0.0 3 17 428 442 427 448 0.85

7 10 0.093 7.8e+02 1.2 0.0 3 17 473 487 472 493 0.85

8 10 0.093 7.8e+02 1.2 0.0 3 17 518 532 517 538 0.85

9 10 8.4e-37 7e-33 113.5 0.0 3 78 563 638 561 639 0.97

10 10 0.97 8.1e+03 -2.0 0.0 24 42 1005 1024 993 1028 0.77

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.093	7.8e+02	1.2	3	17	203	217	202	223	0.85
2	10	0.093	7.8e+02	1.2	3	17	248	262	247	268	0.85
3	10	0.093	7.8e+02	1.2	3	17	293	307	292	313	0.85
4	10	0.093	7.8e+02	1.2	3	17	338	352	337	358	0.85
5	10	0.093	7.8e+02	1.2	3	17	383	397	382	403	0.85
6	10	0.093	7.8e+02	1.2	3	17	428	442	427	448	0.85
7	10	0.093	7.8e+02	1.2	3	17	473	487	472	493	0.85
8	10	0.093	7.8e+02	1.2	3	17	518	532	517	538	0.85
9	10	8.4e-37	7e-33	113.5	3	78	563	638	561	639	0.97
10	10	0.97	8.1e+03	-2.0	24	42	1005	1024	993	1028	0.77

Sequence Information

Coding Sequence: ATGTCCGAGATGGGGTTTGAAAATGTGTTCTACCTAGAGAATTTCGAGTGTGCCGGTGACGAGGTTCTGGTGGAGTCTTCGCCGCCCGCCTCTCCCGACATGGCGGCGCGGTTAGCGGCGCCCGCGCAGAGTAATGGCGCGGGCGGTGCGTCCCCCAGCGCGGTCCGTGACCTGATCGTGATCCCCGAGCTGCCGGATTCCATACATCTGCAGCACGCCATGCAGCAGGTGTCCAGCTCGGTGGTGGAAGTGAACGGCGTGAACGGTGACAGTTCGGGACAATCAAGCCCGAATGCCGAGCCTCAACACACCTTCATCACAGTCGCAAGCGAGGGTGGGAATGGAGTCAACTACCACGTGCAGTATGTCACCGAGCCGCAGGAGATATACGCGCAAGGACATCAGGCTATGGAGACGCTCCGCTCGTACCCGGTGTACGGCGTGGCGACGGTCGCCAACGGAACCGGCGAGACAGAGGCCGCGTGGGGCGGGGCCACCTCAGCCGACTACACCGCTTATGGCGTCGTGGTGGCAGGCGACGAGGCGTCAGCGCCGACGTCCCCCGCCACGCCGGCCGGCGTCCCGCAGCCGCCGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCACACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGTAACGCATCAACATCCAGCGATGCACAGACGCACTCACCCCGACACACTCATCCACACACACCTACATACAGCCATACGCGCATGCCGCCCGCCACCGTGCAGTGGCTGCTCGACCACTACGAGACCGCTGAAGGCGTATCCCTTCCGCGTTCAACTCTCTACGCGCACTACCTCCGGCACTGCTCGATTCACCACCTCGAGCCGGTGAACGCGGCGTCTTTCGGGAAGCTTATCCGCTCGGTGTTTGTGGGACTGCGGACGAGACGGCTCGGGACCAGGGGGAACTCGAAATACCATTACTATGGGATCCGCGCCAAGCCGAATTCCGACCAGCATGCGCCCGATGCAAACGACAGCGCCGATGACAACGCGGACCTCAATGAAAAGGAGAGTGATCGTTCCCGCGAGCGCGAGGAAGGTCCGGGTTCGCCGCTGGGTGCCGCCTCCGTCGCCAACCGGCAGTACCTCGCGTCCGTCACGGCGCCGTCCCCGCCCGCGCTCGATCTCCCGATGTCGGACGACATCCCGCCCGGCGCCTTGCAGCTGCTGCGCCGACATCACCGCGATCACGGCGCCATGTTCCTGGAGGCGGTGGCTGCGCTGGACACGGGCGCCGTGGAGGCCGCGCGTCGCGCCTTCTGGAGGCGCAGCTCCCCTGAAGACAACACCCTGTGCCGACGCACGCTGGCAAGACTCTGCGCAAGGAAGGACGTCTGTCGCTGGCTTCGATCGGCCGACACGCAGCTCTACCAACGCGCCGTGGATATGCTACTGCCTGATGTATTGCGCCCGATTCCACCACAACTCACACAGGCAATCCGCAACTTCGCAAAGAGTGTGGAATGCGCCGTGTCGGCCGGGTCGGGCGGAGCGCCTCTACCGGCTATGCGTGCGCAGGCTCGGGCCGCAGCCGCTCTAGCCGGGGCACTGCGCCGCTACACCTCGCTCAACCACCTCGCGCAGGCGGCGCGAGCCGTGCTCACCAACCACCTCCAGATACACCAGGTATGTGACCGCTCTAGCCGGGGCACTGCGCCGCTACGGCTCGCGCAGGCGGCGCGAGCCGTGCTCACCAACCACCTCCAGATACAGCAGATGGTGTCGGACCTGAACCGCGTGGATTTCCGCGTGGTTCGCGAGCAAGCCTCCTGGGCCTGCGCCTGTCCCTCCGCCGCCGTGGCGCTCAAGCTCGAAGCAGACTTCAAGGCGACGCTGAACCGCGGCGCTACGCTGGAGCAGTGGGCGGGCTGGCTGGAGCGCTGCGTGAGCGGAGCCCTGGCGCCGCACGAGGGCCGCGCCGACTACGTGCCTCGCGCACGACGCCTGCTGCTCGACTGGTCCTTCTACTCCTCGCTCGTCATCCGCGAGCTCACACTCAGATCCGCGGCGTCGTTCGGCTCGTTCCACCTGATCCGGCTTCTCTACGACGAGTACGTGTCCTACCTGATCGAGCGACGCGTCGCGACGCATCTCAACGCGCCGCCCATCGCCGTCATGCATCGCACGCAGgaggaagaagaagaagaaggtcAAGAAGAGAACCGCGTCGAGGGTCTGGAAGAGGATCAAGACTGGGACTGGGAGGATGAGGAAGAGGATGATGAACCGGAGAGCAAGAAAGCGAAGATCAGCTGTGAGTAG
Protein Sequence: MSEMGFENVFYLENFECAGDEVLVESSPPASPDMAARLAAPAQSNGAGGASPSAVRDLIVIPELPDSIHLQHAMQQVSSSVVEVNGVNGDSSGQSSPNAEPQHTFITVASEGGNGVNYHVQYVTEPQEIYAQGHQAMETLRSYPVYGVATVANGTGETEAAWGGATSADYTAYGVVVAGDEASAPTSPATPAGVPQPPRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGNASTSSDAQTHSPRHTHPHTPTYSHTRMPPATVQWLLDHYETAEGVSLPRSTLYAHYLRHCSIHHLEPVNAASFGKLIRSVFVGLRTRRLGTRGNSKYHYYGIRAKPNSDQHAPDANDSADDNADLNEKESDRSREREEGPGSPLGAASVANRQYLASVTAPSPPALDLPMSDDIPPGALQLLRRHHRDHGAMFLEAVAALDTGAVEAARRAFWRRSSPEDNTLCRRTLARLCARKDVCRWLRSADTQLYQRAVDMLLPDVLRPIPPQLTQAIRNFAKSVECAVSAGSGGAPLPAMRAQARAAAALAGALRRYTSLNHLAQAARAVLTNHLQIHQVCDRSSRGTAPLRLAQAARAVLTNHLQIQQMVSDLNRVDFRVVREQASWACACPSAAVALKLEADFKATLNRGATLEQWAGWLERCVSGALAPHEGRADYVPRARRLLLDWSFYSSLVIRELTLRSAASFGSFHLIRLLYDEYVSYLIERRVATHLNAPPIAVMHRTQEEEEEEGQEENRVEGLEEDQDWDWEDEEEDDEPESKKAKISCE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -