Basic Information

Insect: Leptidea sinapis
Gene Symbol: -
Assembly: GCA_905404315.1
Location: FR990182.1:3057405-3060707[-]

Transcription Factor Domain

TF Family: RFX
Domain: RFX domain
PFAM: PF02257
TF Group: Basic Domians group
Description: RFX is a regulatory factor which binds to the X box of MHC class II genes and is essential for their expression. The DNA-binding domain of RFX is the central domain of the protein and binds ssDNA as either a monomer or homodimer [1]. It recognize X-boxes (DNA of the sequence 5'-GTNRCC(0-3N)RGYAAC-3', where N is any nucleotide, R is a purine and Y is a pyrimidine) using a highly conserved 76-residue DNA-binding domain (DBD) [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 22 3.4 2.8e+04 -3.1 0.1 61 68 28 35 25 36 0.87

2 22 0.16 1.3e+03 1.2 0.0 50 68 64 83 60 84 0.85

3 22 0.16 1.3e+03 1.2 0.0 50 68 112 131 108 132 0.85

4 22 0.16 1.3e+03 1.2 0.0 50 68 160 179 156 180 0.85

5 22 0.16 1.3e+03 1.2 0.0 50 68 208 227 204 228 0.85

6 22 0.16 1.3e+03 1.2 0.0 50 68 256 275 252 276 0.85

7 22 0.16 1.3e+03 1.2 0.0 50 68 304 323 300 324 0.85

8 22 0.16 1.3e+03 1.2 0.0 50 68 352 371 348 372 0.85

9 22 0.16 1.3e+03 1.2 0.0 50 68 400 419 396 420 0.85

10 22 0.16 1.3e+03 1.2 0.0 50 68 448 467 444 468 0.85

11 22 0.16 1.3e+03 1.2 0.0 50 68 496 515 492 516 0.85

12 22 0.16 1.3e+03 1.2 0.0 50 68 550 569 546 570 0.85

13 22 0.16 1.3e+03 1.2 0.0 50 68 598 617 594 618 0.85

14 22 0.15 1.3e+03 1.3 0.0 50 68 646 665 642 667 0.85

15 22 0.16 1.3e+03 1.2 0.0 50 68 694 713 690 714 0.85

16 22 0.16 1.3e+03 1.2 0.0 50 68 742 761 738 762 0.85

17 22 0.16 1.3e+03 1.2 0.0 50 68 790 809 786 810 0.85

18 22 0.15 1.3e+03 1.3 0.0 50 68 838 857 834 859 0.85

19 22 0.16 1.3e+03 1.2 0.0 50 68 886 905 882 906 0.85

20 22 0.16 1.3e+03 1.2 0.0 50 68 934 953 930 954 0.85

21 22 0.16 1.3e+03 1.2 0.0 50 68 982 1001 978 1002 0.85

22 22 0.83 6.8e+03 -1.1 0.0 50 67 1030 1048 1028 1049 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	22	3.4	2.8e+04	-3.1	0.1	61	68	28	35	25	36	0.87
2	22	0.16	1.3e+03	1.2	0.0	50	68	64	83	60	84	0.85
3	22	0.16	1.3e+03	1.2	0.0	50	68	112	131	108	132	0.85
4	22	0.16	1.3e+03	1.2	0.0	50	68	160	179	156	180	0.85
5	22	0.16	1.3e+03	1.2	0.0	50	68	208	227	204	228	0.85
6	22	0.16	1.3e+03	1.2	0.0	50	68	256	275	252	276	0.85
7	22	0.16	1.3e+03	1.2	0.0	50	68	304	323	300	324	0.85
8	22	0.16	1.3e+03	1.2	0.0	50	68	352	371	348	372	0.85
9	22	0.16	1.3e+03	1.2	0.0	50	68	400	419	396	420	0.85
10	22	0.16	1.3e+03	1.2	0.0	50	68	448	467	444	468	0.85
11	22	0.16	1.3e+03	1.2	0.0	50	68	496	515	492	516	0.85
12	22	0.16	1.3e+03	1.2	0.0	50	68	550	569	546	570	0.85
13	22	0.16	1.3e+03	1.2	0.0	50	68	598	617	594	618	0.85
14	22	0.15	1.3e+03	1.3	0.0	50	68	646	665	642	667	0.85
15	22	0.16	1.3e+03	1.2	0.0	50	68	694	713	690	714	0.85
16	22	0.16	1.3e+03	1.2	0.0	50	68	742	761	738	762	0.85
17	22	0.16	1.3e+03	1.2	0.0	50	68	790	809	786	810	0.85
18	22	0.15	1.3e+03	1.3	0.0	50	68	838	857	834	859	0.85
19	22	0.16	1.3e+03	1.2	0.0	50	68	886	905	882	906	0.85
20	22	0.16	1.3e+03	1.2	0.0	50	68	934	953	930	954	0.85
21	22	0.16	1.3e+03	1.2	0.0	50	68	982	1001	978	1002	0.85
22	22	0.83	6.8e+03	-1.1	0.0	50	67	1030	1048	1028	1049	0.82

Sequence Information

Coding Sequence: ATGAATACGCCGACGAACTTGCAAGAATTGGTGCTAAAACCACTCAATTTGTCCAAGAGCGCCTGCCTGTTTGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGACTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGACTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACTCAGGCTCGCTCCTGCCTGTGTCCGTGTGTCAGTACCTGCTGCCGCCGCTGCAGGTGCTGCCGGTCCGCGAGCGCCTGCCGGTCGCGGTGCGCGCCGTGCACGCGCCGCAGCACGCCGTCGCCCGCCTCGGCCAACGCGGCCACGAAGGCTCGCTCGCGAGCCGCGTGCTCGGCGTCGAGGCGCGCGCGCCGCTCTCGGTACGCGTCCTTGCGCCGCTCCTTCGACACGAGCTCCACCTCCTGTCGCCACATCAACACACATTCTCTTACTATTACTGGTGGAATTTAACACACTTAAGCTGA
Protein Sequence: MNTPTNLQELVLKPLNLSKSACLFAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLTVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLTVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHSGSLLPVSVCQYLLPPLQVLPVRERLPVAVRAVHAPQHAVARLGQRGHEGSLASRVLGVEARAPLSVRVLAPLLRHELHLLSPHQHTFSYYYWWNLTHLS*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -