Basic Information

Insect: Coenonympha arcania
Gene Symbol: Arid2_1
Assembly: GCA_036785405.1
Location: JAWDAA010000030.1:6821813-6873916[-]

Transcription Factor Domain

TF Family: RFX
Domain: RFX domain
PFAM: PF02257
TF Group: Basic Domians group
Description: RFX is a regulatory factor which binds to the X box of MHC class II genes and is essential for their expression. The DNA-binding domain of RFX is the central domain of the protein and binds ssDNA as either a monomer or homodimer [1]. It recognize X-boxes (DNA of the sequence 5'-GTNRCC(0-3N)RGYAAC-3', where N is any nucleotide, R is a purine and Y is a pyrimidine) using a highly conserved 76-residue DNA-binding domain (DBD) [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 1.2e-07 0.001 20.5 0.0 2 52 585 639 584 644 0.88

2 7 2e-05 0.16 13.4 0.0 17 52 667 703 656 708 0.88

3 7 2e-05 0.16 13.4 0.0 17 52 731 767 720 772 0.88

4 7 2e-05 0.16 13.4 0.0 17 52 795 831 784 836 0.88

5 7 2e-05 0.16 13.4 0.0 17 52 859 895 848 900 0.88

6 7 2e-05 0.16 13.4 0.0 17 52 923 959 912 964 0.88

7 7 9.9e-09 8.2e-05 24.0 0.0 17 78 987 1051 976 1052 0.86

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	1.2e-07	0.001	20.5	2	52	585	639	584	644	0.88
2	7	2e-05	0.16	13.4	17	52	667	703	656	708	0.88
3	7	2e-05	0.16	13.4	17	52	731	767	720	772	0.88
4	7	2e-05	0.16	13.4	17	52	795	831	784	836	0.88
5	7	2e-05	0.16	13.4	17	52	859	895	848	900	0.88
6	7	2e-05	0.16	13.4	17	52	923	959	912	964	0.88
7	7	9.9e-09	8.2e-05	24.0	17	78	987	1051	976	1052	0.86

Sequence Information

Coding Sequence: ATGGCTAAATCACAAATAAATACTAAATCGAGGAACTATTCGCTAGATAAGGAGACGTTTCTAAAGGATTTGAAGCAATTTAACGAAAGTAAAAATATTCCGTACAAAATACCGGTAGTAAATGGGGTTGATATTgatttatacctattatattcgCTGGTGCAACAGCGTGGAGGTCTAAGCAGGgtgAACCAAAACGATACCTGGGAGTCATTTTTGCGTCAACTCAGACTACCACACCCTTGTATAAATGGATCTACCCTACTCAGAAGAATTTATGGTACTTATTTGGAAAAGTATGAAAGAGCCAAGGGGCCTCCACGCCTGGATCTGGATGACAATGACATGGATGAGGATCCCAGGAGAGGCAGGGGTGGTGGAATGCCAAGGATCACTTTCAGTGGCGGCTCTTACATATCAGCTTCAGGCGAGGCACTCCGTCCGGCCAACAGGGTCGCTGGCCCGTCGGAACGGTTGACGCTGTCCCTACTGTCTCCGATGCCCAACGAGCAGGATTTCGCAGTCAACGTGTGCACGGTTCTGGCTGCGGATCACTCCAACCGGCTGCCCCTGAGCACCACTCCGCATATATTGGACTTCCTACTCGCACATGCAGGGGTTTATAATCATTCGAGTCTCCGAGACACAATCGGTCGATCATACTACGAAGCCCGAGGCAGATATCCTCACGAGTTCTGGCAGCTGAGAGCTGGGGGCGGTGGTGCTAAGGAGCTAGCTGATGAGACCAAGTTCATGCAGCCCGGCCTGGAGCAGCCGGAGCTGATGGTGCAAGCCCTGGCCGCACACAACACCCTGACCGACTGCCTAATGCAGGGAGCGGAGGACGAAGACAGCTTGGACAAAATTATTGAAGAGGATCTGCTTGAAGACTGGGTGACAGAACCATCGGAGGAGGATCAGCTGTTCGCGCCGGAGCTGCCGGGCGGCGCGAGCTGCGTGTACACGCAGCGCGTGTTGCAGATCGCGTCCATCGTGCGCTCGCTGTCCTTCCACGAGGAGAACGTGCAGTATCTCGCCAGGAACACCACCCTCATAAGATTCTTATTACTATGTGCCAATTGTTGGGTTGGAGCACTCCGACAAAGTGGCTTGGACACGCTTGGAAACGTTTCCACAGAGCTAATTATAAAGGACCCAGCGACATGTCTGATATCCAGACACGTGATATCGACGATCCAAACAGCGCTCACGTCGCAGGACCGCGCGCGAGTCCTAGCGGCTTTGGAGCTGCTCAACAAGCTGGCGCAAAACGAGGTCAACGAAGACGCCTTGCTTAAAGCGCTGGAAGCCAAGGTGTATCGGGACGTATGCTCCCTGCTAACCCTACGCGATATCATGGTGCTAGTGTGCACGCTGGAGTGCGTGTACGCGCTGACGGGTTTGGGCGACCGTGCGTGCGAGGCCGTCGCCAGGGTGCCCGGGCTACTGCAGACGCTGGTTTCTCTTGTCACGGTCGAGGCGCAAAGCTACGGCCCTCGCGCGTGTATACTGATGCGCGTGGTAGAGACCGTCAGCGGCCCGCAAGCCGTCGCCGCGGCCGGCACAACGGAGCCGGTGTCCCATCCCACGCCGGTAGCGCAGCCACAACCGAGCACGCCAGTCAAGCCGGCTTCGGAACCGCCGCCGCTAACCTCGACGTCCAACACCACGCCAGCGAGCGTGCCTGTCTCTGCGCCCATGTCGACGCTGCAGCAGTCGCATATACAACAACGGACAGTACAGGAAAATGAGCACTTCGTGCAAGCGTGGCTGCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGTGAGATATTATTCCGAGCCACGTACGAGCCGCTGCCGGCGAGCGACAACAGCACGTGCGACGCCGCCGACGTGTACCGCCAGTACCTCGCGTGCTGCACCAAGCTGTCGCGCAAGGGCGTCATTGCGCCCGCGCACTTCCCCAGACTTGTGCGGACTGTGTTTGGAGGCACCGTGGGACCAAACACTGTCAGCACGTCCAGCGGTGAGACGCAGCACGTGTACGTAGGTATACGCGCGAAAAACGCAGCCAACAGGACCAACCCACCTGCTGGACCCTCGTCGCCCATCCTGAAGGCGCAACTCACGAACAAGCCACCGACCAGCGAGCCCaaaccgccgccgccgcagcctcAGATAGTTCAGCAGGCGCCGCACCCGGTGCTGTCGCAGGCGCTGGAGTCGTCGCCGTCCAACACGTCGCTCATCAAGCACCTACTGGCGCACAAAGTAAGCCCCGCCCCGCCACCGCACGCGCAAgtCGCTCAAAGACAACAGAGTCAGCAGAGAGTGGGGCCAGCGCAGGCTGGAACCGTCGTGGTACAGGCTGGCCAATCAGCgGGTATGGAAGTGGACCCCGAGGCGTTGATTAAATGCACAACAATTATACCGGGCGGAGTTGCTACTAACCAAAACGCGCAAGGGGAAAAGAAAACGGCTCAAAACAAAATGCTGGCGGACctccttgaaaaaaaatccaacccTCCAGTGCAAGTCGTTCCAATGGGACAACAGATCAACGCGCCGACCATACAAATAACCGAGACCGGGCAAATAGTGCAGGTCAAATCCGAGAACCCTCTCATACAAATCAATACAGACAACGTCCAACCGAGCGGGCcgttcttccaaataaaaaacGACCAAGGCCAATTGGTGCAACTTAAAAACGACCAAGGCCAGATCATACAGTTGAAGAGCGACCAACTACAAGGATTGCTACAGTTTAAAAACGATCAAGGCCAAATAGTGCAGATCAAAAACGAACAGTTGGTCCCTCAAGTAGTTCAGCAGAGTGTCATACAGAGCGTGAAGACGGAAAAGGATCAGATAATCGATACCGTGGTCACCGATCACTCGTATACGGAACCGCCTAACAAAAAGGCGAAGATTGAGGATAAGTCTGAGAGCAATTCTCCTCAAGAGAGAGAGAGCGTGTCAAAAACCGCTGCCAACCTGTACGCTGCGATTGCGGCGTCCGCGCTAGAAGACGAAGACGATTTGGTGCAACCACCGCCATTGCAAGTGACACAGCCGACGATGCAAGTGCATCAGCCGACAATGCAAGTGCAGCAACCAGCTCTGCAAATGCACCAGACTCCGACTTTACAGGTCCAACAGCCAACGTTGCAGGTCCAACAGCCAACATTGCAGGTCCAGCAGCCGATGCTACAGGTGCAGCCGATGGACGTGCAGAATATCATCGCTTCACAATCCGGACAAATTATATTACAAGaaaagCAGATGCCGTCTCAAGCGACGCAGTTCATGCAACAGCCGATGCAAATTATAGCTACTCCTGGCTCCTCACAAGGAGGTCTTAGCTATATAGCTCAAAATATCCCCGGCAATATGATGCAGAAAACAATCATTATCGTACAAGGTGCCGGCGGGGGACCGCTCACATTGACGGTATGTTACGACAAGTAG
Protein Sequence: MAKSQINTKSRNYSLDKETFLKDLKQFNESKNIPYKIPVVNGVDIDLYLLYSLVQQRGGLSRVNQNDTWESFLRQLRLPHPCINGSTLLRRIYGTYLEKYERAKGPPRLDLDDNDMDEDPRRGRGGGMPRITFSGGSYISASGEALRPANRVAGPSERLTLSLLSPMPNEQDFAVNVCTVLAADHSNRLPLSTTPHILDFLLAHAGVYNHSSLRDTIGRSYYEARGRYPHEFWQLRAGGGGAKELADETKFMQPGLEQPELMVQALAAHNTLTDCLMQGAEDEDSLDKIIEEDLLEDWVTEPSEEDQLFAPELPGGASCVYTQRVLQIASIVRSLSFHEENVQYLARNTTLIRFLLLCANCWVGALRQSGLDTLGNVSTELIIKDPATCLISRHVISTIQTALTSQDRARVLAALELLNKLAQNEVNEDALLKALEAKVYRDVCSLLTLRDIMVLVCTLECVYALTGLGDRACEAVARVPGLLQTLVSLVTVEAQSYGPRACILMRVVETVSGPQAVAAAGTTEPVSHPTPVAQPQPSTPVKPASEPPPLTSTSNTTPASVPVSAPMSTLQQSHIQQRTVQENEHFVQAWLRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRASLRPRTSPDLCGEILFRATYEPLPASDNSTCDAADVYRQYLACCTKLSRKGVIAPAHFPRLVRTVFGGTVGPNTVSTSSGETQHVYVGIRAKNAANRTNPPAGPSSPILKAQLTNKPPTSEPKPPPPQPQIVQQAPHPVLSQALESSPSNTSLIKHLLAHKVSPAPPPHAQVAQRQQSQQRVGPAQAGTVVVQAGQSAGMEVDPEALIKCTTIIPGGVATNQNAQGEKKTAQNKMLADLLEKKSNPPVQVVPMGQQINAPTIQITETGQIVQVKSENPLIQINTDNVQPSGPFFQIKNDQGQLVQLKNDQGQIIQLKSDQLQGLLQFKNDQGQIVQIKNEQLVPQVVQQSVIQSVKTEKDQIIDTVVTDHSYTEPPNKKAKIEDKSESNSPQERESVSKTAANLYAAIAASALEDEDDLVQPPPLQVTQPTMQVHQPTMQVQQPALQMHQTPTLQVQQPTLQVQQPTLQVQQPMLQVQPMDVQNIIASQSGQIILQEKQMPSQATQFMQQPMQIIATPGSSQGGLSYIAQNIPGNMMQKTIIIVQGAGGGPLTLTVCYDK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00352822;
90% Identity: iTF_00352822;
80% Identity: iTF_00352822;