Basic Information

Insect: Ferdinandea cuprea
Gene Symbol: RREB1_1
Assembly: GCA_963576555.1
Location: OY754958.1:146329969-146335724[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.029 4.4 8.8 0.8 1 21 235 255 235 257 0.93

2 14 0.00027 0.041 15.2 0.2 1 23 267 289 267 289 0.98

3 14 7.7e-06 0.0012 20.0 5.2 1 23 295 317 295 317 0.98

4 14 0.03 4.6 8.7 1.4 2 19 520 537 520 537 0.97

5 14 3.7 5.6e+02 2.2 0.6 1 19 583 601 583 603 0.78

6 14 0.0071 1.1 10.7 0.1 1 23 755 777 755 777 0.97

7 14 0.00014 0.022 16.0 1.7 1 23 786 808 786 808 0.99

8 14 0.00037 0.057 14.7 2.0 1 23 814 837 814 837 0.97

9 14 0.00076 0.12 13.8 2.1 1 23 1182 1205 1182 1205 0.95

10 14 6.9e-05 0.011 17.0 0.3 2 23 1508 1529 1507 1529 0.97

11 14 0.12 18 6.9 6.3 1 23 1535 1558 1535 1558 0.97

12 14 2.4 3.7e+02 2.7 6.3 1 23 1651 1673 1651 1674 0.95

13 14 0.0068 1 10.8 0.5 3 23 1723 1743 1721 1743 0.96

14 14 0.0011 0.17 13.2 4.8 1 23 1749 1771 1749 1771 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.029	4.4	8.8	0.8	1	21	235	255	235	257	0.93
2	14	0.00027	0.041	15.2	0.2	1	23	267	289	267	289	0.98
3	14	7.7e-06	0.0012	20.0	5.2	1	23	295	317	295	317	0.98
4	14	0.03	4.6	8.7	1.4	2	19	520	537	520	537	0.97
5	14	3.7	5.6e+02	2.2	0.6	1	19	583	601	583	603	0.78
6	14	0.0071	1.1	10.7	0.1	1	23	755	777	755	777	0.97
7	14	0.00014	0.022	16.0	1.7	1	23	786	808	786	808	0.99
8	14	0.00037	0.057	14.7	2.0	1	23	814	837	814	837	0.97
9	14	0.00076	0.12	13.8	2.1	1	23	1182	1205	1182	1205	0.95
10	14	6.9e-05	0.011	17.0	0.3	2	23	1508	1529	1507	1529	0.97
11	14	0.12	18	6.9	6.3	1	23	1535	1558	1535	1558	0.97
12	14	2.4	3.7e+02	2.7	6.3	1	23	1651	1673	1651	1674	0.95
13	14	0.0068	1	10.8	0.5	3	23	1723	1743	1721	1743	0.96
14	14	0.0011	0.17	13.2	4.8	1	23	1749	1771	1749	1771	0.99

Sequence Information

Coding Sequence: ATGATGAAAACATCAATTAAAAAGCAATTAACAGACATTCCACCGCGTAAAATGGAGCGACGCGATTCAACAACATCGGATTCATCCGTCGAACCCATGGACCTGGGTCGTAcaccagaaataaaaaaagaagccaaCACAGCGATATCAGCATTGCAGATGCCAACAGCAGTAACACTTAAAGATGCCATTTTATCAGATGCCAATACCCCATACCCCATACGTCATGAATCTGATGCCGACGAATCAGACGATAAGGACAGAGATCAACATCGACGATCACACAGTCAACATCACTACCATCATCGTCGGCGAACTGGCAATAGTGGACGTGACAAACGTACTGTCCTCTTGGAATGCACCGACACTCCACATTCGCTGCGAAAGAAATTCCGCTTCAGTAGCAGTAGTAACAACCAAAACGTTCCAGAGTCTGTGATCAATTTAAAGCAACAGAAAACATCGAACAATGATTCCACGATATCGGGGAAATCAGCAAACCTTACCGCTACAACGAACAACAATGAATCTGGATTTGTGGATGCTAGCAGTAGTCATGTTCTAAACACATCCGGTTCATCGGCGACATCATccacatcgtcatcgtcgtcgccGACATCATCATCGTCAGCGTCACCATCCGCCAGTAATATCGCCGTCTCAAGTCCCGAATCGGGCATGGGCGAACGTGACGACATGAAGTACCTTTGTCCAATTTGTGAGGTTGTATCGGCAACACCCCATGAATTTACCAATCACATACGATGTCATAATTATTCATCTGGGGACACTGAAAATTTCACCTGCCGCATTTGCTCTAAgGTTCTGTCATCTGCCTCGTCACTGGATCGACACGTTCTGGTACACACTGGTGAGCGGCCCTTTAATTGCAAATATTGCCAACTGACATTCACCACAAATGGAAATATGCATCGCCACATGCGAACCCACAAACAGCACCAGCAACACTATCATCGAAATTCAAATGAAACGAAGGGTGGTAGTGCGGCGGGTGCGGGTGCGGGTGGTAATGGTAGTGGCTCTAGCTTAATGCCAATATTACCATCAAATGACCAATCGGCTACAGCGCAAATGCCCTCCAAACCAACTATCGTTAGCAATGGTGTCGTTATTAATAGCAATGGTGACACAATTGGAGGAGGTGGCGGTGGCGAAAGCTACGAAAGTGATGGTGGTTGCTCAACGGATTCATCAAGTGCCATCAGCCAAAGTtccaataacaataataacagcaataccaacaacaaaaacattagcAATTTTAAGCGCAAGAGCACCGACAGCATGGATGACATGGCCGTGATGAAGCGACGCGTGAAGACaaccatcaacaacaacaatatcgTCGATAACTTGCATGGTGCTGCGGATAAAAGTACGATCGAAGAGGCTGACGAAAACAAGCAACAGCACCAaccacagcaacaacaacaaccacaacagaAGCTCTATTGCCCGGTGTGCAATCGCAACGACTTTGTGGGGATGCTAGCATTGGGCGCCCATATGGACTGCGAGCATTCCGATATACCCGCAAAGTGTCGTCAATGTGACGTTGTCTTTAAGACACATAAGCAACTCAACGTCCATCCATGCACGAGTAAACTTAAGATCACACACGGCTTTAAGGATCTTACGTTTGTGGATTTTTCCAGTGAAAAATTCCCTCTTATAGCCAAGTCGCTGTGCGAACAAAGCCTTCGAACGGCGGTCAGTAATCAAAAGTTCGAGTGCTCAAAGTGTTATCGAGCATTTCCATGCGCTAGTGCGGTGGAGATACACGAGAAAGACTGCTCAACGTCGGGTATGAATCTGTTTGTGGATGCGCATGACTTTTCTGTTCGTAAGCAGCGATCCTACAGCGAGAGTTCAGGAtgtgctgatgatgatgacaacCGACGAGAGGAGTTCTTCGCACGATTGTActtgaaaaacaaatcaaccGCACAAAGTATGACGAGTTTGTCGCTATCTTCACCCTCGCTGTCCGATGTTAAGTCCTCAGAGTTGGAGAAATCGCCCGTGAAATTGTCTCAATTAGACCAGTTTCAAGACACCAAGGAGCTGGCTGATATTCAGTCGATTCTGAATATaacctcatcatcatcaactaGCAATTTCCTGCGCAACTTTGAGAATTCTGTAAATGCACCAATCAGTAACTACGGGGCTGAAAACGGCGAAGAGGAGGCTCAGGATGCGTTCACCTCGGAGTTTCGTAAAATGAAATTGCGTGGCGAATTTCCTTGCAAGTTGTGCACGGCAGTGTTTCCCAATTTACGTGCCCTCAAGGGACACAATCGCATTCATCTCAGCGCAGCTGGGCCTGGTCCGTATCGGTGCAATATGTGCACATATTCTATCCACGATAAGGCGGCTCTTGTGCGCCATATGCGCACACACAATGGCGATCGCCCGTACGAGTGCGCAATATGCAACTATGCATTCACGACAAAGGCTAACTGCGAAAGGCACCTGCGAAATCGTCATGCCAAAACGACACGTGACGAAGTAAAGCGTGCGATTATCTACCATCCGTCGGAAGATTCGAACTGTGATGATGCTATTAAGAAGCTGCAATTGTTCTCTTCGCCCGAGTTCGATCAAGACGACATGGAACAACATCATCCGCCAAAGGATCGATCTACACCGGTGTCTCACCTAAAGGAAATGCTTCAGGCGGAGTCGAAACCACTCAAAATCCAAGTGAAGAGCTTGGAAAAGTTAATTGACAAAGCAGCACCATCGTTTAATCATTCGGATGAGGTTGAAAAGGAGTTGGTGCCAGAAGAGTCGCTGCACGATAAATCTAGTCGACCGATGGATCTTAGCATGGACGCATTAGACTTGAGTAAAAAACCTGTTAAGGTACTTAAAGTCCAAGAAAAGCCTCCACAATCTCCCCCGGCACAGGTGACATCTTCGCGTGCGCAGGTACCCGATGAACAAAATATTGACATGCGAGTTTTGGAAAAGAATCAACAGTTGTTACTCGCCCAGCAGCGTCTGTTAAACGAAGCTATGCCGAAAATGGATCCGGCACACTATTTCCAGCTGTCGCAGCTCTATCGCAATTTGGTTTTCCAGCCGCTAAATCcgtttttcttgcaaaactcatTTCTATCGAACAACATCAGCGATCTAAACAAATTTGGGCCGATGATGAATCCACTTTTCGACCATGCCGCAGTTGGTGAAAGTTCAATCACTGGCAACCATACCCAAAATATGCAGCCAAAGACAGCCACGGAAGAGGCCAATTTATTGATGAAGCACTCCAATTCCAGCCCTCACTCGCCTACCCCCGCTAAGAACCAAATGATACCGCGGAACCTGACTCCGTCCTTGTCACAAATGCCGGCactgccaagaagccatcaacACATGAGCCCAATGACGGGATCACATACCTCAGGAATGCTCCCATCATCGGTGCCTAACTCGGGCCCAGTAAAGATGGTCATCAAAAACGGTGTACTTATGCCCAAGCAAAAGCAGCGTCGTTATCGCACGGAACGCCCTTTCGCCTGTGAACACTGCTCCGCCCGTTTTACTCTCCGTTCCAATATGGAACGTCATATTAAACAACAACATCCGCAGTACTGGGCTCAGCGACAACGTAGTGGGCACCACATTATGCGTGGACGTGCCAACAGTTCTTCTGTTCTCTCTAACATGCATTCGCCTCACCCGCCCTTGGAAGCCCCTCATCAGATTGGCGGTAGTGGCATGATGCCTAATCCCCTGAGTGCCATCTCAGATCAAGTAAAATATGCCATTCTCGCCCAACAGCTCACCCGCAAGGAAACAGACATTTTACAGCAAACTTTGTCACAGGGCTCGAGCAGTGTGATGACACCGAACCCAATGACAGCGGCCATCAGCAGCCTTCGTAAATCATTGAGTTCTTCGTCGAATACAAACAACGGAAGCATAGAAGATGACGATCCGAAACTCGTTATCGATGAGGACGACGAAAAGGGAGAAGAAgacgatgaagatgatgaagagGAAGATCGAAAGCCAGAAAACTTAACTAAAATCCAAGACCTTCAAGAGCAGGGAGCCAACGAAGCTGCTAAAAAAGTTGCTGAGTCGATTTTGGAACAAGCCATGAAAGCTTGCGGCACTAAAAACTCCGCCGCTGTCGATCAGAACCGTGCACCTGTTAAGGACTTTGGACTCAAGCTCTCGAAAAACATGATTGCTCAAGCTGAATCTGTTGGGAAATTTCTTAAAGAAGTCGCCAGTTCTCCGTTTAAGGACGAATCCAACGACCTAGCATCGGTGTCCAGACTTGTTGACAATGCTACCAATTCGATGTCCTTCAACAACTACTTTCGGCCCAGTGATGTAGTGAATCAAGCAGAGCAGAGTGACGAAGAGGGCTTAGTCGCATCAGGCAGTGCCTCCGAAAGCAACAACTCTGGCCCAGAGGATATGCCCGGCTCTCAGGAACCAAAGAAGAAGTCCGCCTACAGTTCGGCACCAAATCGAGTCTCGTGCCCCTATTGCCAGCGAATGTTCCCCTGGTCCAGCTCATTGCGACGACATATTCTAACACACACTGGCCAAAAACCTTTCAAATGCTCCCATTGTCCGTTGCTCTTCACAACGAAAAGCAATTGCGATCGCCACCTTCTGCGGAAGCATGGAAATGTCGAATCAGCTGTGTCCCTGTATGTTCCAATCGAAGATGTCAATGAACCGATGCCAGTACCAAAGTCTGTCGAGGAGATTGAGTTGCTACGTCAACAACAACTTTTGCAacagagagaagaaaaaaagctCGAAGAGCAAAAGGAGCTGGAGAAGCAAAAGCAAGTGGTTCAAGAAAATCAagaaacaacagcaacaactccAACTTGCGTCAACGCAGTATGTAAAGTCGAACCAGCACCACAGATAGTTTCGTCATCAGAGCTGCCGTTTAAATGTCATCTATGCGACAGTTCATTTGCCGAAAGATTTCAGTGCCTCGACCACATTAAAATCCATCATGCTCAAGAGTTCGCCCTGCTTTTGTCCAAGGGCGCCATCGACAGCGAAGCCGATGTCAACAATCAAGTGCAGTCAACCGAAGACGATGAGAAACGCGACGAAAGCCGTGGCAAATATCCGGACTATACCAATCGCAAGGTAATCTGCGCCTTCTGCGTGCGACGCTTTTGGTCCACCGAAGATCTACGTCGGCATATGCGGACTCACTCGGGCGAACGACCATTTCAGTGTGACATCTGTCTGCGTAAGTTCACTCTTAAACACAGCATGCTCCGCCACATGAAGAAACACAGCGGTGGCAGTCATTCTGGTAACGGTGCCGCCAATGCCACAAACAGCGGCTCCGACATATCCGACGATGAGCAACCGCCATCGAATGTCATGCTAGCGACCACCTTACGCTCGCACAAAATCCAGGAGCTCTTTTCGAAGGCCAACACAGAGTGGCGCAACAGTCGTCTATCTGGCGAGCACAAGGAGAACATCGAAGAGCACAACAACCAGTCCGACCTAATTGGCAATTTGCTTGGCATCAGCGATCAAGGCATTCTCAACAAGCTTCTCTCATCAGCCGATGAGGCGGCCAAATTTTTAGGTGTCGATAAGTAG
Protein Sequence: MMKTSIKKQLTDIPPRKMERRDSTTSDSSVEPMDLGRTPEIKKEANTAISALQMPTAVTLKDAILSDANTPYPIRHESDADESDDKDRDQHRRSHSQHHYHHRRRTGNSGRDKRTVLLECTDTPHSLRKKFRFSSSSNNQNVPESVINLKQQKTSNNDSTISGKSANLTATTNNNESGFVDASSSHVLNTSGSSATSSTSSSSSPTSSSSASPSASNIAVSSPESGMGERDDMKYLCPICEVVSATPHEFTNHIRCHNYSSGDTENFTCRICSKVLSSASSLDRHVLVHTGERPFNCKYCQLTFTTNGNMHRHMRTHKQHQQHYHRNSNETKGGSAAGAGAGGNGSGSSLMPILPSNDQSATAQMPSKPTIVSNGVVINSNGDTIGGGGGGESYESDGGCSTDSSSAISQSSNNNNNSNTNNKNISNFKRKSTDSMDDMAVMKRRVKTTINNNNIVDNLHGAADKSTIEEADENKQQHQPQQQQQPQQKLYCPVCNRNDFVGMLALGAHMDCEHSDIPAKCRQCDVVFKTHKQLNVHPCTSKLKITHGFKDLTFVDFSSEKFPLIAKSLCEQSLRTAVSNQKFECSKCYRAFPCASAVEIHEKDCSTSGMNLFVDAHDFSVRKQRSYSESSGCADDDDNRREEFFARLYLKNKSTAQSMTSLSLSSPSLSDVKSSELEKSPVKLSQLDQFQDTKELADIQSILNITSSSSTSNFLRNFENSVNAPISNYGAENGEEEAQDAFTSEFRKMKLRGEFPCKLCTAVFPNLRALKGHNRIHLSAAGPGPYRCNMCTYSIHDKAALVRHMRTHNGDRPYECAICNYAFTTKANCERHLRNRHAKTTRDEVKRAIIYHPSEDSNCDDAIKKLQLFSSPEFDQDDMEQHHPPKDRSTPVSHLKEMLQAESKPLKIQVKSLEKLIDKAAPSFNHSDEVEKELVPEESLHDKSSRPMDLSMDALDLSKKPVKVLKVQEKPPQSPPAQVTSSRAQVPDEQNIDMRVLEKNQQLLLAQQRLLNEAMPKMDPAHYFQLSQLYRNLVFQPLNPFFLQNSFLSNNISDLNKFGPMMNPLFDHAAVGESSITGNHTQNMQPKTATEEANLLMKHSNSSPHSPTPAKNQMIPRNLTPSLSQMPALPRSHQHMSPMTGSHTSGMLPSSVPNSGPVKMVIKNGVLMPKQKQRRYRTERPFACEHCSARFTLRSNMERHIKQQHPQYWAQRQRSGHHIMRGRANSSSVLSNMHSPHPPLEAPHQIGGSGMMPNPLSAISDQVKYAILAQQLTRKETDILQQTLSQGSSSVMTPNPMTAAISSLRKSLSSSSNTNNGSIEDDDPKLVIDEDDEKGEEDDEDDEEEDRKPENLTKIQDLQEQGANEAAKKVAESILEQAMKACGTKNSAAVDQNRAPVKDFGLKLSKNMIAQAESVGKFLKEVASSPFKDESNDLASVSRLVDNATNSMSFNNYFRPSDVVNQAEQSDEEGLVASGSASESNNSGPEDMPGSQEPKKKSAYSSAPNRVSCPYCQRMFPWSSSLRRHILTHTGQKPFKCSHCPLLFTTKSNCDRHLLRKHGNVESAVSLYVPIEDVNEPMPVPKSVEEIELLRQQQLLQQREEKKLEEQKELEKQKQVVQENQETTATTPTCVNAVCKVEPAPQIVSSSELPFKCHLCDSSFAERFQCLDHIKIHHAQEFALLLSKGAIDSEADVNNQVQSTEDDEKRDESRGKYPDYTNRKVICAFCVRRFWSTEDLRRHMRTHSGERPFQCDICLRKFTLKHSMLRHMKKHSGGSHSGNGAANATNSGSDISDDEQPPSNVMLATTLRSHKIQELFSKANTEWRNSRLSGEHKENIEEHNNQSDLIGNLLGISDQGILNKLLSSADEAAKFLGVDK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01223735;
90% Identity: iTF_01254312;
80% Identity: -