Basic Information

Insect: Sogatella furcifera
Gene Symbol: RREB1_1
Assembly: GCA_014356515.1
Location: chrX:28776256-28831891[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.0049 0.25 12.1 0.7 1 23 136 158 136 158 0.98

2 15 0.00087 0.045 14.4 0.5 3 23 186 206 184 206 0.97

3 15 8.4e-06 0.00043 20.8 3.9 1 23 212 234 212 234 0.99

4 15 0.24 12 6.8 0.3 1 23 387 411 387 411 0.92

5 15 0.051 2.6 8.9 0.0 1 21 489 509 489 510 0.93

6 15 0.15 8 7.4 0.1 1 23 721 743 721 743 0.97

7 15 2.7e-05 0.0014 19.2 2.2 1 23 755 777 755 777 0.99

8 15 0.0017 0.089 13.5 4.8 1 23 783 806 783 806 0.97

9 15 0.0014 0.072 13.8 2.8 1 23 1394 1417 1394 1417 0.96

10 15 0.00075 0.039 14.7 0.4 2 23 1693 1714 1692 1714 0.97

11 15 1 53 4.8 7.3 1 23 1720 1743 1720 1743 0.96

12 15 0.00087 0.045 14.4 1.7 1 23 1792 1816 1792 1816 0.96

13 15 0.13 6.5 7.6 0.8 1 23 1905 1928 1905 1928 0.96

14 15 0.0064 0.33 11.7 0.5 3 23 1978 1998 1976 1998 0.96

15 15 0.015 0.76 10.6 5.9 1 23 2004 2026 2004 2026 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.0049	0.25	12.1	0.7	1	23	136	158	136	158	0.98
2	15	0.00087	0.045	14.4	0.5	3	23	186	206	184	206	0.97
3	15	8.4e-06	0.00043	20.8	3.9	1	23	212	234	212	234	0.99
4	15	0.24	12	6.8	0.3	1	23	387	411	387	411	0.92
5	15	0.051	2.6	8.9	0.0	1	21	489	509	489	510	0.93
6	15	0.15	8	7.4	0.1	1	23	721	743	721	743	0.97
7	15	2.7e-05	0.0014	19.2	2.2	1	23	755	777	755	777	0.99
8	15	0.0017	0.089	13.5	4.8	1	23	783	806	783	806	0.97
9	15	0.0014	0.072	13.8	2.8	1	23	1394	1417	1394	1417	0.96
10	15	0.00075	0.039	14.7	0.4	2	23	1693	1714	1692	1714	0.97
11	15	1	53	4.8	7.3	1	23	1720	1743	1720	1743	0.96
12	15	0.00087	0.045	14.4	1.7	1	23	1792	1816	1792	1816	0.96
13	15	0.13	6.5	7.6	0.8	1	23	1905	1928	1905	1928	0.96
14	15	0.0064	0.33	11.7	0.5	3	23	1978	1998	1976	1998	0.96
15	15	0.015	0.76	10.6	5.9	1	23	2004	2026	2004	2026	0.98

Sequence Information

Coding Sequence: ATGATAGACATGGCTTCGGGAACGATACCATGTCAAATGACTGTCGCAATGATCCGTGACCCAAGTGAGCCTAAAGCTACTTCATTACATATGACAGACGAGAGCGCTAGCCGTTCAAAGGAAATGACTACATTTGAAAAACAACCAAAGTTTGCTGATACCAAAGAAAATGATGAAACAGCTGACAAGCACACCAAAGAGCCAGATACCCACAAGAACAACGATAATTGGACATCGAGAAATGGACATACCAAAGCCTCCGACAATACCGAAAGAAACGAGACTGATAACTTAGGGAATGGATCTTCAACGAAAATCAACTTAGATAAGAAATATCAAAATCAGATGAAAAACTCAGACAGCGAATCTGTTGAAGCAGACAACGAATATGATAATGTGAGCCGATTCATCTGCCCGATCTGCAACGTGCTTCTCACCTCGCAGCATGAGTTCACGCTTCACATTCGTTCACACAATAACAACAACGGAGATGCATCCAGCAACCACACATCAGGCGAAGACGAGTGCCTTCTCCCAGGAGGAAAAGGATACGGTTGCTGCATTTGTGGCAAAGTTCTCAGCTCATCAAGCTCATTGGATAGACATGTATTGGTACACTCTGGAGAACGCCCGTTCAAATGCAGCATCTGCAGAGTGAGTTTTACAACAAATGGAAACATGCATCGTCACATGAGGACCCATAATTCAACTGGCAAGGGAATCAATAATTCGCCAACAAATAAAATGAACGGTGGCAATCCTTTGGAGAGCAGCTATGAGAGTGATTGTGGATCAGACAGTTCTGGAACAGGTTCATCATTGTCTCCTTGTTTGAAACGGCGTAAAACATCTAATAACAGTTTCCACGGAGGCGCTAACACTACCATCGATTCAGTTTCAAAACAATCGAGAGATTTAGAATCGAAGATGGAGACAAACTTTAACCCTGTGTCCACTCCCACCACTAATAAGAGGAAAAACGCAGATATCGATTCTTCATTGGATGACAGTGGAAGCAAGGAACAACACACTCGATTGTGTTCGAATACAGTTGCCAGAAACACTCCCACAGTTACTTCAACAGTAGCGAATTCTCGCCGTAGAAGCTCGAAGAACAGCTCTAGCTCAGATGGAGAAGATCGCAGATTAGTGAACAAGTTCAAGTGTCCAGTATGCAAGCGTGAAGACTTTTCGTCACTTAACCTACTAGAGACACATCTAGAGGCCAAGCACCCTGAGTTTAAGGCTTGCTGTGAACCATGCAACTTGGAGTTCAAAAATCACCGTGCATTGAATCTACACCGATTTATGAAGCATCCAGATCATGAGAGGCCGACCAATGGAAGAGACATCGTTGGATTCGACGATCTAACATTTGTTGACTTCTCAAGTGAGAAATTTCCCTACATTGCAAAAACAGTCTGTGAGAAGAGTCTCCATAAGGCTAGTTCAACACAATTGAAATTTCAATGTGAAATCTGCCAACGAGCTTTTCCACTTGGATCTGCATTGGCAATACATCGACAAAGCTGCTTACAAGTTGCTAAAAATAAAAGTGGCTGTATTATAGAGAATGAGCTGAACTGTAGAAAAAATCACCACAAATCAAAAGGAATGCTGACCACTGATGCATCATCAGAAGATGAATCTCCAGAAGTTTCAACTCCTTACTCCAAAATTTCTTCCTATGATCACCATACAGAAATGTCAGAGTCTGAGGAGAGTGATGAACAGAGGCGAGATAGTTTCTTTGCCAGATTGGATTTGAAAAATAAACTAACTCCTGATTATCTCTCACCAACGAGTGATGAAGAGCTCATGAATAATTCTACAAGTTTGCAACCGACATCCTCTCAACCGCCTCACATCGATTATAAACTCAGTAGTATTATTTCTCAGAGCTTGTTAAGAAATTCGGAGATTTTATCATCCAGATCCACAAGCACGTCAGTCTTATCTGAAGTACGAGACTTGGCTGATATCCAGAGTATCATCTCAGTTACGTCAGCTGGAAATACCATGCTACCAGATCTCTCAAAGAGTCCTCAGCCATCAACCACCATCACCGACGTCACCCCACCCGACTCAGCATCAAGAGAAGAGGAAGAACAACAAGACTGTTTCGCTGCTGAGTTCAGGAAGATGAAACTAAGAGGAGAGTTTCCCTGCCGCCTCTGTACTGCTATATTCCCAAATCTGAGAGCACTGAAAGGTCACAATAGAGTACATCTAGTGTCTTCCAGCTCTGGTACCAATCTACCATATCGATGCAACATGTGTCCCCATTTCAGTAATGACAAATCGGCGCTGATTCGCCACATGCGAACTCATAATGGTGATCGTCCATACGAGTGCAGTATATGTCATTATGCTTTCACCACCAAAGCAAATTGCGAGCGTCATTTGAGAAATCGTCATGCAAAGATGACAAGGGAGGATGTCAAGAAGTCAATAATCTACCATCCTTCAGAGGATCCAACAAACGATATCAATGGAACAAGCCTTCTGTTCAAGCCTGAACTCAACTGCAACGATATCAAAAGAACACTGTTCTCAGATCGGATCAAAGAAAACATTGTATCATCAAATGAGTCCTTATCTCTTGACTGCGACAAAGAAGCGATGAGAAATTATCCAGCAATCAACACCGACTTGCCAAATGGCATGCCAGTGGTTAGTGCACAAACTGTGGAAGCAAGACCAAACAAGAAGGCACAAAACAATATCACTCCAAACTTGCTATCACGGCTCTCATCGAATATTGGAGTCAAGTTTGAACAAGAAAATAATAATATAATTAAAGAGGAATATCAAAGTGATGGTGCTATTGTCAATCTGACAAGAGATATGCAAAACAAACGGAGGAAGAGTTTGGATGTGGCGACAATGACATCTGAAGAAGACGTAAACAATGATGAAGATGATGACGAAAATGACATGGATGATATGTCCGATTTGACTAATAAAAACGAAGACAAACCGTTGGATTTGAGCATGGACGCCTTGGATCTGAGTCGCAAACGTCAGGACTTCGTAAAGCATGACTCTACGGAAAGTAGGAAATCTGATTTTAGAGGTTTTGGCGTGAGTGAAGATGATGCAAGTAGTATTGAATATGATAGTCATCCAGCAGACGTGCCTCAAGATTTGAGCAAGAAGAAAGTTGTAGAAGTGACTGATGATTTAGAGGGAGATGAGAATAATGATTGTGAAGATGAAGACATGATAGATGTGACAGGAGATGAGGATAAAGAAGGGGATGTGATGCCAAAACAAAACAATGTTTCTTCTGCAGAAATTGATGAGTTGCAGCGTCTCCACCCAGGCTTAGAAAATGCTGAGCTCCTCAACTTCCCGAAATTGAACCTTTCACAGTTCTATGCAGCTGCTGCCGCCGCTGGCAACGTTGCAACTGCTCTACCATCAACATTTTTCTTGAACAATAATACTACTAATTCCAATAATAACAATAGTGCTTTCTCGCCATTTGCTGGAGCCCCGAATCCAGCTGCAGCTGCAGCTCTCTTCTCTCCCTACTTCCTGGCTCCACACCCAGGAGTCATGTTCCCCAGGAATCTCACTCAAGACTATATGCTGGAGATGAAGGAGCGTCTGCACAAAGACCTCATGAGAGGACTCCAACTCTCATCTGGTGGCTCTCTCATATTGGATCAAATCGCCATGGCTACAGCTGCAGATCGTATACAAACACTTCATAACCAAGCGCTCATGGAGTACAATCGACGCATGGAGAGCTCGGTACCTCTCAATTTGATTGATGCTTTGAACCAGAATTTCGTTGGAAAGCCCAGTGATTCAAATGAGAATAATAACAACAAGACCAGCCCAATACAGCAGACAGTGATCAATTCACATTCCACTCCTTCCACCTCTCCACTGTTGAGAAACGTCACATCTCCCAATACATCTTCTTCACCAATGGGATTGGTCGATAAATCTATTCCAAAGTTCAACAGTGGTTTCAGCTTGGCACGAAAAAACGTCCTAGTACCAGGTATGAATAATCCAGTACAATCTCCTCGTGCACCTAGCTCAACCAATAACAATGTAAGTAGCGATAGTATGTCACCTTCATCAGCTTCATCTGTAAAAATGGTGATCAAGAACGGTGTATTGATTCCGAAACAAAAGCAACGACGTTACCGCACTGAACGACCGTTCTCCTGTGAACACTGCTCAGCTCGCTTTACACTTCGTTCGAACATGGAGAGACACATCAAGCAGCAGCATCCACAGTATTGGACCCAGAGACAGAGATCAAGCCACGGCGCGGGAAGGAGAGCACAGTCCAGGAATAATCTCCAACCGACTGGCAGCTTGAACAGTCAACTGTCCTACTTCCCGCATCTTGCTGTCAGCGGATCTGATAATGAGACCAGTCGCCCATGTTCACCGCGAGAAGATCCTATCAAAGAGAATTCTGTACTCATGGATGTGGGTAGGACGATATCCGATGAAGTGAAGCATGCCATCGCCTTGCAGCTCAAATCGAAGAACCCCGCGATCCAACACGACAGACAATCTCTTAAGAGTAAAGAAGAAAAAAGCGTCGATCAGAAACCAATCAAGGACATCGAAGAAGATGACGACGTGTTCTACGCTGAAGAAGAGACTAGCGAGAGACTGGTGATTGATGAGGAGAGAGCAGTTAGTGACACAGAAAATGACGATGTGGAAATGAAGAATGAAGCAGAAACTAAGGTAGAAAAAGACACTCAGGTACCCTTACCTAAATTTCTACCGTCAGCTAAGAAAGAAAGTGAGAAAACTCCATCACAAAAAGATGAAAATCTGAATGTCGATTTGGCGTCAGTGTCCAGACTGCTTGACAATGCTTCCACGCAGACTTTCAAGGAATATTTCAATAACGATGACGACCAGATTCGAGATGAGAATAGTGAGGAGGATGAGGAGGGCCTCGTCGCAGCCAACAGTGAGGGCAACAACTCTGGAAGTGATGAAAACAAGTCTGAATCAGACACGGCGGGTAGTAGTACGGGAAACCGCCAGGGTGAGAAAAAGAAGAGCGCATACTCCCTGGCACCAAATCGTGTTTCCTGTCCTTATTGTTCCAGAAAATTCCCGTGGTCATCATCTTTGAGGCGCCACGTTCTCACGCACACCGGCCAGAAGCCTTTCAAATGTTCGCATTGCTCCCTACTTTTCACCACCAAATCGAACTGTGATCGTCACCTTCTCAGAAAACATGGGAATAACAACAACACCAACACGAATAACAACAACAGTATCACCAACGATACCAACACCACTGGGGAAGAAGTGCAAGGTAGAGTTTTGGAGAATGGTGTTTCCGAGGATTGTTACACGATGAGAAACGTGCCAGAAAGACCCTACAAGTGCAAATACTGCCCCAGTTCGACATTTTCCACTCTGAGCAACCTGAGGAAGCATATCGCATCGAAGCATCCGAACTGCAGTATTCCTGGGTTCAAGGGTGGTGCTAAAAGAAGCAGTTGCGATGGGTATGAAAGTCAGCAAAGCTCTACAGAAGAAGTGGAGTCTGATGTGACTGTGGCAGAGGTGAAACCCAGTCAAGACACTATCACTCCACCTAAAGTAATCGATCACAAAGTAGGAGTTGAGTCGAACAGATTACCTCTACCGTTGCAGAATATTGGTGCTACTGAAACGTCAGGGTCAATCATTCCTCAAACGCCTTCGGATCTACCATTCAAGTGTCATCTGTGTGACAACAGCTTTGGAGAACGTCAAGATGCCTTGGATCACATCAGAGAGACACATGAATCCGAGTATGCGTTACTCGCCATGAAGGGGGCTCTCGACTCTGGTACCGCCGATGAAGCGTTTCATCTGGACGACCCCAATGGAGAAGAGAGTCTAGAACAATTGCGAGGAAAATTTCCGGACTATGCCAACCGGAAGGTAATGTGTGCGTTCTGCCTGCGTCGTTTCTGGTCGGCCGAAGATTTACGCAGACACATGCGTACACACACCGGCGAACGCCCGTTTTCCTGCGACATTTGCCGCCGACGATTCACACTGAAGCACAGCATGCTGCGTCACCGCAAGAAGCACTCGCTGCAGAGGACAGCTGTCAACTGTCGTTCGCCAATGTCGCTCGCCAATGAAGCAAGCGACGACGAGGCTAACATCAACAACAACAATCTGCCGCTCACCCCCACCAGAAAACCTGGCAACGAGGAGTTCGATCTAATAAGCAATCTGCTGGGAATCGGAGATAAGTCTATTGTTGATGAAATGATTAGAACAAAATCAGCTGAAGACGCTGCTAAACTTCTAGGTGTGCTGAAGCACTAG
Protein Sequence: MIDMASGTIPCQMTVAMIRDPSEPKATSLHMTDESASRSKEMTTFEKQPKFADTKENDETADKHTKEPDTHKNNDNWTSRNGHTKASDNTERNETDNLGNGSSTKINLDKKYQNQMKNSDSESVEADNEYDNVSRFICPICNVLLTSQHEFTLHIRSHNNNNGDASSNHTSGEDECLLPGGKGYGCCICGKVLSSSSSLDRHVLVHSGERPFKCSICRVSFTTNGNMHRHMRTHNSTGKGINNSPTNKMNGGNPLESSYESDCGSDSSGTGSSLSPCLKRRKTSNNSFHGGANTTIDSVSKQSRDLESKMETNFNPVSTPTTNKRKNADIDSSLDDSGSKEQHTRLCSNTVARNTPTVTSTVANSRRRSSKNSSSSDGEDRRLVNKFKCPVCKREDFSSLNLLETHLEAKHPEFKACCEPCNLEFKNHRALNLHRFMKHPDHERPTNGRDIVGFDDLTFVDFSSEKFPYIAKTVCEKSLHKASSTQLKFQCEICQRAFPLGSALAIHRQSCLQVAKNKSGCIIENELNCRKNHHKSKGMLTTDASSEDESPEVSTPYSKISSYDHHTEMSESEESDEQRRDSFFARLDLKNKLTPDYLSPTSDEELMNNSTSLQPTSSQPPHIDYKLSSIISQSLLRNSEILSSRSTSTSVLSEVRDLADIQSIISVTSAGNTMLPDLSKSPQPSTTITDVTPPDSASREEEEQQDCFAAEFRKMKLRGEFPCRLCTAIFPNLRALKGHNRVHLVSSSSGTNLPYRCNMCPHFSNDKSALIRHMRTHNGDRPYECSICHYAFTTKANCERHLRNRHAKMTREDVKKSIIYHPSEDPTNDINGTSLLFKPELNCNDIKRTLFSDRIKENIVSSNESLSLDCDKEAMRNYPAINTDLPNGMPVVSAQTVEARPNKKAQNNITPNLLSRLSSNIGVKFEQENNNIIKEEYQSDGAIVNLTRDMQNKRRKSLDVATMTSEEDVNNDEDDDENDMDDMSDLTNKNEDKPLDLSMDALDLSRKRQDFVKHDSTESRKSDFRGFGVSEDDASSIEYDSHPADVPQDLSKKKVVEVTDDLEGDENNDCEDEDMIDVTGDEDKEGDVMPKQNNVSSAEIDELQRLHPGLENAELLNFPKLNLSQFYAAAAAAGNVATALPSTFFLNNNTTNSNNNNSAFSPFAGAPNPAAAAALFSPYFLAPHPGVMFPRNLTQDYMLEMKERLHKDLMRGLQLSSGGSLILDQIAMATAADRIQTLHNQALMEYNRRMESSVPLNLIDALNQNFVGKPSDSNENNNNKTSPIQQTVINSHSTPSTSPLLRNVTSPNTSSSPMGLVDKSIPKFNSGFSLARKNVLVPGMNNPVQSPRAPSSTNNNVSSDSMSPSSASSVKMVIKNGVLIPKQKQRRYRTERPFSCEHCSARFTLRSNMERHIKQQHPQYWTQRQRSSHGAGRRAQSRNNLQPTGSLNSQLSYFPHLAVSGSDNETSRPCSPREDPIKENSVLMDVGRTISDEVKHAIALQLKSKNPAIQHDRQSLKSKEEKSVDQKPIKDIEEDDDVFYAEEETSERLVIDEERAVSDTENDDVEMKNEAETKVEKDTQVPLPKFLPSAKKESEKTPSQKDENLNVDLASVSRLLDNASTQTFKEYFNNDDDQIRDENSEEDEEGLVAANSEGNNSGSDENKSESDTAGSSTGNRQGEKKKSAYSLAPNRVSCPYCSRKFPWSSSLRRHVLTHTGQKPFKCSHCSLLFTTKSNCDRHLLRKHGNNNNTNTNNNNSITNDTNTTGEEVQGRVLENGVSEDCYTMRNVPERPYKCKYCPSSTFSTLSNLRKHIASKHPNCSIPGFKGGAKRSSCDGYESQQSSTEEVESDVTVAEVKPSQDTITPPKVIDHKVGVESNRLPLPLQNIGATETSGSIIPQTPSDLPFKCHLCDNSFGERQDALDHIRETHESEYALLAMKGALDSGTADEAFHLDDPNGEESLEQLRGKFPDYANRKVMCAFCLRRFWSAEDLRRHMRTHTGERPFSCDICRRRFTLKHSMLRHRKKHSLQRTAVNCRSPMSLANEASDDEANINNNNLPLTPTRKPGNEEFDLISNLLGIGDKSIVDEMIRTKSAEDAAKLLGVLKH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00857944;
90% Identity: -
80% Identity: -