Basic Information

Insect: Rhopalosiphum nymphaeae
Gene Symbol: -
Assembly: GCA_036289425.1
Location: JAZAQC010000027.1:540408-544958[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 0.0019 0.23 12.5 0.4 2 23 198 220 197 220 0.93

2 24 0.00095 0.11 13.4 0.2 1 23 251 274 251 274 0.95

3 24 0.18 21 6.3 0.5 2 23 281 303 280 303 0.95

4 24 8.6 1e+03 1.0 1.8 1 23 317 339 317 339 0.93

5 24 4.4e-05 0.0053 17.6 0.6 2 23 375 397 374 397 0.95

6 24 0.29 35 5.6 0.7 2 23 425 447 425 447 0.94

7 24 0.18 22 6.2 0.6 3 23 455 477 453 477 0.93

8 24 0.82 99 4.2 0.1 2 23 486 508 486 508 0.93

9 24 3.3e-05 0.004 18.0 0.6 2 23 548 569 547 569 0.96

10 24 0.014 1.6 9.8 3.2 1 23 615 638 615 638 0.95

11 24 0.0017 0.2 12.6 1.6 2 23 645 667 644 667 0.96

12 24 0.0067 0.8 10.8 1.6 1 21 690 710 690 711 0.91

13 24 9e-06 0.0011 19.8 4.0 1 23 728 751 728 751 0.96

14 24 0.98 1.2e+02 3.9 0.4 3 23 756 782 755 782 0.81

15 24 7.6 9.1e+02 1.1 3.0 3 23 790 812 788 812 0.91

16 24 0.98 1.2e+02 3.9 4.0 1 23 819 842 819 842 0.96

17 24 0.7 84 4.4 0.4 1 23 848 871 848 871 0.91

18 24 0.081 9.8 7.4 0.1 3 23 881 902 880 902 0.83

19 24 7.4e-05 0.0088 16.9 0.2 2 23 908 929 907 929 0.96

20 24 0.0057 0.69 11.0 3.1 1 23 995 1018 995 1018 0.95

21 24 0.48 58 4.9 0.4 2 23 1046 1068 1045 1068 0.95

22 24 0.37 45 5.3 1.7 1 23 1074 1096 1074 1097 0.94

23 24 0.38 45 5.3 1.1 1 23 1106 1128 1106 1128 0.95

24 24 0.0053 0.64 11.1 1.0 1 23 1138 1160 1138 1160 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	0.0019	0.23	12.5	0.4	2	23	198	220	197	220	0.93
2	24	0.00095	0.11	13.4	0.2	1	23	251	274	251	274	0.95
3	24	0.18	21	6.3	0.5	2	23	281	303	280	303	0.95
4	24	8.6	1e+03	1.0	1.8	1	23	317	339	317	339	0.93
5	24	4.4e-05	0.0053	17.6	0.6	2	23	375	397	374	397	0.95
6	24	0.29	35	5.6	0.7	2	23	425	447	425	447	0.94
7	24	0.18	22	6.2	0.6	3	23	455	477	453	477	0.93
8	24	0.82	99	4.2	0.1	2	23	486	508	486	508	0.93
9	24	3.3e-05	0.004	18.0	0.6	2	23	548	569	547	569	0.96
10	24	0.014	1.6	9.8	3.2	1	23	615	638	615	638	0.95
11	24	0.0017	0.2	12.6	1.6	2	23	645	667	644	667	0.96
12	24	0.0067	0.8	10.8	1.6	1	21	690	710	690	711	0.91
13	24	9e-06	0.0011	19.8	4.0	1	23	728	751	728	751	0.96
14	24	0.98	1.2e+02	3.9	0.4	3	23	756	782	755	782	0.81
15	24	7.6	9.1e+02	1.1	3.0	3	23	790	812	788	812	0.91
16	24	0.98	1.2e+02	3.9	4.0	1	23	819	842	819	842	0.96
17	24	0.7	84	4.4	0.4	1	23	848	871	848	871	0.91
18	24	0.081	9.8	7.4	0.1	3	23	881	902	880	902	0.83
19	24	7.4e-05	0.0088	16.9	0.2	2	23	908	929	907	929	0.96
20	24	0.0057	0.69	11.0	3.1	1	23	995	1018	995	1018	0.95
21	24	0.48	58	4.9	0.4	2	23	1046	1068	1045	1068	0.95
22	24	0.37	45	5.3	1.7	1	23	1074	1096	1074	1097	0.94
23	24	0.38	45	5.3	1.1	1	23	1106	1128	1106	1128	0.95
24	24	0.0053	0.64	11.1	1.0	1	23	1138	1160	1138	1160	0.97

Sequence Information

Coding Sequence: atgtcaCGATTACATCACATTCAACCAGAAGTATCAATTTTTGCTGTTTCTCCAAATCCTCCTCCCAAACCAAGGAAAATTAAAAGTGAACCTCCTCCTTTAAAACCAGCAATATGGCCTTCCAAGCAACCTGCAGCATCTATGCaattacaacaatttttaaaagctCAGCGTCTGAGTCAAAAGCAACTTGTTCAAAGAGGACCTCCACCACTTAacaaaatgcaatattttgcTAATGATAGCCGTACAGAGTATCAAAAACAACAACAGGCAATGCATCAAAAAATGATGCAGCAACGTGCCATAATCAATAACCAtactaacaataatagtatacgaGAAGATTCTCCAAACCCAATGGATTTTCTAGAGattggAGTTCATGCTGATAActgtatcataaataatattccaaGGGATAAACCaagatcaaattttaaatcggGAGGAAGTATATCACAATCAGATTCTGGTAGTCGTCGCAAGAATGCTAATCCAAGAAAAGTAGCTCGAGAAAACGAAATTGAACCACCAGGACCAAGTGATCATTTTCTGCTTTCTCAGATTAAACAAGAAAACCTACGTCAATCCTGTTTATTATGTGAACGAAATTTTAGCAATAAAAACGATCTAAGTCAACATATATCTGAAGTACATGGTATTGAACCTTCAGATTTACACAAACTAAATGGACATTTGGGTGAAGACGAAGAGCTTGCTGAAAGTATGATGGAAGCTGAAACGGTGTTTTTTTGTGAAGTATGTACTAGAGAATTTCAAGACAAAGCTAGTCTTTGGTTACATATGGTTAGAGGTCACAAACAGGAAGCTGCAGTGACATGTGGAGTGTGTATGAAAATTTGTAATGATAGTAAATCTTTAATGGAACATGTAAATATCCAACATCCTAAAAATTGTGATACTGCCGATTCCGTACAACGTAGGTATAGATGTCAAGTTTGTGCACGGCAACATGATACcaagaaaaaaatgatgagACATGTGGTCATCCACACAGTATACGATAATGATGGTCAAATTATTGATcctgataaattaattataattaacaataattttcatcCAACTAAATCTTCAAATAATGAGCATTATACAATTAGCTGTCAAGTCTGTCATAAAGTATTTCCAAGTGAAGAAAAACTTTTACGACACATGTCTTCTGTTCATCTGATGACTGGTTGTGATGATATGATTACCACAACAGCTGTTACAACTACTGGTAATTCTTCTCAAAGTAGTTTTGTGAATCGCTGTGAATTATGTGGTGAATCATGTGGTTCTCGTACTGAAAAATGGTGGCATGTTCTTAAAGAGCACGGCACTAATGAAACACTTATATGTCCAAAACCAGACtgtagaaaattatttgtttcacAATCTTTACAAATTGAACATCAATCTCATCATGAAACCCAAGGTGAACTTCCTAATACTTGTGAAGTATGTGGACGTTTATGGCCTAATAGAAATGATTTTTACAAACACATAATGGCTGTACATGCTGAATGTATGCCTTTATTATGTGGTATATGTCTAAAAGTTCATGTGGATGTACCAAAACTCAGAGAACATATAAAAGAGAAACACGAACCTTTAGTATCCAAGGAGAATGCTATTTATTGTGATATATGTGGTCGCACTTATACCAAATGGTCAAAAATGATGAGGCATAGATCAATTCATAATGTTGAAGACCAAGTATCTCACTTTGTAACAGATCAATTAACTGAAGTGAAtctaaaatgtacattatgtCCCGATACTGAATTCAAAACTGTCGAAGAAATATCTGAACACAGAAAGAATGACCATCAACTACATGTATGTGATctttgttcaaaatattatagtggAAACAATCATTTATGGAAGCATGTTAGTAGACAACACAAAGGTCATCCAGATGTCACATGTAGCTTATGTGCACGTACATCTGCTTCTAAAGTTCACCTTAAAAGGCATATGATCAAATATCATTCTGATCCTGTAGATCAGCTTATTGATAAgtcaaataatagtatttgtgCAGAATTAAATGCCATTCACCAGTGTATAAGATGCGATAAAGTCTTTAGGATTAGAAGTTTACTGAAGAAACATCTTAAATATTGCAAAGGTAAAAGAGATGTAATGCCAATACCCAAAGAAAAAGGTCATTATCCTTGTACAAAATGTGGTAAAACATTTGAATatcaaacttatttaaatagacATTTAAAGCATAGTCACTTAGTTCAGTACTGTGAGATATGTTCTGAGGATAAAACTGGTgaacattttgataataaaatgttattaatggaTCATATTAGAGAAAAACATGGAAATGACCCAGAATTGTGTTGTGATGTTGAAGGTTGTGACAAAGTTATGAGAACAAAAGTTGATTGCCAGAAACATAAACGTGATCATGTTCGTAAAGTATTTTCATATGTTTGTGAATTTTGTGGAGATAtgcattcaaataaaaaaacctatagAAAACACCTGAGGCAGCGACACAAGGAAAATACTCAGTATTTATGTGGTGTGTGTATGGAAGTATGTGTAGACAATGACGGTTTATCAAAACACTTACATGAAGCACACCCTCAGACATTTTCCAAGTCAAATATTTGTCAGATTTGTGGGAAAATGTTTACTCTTGGAAGTAAAGTTGGAGAACACATAGATAAAATTCATGGAAAAAATTTGAAACCTTGCAAAATTTGCTGGAAAGTTTTTAGCGATATGGATAAACTTAAAGATCATATTGAAAACCATCCGGCAAAAGAGGAATTCCCCAAAGTAGTTACTCCTGTGAAAAAACCAATAGAACCAAAACCAAAAACTCCCAAACTATATGGTCTTCCTAAAGAACTTGCTGAGCTTGGTTTCAATGAAGAGCAACAGGAGAGTTTGAAACGAGATATAGATGACGTTACTTCAGACATAAATACAAAGAGACTGAGAAAATTACATTCTTGTACAGTTTGCTACAAAAGTTTTAGATTTGAAACAGATTTATATGACCATAAACGAGAAGAGCATTCAATTATTGAAGACAGTTATATGGAAGAAGAAACTGAGCGCAAGGAACAACAGTCATCTATaccaaaaagtaataaaaccgTGTGTGGTATATGTAAAAAAGAATGGATtagtttgaaacatttttggCAACATTTAATAAGAGCTCATCGCACAGAAGCTGCATTCGTCTGTGGTATTTGCTGTAAAATCACTAAAAACTATGATGAGTTAGCTTTACATTTAGATAATCACCATCCGAATGCCACTGTTTTGTCATTATTTGCTTGTGATGTTTGTGGTCGTAATCACAATGCGTTTTCAAAACTCCAAAAACATCGTATTATACATTCAACTGCACCACCTACGTTccaaaaatatcattgtgatGAGTGTGAactagtttttaattcaaagtCATATGGAGAGAAACATATTTTGAGCCATGGACCTGGTAGTAAATTATGCAAAGGTAAAGATTTATGTCAAGAAATGGATGATGACATGTTGGATGAACAGATTGAAGAGgaggaagaagaagaagaagaagaagaagtaGAAGAAGTAGAAGAAGTAGAAGAAGATTGTGTAGATGTTAAAGCAGAAAATAAAGGAGACGATGACGAGGACGAGGAGgaggaagaagaagaagaagaagatgCAGAACAAAACGATGAAGATGGAGATGAGGATAATGAGAATGAACAATTTGATGATGTTGAAGACGAAGAAGACATAGAACAGAATGCAGAAgaagacgacgacgatgatgaaCAAAACGACGATATTGATGCTGAGGAAGATAAGGTAAAGGTTGAAGCAGATGATGACGAAGAAGAAGACGTAGAGGAAAATGGTGTTGATGATCAAGATGACGACGAAGATGAAGAACAAGAGGAAGAAGATGACGATGATGAAGTCTAA
Protein Sequence: MSRLHHIQPEVSIFAVSPNPPPKPRKIKSEPPPLKPAIWPSKQPAASMQLQQFLKAQRLSQKQLVQRGPPPLNKMQYFANDSRTEYQKQQQAMHQKMMQQRAIINNHTNNNSIREDSPNPMDFLEIGVHADNCIINNIPRDKPRSNFKSGGSISQSDSGSRRKNANPRKVARENEIEPPGPSDHFLLSQIKQENLRQSCLLCERNFSNKNDLSQHISEVHGIEPSDLHKLNGHLGEDEELAESMMEAETVFFCEVCTREFQDKASLWLHMVRGHKQEAAVTCGVCMKICNDSKSLMEHVNIQHPKNCDTADSVQRRYRCQVCARQHDTKKKMMRHVVIHTVYDNDGQIIDPDKLIIINNNFHPTKSSNNEHYTISCQVCHKVFPSEEKLLRHMSSVHLMTGCDDMITTTAVTTTGNSSQSSFVNRCELCGESCGSRTEKWWHVLKEHGTNETLICPKPDCRKLFVSQSLQIEHQSHHETQGELPNTCEVCGRLWPNRNDFYKHIMAVHAECMPLLCGICLKVHVDVPKLREHIKEKHEPLVSKENAIYCDICGRTYTKWSKMMRHRSIHNVEDQVSHFVTDQLTEVNLKCTLCPDTEFKTVEEISEHRKNDHQLHVCDLCSKYYSGNNHLWKHVSRQHKGHPDVTCSLCARTSASKVHLKRHMIKYHSDPVDQLIDKSNNSICAELNAIHQCIRCDKVFRIRSLLKKHLKYCKGKRDVMPIPKEKGHYPCTKCGKTFEYQTYLNRHLKHSHLVQYCEICSEDKTGEHFDNKMLLMDHIREKHGNDPELCCDVEGCDKVMRTKVDCQKHKRDHVRKVFSYVCEFCGDMHSNKKTYRKHLRQRHKENTQYLCGVCMEVCVDNDGLSKHLHEAHPQTFSKSNICQICGKMFTLGSKVGEHIDKIHGKNLKPCKICWKVFSDMDKLKDHIENHPAKEEFPKVVTPVKKPIEPKPKTPKLYGLPKELAELGFNEEQQESLKRDIDDVTSDINTKRLRKLHSCTVCYKSFRFETDLYDHKREEHSIIEDSYMEEETERKEQQSSIPKSNKTVCGICKKEWISLKHFWQHLIRAHRTEAAFVCGICCKITKNYDELALHLDNHHPNATVLSLFACDVCGRNHNAFSKLQKHRIIHSTAPPTFQKYHCDECELVFNSKSYGEKHILSHGPGSKLCKGKDLCQEMDDDMLDEQIEEEEEEEEEEEVEEVEEVEEDCVDVKAENKGDDDEDEEEEEEEEEDAEQNDEDGDEDNENEQFDDVEDEEDIEQNAEEDDDDDEQNDDIDAEEDKVKVEADDDEEEDVEENGVDDQDDDEDEEQEEEDDDDEV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00340860;
90% Identity: iTF_00135639;
80% Identity: -