Basic Information

Insect: Leuctra nigra
Gene Symbol: PSMC4_1
Assembly: GCA_934046545.1
Location: CAKOHC010000942.1:326196-382483[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 1.2 85 5.1 3.1 1 23 109 131 109 131 0.97

2 17 0.0013 0.09 14.4 3.2 1 23 136 158 136 158 0.98

3 17 1.3 96 4.9 1.0 1 23 164 187 164 187 0.96

4 17 0.16 12 7.8 0.2 3 23 224 244 223 244 0.96

5 17 0.093 6.6 8.6 1.5 1 23 250 272 250 272 0.96

6 17 0.12 8.7 8.2 0.5 2 21 475 494 474 495 0.93

7 17 9.1 6.5e+02 2.3 4.7 1 23 550 572 550 572 0.94

8 17 0.36 26 6.7 5.4 1 23 616 638 616 638 0.98

9 17 0.048 3.4 9.5 1.4 1 23 695 717 695 717 0.98

10 17 0.032 2.3 10.0 3.6 1 23 910 932 910 932 0.98

11 17 7.5 5.4e+02 2.6 3.5 1 23 1456 1478 1456 1478 0.92

12 17 0.00011 0.0079 17.8 1.7 1 23 1483 1505 1483 1505 0.97

13 17 1.8 1.3e+02 4.5 1.9 1 23 1511 1534 1511 1534 0.96

14 17 0.015 1.1 11.1 1.1 1 23 1587 1609 1587 1609 0.98

15 17 7 5e+02 2.7 0.0 1 18 1643 1660 1643 1660 0.92

16 17 0.015 1.1 11.1 0.5 1 23 1671 1693 1671 1693 0.97

17 17 0.005 0.36 12.6 0.7 1 23 1741 1763 1741 1763 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	1.2	85	5.1	3.1	1	23	109	131	109	131	0.97
2	17	0.0013	0.09	14.4	3.2	1	23	136	158	136	158	0.98
3	17	1.3	96	4.9	1.0	1	23	164	187	164	187	0.96
4	17	0.16	12	7.8	0.2	3	23	224	244	223	244	0.96
5	17	0.093	6.6	8.6	1.5	1	23	250	272	250	272	0.96
6	17	0.12	8.7	8.2	0.5	2	21	475	494	474	495	0.93
7	17	9.1	6.5e+02	2.3	4.7	1	23	550	572	550	572	0.94
8	17	0.36	26	6.7	5.4	1	23	616	638	616	638	0.98
9	17	0.048	3.4	9.5	1.4	1	23	695	717	695	717	0.98
10	17	0.032	2.3	10.0	3.6	1	23	910	932	910	932	0.98
11	17	7.5	5.4e+02	2.6	3.5	1	23	1456	1478	1456	1478	0.92
12	17	0.00011	0.0079	17.8	1.7	1	23	1483	1505	1483	1505	0.97
13	17	1.8	1.3e+02	4.5	1.9	1	23	1511	1534	1511	1534	0.96
14	17	0.015	1.1	11.1	1.1	1	23	1587	1609	1587	1609	0.98
15	17	7	5e+02	2.7	0.0	1	18	1643	1660	1643	1660	0.92
16	17	0.015	1.1	11.1	0.5	1	23	1671	1693	1671	1693	0.97
17	17	0.005	0.36	12.6	0.7	1	23	1741	1763	1741	1763	0.97

Sequence Information

Coding Sequence: ATGTCGTCACTGAAGAGAGCTAATGCCGCGAAGATAAGTCAAGTCGGCGATTACAACACCGTTGCTGTGAAGTCTGAGCCAGAAGATATTCCAGATCATAAATCCATCAGCATTGAAGATACTGTGACTACAGCTACATCCATCCAATCTTTAGAAGACTTCTTACACGAAGAAAAACCGAAAACCTTTGGTGAAACAGGCTTCTTCCACATACAGATAAAATCCGAAGAACACGCGGAAATGCCTAGCGTGGTTAACGATCATCACATAGTGAGTCAAAACACAGATCCACTGAACAGCCTCGTTCTTTCCGGAGACTTGCTCTACTCTTGTCAACTCTGCGATTACCAGGGCGCCTCGAAACACCAACTTGCCTATCACACGCTACACCATTGCAAAGAGAAGCATCGATGTAGCAAGTGTGACTTTAGTTCGGTCAACAAACGTGACCTTTACGTGCACATGAGAATGCATTCGACCGAGTGGCTGTTTGTCTGTAATGTTTGCTCGTTCGCAACCGACACAAGTAGAGGCTTAGGCATACACAAGCGTCTCTGCCATTTCGTTGAGAAGAAGCATCCAAATGGTTCTAGTGAGGTCGAATTCTCCTCGAATACGCATCACAGCGAGGAGTCTTCCAAGACGCATGCCACTGAGAAGCCGCTACTTTGTGACGCATGTGGTCAGGCATTTAGTTTGAAAGAGAACTTGGAGTTCCATTTGAAAAGCCATAGCGAAGAGACGGAATTCAAGTGCGACTTGTGTAACATTGATTTCGGTCTGAGGCGAGCGCTGCAGCACCATCAGGAGTTCCATGCCACGGAGAAACCGTATTCGTGTAGCACGTGTGAGCCCATGGAGTGTGAAGCCATGGAGGTGGACCTCACAGACCCCCTGGACATAGAAATGAAACCGGAGCTGGAGCTTGCTGCGGAACTGGAGGCGGCGTTCACTCTGGATGCTCCAACTCCGTCTCACATAGATCCTCTCGCCGTGGACATGAAAGTGGACGTGGACGAACCAGGGGTCAAGCAAGAACTACAGCCAGTTCCGAGAAGTCCAAGTCAGACTTCGTTCCTTAGAGACTTGCTGACGTCTGTACCAAGAACACAGAGTCTTCAGAGTGACACGATAAGTCAATTTGGAGATTTCATCCCCTTTGTTTTGAAGCCAGAGCCAGAGGAAGTTCAAGATTCACAATACATGAACACAGATGACAGTTTGACTCTAGCCACATCCATCCAACCGTTCAACAACTTAATAGAAGAAGAACCAGGAGATTTTGGTAACACAGGTTTCTTCCACGTACAATTAAAATCCGAAGCACCGACTGATTTGCTAGATGACGATTGCGTTAATCAAGCATTACCAAACTCAGATCCACTAACCAATAGCTTGATTCTTACCAGAGAGTTGGCCTTATCTTGTGATCTATGCAGTTACCAGGGTAACAACAAACGCAATCTTACTCGACACCAGCTTCGACTTCTCATGAATAAGGCCAAGAGGAAGCAAGGGTCTACTCTCTCAAAGCAACAACATGAATCATCATATAGTTTAAGGAACACTCTGCCGTCTTCTAGCAAGGATCGTCTCACCAAACCTGGTCATGACACTGATCTACTGAACAACAGCCTCGTTGATATCTTCTCTTGTGATATCTGCAGTTACCAGTGTGCCTCTAGAGAAAACCTAAGCTGTCACAAGCTGAGTCATTACTTGGAGAAGTACCAAGTGCGGCCATGTTTCGTTTCCCTAACCCGTTGTGATTCATCCATCAGTTCTAGTGACACTATGCCGTCTTCATGCAAGGATAACAACAGCCTCGCTCCTCCCAAAAACTTCTACTGTTGTGATATCTGTAGTTTCCAGGGTAAGTCCAAAAGAAATCTTACGTATCATAAACGTCGCCATTTATTGAAGAAGGACGATGGAAAGCAAGCCTCCGTTTTGATCGCACAACAGGAATCTAGTTCAAGCTTCACTCTTTCGTCTTCTAATATGGATATTGATCATACCACTGACCCAGTTCCAATCACAGATCCACTAACCAGCAGCTTGGATCCCGCCAGAGAAGTAGTCTTTTCTTGTGATCTATGCCCATACCAGGGTAAAGCCAAACGCAACCTTACTCAACACAAGCGGCGACATTTAGTGAAGAATGACCAATGGAAGCCATGCTCCGTGTTCCTCCCACAACATGAATCAAGTTCGAGCAACATTCTTCCGTCTTCCAGCGAGGATAACGACTACACTGAACCAAGTGAAGACATAGATCCACTCAGTGGCTTGCTTTGTGAACTCTGCAGTAGCCAGGGTTACGACCTTGCCGATCACAAGTGTCCCCATTTCGTGATTAAGGACGATGGAGAGCAAGGATCCGTGGTCCCACAACATCAATCTACTTCCAAGAACACTCTGCCTTCTTCTAGCGAGATTAACGACTACACAAGTCAAGAAACAGACCCACTCAAAAGTCACGTTCCACCCAGAGACATGTTGCTACACTCTTGTGAACTGTGCAGTTACCAGGGTTACGACCTTGCCGATCACAAGTGTCCCCATTTCGTGAATAAGGACGAAGGAAAGCAAGGTTCCGTGTTCATCACTGAACATGAATCTATTTCGAGCAATATTCTGCCGTCTTCTAGTGAGAGTAACGACTACACTGAACCAAGTCGCACATATCCACTAAACAACAGCCTCGTTCCTCCCAGAGACTTGCTCTACTCTTGTGATCTCTGCAGTTACCAGGGCAAAACCAAACACAACCTTGCCTCACACAAGCGTCGCCATGTCTTGAAGAACAGCAAATGGAAACAAGGTTCAGTGTTGCCCACACAACTTGAGCCGTCCGGCAGTTCAAACAACACTCTTCCGTCTCCTAACGAGAATCAAACAGAACCAAGTCAAAGCACAGATCCACTTCACAGCATTGTTCCTCCCTTGATATTGTACCAGGGCTACAACCTTGACATACACAAGCGTCGGCATTTTGTGAACGACCAATGGCAGCAAGATTCCGTTTTGATCACGCAACATCAATCTAGTTCAATGAATATTCTGCCGTCTTCTAGCAAGGATAACGATCACCACACTGTACTAGCTCGAAACAACAGCTTCGTTCCTCCCAGTGCTTGTCATCTCTGTAGTTACGTGGGTAACAACCTTGCCAATCACAAGTATCCCCATTTCGATAAGGACGTTGAAAAGCAAGGTTCCAAGTCACTCACGCTATGTAAAACATGCTCCAGTTCAAGCATGTTTCCGTATTCTAACGAGAATCAATCCGAACAAATTAGAGACTCAGATCCACTCGTTCCTCCTAGTGCCTTGCTCTTGTCCTGTACATTCTGCAGTTACCAAGGTAACAACCTTATCAATCACAAGTGTCCCCACCTCGTGGATAAGGACGATGGGAATAATGGTTCCAAATCAGCCACACTATGTAAAGCATGCTCCAGTTCAAGTAACATACTTCCGTCTGCTAGCAAGAATAACGGCCATCAAACTGAATCTAGTGAAAACAATCAACTGAACAACATCTTTGTTCCTTCCATTGACTCTTCTGATCTCTGCCACCAGGGTGACACCAGACAAACCCTTGCTAAACATGATTTTCAGACAGAGCTCATCATGGAGTCCGACTCTCTCACGGATCCTCTCGCTGTACAAGTCGAACCGAAGCTGGAGCCGAGTGAGGAACTTTTGGCGGAGTTCACTTTGGAGTCCGACCCCACGGATCCTCTCGCTTTAGAAATCGAACCGAAGCTGGAGCCAAGTGAGGAACTTGTGGCGGAGTTCACTTTGGAGTCCGACCCCACGGATCCTCTCGCTGTAGAAGTCGAACCGAAGCTGGAGCCGGGTGAGGAACTGGTGGCGGAGTTCACTTTGGATTCTGCAACTTCGTCCGGTGTCGATCCTCTTGCCGTGAACACGGAGATGGACGTAGACGAGACCGTCGTGAAGCAAGAACCAACGCCAGTCCCAAGAAGTCCACCGCGGCCTTTGTTTGGAGGCATGCCGAGAACCAACTCAAGAAAACGCAATATTCAGAGAGCAAGTGCCGCGAAGATAAGTCAAGTTGTTGATTACAACACCCTTGCTGTGAAGTCTGAGCCAGAAGATATTCCAGATCATAAATCCATCAGCATAGAAGATACTGTGACTACAGCTACATCCATCCAACCGTTAGAAGACTACTTACACGAAGAAAAACCGAAAACCTTTGGCGAAACAGGCTTCTTCCACATACAGATAAAATCCGAAGAACACACGGAAATGCCTAGCGAGAATAAAGAGCATCACACAGTGAGTCAATTCACAAATCCACTCAACAGCCTCATTCTTTCCGGAGACTTGCTCTACTCTTGTGATCTCTGCGATTACCAGGGCACCTCGAAACACCACCTTGCTTTTCACACGCTAAACCATTCCGAAGAGAAGCATCGATGTAACAAGTGTGACTATAGTTCTGTTAACAAAAGTGACCTTAACGTGCACTTGAGAGCGCATTTGAGCGAGTGGTTGTTCGTCTGCACCGTTTGCTCTTTCTCAACCGACACAAGTAGAGGCTTAGGCATGCACAAACGTCTCTGCCATTTCGTTGAGAAGAAGCATCCAAATGGTTTAGATACCAATGGTGAGGTCAAATTCCCCTCGAATACGCATCACAGCGAGGATTCTTCCAGTAACTCTTACACAGCTAAGGATACCACCGGACGAACCACACAGAAATACAATTCTGGCGAGAATAATCATCGGTGTAACCAGTGTGATTTTAGTTCTATTACCAGAATTGCCCTTGACATACACTTGAGAACACATTTAACGGGGGGAACGGATTCCGGCAATATTCCTACGTACGAACGTAAACCTGGGAAAGAGCGGACTGACCACGAGCTAAGTCGTTCATCGGAGGAAAAGCATGTTTGCGAAGTTTGTTCAAGTGAATTTGAGACCAGCGAGGAACTGATTCGGTACAAGCATGTCCATTCACAGGACCAGAGGTTCAACTGCAGGGAATGTGGCTTCGGAACGAACTCTAATCGCAGTCTTTTAGCTCACCTGACGACGCATTCTGCGGAGAGTCTATCGCTACTGGCCGCCCACATTACAGAAAGCCATCGGAATAAGTTGAAATGTAGTCAATGTGATTTTCAGTGTTTCGGAAAGCGATCTCTAGATATGCATTCGAGATCGCATTCGAGCAAGATGAGTTACTCGTGTACGATTTGCAATTTGAAATATAAATCCGTTGCAGGGTTAACAAAGCACACTCTACAGCACTCGGAAAAGAAAAAGTTTAAATGCTTCTGCGAAGCAGGAGATCAGATAGGCCGTGGAGCTGTCGTTAATGCACTACTAGCTGTACAAGCAGATCGGCATCGACTCGCCACGAGGCGTCCTGCATGCGGCAAGACCATGCTGGCCAAGGTATTCACTCATCACACCACCGTCGCGGTCATCCGTGTGATGGGCTCAGAGTTCATGCAGAAGAACTTTGGCAAGGGTCCGCGAATGACGGGAGTGGACAGGGAGGTGCAGCGCATCCTGCTTGAACACCTAGATCAGATGGACAGGTTTGATCCGAACACCAACTTCAAGGTTGTGATGGCGATGACTCTATCATCATAA
Protein Sequence: MSSLKRANAAKISQVGDYNTVAVKSEPEDIPDHKSISIEDTVTTATSIQSLEDFLHEEKPKTFGETGFFHIQIKSEEHAEMPSVVNDHHIVSQNTDPLNSLVLSGDLLYSCQLCDYQGASKHQLAYHTLHHCKEKHRCSKCDFSSVNKRDLYVHMRMHSTEWLFVCNVCSFATDTSRGLGIHKRLCHFVEKKHPNGSSEVEFSSNTHHSEESSKTHATEKPLLCDACGQAFSLKENLEFHLKSHSEETEFKCDLCNIDFGLRRALQHHQEFHATEKPYSCSTCEPMECEAMEVDLTDPLDIEMKPELELAAELEAAFTLDAPTPSHIDPLAVDMKVDVDEPGVKQELQPVPRSPSQTSFLRDLLTSVPRTQSLQSDTISQFGDFIPFVLKPEPEEVQDSQYMNTDDSLTLATSIQPFNNLIEEEPGDFGNTGFFHVQLKSEAPTDLLDDDCVNQALPNSDPLTNSLILTRELALSCDLCSYQGNNKRNLTRHQLRLLMNKAKRKQGSTLSKQQHESSYSLRNTLPSSSKDRLTKPGHDTDLLNNSLVDIFSCDICSYQCASRENLSCHKLSHYLEKYQVRPCFVSLTRCDSSISSSDTMPSSCKDNNSLAPPKNFYCCDICSFQGKSKRNLTYHKRRHLLKKDDGKQASVLIAQQESSSSFTLSSSNMDIDHTTDPVPITDPLTSSLDPAREVVFSCDLCPYQGKAKRNLTQHKRRHLVKNDQWKPCSVFLPQHESSSSNILPSSSEDNDYTEPSEDIDPLSGLLCELCSSQGYDLADHKCPHFVIKDDGEQGSVVPQHQSTSKNTLPSSSEINDYTSQETDPLKSHVPPRDMLLHSCELCSYQGYDLADHKCPHFVNKDEGKQGSVFITEHESISSNILPSSSESNDYTEPSRTYPLNNSLVPPRDLLYSCDLCSYQGKTKHNLASHKRRHVLKNSKWKQGSVLPTQLEPSGSSNNTLPSPNENQTEPSQSTDPLHSIVPPLILYQGYNLDIHKRRHFVNDQWQQDSVLITQHQSSSMNILPSSSKDNDHHTVLARNNSFVPPSACHLCSYVGNNLANHKYPHFDKDVEKQGSKSLTLCKTCSSSSMFPYSNENQSEQIRDSDPLVPPSALLLSCTFCSYQGNNLINHKCPHLVDKDDGNNGSKSATLCKACSSSSNILPSASKNNGHQTESSENNQLNNIFVPSIDSSDLCHQGDTRQTLAKHDFQTELIMESDSLTDPLAVQVEPKLEPSEELLAEFTLESDPTDPLALEIEPKLEPSEELVAEFTLESDPTDPLAVEVEPKLEPGEELVAEFTLDSATSSGVDPLAVNTEMDVDETVVKQEPTPVPRSPPRPLFGGMPRTNSRKRNIQRASAAKISQVVDYNTLAVKSEPEDIPDHKSISIEDTVTTATSIQPLEDYLHEEKPKTFGETGFFHIQIKSEEHTEMPSENKEHHTVSQFTNPLNSLILSGDLLYSCDLCDYQGTSKHHLAFHTLNHSEEKHRCNKCDYSSVNKSDLNVHLRAHLSEWLFVCTVCSFSTDTSRGLGMHKRLCHFVEKKHPNGLDTNGEVKFPSNTHHSEDSSSNSYTAKDTTGRTTQKYNSGENNHRCNQCDFSSITRIALDIHLRTHLTGGTDSGNIPTYERKPGKERTDHELSRSSEEKHVCEVCSSEFETSEELIRYKHVHSQDQRFNCRECGFGTNSNRSLLAHLTTHSAESLSLLAAHITESHRNKLKCSQCDFQCFGKRSLDMHSRSHSSKMSYSCTICNLKYKSVAGLTKHTLQHSEKKKFKCFCEAGDQIGRGAVVNALLAVQADRHRLATRRPACGKTMLAKVFTHHTTVAVIRVMGSEFMQKNFGKGPRMTGVDREVQRILLEHLDQMDRFDPNTNFKVVMAMTLSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -