Basic Information

Insect: Neodiprion pinetum
Gene Symbol: stc_1
Assembly: GCA_021155775.2
Location: CM037743.2:37710198-37714878[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 2 3.4e+04 -4.3 1.6 15 19 502 506 501 506 0.81

2 15 0.17 2.8e+03 -0.7 0.1 4 10 535 541 534 542 0.94

3 15 1.5e-07 0.0026 18.6 13.6 4 18 552 566 550 567 0.94

4 15 1.1e-05 0.19 12.7 14.2 3 18 605 620 603 621 0.91

5 15 1.2 2e+04 -3.4 0.6 6 10 649 653 648 653 0.89

6 15 1.6e-09 2.7e-05 24.9 12.0 1 18 659 676 659 677 0.98

7 15 2 3.4e+04 -4.4 3.9 6 12 707 713 706 713 0.90

8 15 0.00034 5.7 7.9 13.2 4 18 724 738 717 739 0.86

9 15 2 3.4e+04 -4.4 1.7 5 10 768 773 768 773 0.90

10 15 0.0074 1.2e+02 3.7 10.8 1 11 779 789 779 801 0.89

11 15 6.8e-11 1.2e-06 29.3 14.0 1 19 806 824 806 824 0.98

12 15 0.49 8.3e+03 -2.2 0.6 5 10 852 857 852 858 0.89

13 15 2 3.4e+04 -6.7 9.2 10 19 871 881 860 881 0.78

14 15 0.00065 11 7.0 15.8 1 16 917 932 907 943 0.83

15 15 1.2e-06 0.019 15.8 14.5 1 19 949 968 949 968 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	2	3.4e+04	-4.3	1.6	15	19	502	506	501	506	0.81
2	15	0.17	2.8e+03	-0.7	0.1	4	10	535	541	534	542	0.94
3	15	1.5e-07	0.0026	18.6	13.6	4	18	552	566	550	567	0.94
4	15	1.1e-05	0.19	12.7	14.2	3	18	605	620	603	621	0.91
5	15	1.2	2e+04	-3.4	0.6	6	10	649	653	648	653	0.89
6	15	1.6e-09	2.7e-05	24.9	12.0	1	18	659	676	659	677	0.98
7	15	2	3.4e+04	-4.4	3.9	6	12	707	713	706	713	0.90
8	15	0.00034	5.7	7.9	13.2	4	18	724	738	717	739	0.86
9	15	2	3.4e+04	-4.4	1.7	5	10	768	773	768	773	0.90
10	15	0.0074	1.2e+02	3.7	10.8	1	11	779	789	779	801	0.89
11	15	6.8e-11	1.2e-06	29.3	14.0	1	19	806	824	806	824	0.98
12	15	0.49	8.3e+03	-2.2	0.6	5	10	852	857	852	858	0.89
13	15	2	3.4e+04	-6.7	9.2	10	19	871	881	860	881	0.78
14	15	0.00065	11	7.0	15.8	1	16	917	932	907	943	0.83
15	15	1.2e-06	0.019	15.8	14.5	1	19	949	968	949	968	0.96

Sequence Information

Coding Sequence: ATGGCAAGCTGGGATGGGTCTTATTATGGGCCTGAGGACCCAAATTTTCATCGGTATTCGGACCAGGGGAACGTGGCGCGCAACTGGAGCTACTATCCTGAGAATGGCTCCAACGTGCAGCCGAGTATCTCGAACCTGGGTCAACAGCACTTAGCCAATGCCTATCAGGATCCGCAAATGGCTGGTGGTACTCAGTATGCAAGGCCACAGCCTTTCTTTGAGAACAATAGATCGCAGCTTAATCTTCCGCCATTCAAATGCAAAAGTGGGAACCCGAATGACAAACTTAAGAAAAAGAATTACCACGGTAAATTACCGTTTGTCCCTCAGCAAACGATTGATCCCAGTGTCGTTGAGAATTCAAACCTGCATGCAACCGCTGGTGAGTTTATACCTAGCTCCTTGAAGGCGCTGCAAACAGCTGGGACAAACTCGTCTGCCAGTAGTAGTGAAAATAATGGCAGAATTATGCTGGAAAATTATGATTCCTCAACTCAGCATTCGGGAAATTTGACCTTCCACGATTCGAACATGCCGAAAGTTGACCATGTGGATACTAGAAATAAGCGAGATAAGAAGGATAGGAAATATGATGCAAATAAAAAAGGCGATAGTTATAAGCAGAGGGATACTCAGGATGCTCAATATCAAAATACCAATTTGTTTAAGAATTCTGTCAGGAATCAGAATCCGAAGAATCGCAGATTCCAAAATGATAGGTATTCTAACACCAGACATTATTCGGATAATAGTTCTAATTATACGAGCGATAAGGATAGCGACAGAAGAAAATGGACAGGTAATTCCAGtgttcgagaaaattttgaaaacggtTCATATCACGGTGAAGAAGACGGAACTCAATCTGTGGAGGGGACTGTTAATAAGCACTATAAAACCTCTAGACATGATAATACCCGACAATCTGGTGGTGCAGCCAAGTATTACGGCGATCAAAATTATTCTAGTCACAATTCTGAGATGAAGTACAGTCAAACGGGTGGTAAGAGTGTTAGAAGATATTTTAATGAAGATCGTGGAGAACGGTATCGTGATAAAAGAGACAGATACAGTGATAAGTATGAATCTGGGATCAGGGAGAAGAAAACTAGCTATGCAGATTACAATggatacaaaaataattatgaaagaGAGGAAAGAGGGGAACGGAGCAGAGACAAGGATAAATCTAAGGATAAGGATAATTCAAAAGGTATCAGGGATAAAGAGATTGAAAATTGGCGATACAAGAATGACGAAGATGTCAAAGGAGGAAGTAACATGAAGCGATTGAGTAACAAAAGATCGGAGAAAGATGATGACGCCAGTCAAAGAGAACGTCTCACTGAACAGTTAAACCGAGGACAATTGGAATGTTTAGTTTGCTGTGATCGTGTCAGGCAGCAAGATGCTGTGTGGTCATGTTCAAATTGCTATCATGTGCTTCACCTTAAGTGCACCAAAAAATGGGCAAAATCTTCACAAGCTGAAAATGGATGGCGTTGTCCTGCTTGTCAAAATGTGACAGCAGCTATCCCAGAGGATTACTTTTGCTTCTGTGGTAATACTAACAATCCAGAATGGAATCGACGAGATGTTGCTCACTCGTGTGGCGATGTTTGTGGCCGTCTCAGATCAAAATCAAACTGTGTACACAAATGTAATTTATTGTGCCATCCTGGACCTTGTCCACCTTGTGTTGCAATGGTTACAAAACATTGCGGCTGTGGCAGAACTTCGCAAACTTTAAAATGTAGTACTGGTACACCATTAGTCTGCTCTGCAACTTGTGAGAAACTTTTGAACTGCATAACTCATACCTGTGAGCGAAAATGTCATCATGGAGATTGCGGAGACTGTGAAAAACTCATCCATCAGGAATGTTACTGCGGGAAAAATTGTCGTGATGTTGCTTGTGTTGCTGATGTTGTAGCAAGTTACAGCTGCGAATCTATTTGTAACAAATTATTAGAGTGTGGTAATCATAACTGCAAAGCTTTATGTCACCCAGGGCTTTGCGAGCCATGTGTACTCAGACCAGAAGCTGTATCTCATTGTTGCTGCGGACAAACACTTTTAACTGAGCCACGAAATAGCTGTTTGGACGAGATTCCAGTTTGCGAAAAAAAGTGCTGCAAGCGTCTCAAGTGTGGGCAACCTAGTAATCCTCACATGTGCAAATCCAACTGTCATCAGGGAGAATGCCCTGAGTGCGAATTGACAACAAAAGTGAAATGTCGTTGCGGCAACATGGACAAAGAGATCCCGTGTAAAGAATTGACGACCAAGGCAGATGATGCACGATGCCAGAAGCGATGCATAAAGAAACGTTCTTGCGGAAGGCATAAATGTAACCAGATGTGTTGCATCGACATTGAACACATCTGCCCGTTGCCTTGTACGCATTCTCTGAGTTGCGGAAGACACAAATGCGAACAGACTTGTCACAAGGGTAGATGTCAGCCTTGCTGGCGAAGCAGTTTTGAGGAACTTTATTGCGAGTGTGGAGCCGCTGTAATCTACCCTCCTGTACCTTGTGGGACGAGACGCCCAACGTGCGACAGGCCTTGCTCACGACAGCATGTCTGCGATCACCCTGTGCTGCATAATTGTCATAGTGAGCCAACGTGTCCGCCTTGCACAGTACTCACGCAAAAATGGTGTTATGGTAAACACGAACTGCGAAAAGCAGTTCCCTGTCATGTTAACGAAGTTTCATGTGGGTTAGCATGTAATAAGCCTCTTTCATGTAAGAGGCACAAATGTATAACCATTTGTCATCCTGGGCCGTGTGAAAAACCGGGGCAAGTTTGTGCTCAGCCATGTACAACTGCAAGAGAATTGTGCGGACATAGTTGTTCAGCACCATGTCATGAAGGAAAATGTCCTGAAATTCCATGTAAAGAGATGGTCAAGGTGACGTGTCAGTGTGGACACAGAACTATGAGCCGAGCCTGCGCAGAGAATTCTCGTGAGTTTCAAAGAATAGCTAGTGGAATTCTGGCTAGTAAAATGGCTGAGATGCAGCTGGGACATTCCGTAGATTTGGAAGACGTTCTAGGACAAGGTGCAAGAAAGCAAAATCAGTTAAAAACTTTGGAGTGTAACGAGGAGTGTAAGATGATTgaaagaaatcgaagattGGCGTTAGGACTGCAAATAGTCAATCCGGATCTAAGTGGGAAATTAATGCCGAGATACACCGAGTTTATGAAGCAGTGGGGTAAAAAAGATCCAGTCTTTTGCCAGATGGTACATGACAAACTAACTGAACTAGTTCAACTGGCAAAGATTTCTAAACAAAAATCTAGGAGCTATTCGTTCGAAAGTATGAACCGTGACAAACGTCATTTTGTTCACGAATATTGCGAACACTTTGGATGCGAAAGTCAAGCGTATGATCGAGAACCCAAACGTAATATTGTTGCTACTGCTGTGAAAGATAAGTGCTGGTTACCAAGTTTAAGTTTACTTGAAATGCTACAACGAGAAAGTGGTCAGAGGAAAGTACCAGGACCAATGTTGAATTCTGCAACAGCTTCAAGCTCTCTCAgGAACGTAGAAGTATTACCACTGCCTACTAAAAAAAGTCCCAAGGTCCAGTCTGCACCAGCGACTTCAAAATCACCTGAGCctgaaattgattattttgacTATCAGGGTTGA
Protein Sequence: MASWDGSYYGPEDPNFHRYSDQGNVARNWSYYPENGSNVQPSISNLGQQHLANAYQDPQMAGGTQYARPQPFFENNRSQLNLPPFKCKSGNPNDKLKKKNYHGKLPFVPQQTIDPSVVENSNLHATAGEFIPSSLKALQTAGTNSSASSSENNGRIMLENYDSSTQHSGNLTFHDSNMPKVDHVDTRNKRDKKDRKYDANKKGDSYKQRDTQDAQYQNTNLFKNSVRNQNPKNRRFQNDRYSNTRHYSDNSSNYTSDKDSDRRKWTGNSSVRENFENGSYHGEEDGTQSVEGTVNKHYKTSRHDNTRQSGGAAKYYGDQNYSSHNSEMKYSQTGGKSVRRYFNEDRGERYRDKRDRYSDKYESGIREKKTSYADYNGYKNNYEREERGERSRDKDKSKDKDNSKGIRDKEIENWRYKNDEDVKGGSNMKRLSNKRSEKDDDASQRERLTEQLNRGQLECLVCCDRVRQQDAVWSCSNCYHVLHLKCTKKWAKSSQAENGWRCPACQNVTAAIPEDYFCFCGNTNNPEWNRRDVAHSCGDVCGRLRSKSNCVHKCNLLCHPGPCPPCVAMVTKHCGCGRTSQTLKCSTGTPLVCSATCEKLLNCITHTCERKCHHGDCGDCEKLIHQECYCGKNCRDVACVADVVASYSCESICNKLLECGNHNCKALCHPGLCEPCVLRPEAVSHCCCGQTLLTEPRNSCLDEIPVCEKKCCKRLKCGQPSNPHMCKSNCHQGECPECELTTKVKCRCGNMDKEIPCKELTTKADDARCQKRCIKKRSCGRHKCNQMCCIDIEHICPLPCTHSLSCGRHKCEQTCHKGRCQPCWRSSFEELYCECGAAVIYPPVPCGTRRPTCDRPCSRQHVCDHPVLHNCHSEPTCPPCTVLTQKWCYGKHELRKAVPCHVNEVSCGLACNKPLSCKRHKCITICHPGPCEKPGQVCAQPCTTARELCGHSCSAPCHEGKCPEIPCKEMVKVTCQCGHRTMSRACAENSREFQRIASGILASKMAEMQLGHSVDLEDVLGQGARKQNQLKTLECNEECKMIERNRRLALGLQIVNPDLSGKLMPRYTEFMKQWGKKDPVFCQMVHDKLTELVQLAKISKQKSRSYSFESMNRDKRHFVHEYCEHFGCESQAYDREPKRNIVATAVKDKCWLPSLSLLEMLQRESGQRKVPGPMLNSATASSSLRNVEVLPLPTKKSPKVQSAPATSKSPEPEIDYFDYQG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01048573;
90% Identity: iTF_01048573;
80% Identity: -