Basic Information

Insect: Tenthredo scrophulariae
Gene Symbol: stc_1
Assembly: GCA_963978835.1
Location: OZ022227.1:8662509-8667012[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 3.1e+04 -4.3 1.6 15 19 505 509 504 509 0.81

2 14 0.19 3e+03 -0.8 0.3 4 10 538 544 537 546 0.93

3 14 7e-07 0.011 16.5 17.2 3 18 554 569 540 570 0.88

4 14 2.2e-05 0.34 11.7 14.8 1 18 606 623 606 624 0.95

5 14 0.38 5.9e+03 -1.8 1.0 5 10 651 656 651 656 0.95

6 14 6.7e-10 1.1e-05 26.2 14.4 1 18 662 679 662 680 0.98

7 14 0.086 1.4e+03 0.2 12.2 4 18 727 741 720 742 0.85

8 14 2 3.1e+04 -4.4 1.7 5 10 771 776 771 776 0.90

9 14 0.0074 1.2e+02 3.7 10.8 1 11 782 792 782 804 0.89

10 14 6.9e-11 1.1e-06 29.3 14.0 1 19 809 827 809 827 0.98

11 14 1.6 2.5e+04 -3.8 1.4 6 10 856 860 856 860 0.94

12 14 2 3.1e+04 -7.4 9.7 10 19 874 884 866 884 0.73

13 14 0.0001 1.6 9.6 13.0 1 16 920 935 920 946 0.81

14 14 8.9e-06 0.14 13.0 11.0 1 18 952 970 952 971 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	3.1e+04	-4.3	1.6	15	19	505	509	504	509	0.81
2	14	0.19	3e+03	-0.8	0.3	4	10	538	544	537	546	0.93
3	14	7e-07	0.011	16.5	17.2	3	18	554	569	540	570	0.88
4	14	2.2e-05	0.34	11.7	14.8	1	18	606	623	606	624	0.95
5	14	0.38	5.9e+03	-1.8	1.0	5	10	651	656	651	656	0.95
6	14	6.7e-10	1.1e-05	26.2	14.4	1	18	662	679	662	680	0.98
7	14	0.086	1.4e+03	0.2	12.2	4	18	727	741	720	742	0.85
8	14	2	3.1e+04	-4.4	1.7	5	10	771	776	771	776	0.90
9	14	0.0074	1.2e+02	3.7	10.8	1	11	782	792	782	804	0.89
10	14	6.9e-11	1.1e-06	29.3	14.0	1	19	809	827	809	827	0.98
11	14	1.6	2.5e+04	-3.8	1.4	6	10	856	860	856	860	0.94
12	14	2	3.1e+04	-7.4	9.7	10	19	874	884	866	884	0.73
13	14	0.0001	1.6	9.6	13.0	1	16	920	935	920	946	0.81
14	14	8.9e-06	0.14	13.0	11.0	1	18	952	970	952	971	0.89

Sequence Information

Coding Sequence: ATGGCAAGCTGGGATGGGTCCTACTATGGGCCTGAGGACCCAAATTTTTACAACGTAGGAAGAAATTGGAACTATTTTCCTCAAAATGGGGCAAATCCTCAGTCAAATATCTCTAACATGGGTCAAGATTCATTAGTCAATACGTACATGCAGGATCCTCAAGCAGCAGGTCATACACAGTACAATAGACAGCAAGCtttctttgagaataataGATCGCAGCCGAATTTACCGCCTTTTAAATGCAAAAGTGGAAATCCTAGCGATAATAATAAGCCGAGGAAGAAGAATTACCATAATAAATTACCGTTCGTTAATCAGCAGATCGATCCGAGCATAGTGGAAAATTCAAACTTGCATGCTACTGCCGGAGAGTTTATACCGACTAGTTTTAAAGCTTTGCAAGAGCCTGGGACAAGCTCTCTGTCTAATAGCAGAATTGACGTTGAACGTTACGAAGTTTTGTCTCAGCAGCCAGAAGGCTTTAACTTTATACCAGAAGCTGTGGCAGCTAAACCTTACTATACTGATAATCGGAATAAGCGtgagaaaaaagataagaaataCGAGATTAAAAAGAATGATAATTACAAGCCTAGAGATCCTCAGGATGGTCAATATCAGGGCAATAGTTTGTACAAAAATTCGGTTCGAAATCAAGCCCCGAAGAATcctcgaaaatttcaaaatgataGATACTCTAATGTGAGACAGTATCCGGAAAATAGTAGAAATTATTCTGTCGAAAGAGATAATGATAGGAAAAAATGGCCCGGTAATAGAGAGAGCTTTGAAAACGGCTCTCAACTCGCAGAAGACGATGGAGCTCAAGCACCTGACGCAGGGGTCAATAAGTACTATAGGAATTTGGTCTACGACAATCCAGCCACGGCTCGTAACCCGAGACATGATAACGTCCGGCAAACTAGCGGGGCTCCTAAGCATTATGGCGATCGTAATAACGAGTCAAATCACTCTAGTCATAACTCTGAAGTGGATCATACTCAAGcgattggaaaaaatattagaagATATTTCAACGAAGATCGTGGGGAAAGATATCGGGATAGGAGAGAGCGGTACAGCGATAGATACGAGCCTGTAGTTAGAGAGAAGAAACCTAATTATTTGGATTATAATGGGTATAAGAACAACTATGAAAGGGAAGAAAGAGGCGAACGGACAAGAGACAAGGATAAATCTAAGGATAAGGATACTTCTCGAGATATTAAGGATAAGGAGTTTGAAAATTGGCGTCATAAAATCAGTGAAGATGACAAAGTAAGCGCTTTGAAAAAACCGAACAACAAAAGACACGAGAAAGACGACGATGCAAGCCAGAGAGAACGTCTCACCGAACAACTGAACAGAGGGCAATTGGAGTGTTTGGTATGCTGCGATCGTGTTAGGCAGCAGGATGCTGTTTGGTCATGTTCAAACTGCTATCACGTTCTTCATCTTAAGTGTACGAAGAAATGGGCAAAATCCTCGCATGCTGaaaatggatggcgctgtCCAGCGTGTCAAAATGTAACGTCCGCCATCCCGGAGGAGTACTATTGTTTTTGCGGTAATAATAGCAATCCGGAATGGAATCGCCGAGACGTAGCCCATTCTTGCGGAGACGTATGCGGTCGTCTGCGATCAAAAAccaattgcattcataaatgtaATTTATTGTGCCATCCCGGGCCGTGCCCGCCTTGCGTTGCAATGGTTACTAAGTCTTGTGGCTGCGGAAGAACTTCTCAGACGTTAAAATGCAGCACTGGGACACCTTTGCTGTGCAAATCGACTTGCGAGAAAATCTTAAACTGCACTATTCACACTTGTGAAAGAAATTGCCATCACGGAGAATGTGGAGATTGCGAAAAACTGGTTCATCAAGAATGTTACTGTGGTAAAGATAATCGCGACGTTCCGTGTGTACCAGATGTTTCACCAACCTACACTTGCCAATCTATATGTAATAAGTTATTAGAATGCGGTAATCACAATTGTAAGGATTTGTGTCATCCGGGACCTTGCGAGCCATGTGTTCTGAGACCAGAAGCTGTCTCTCATTGCTGTTGCGGACAAACGACTTTAACTGAGCCAAGAACTAGCTGTTTGGATGAAATTCCAGTATGCGATAAAATGTGCTGTAAACGTCTGAAATGTGGGCAACCCAGTAATCCTCACATGTGCAAAGTCAAATGTCACCAAGAGGAATGTCCCGATTGCGAAATGACAACCAAGGTGAAATGCCGTTGCGGTAACATGGACAAGGAAATACCATGCAAAGAATTAACATCTAAAGCTGATGATGCACGGTGCCAGAAACGATGCACTAAAAAACGATCTTGCGGTAGACACAAATGTAATCAAATGTGCTGCATTGATATCGAACACATCTGTCCATTACCTTGCACGCATTCTCTCAGTTGCGGTAGACACAAGTGCGAACAAACTTGTCACAAGGGCAGATGTCAGCCCTGTTGGCGTAGCAGTTTTGAAGAACTTTACTGCGAGTGTGGTGCAGCTGTAATATACCCTCCGGTACCATGTGGAACGAGACGTCCAGTTTGTGAGAGACCTTGTTCACGAGAGCATGTATGCGGACATCCGGTTCTCCACAATTGTCATAGCGAGCCGATATGTCCGCCTTGTACAGTTCTCACGCAGAAATGGTGTTACGGTAATCACGAGCGTAGGAAAGCGGTCCCATGTCATGTTAACGAAGTTTCATGTGGATTGCCGTGTAATAAGCCTTTGTCGTGCAAAAGGCACAAATGTATAACCATTTGTCATCCTGGTCCGTGCGAGAAATCGGGACAAGTTTGTGTCCAGCCTTGTACAACTGCTAGGGAATTATGTGGACATATCTGTTCGGCACCATGCCATGACGGAAAGTGCCCTGAATTAGCGTGTAGGGAAATGGTCAAGGTGACTTGCCAATGCGGACATAGAAGCATGAGTCGAGCTTGTGCAGAAAATTCTCGTGAGTTTCAGAGAATAGCTAGTGGAATCCTGGCCAGTAAAATGGCCGAAATGCAGCTCGGTCATTCGGTGGATTTGGAAGATGTATTGGGACAAAGCGCGAGGAAGCAAAATCAATTGAAGACTTTGGAATGTAATGAAGAATGTAAAATGGTTGAGAGAAATCGGAGATTGGCACTGGGATTGCAAATCGTTAATCCAGATTTGAGCGGAAAGTTAATGCCGAGATACACTGAGTTCATGAAACAATGGGGAAAGAAGGATCCGAACTTCTGCCAAATGATACACGATAGATTGACCGAACTAGTTCAACTCGCTAAAATGTCTAAACAAAAATCTCGAAGCTATTCATTCGAGAGTATGAACCGTGACAAGCGTCATTTCGTTCATGAATGTTGCGAACATTTTGGATGCGAGAGTCAGGCATACGATCAAGAACCGAAAAGAAATATTGTCGCTACGGCTGTTAAAGATAAGtGCTGGCTGCCAAGTTTGAGCTTACTTGAATTGTTACAAAGAGAAAGTGGCCAGAGAAAAGTACCAGGACCAATGTTGAATGCTGCGAAAGCTACGAGCTCTCTAAGGAACGTAGAAGTATTACCACTGCCGACTAAAAAGGGTCATAAGATCCAGCCTGCGACGGTGATTCCAAAATCACCTGAGCCTGAAATAGACTACTTCGATTACCAAGGTTGA
Protein Sequence: MASWDGSYYGPEDPNFYNVGRNWNYFPQNGANPQSNISNMGQDSLVNTYMQDPQAAGHTQYNRQQAFFENNRSQPNLPPFKCKSGNPSDNNKPRKKNYHNKLPFVNQQIDPSIVENSNLHATAGEFIPTSFKALQEPGTSSLSNSRIDVERYEVLSQQPEGFNFIPEAVAAKPYYTDNRNKREKKDKKYEIKKNDNYKPRDPQDGQYQGNSLYKNSVRNQAPKNPRKFQNDRYSNVRQYPENSRNYSVERDNDRKKWPGNRESFENGSQLAEDDGAQAPDAGVNKYYRNLVYDNPATARNPRHDNVRQTSGAPKHYGDRNNESNHSSHNSEVDHTQAIGKNIRRYFNEDRGERYRDRRERYSDRYEPVVREKKPNYLDYNGYKNNYEREERGERTRDKDKSKDKDTSRDIKDKEFENWRHKISEDDKVSALKKPNNKRHEKDDDASQRERLTEQLNRGQLECLVCCDRVRQQDAVWSCSNCYHVLHLKCTKKWAKSSHAENGWRCPACQNVTSAIPEEYYCFCGNNSNPEWNRRDVAHSCGDVCGRLRSKTNCIHKCNLLCHPGPCPPCVAMVTKSCGCGRTSQTLKCSTGTPLLCKSTCEKILNCTIHTCERNCHHGECGDCEKLVHQECYCGKDNRDVPCVPDVSPTYTCQSICNKLLECGNHNCKDLCHPGPCEPCVLRPEAVSHCCCGQTTLTEPRTSCLDEIPVCDKMCCKRLKCGQPSNPHMCKVKCHQEECPDCEMTTKVKCRCGNMDKEIPCKELTSKADDARCQKRCTKKRSCGRHKCNQMCCIDIEHICPLPCTHSLSCGRHKCEQTCHKGRCQPCWRSSFEELYCECGAAVIYPPVPCGTRRPVCERPCSREHVCGHPVLHNCHSEPICPPCTVLTQKWCYGNHERRKAVPCHVNEVSCGLPCNKPLSCKRHKCITICHPGPCEKSGQVCVQPCTTARELCGHICSAPCHDGKCPELACREMVKVTCQCGHRSMSRACAENSREFQRIASGILASKMAEMQLGHSVDLEDVLGQSARKQNQLKTLECNEECKMVERNRRLALGLQIVNPDLSGKLMPRYTEFMKQWGKKDPNFCQMIHDRLTELVQLAKMSKQKSRSYSFESMNRDKRHFVHECCEHFGCESQAYDQEPKRNIVATAVKDKCWLPSLSLLELLQRESGQRKVPGPMLNAAKATSSLRNVEVLPLPTKKGHKIQPATVIPKSPEPEIDYFDYQG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01413836;
90% Identity: iTF_01413836;
80% Identity: -