Basic Information

Insect: Pegoplata infirma
Gene Symbol: stc_1
Assembly: GCA_963921195.1
Location: OY992537.1:196722591-196731316[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 4.7e+04 -4.4 1.6 15 19 651 655 650 655 0.81

2 14 0.072 1.7e+03 0.5 0.2 4 10 684 690 683 692 0.95

3 14 3.2e-05 0.77 11.2 16.1 4 19 698 713 696 713 0.91

4 14 6.5e-07 0.015 16.6 12.6 3 19 751 767 749 767 0.91

5 14 1.6 3.8e+04 -3.8 0.6 7 11 771 775 771 775 0.87

6 14 1.4e-05 0.32 12.4 18.7 1 19 807 825 807 825 0.98

7 14 0.0024 56 5.2 13.3 4 18 873 887 866 888 0.86

8 14 0.0087 2e+02 3.4 9.3 1 11 928 938 928 939 0.96

9 14 2 4.7e+04 -4.8 1.1 4 10 943 949 943 949 0.58

10 14 6e-10 1.4e-05 26.3 15.5 1 18 955 972 955 973 0.97

11 14 2 4.7e+04 -4.2 0.9 6 10 1002 1006 1002 1007 0.81

12 14 2 4.7e+04 -8.5 11.9 4 18 1014 1029 1009 1030 0.79

13 14 3.8e-09 8.9e-05 23.8 12.0 1 17 1066 1082 1066 1082 0.99

14 14 5.6e-07 0.013 16.8 14.0 1 19 1099 1118 1099 1118 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	4.7e+04	-4.4	1.6	15	19	651	655	650	655	0.81
2	14	0.072	1.7e+03	0.5	0.2	4	10	684	690	683	692	0.95
3	14	3.2e-05	0.77	11.2	16.1	4	19	698	713	696	713	0.91
4	14	6.5e-07	0.015	16.6	12.6	3	19	751	767	749	767	0.91
5	14	1.6	3.8e+04	-3.8	0.6	7	11	771	775	771	775	0.87
6	14	1.4e-05	0.32	12.4	18.7	1	19	807	825	807	825	0.98
7	14	0.0024	56	5.2	13.3	4	18	873	887	866	888	0.86
8	14	0.0087	2e+02	3.4	9.3	1	11	928	938	928	939	0.96
9	14	2	4.7e+04	-4.8	1.1	4	10	943	949	943	949	0.58
10	14	6e-10	1.4e-05	26.3	15.5	1	18	955	972	955	973	0.97
11	14	2	4.7e+04	-4.2	0.9	6	10	1002	1006	1002	1007	0.81
12	14	2	4.7e+04	-8.5	11.9	4	18	1014	1029	1009	1030	0.79
13	14	3.8e-09	8.9e-05	23.8	12.0	1	17	1066	1082	1066	1082	0.99
14	14	5.6e-07	0.013	16.8	14.0	1	19	1099	1118	1099	1118	0.96

Sequence Information

Coding Sequence: ATGTCTACGGATTCAAAATCGCAGTCTTCTTCACAACCACCCTTGTCACAACTATGGCCTGGGTTTGGTTCAACAACATCTGACCTCAATACTTCTGGTCCTCTATTGGATAGCCCTCATCTTCAGCCGGTAACCACACAAGGCCTTGGTGGTAAACATCAACACCAACAACAGCAGCCCAATAATAATTATGTAAATTTTAATCAATTTATAATGCAACATAATTTAGTGTCTCCACCACCACCGCAAAAAGCGTCCTTACCATCTGTTGGTCCTTTTGATGAAGGATTTTCTAAAGTGGAAAAAACGTCAAGTTATGTGGATgactttgattttttcaataatttgggAGGTCTTAATATGAAAATTGACCACAATAGTAACAGCAATATTATACCAGCTGTCACTAATAgcggcaacaacaacagcaattcTAATCAGCAGCGTCagtcacaacaacaacaacagtttAATTATTTTAATACATCTTCGAATCCACAATATCCATACGCCAACTATAATCCAACTTCAAACAACAACAATAGTGTCTTTTCGGATGGTTTACAAAACTACAATATTAATCCCAATACAACTACAGCTCCTGGTGCTACACCAACAAACACTACAGGAAATCAAAATTATTATGATACTACCAATTCGTATAGTAACTTTAATTCCAATGGTACTACATACTATGCAAATCCTTTTGCAACCGGATTTGATTTTGGCAACACTAAATTGCAACCAAATGCACCAGAATTTGTGCCAAGATTTGATAAACTTTCGTTGaacgaaataaaaaaagaaaataaacaaattgaggaattttcaaaagacATTTTTGAAGACTTTAATAAAGAGAGCAGAAATAGAGAGATCGTAGGAGTGGGTGGTCCACCACAGGTGCCCAGAGAGAACGAGCTTAATTTAGACTCTAGCTTTGAAAAAGAAGAAAAGCGTGAACAGCAACGTAATGAAAGAACACGCAACAATCGTCAACAAAATAAACACGATAAAGAgaataataagaaaaataatcAGAGAATGGAAAAAAATATGGAAAGATTTTCAAGAAATCTTCAAGATAAAAATTACAATAATGATTCAGCTTCTAATTCAAACTCTTCAACGCCATCATTGACTATGAATAATGGTGGTGGGACTACACATAGAGAACAAAGAGAGCTACATCAAAATTTTGTAACACCACAAGGTGGAGGGCAATTTAATAAGACCGGAGCTTTTAGCAAAAACTATCGTAATTCTTCGGGTGGAAGTAATGGCGGAGGAAACGGTGGAGGAAATGGAGGAGGAAATGGTGGAGGTAACGGAGGAGGAAATGGTGGAGGTAATGGTGGAAATAATGGTGGTGGTTCAGGGGGCGGTAATCCTGGAGTTTCTGACAAATATAGAAATGGCGACAATTTGGATAAGAATGAGAAatcaaattataataataaacaacGCTTTCAAAATGATAGACGTTCACAAGACTTTACGGAACGTGAAGATCGTTATGATCGCTATGTAGAACGTGGTGATCGTTCCGATCGTGGCCACAATCAACGTAATCAACAACGTAATGATTATCATCAACGTTATGATAATTATCGTAGCAACAAAAGACGTGATGATTGGAATCGTAATCGTGATCGCATTAATGGTTTTCGTGTCGATGAAAAATATTCCAATGATAATGGCAAGGACAGTCCATTGCCTTCTCCCGAAAAGAAATCCCCTAAAAAACAAtatgaaaaagaaaatgaaaaattatctcaaagaGAAAAACTGATCAGAGACATTGAAAATAGACGTCTGGAATGTCTAGTTTGTGTAGAACCCATTAAGGCCCATCAGGGTGTATGGTCTTGTCATAATTGCTATCATATTTTGCATCTTCAGTGCATTATAAAATGGGCTTCTTCTTCGAAATCGGATGATGGTTGGCGTTGTCCAGCTTGTCAAAATGTGGAAAAAGATGTACCACGTGATTATTATTGTTTCTGTGGCAAACTACGTAATCCTACAAATAATCGTCAGGATATCGCTCATTCCTGTGGTGAGGTATGTGGTCGTGTTGAAGGTTGTGCTCATGCCTGCACACTACAATGTCATCCGGGTCCCTGTCCACCCTGTCAGGCTCAAGTTAAACGTGAATGTGGTTGTGGTAAGACTTCAAAAATAATGCAATGCTGCGTAAAGGAATCAATCGAATGTGATTCTACTTGTGAAAAACTTTTGAATTGTGAATTGCATACTTGTTCAGAAAAGTGTCATGAAGGAAAATGTCCAGCTTGCAAAGAAAAGGTAGAACAAAAATGCCATTGTGCTAAACAAGATAGACAAGTTACTTGCACTCGAGAATCGCATGACAAACATAATTACTCCTGTGGTAAACCATGTGGTAAGGATCTCACTTGTGGCAATCATAAATGTAAAGATTGTTGCCATCCCAATGATTGCAGACCTTGTAAACTAAGTCCCGATTTGGTGACTTCTTGTCCTTGTGGTAAAATGCCTATAGTTCCAGAACAACGTAAGTCCTGTTTAGATCCCATACCCATTTGCGAAGGTGTTTGTGGTAAGACTTTGAAATGTGGCAAAGCCACTAATCCTCATCACTGTACTTCCAAATGTCATTTGGCTAACTGTCCACCATGCAACAAGCAGACTGCTGTAAAATGTCGTTGTGGTCATATGGATCAGTTAATAAAATGCCGCCAGCTATCGACCAGAGCCGATGATGCTAGATGTAAAAAACGTTGTACGAAAAAACGTTCCTGTGGCAAACATAAATGCAATCAAGAATGTTGCATTGATATTGATCATTTCTGTCCACTGCCTTGTAATTATACTCTATCCTGTGGCAAACATAAGTGTGATCAACCTTGTCATCGTGGTAATTGTCCACCCTGTTATCGTTCTTCTTTCGAGGAGCTATTCTGTGAATGTGGTGCTGAGGTTATCTATCCACCGGTACCATGTGGCACAAAACGTCCCATTTGCAAGAGACCCTGTTCGCGTAAACATCCTTGTGATCATACACCACAACATAACTGCCATTCATCGGCCACTTGTCCTCCTTGTATGATGTTTACAACTAAATGGTGTTTTGGTCAACATGAACAACGTAAAACCATTCCGTGCTCCCAACAAAGCTTCTCTTGTGGTTTAGCCTGTAACAAACCATTGTCGTGTGGTCGCCACAAATGCATTAAGACTTGTCATGAAGGACCGTGTCAGCCGGTGGCCGGAGAAGTATGTAAACAAAATTGTACTACTGTCAGAGCCAGTTGTGGTCATAAATGTATGGCACCTTGTCATAATGGTGACTGCCCAGAGACACCATGTAAAGAAATGgtcGAAGTTCAATGTGAATGTGGTAATCGCAAACAAATGCGCTCTTGTGCCGACTTGCATCGTGAATATAGTCGTATTGCTACCGCTCAATTGGCCTCATCAATGGCTGAAATGCAGCGTGGCAATTATATGGAACTTTCTGAAATTTTAGCTCCCGTTAAGCTATCTAACAAATCTAATAAAACTTTAGACTGCAATGAAGAATGTCGTCTACTTGAACGTAATCGTCGTTTGGCCATTGGCCTACAAATTCGTAATCCCGATTTGCcacaaaaattattaacaaaatattcTGATTTTATAAGAAGTTTTGCTAAACGTGATCCAACCTTAGTCAAGTCAATACATGATGCTTTAACAACACTTGTCAAATTGGCCAAAGAGAGTAAACAGAAATCAAGATCGCATTCATTCCCCACGATGAATCGTGAAAAACGCCAATTGGTACATGAAATGTGTGAAATGTTTGGTGTTGAATCGGTGGCCTATGATGCTGAACCAAATCGTAATGTGGTGGCAACAGCCTATAAAGAtagaTCTTGGCTTCCTGCTACTAGCATTTTGGAAATAATGGCTCGTGAATCTGGTCAACGACGTGTACCAGTGCCAAGTAATAATGCCTGGGGCTTAAAAAGATAA
Protein Sequence: MSTDSKSQSSSQPPLSQLWPGFGSTTSDLNTSGPLLDSPHLQPVTTQGLGGKHQHQQQQPNNNYVNFNQFIMQHNLVSPPPPQKASLPSVGPFDEGFSKVEKTSSYVDDFDFFNNLGGLNMKIDHNSNSNIIPAVTNSGNNNSNSNQQRQSQQQQQFNYFNTSSNPQYPYANYNPTSNNNNSVFSDGLQNYNINPNTTTAPGATPTNTTGNQNYYDTTNSYSNFNSNGTTYYANPFATGFDFGNTKLQPNAPEFVPRFDKLSLNEIKKENKQIEEFSKDIFEDFNKESRNREIVGVGGPPQVPRENELNLDSSFEKEEKREQQRNERTRNNRQQNKHDKENNKKNNQRMEKNMERFSRNLQDKNYNNDSASNSNSSTPSLTMNNGGGTTHREQRELHQNFVTPQGGGQFNKTGAFSKNYRNSSGGSNGGGNGGGNGGGNGGGNGGGNGGGNGGNNGGGSGGGNPGVSDKYRNGDNLDKNEKSNYNNKQRFQNDRRSQDFTEREDRYDRYVERGDRSDRGHNQRNQQRNDYHQRYDNYRSNKRRDDWNRNRDRINGFRVDEKYSNDNGKDSPLPSPEKKSPKKQYEKENEKLSQREKLIRDIENRRLECLVCVEPIKAHQGVWSCHNCYHILHLQCIIKWASSSKSDDGWRCPACQNVEKDVPRDYYCFCGKLRNPTNNRQDIAHSCGEVCGRVEGCAHACTLQCHPGPCPPCQAQVKRECGCGKTSKIMQCCVKESIECDSTCEKLLNCELHTCSEKCHEGKCPACKEKVEQKCHCAKQDRQVTCTRESHDKHNYSCGKPCGKDLTCGNHKCKDCCHPNDCRPCKLSPDLVTSCPCGKMPIVPEQRKSCLDPIPICEGVCGKTLKCGKATNPHHCTSKCHLANCPPCNKQTAVKCRCGHMDQLIKCRQLSTRADDARCKKRCTKKRSCGKHKCNQECCIDIDHFCPLPCNYTLSCGKHKCDQPCHRGNCPPCYRSSFEELFCECGAEVIYPPVPCGTKRPICKRPCSRKHPCDHTPQHNCHSSATCPPCMMFTTKWCFGQHEQRKTIPCSQQSFSCGLACNKPLSCGRHKCIKTCHEGPCQPVAGEVCKQNCTTVRASCGHKCMAPCHNGDCPETPCKEMVEVQCECGNRKQMRSCADLHREYSRIATAQLASSMAEMQRGNYMELSEILAPVKLSNKSNKTLDCNEECRLLERNRRLAIGLQIRNPDLPQKLLTKYSDFIRSFAKRDPTLVKSIHDALTTLVKLAKESKQKSRSHSFPTMNREKRQLVHEMCEMFGVESVAYDAEPNRNVVATAYKDRSWLPATSILEIMARESGQRRVPVPSNNAWGLKR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -