Basic Information

Insect: Catonia carolina
Gene Symbol: stc_1
Assembly: GCA_035578175.1
Location: JAQMRL010000002.1:101619417-101673410[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 3 6.4e+04 -4.5 1.6 15 19 630 634 629 634 0.81

2 16 0.17 3.6e+03 -0.1 0.4 4 10 664 670 663 670 0.96

3 16 2.6e-06 0.056 15.3 14.8 3 18 684 699 683 700 0.96

4 16 0.46 9.8e+03 -1.5 2.9 6 13 727 734 726 735 0.90

5 16 2.4e-08 0.00051 21.8 10.3 1 19 737 755 737 755 0.99

6 16 5.8e-06 0.12 14.1 17.9 1 19 795 813 795 813 0.99

7 16 1.2 2.5e+04 -2.8 0.9 5 10 843 848 843 848 0.95

8 16 2e-05 0.42 12.4 12.7 4 18 861 875 854 876 0.86

9 16 2.2 4.7e+04 -3.7 2.2 5 10 905 910 905 910 0.93

10 16 0.00063 13 7.6 7.8 1 11 916 926 916 928 0.96

11 16 3 6.4e+04 -5.0 1.1 5 10 932 937 930 937 0.53

12 16 2.5e-09 5.4e-05 24.9 14.8 1 19 943 961 943 961 0.98

13 16 1.3 2.8e+04 -2.9 0.2 6 10 990 994 989 994 0.83

14 16 3 6.4e+04 -11.2 16.4 9 19 1007 1018 994 1018 0.67

15 16 2.2e-05 0.46 12.3 15.5 1 16 1054 1069 1054 1080 0.88

16 16 0.001 21 7.0 14.6 1 19 1086 1105 1086 1105 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	3	6.4e+04	-4.5	1.6	15	19	630	634	629	634	0.81
2	16	0.17	3.6e+03	-0.1	0.4	4	10	664	670	663	670	0.96
3	16	2.6e-06	0.056	15.3	14.8	3	18	684	699	683	700	0.96
4	16	0.46	9.8e+03	-1.5	2.9	6	13	727	734	726	735	0.90
5	16	2.4e-08	0.00051	21.8	10.3	1	19	737	755	737	755	0.99
6	16	5.8e-06	0.12	14.1	17.9	1	19	795	813	795	813	0.99
7	16	1.2	2.5e+04	-2.8	0.9	5	10	843	848	843	848	0.95
8	16	2e-05	0.42	12.4	12.7	4	18	861	875	854	876	0.86
9	16	2.2	4.7e+04	-3.7	2.2	5	10	905	910	905	910	0.93
10	16	0.00063	13	7.6	7.8	1	11	916	926	916	928	0.96
11	16	3	6.4e+04	-5.0	1.1	5	10	932	937	930	937	0.53
12	16	2.5e-09	5.4e-05	24.9	14.8	1	19	943	961	943	961	0.98
13	16	1.3	2.8e+04	-2.9	0.2	6	10	990	994	989	994	0.83
14	16	3	6.4e+04	-11.2	16.4	9	19	1007	1018	994	1018	0.67
15	16	2.2e-05	0.46	12.3	15.5	1	16	1054	1069	1054	1080	0.88
16	16	0.001	21	7.0	14.6	1	19	1086	1105	1086	1105	0.97

Sequence Information

Coding Sequence: ATGAAAAATGTACACGACAAATGTGTCGGCGAATCTGGAGTGAGTGAAGCTGTGTTGGATAAAGCAAGGACAGGTGATTTTGATGGCAGTGAACCATTACAGTGCTTCATGAAATGCGTTTGGGTCACTATGACTGTTATGGATGACGACGGTGAAATAGACGAAGGAGTACTTCAAGTGTTGATACCACCCGACATGAAGGACACCCTCTTGACCGCGTACGAGAAGTGTAAAAATGAAGgtggaaGTACTCCTTGTGAGAAAGCATACAAGCTTAATACGTGTATGCGCAGAATAAATCCTGAAGTAATTGGATTGGACCGCCACCAGAGAGTGAGAATTAACGTCAGCCCCGCTGCGGCTGCCACCTCACCAGTGAGGGAGGGAGCAGGAGGCTTCCCCTCCCGACTACAAATGTCCAACTGGGGCCGGCCATATTTCAGCAACAATCAAAATTATTCATCTGCCTCCTCTTATCACAATAATCGACCCAATAACAGTAACAGCGGTGGCCATGGAAATGATTCACGGTGGCATTACTACCAACAACAACAGCCTCCACAATctaataattcttcttcttctcaatCGGTAGGGGGAGTTTACCTCCCATCTCATCGGCAGCAGTATAATGGTACGTCTTCGACTAATATGGAAAGTGATATTTTTTATCCTTCTCATGTGAGAGGTGGGGCACCGGCTGTGGATTTCAACTCTtcattgtcttcttcttcttctagatCTGGTTTAATGAATAATCCGTTACAGTTCAACAATTCAGGACGAAGCCATTTAAATAGTGATATTTGGGCTAAAGCTGCCAACTCTAATTTAGTTCCAACCGCTGGTGAATTTTTCCCATCGGGTAACTGTCATCAGCCTCCACCTGCGGTCAGTGATTATCAAGGTGGATCAAGACATGAATTGAACAACAACAGCAGTACTAATGATAATCAGTGGAAATTTGGTAGTGGGACTGGACAACGATCAGATTCCTCTTTATCCAGTTCTCAATATGAAGGGACCCCCAACCATAGAGGAGGAGGAGGCAATGGTAGAAATTATTCCGGCAGTCATCATCTATACAACAGTCATCATCAATCATCATCCAATAGAAATCcatcaaaaagtaactacaaCAGGGAATATCACCaaaagaataataacaataatgggAAGTCTGGATGGAATAATCACAGTAATAGTAGCAATTATAGTAATAGGGGTGGAACTAGAAACAATTATAGTCAAAGCCGCAGCTCTAATTCATCTTCAACTTATGGTAGAGGGCCAACATCTAGCAATTCTAGATTAGATGATCAAAAATCAGAAGGACGCAAAAAACTTTTAGAAGAAGTAGCCACATTATTAACACAACCACAAGATGGGCCTTGTACTATCTCATTGTCATCatcttcttcatcttcatctaCTGATTTGCATTCCAGTAGAGCAGGGGGTTGTAAtagtgaagaagaagaactcAGGAAAGTAATAAACCTCACTAATATTGTGGATGGAAGTAACGGACGGTCATCTGGGGATTATAAGAGAAATTACAATCATTTCCGTCGCACTGATAGAGGGGCTGAGAATTTTGGGACACCGCCGCCATTTCCAAGTAGAGTTTTTAATAATACGAATATGTCGGCTGTTACTGATAAACAACTTTCTGATAGAACTGGTTTATTAAATCaagATAATACAGTTTCTCAGCGGGAACGATTGACAGAGCAGTTAGAGAGAGGTACATTGGAGTGTCTTGTTTGTTATGATAGAGTTCGTCAAACGGATTCCGTCTGGAATTGTTCAAATTGTTTCCATGTTTTACATTTACGTTGTATCATCAGATGGGCCAATTCATCTCGTTCTGAAAATGGATGGAGATGTCCTGCTTGTCAGAATGTATCTAAATTAACTCCAcgtaattattattgtttctgcGGTAAAGTTATTGATCCTGATTGGAATCGTGGTAATGATATACCACATTCTTGTGGTGAGGTTTGTAACAAGCCAAAGCCAAATCCATCACCATATTTCCAGTGTAACCACCCATGTACATTGTTGTGTCATCCTGGGCCATGTCCTCCGTGCATCACCATGATACACAGAAATTGTGGGTGTGGAAGAACGAGCCAGATGATTCAGTGTGGTCAAAATTCATCGACAATATCGTGTGGCGAGACTTGCTGCAAAGGATTAAATTGTGGAGAACATTTCTGTAGCAATATCTGTCACTTAGGTGATTGTAAACCGTGTCCAGCAAAAATTTCTCAAGAGTGTTATTGTGGTACAATGTCAAGAGAAGTGGCTTgtgataaaaacaatattaacattaaaaaatttgaatgcgGGAACGAATGCCCAAAAAAATTAGAGTGTGGTGAACATCCATGCCTAAGAAACTGCCACCCAGGAAGTTGTGGCCCATGTCCACTGGATCCTTCTAGAGTTACACATTGCCCATGTGGGAAGATGCCAATAAACAATGTAGAACGTAAATCTTGCCTTGATCCTGTGCCTACATGTAGTGAGATTTGCAGCAAATCACTCACTTGTGGACAACCAGGCAATCCACATATGTGTAAATCTGCGTGCCATGAAGGCAATTGTCCTACTTGTGATCGTACTACTTTAGTCAGGTGTCGTTGTGGCCATATGGATAAGGAGATACCATGCAAAGATCTGACTACCAAGGCTGATGATGCACGCTGTCAAAAGAAATGCCCCAAGaaaCGTAGTTGTGGTAAGCACAAATGCAATCAGTTGTGCTGTATTGAAGTAGATCATGTGTGTCCCATACCATGTAATCATATGCTTACATGTGGCCAACATCGTTGTGAAGAACTCTGTCACAGGGGACATTGTAAACCTTGCTGGAGAACtagTTTTGAAGAATTGTTCTGCGAGTGTCGCAGCAGTGTTTTGTTTCCTCCTATACCATGTGGTACACGACCACCAGAGTGTAAGAAGCCATGCTCTCGTCAACATAATTGTGATCATCCTGCTCTGCATAGCTGTCACAGTGAACCTAATTGTCCTCCTTGTACTGTTCTAACTGCCAAATACTGTCATGGCATGCATGAGCTGAGAAAAACAGTGCCTTGTCACTTAGAAGAGTTTTCCTGTGGTATGCCGTGCAATAAAGAGTTACCCTGCGGCCATCATAAATGTATATTGCCTTGTCATAAAGGTGAATGTCTAAAGCCAGGACAGTTGTGTGTTCAGCCGTGCAGCAAGACCAGGTCGTTGTGTGGTCATCCGTGTAATGCTCCATGCCATGAAGATGAGTGTCCTGATACTCCCTGCAAAGAAACTGTAAAAGTGACTTGTGAATGCGGAAATAGAAGTATGACAAGACCTTGCtgtgaaaataataaagaataccAACGCATCGCTACATCATTACTGGCTTCAAAGATGGCTGATGTTCAACTCGGACGTTGTATCGATCTACAGGATATGCAAGGAGCTCGAAACAAGATGAGCTTAAAAACGTTGGAATGCAATGATGAATGCCGAATCGTTGAACGTAACCGCCGAATGAGCATAGGACTCCAAATAAGAAATCCTGACCTCTCTTCCAAATTGACACCACGATATTCTGATTTTATGCGCGGTTGGGCTAAAAAGGATCCTAAATTTTGTCAGCATGTCCATGATAAACTCTCTGAGTTGGTTCACCTCGCTAAACAGTCTAAGCAGAAAAGTAGGAGTTATTCATTTGAAACTATGAACAGAGAGAAGAGGCAATTTGTGCATGAGTATTGTGAACATTTCGGCTGTGAATCAGTTGCCTATGATGCTGAACCTAAACGGAATATTGTCGCAACTGCTCAAAGAGATAAGgcTTGGCTTCCCAGTTACAGCCTACTAGAGGTGATCCAAAGAGAAATGGGCCAACGTAAAGTACCACTTCCTACCCTAAATGGTATCAAGAAGCCAGCAACTGCTACTGGAACCACCAGagCTGCTGCGACGGCGCCGCTTGTACGTCTAGGTCAAAATCATCAACAGTTATCATCGCATAATTCTACTCAACAACAGTCTTCCACTCAACAACATCTAAACAGCAACAGTAACAGCAATAATAAAATCGATTATTTCAATTATACCAACACGTAA
Protein Sequence: MKNVHDKCVGESGVSEAVLDKARTGDFDGSEPLQCFMKCVWVTMTVMDDDGEIDEGVLQVLIPPDMKDTLLTAYEKCKNEGGSTPCEKAYKLNTCMRRINPEVIGLDRHQRVRINVSPAAAATSPVREGAGGFPSRLQMSNWGRPYFSNNQNYSSASSYHNNRPNNSNSGGHGNDSRWHYYQQQQPPQSNNSSSSQSVGGVYLPSHRQQYNGTSSTNMESDIFYPSHVRGGAPAVDFNSSLSSSSSRSGLMNNPLQFNNSGRSHLNSDIWAKAANSNLVPTAGEFFPSGNCHQPPPAVSDYQGGSRHELNNNSSTNDNQWKFGSGTGQRSDSSLSSSQYEGTPNHRGGGGNGRNYSGSHHLYNSHHQSSSNRNPSKSNYNREYHQKNNNNNGKSGWNNHSNSSNYSNRGGTRNNYSQSRSSNSSSTYGRGPTSSNSRLDDQKSEGRKKLLEEVATLLTQPQDGPCTISLSSSSSSSSTDLHSSRAGGCNSEEEELRKVINLTNIVDGSNGRSSGDYKRNYNHFRRTDRGAENFGTPPPFPSRVFNNTNMSAVTDKQLSDRTGLLNQDNTVSQRERLTEQLERGTLECLVCYDRVRQTDSVWNCSNCFHVLHLRCIIRWANSSRSENGWRCPACQNVSKLTPRNYYCFCGKVIDPDWNRGNDIPHSCGEVCNKPKPNPSPYFQCNHPCTLLCHPGPCPPCITMIHRNCGCGRTSQMIQCGQNSSTISCGETCCKGLNCGEHFCSNICHLGDCKPCPAKISQECYCGTMSREVACDKNNINIKKFECGNECPKKLECGEHPCLRNCHPGSCGPCPLDPSRVTHCPCGKMPINNVERKSCLDPVPTCSEICSKSLTCGQPGNPHMCKSACHEGNCPTCDRTTLVRCRCGHMDKEIPCKDLTTKADDARCQKKCPKKRSCGKHKCNQLCCIEVDHVCPIPCNHMLTCGQHRCEELCHRGHCKPCWRTSFEELFCECRSSVLFPPIPCGTRPPECKKPCSRQHNCDHPALHSCHSEPNCPPCTVLTAKYCHGMHELRKTVPCHLEEFSCGMPCNKELPCGHHKCILPCHKGECLKPGQLCVQPCSKTRSLCGHPCNAPCHEDECPDTPCKETVKVTCECGNRSMTRPCCENNKEYQRIATSLLASKMADVQLGRCIDLQDMQGARNKMSLKTLECNDECRIVERNRRMSIGLQIRNPDLSSKLTPRYSDFMRGWAKKDPKFCQHVHDKLSELVHLAKQSKQKSRSYSFETMNREKRQFVHEYCEHFGCESVAYDAEPKRNIVATAQRDKAWLPSYSLLEVIQREMGQRKVPLPTLNGIKKPATATGTTRAAATAPLVRLGQNHQQLSSHNSTQQQSSTQQHLNSNSNSNNKIDYFNYTNT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -