Basic Information

Insect: Cosmorhoe ocellata
Gene Symbol: stc_1
Assembly: GCA_963675405.1
Location: OY776254.1:8788247-8803630[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 3e+04 -4.4 1.6 15 19 579 583 578 583 0.81

2 14 0.053 7.8e+02 0.9 1.4 2 10 610 618 610 618 0.92

3 14 4e-05 0.59 10.9 18.1 4 19 626 641 624 641 0.93

4 14 0.00043 6.4 7.6 12.2 1 18 677 694 671 695 0.89

5 14 6e-05 0.89 10.3 13.7 1 18 736 753 736 754 0.98

6 14 1.6e-06 0.024 15.4 9.8 1 19 795 817 795 817 0.88

7 14 2 3e+04 -5.4 2.2 6 10 847 851 847 851 0.94

8 14 0.016 2.4e+02 2.6 7.3 1 11 857 867 857 868 0.93

9 14 0.38 5.6e+03 -1.8 2.4 4 10 872 878 871 878 0.92

10 14 8e-09 0.00012 22.7 15.8 1 19 884 902 884 902 0.99

11 14 1 1.5e+04 -3.2 2.6 11 18 931 941 930 942 0.74

12 14 0.00091 13 6.6 9.5 10 18 949 957 946 958 0.92

13 14 4.1e-08 0.0006 20.5 13.8 1 17 994 1012 994 1018 0.83

14 14 0.0062 92 3.9 5.1 1 12 1024 1034 1024 1034 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	3e+04	-4.4	1.6	15	19	579	583	578	583	0.81
2	14	0.053	7.8e+02	0.9	1.4	2	10	610	618	610	618	0.92
3	14	4e-05	0.59	10.9	18.1	4	19	626	641	624	641	0.93
4	14	0.00043	6.4	7.6	12.2	1	18	677	694	671	695	0.89
5	14	6e-05	0.89	10.3	13.7	1	18	736	753	736	754	0.98
6	14	1.6e-06	0.024	15.4	9.8	1	19	795	817	795	817	0.88
7	14	2	3e+04	-5.4	2.2	6	10	847	851	847	851	0.94
8	14	0.016	2.4e+02	2.6	7.3	1	11	857	867	857	868	0.93
9	14	0.38	5.6e+03	-1.8	2.4	4	10	872	878	871	878	0.92
10	14	8e-09	0.00012	22.7	15.8	1	19	884	902	884	902	0.99
11	14	1	1.5e+04	-3.2	2.6	11	18	931	941	930	942	0.74
12	14	0.00091	13	6.6	9.5	10	18	949	957	946	958	0.92
13	14	4.1e-08	0.0006	20.5	13.8	1	17	994	1012	994	1018	0.83
14	14	0.0062	92	3.9	5.1	1	12	1024	1034	1024	1034	0.96

Sequence Information

Coding Sequence: ATGAGTCAGTGGAACAACTCCTATGCTTATAATAATCAGTACCAACAAAGCCCTAATGGCTGGAACGGTGACCCTAACGGCCAATACATGAATCAAGCCTACTACAGCAGACCAGATGCCAATGGTCAATATGTGAGTTTCAATGAGTTCCTAACGCAAATGCAAACCAATGTGGCTCCACAGGCCACTTCCAGTAGTTTCAGCAATGCAGGTCCTTTTGAAAACTATCCCCCAGGTCAGTATAACTATCAAAGTGTGCCTTCGGCTTCATCATCCCAAACGCAGCTCAATAATTACAACTATGGGCCTTCAAATGAGCCTAATGAACCTAATACATACCCAGTGAGTGCACAGAACCACTACGCAGCCCCTCCAGCAGAACCAACAACATATACAAACAGTATGGCTTTCAAATCTAATCTTACAGCAACCGCTGTTGAATTTGTACCAAAAGGTGCTACTCCAAAACCATCTTCTAGTAAGCAGAACATTCCAGAATCTTCCAGTAATTACAAGGATATGAATGAAGGTGCTAGCGAGATACAAACTAACTATGGCAGGTCTACAGATCGAAACTGGAGACAGCGGCCCCAGACTGCTCATCAAAACAGTGAAGCAAAAGATAAAACAGAGTCTAATGGAGATAAAAGCTATGAGCGTAATGCACACAACCGTGACACTCCTCGACGAAACAATGAAGACTTAGAACTAAATGATCATAATAATGAACCTAACACTGAATCTAATCATAGAAATCAAGAGTCAGATAAGAGTCATGATACCAATCACCAAAATGAGTCAAATAGTCTGAGCCGAGAGCCACGTCAACGAAACTatgattcaaataataaaaaccaagaatcacaattaaataataaaaatcaagaATCACGGTCAAATAATAGGAATCAAGAATCGCGTCAATATAATGATAGAAACCAAGAATCGCGGCAAAGAAACTATGATGATAGAAACCAAGATACAAGGCAAAGAAACTATGATTCAAATAGTCGAAATAGAGATTATCGTCAAAACTATGAATCCAATGACAGAGGCCAAGAATCAAGGGAACATGAATCAAATCAGCGTTATGAATCTTCCAGAAATGACCGTCGGAACCAATCTAAAGGTAACCCCAAACCTAAAGGAAAAGAGGACAACAGGACTTTCTATAACAGTGCTATAAGCAAAGACAGTCAGGATGTTAGATCTGCAAGAGGGGAAAACTCTCGGACAGATTATACAAAGGGGGAAGGTTATGCAAGAGTTGAAGGTAATAATAGAGGTGAAGGTTCTGGTAGGGGTCAACGAAACTGGGCTGGTACCCAACGTCCCCGAGGTGACCGTAACCAAGATGATGAGCAATATGCTAATAACTACTACCAAAAAGAAGATAGAGCTGACAGGGATAAACCTGAAAGGCTGGAAAGAGATCGAGGGTATGATAGAGAGAGAGGATATGACAGGCAAGACAGAGAAAGAGTACAGAAATCTAACCTATCAAGTCCCGCAAGGTTTAAGAGCAAACATCAGACTGATCTAGCTAACAAAGAGATGACACAACGCGAGCGTCTCACGGACCAACTAGACAAAGGCACATTAGAGTGCCTGGTGTGCTGTGATAGAGTGAGACAGACTGACCCGGTGTGGTCCTGCTCTAACTGCTACCATGTCCTTCATTTGAGATGTATAAGAAAATGGGCCATGAGTAGTGTAATTGAGGGCAAATGGCGGTGCCCAGCTTGTCAGAACATCAGTAAGATCATTCCGACGGAGTACCGCTGTATGTGCGGCGCGATCCGCTCGCCAGACTACCAGCGCGGCAGCGGCGCGCACACCTGCGGGAAGGCGTGCAAGAGAGAACGGATCTGCCCCCATCCCTGCACTCTACTCTGCCATCCGGGACCATGCCCGCCATGTCAGGCCACTGTCAGCAAGCAATGCGGTTGTGGCGCCGAGACTCGTAGTATAATGTGCAGTAGCAAACTACCTCAGATCTGCGGTCGGGTGTGTGGCCGCACACTAGGGTGCAATGTACACTCGTGCGTAAAAGAGTGTCACGAAGGGGAATGTGATGATTGTGATAAAACTGTCACGCAAGTGTGTTACTGCCCCGCTGCGAGCGAGCGCACCATCCCGTGCACGCGCGAGACGGGCTCGCAGTCTCAGTGGGCGTGCGAGCGCGCGTGCGGCCGCATCCAGGCGTGCGGGGCGCACGTGTGCCGCGCGCCCTGCCACCCGCCCCCCTGCGACCCCTGCGCGCTCCTGCCCGCAGCCGTGGTGACCTGCCCCTGTGGGAAGATGCAGTTAGACAAGGACGCACGCAAAGTGTGCACTGACCCGATTCCACTGTGCGGCAATATCTGTGCCAAGCCGCTGCCTTGCGGACCAGTGGGCGACAAACACTTCTGCAAGCTCATCTGCCATGAAGGTGCGTGTCCCGTGTGCCCCGATAACACCCTGCTTCAGTGCCGCTGTGGGCATTCGAGCCGCGAAGTGCCCTGCGCCGAACTGCCCGAAATGCTCAACAATGTACTCTGCCAGAAGAAATGCAATAAGAAACTGTCGTGCGGTCGTCACCGCTGCCGCACCGCATGCTGCGCGGCGACCACTCATCGTTGCACGGTGACGTGTGCGAGGTCGCTCACATGCGGCTTGCATCGCTGCGAGGAGTTCTGCCATACAGGACACTGCCCGCCCTGCCCGCGCGTCAGTTTCGAAGAGTTGCGATGCGAGTGCGGCGCGGCAGTGGCGCTGCCGCCCGTGccgtgcggcgcgcgcgctcCCCCGTGCGAAGGGCCCTGTCTGCGCGTGCGCCCCTGCAACCACCCCCCGCACCACTCGTGCCACACCGGCGAGTGCCCCCCCTGCGTCGTGCTCACTACTAAGCATTGCTACGGCAAGCACGAGGAGCGGAAGACCATCCCGTGTTCATTAGAAGAGTTCTCTTGCGGTCTGCCGTGCGGCAAGCCGTTGCCTTGCGGGAAACACACATGCATCAAAACCTGCCATAAGGGACCATGCGACGCTGGCAAATGCACGCAGCCGTGTACGGAGAAGCGTCCGGCGTGCGGGCACGTGTGCAACGCGGCGTGCCactcgtccgccgccgccgacAGCCAGGCGGCCGCCTGCCCCAGCGCCGCGCCGTGCCGCCAGCTCGTGCGCGCCACCTGCCCGTGCGgccggcgccgcgcgcccCGCGCCTGCAGCGACAACGCACGGGACTACGCCAAGTTGATGAGTGCCTTAGCCGCTACGAAGATGCAAGAAGGTGGAGCGATCGAGATCACCGAACAACGTCCCGGGAACATGCTGAAAACTTTGGAGTGCGACGACGAGTGCCGCGTGGAGGCGCGCACGCGGCAGATGGCGCTGGCGCTCCAGATCCGCAACCCCGACGTGTCCGCCAAGCTGGCGCCGCGCTACAGCGAGCACGTGCGCACCACGGCCGCGCGCGAGCCGGCCTTCGCGCAGCAGGTGCACGACAAGCTCACCGAGCTCGTGCAACTGGCCAAGAAGtCTAAACAAAGAACTCGTGCGCACTCGTTCCCATCAATGAACTGGCAGAAGCGGCAGTTCATACACGAATTGTGCGAGCATTTCGGCTGCGAGAGTGTCGCCTACGACGCCGAGCCGAACCGCAACGTTGTGGCTACGGCCGATAAAGAGAAGTCATGGCTTCCAGCGATGAGTGTTCTAGAAGTGTTAGGTCGCGAGGCAGGCAAGAGGAGAGTCCCCGGGCCTGTGCTGAGGGCTCCACCGGCCGCCGCTGCCTCTGCTTCTTCCTCCGGCGCTACCAACGCCAAATCTACAAGCGGTTGGGCAACATTGACTTCGAAGAACACGAACGCGTGGGGCGTTCGTAGTCCGAGCCAAGCCAAGCCGGCGCCGCCCGAAACCAAAATCGACTACTTCGATAACCCGCCAGACAACTAG
Protein Sequence: MSQWNNSYAYNNQYQQSPNGWNGDPNGQYMNQAYYSRPDANGQYVSFNEFLTQMQTNVAPQATSSSFSNAGPFENYPPGQYNYQSVPSASSSQTQLNNYNYGPSNEPNEPNTYPVSAQNHYAAPPAEPTTYTNSMAFKSNLTATAVEFVPKGATPKPSSSKQNIPESSSNYKDMNEGASEIQTNYGRSTDRNWRQRPQTAHQNSEAKDKTESNGDKSYERNAHNRDTPRRNNEDLELNDHNNEPNTESNHRNQESDKSHDTNHQNESNSLSREPRQRNYDSNNKNQESQLNNKNQESRSNNRNQESRQYNDRNQESRQRNYDDRNQDTRQRNYDSNSRNRDYRQNYESNDRGQESREHESNQRYESSRNDRRNQSKGNPKPKGKEDNRTFYNSAISKDSQDVRSARGENSRTDYTKGEGYARVEGNNRGEGSGRGQRNWAGTQRPRGDRNQDDEQYANNYYQKEDRADRDKPERLERDRGYDRERGYDRQDRERVQKSNLSSPARFKSKHQTDLANKEMTQRERLTDQLDKGTLECLVCCDRVRQTDPVWSCSNCYHVLHLRCIRKWAMSSVIEGKWRCPACQNISKIIPTEYRCMCGAIRSPDYQRGSGAHTCGKACKRERICPHPCTLLCHPGPCPPCQATVSKQCGCGAETRSIMCSSKLPQICGRVCGRTLGCNVHSCVKECHEGECDDCDKTVTQVCYCPAASERTIPCTRETGSQSQWACERACGRIQACGAHVCRAPCHPPPCDPCALLPAAVVTCPCGKMQLDKDARKVCTDPIPLCGNICAKPLPCGPVGDKHFCKLICHEGACPVCPDNTLLQCRCGHSSREVPCAELPEMLNNVLCQKKCNKKLSCGRHRCRTACCAATTHRCTVTCARSLTCGLHRCEEFCHTGHCPPCPRVSFEELRCECGAAVALPPVPCGARAPPCEGPCLRVRPCNHPPHHSCHTGECPPCVVLTTKHCYGKHEERKTIPCSLEEFSCGLPCGKPLPCGKHTCIKTCHKGPCDAGKCTQPCTEKRPACGHVCNAACHSSAAADSQAAACPSAAPCRQLVRATCPCGRRRAPRACSDNARDYAKLMSALAATKMQEGGAIEITEQRPGNMLKTLECDDECRVEARTRQMALALQIRNPDVSAKLAPRYSEHVRTTAAREPAFAQQVHDKLTELVQLAKKSKQRTRAHSFPSMNWQKRQFIHELCEHFGCESVAYDAEPNRNVVATADKEKSWLPAMSVLEVLGREAGKRRVPGPVLRAPPAAAASASSSGATNAKSTSGWATLTSKNTNAWGVRSPSQAKPAPPETKIDYFDNPPDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00362225;
90% Identity: -
80% Identity: -