Basic Information

Insect: Calephelis nemesis
Gene Symbol: stc_1
Assembly: GCA_002245505.1
Location: NJDD01007193.1:68207-86998[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 2 2.8e+04 -4.3 1.6 15 19 465 469 464 469 0.81

2 13 0.038 5.3e+02 1.4 1.2 2 10 497 505 497 505 0.93

3 13 4.1e-06 0.057 14.1 17.0 1 19 511 528 511 528 0.93

4 13 4.3e-07 0.006 17.2 11.0 1 18 564 581 564 582 0.94

5 13 2 2.7e+04 -4.1 1.0 6 10 686 690 686 690 0.96

6 13 1.4e-05 0.19 12.4 11.4 1 19 696 718 696 718 0.87

7 13 2 2.8e+04 -4.7 1.7 6 10 748 752 748 752 0.95

8 13 7.8e-05 1.1 10.0 3.4 1 11 758 768 758 771 0.96

9 13 0.044 6.1e+02 1.2 2.2 1 10 768 779 768 779 0.88

10 13 6.5e-06 0.091 13.4 13.5 3 19 787 803 785 803 0.92

11 13 0.051 7.1e+02 1.0 17.3 1 18 842 858 842 859 0.89

12 13 4.4e-08 0.00061 20.4 14.2 1 17 895 917 895 919 0.83

13 13 8.9e-07 0.012 16.2 7.2 1 16 925 939 925 941 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	2	2.8e+04	-4.3	1.6	15	19	465	469	464	469	0.81
2	13	0.038	5.3e+02	1.4	1.2	2	10	497	505	497	505	0.93
3	13	4.1e-06	0.057	14.1	17.0	1	19	511	528	511	528	0.93
4	13	4.3e-07	0.006	17.2	11.0	1	18	564	581	564	582	0.94
5	13	2	2.7e+04	-4.1	1.0	6	10	686	690	686	690	0.96
6	13	1.4e-05	0.19	12.4	11.4	1	19	696	718	696	718	0.87
7	13	2	2.8e+04	-4.7	1.7	6	10	748	752	748	752	0.95
8	13	7.8e-05	1.1	10.0	3.4	1	11	758	768	758	771	0.96
9	13	0.044	6.1e+02	1.2	2.2	1	10	768	779	768	779	0.88
10	13	6.5e-06	0.091	13.4	13.5	3	19	787	803	785	803	0.92
11	13	0.051	7.1e+02	1.0	17.3	1	18	842	858	842	859	0.89
12	13	4.4e-08	0.00061	20.4	14.2	1	17	895	917	895	919	0.83
13	13	8.9e-07	0.012	16.2	7.2	1	16	925	939	925	941	0.97

Sequence Information

Coding Sequence: ATGTCACACTGGAATAACTCATACGCCTATAATAATCAGCATCAAAACCCGAATACGTGGAACTCTGATGCAAGTAGGCAACAAAGTAATCAACCATACTATTCTAATCCTAATAGACAATATGATTCCAGCAACCAATATGTTACTTTTGATGAATTTCTTACTCAAATGCAACCCAGTACTTCTACATCTGATACCAGTTACGATGCACTGCAATATCAAAACTATCCCAACAATCAGTACAATGTAGCTAGTTATAGTGGACCACCAGTTCAAAACTCTCAATTACACTATACTTATGGATCAAACACtgccaatttttctaataatgtaGATATTTATCAAGAAAATATACCTAGCCAATTACCCCAAACTCAAGACCCTAATAGATATCCTGAAGAGCTTGTATCTAAATCAAGACTTACTGCAACTGCCAGTGAATTTGTACCAAAAAATGCCTTAAAACCTTCAAATAGTAGTACTCAAATTGAGCAAGCTCAAGATCCCCATCCAGCTAGCCATAATACAAAAGaaagtaagcaaactaaatCTTCTAATTCAACAAATTGGAGGGAAAGGCCAACTCAAGCTCAAAATAGTGATAGTTATAATACCGAAACAAATAGCAGTAATTATAAACCACAGAAGTATAATGGTTATAATAAACATGAGGAATCTAATAGTAAGTTTGACTCCAATAGTTATTACAATAGAAGGGACCAGAATCGTTATAATGAGTATAATGGTCGAAATTTGAGAAAAAACCGTTCAAATGAAAACTCTGACTCTGGTTATAGCAATTCAGACAATAGGTCTGATAATATGAGATTTAAGTCCCGAAATGAACCAAGTAATGACTCTCAGGAATCATCAAATTATAGTGCAGATAATCTGTCTGATAATGTAAACAATGATGAGAACCAAACCAGAAACTCTAAGTCAAGACATAAAGAACCTGAAGTGTACCGTACTTATTATAACAGCTCAATGCCTAAAAGTAGTCAAGATGTTAGAAATGGCAGAGGTGAAAGTTCAGGAAGAGGCCGTAACTGGGCAGGCAGTCAGAGGCTTAGAGCTAGTGATCGAAATTACGTGGAAGATGAACAATTtgcaaatacatatttacatcaAAGAGAAGAAAGAGAAAGGGAGAAAGTTAATACAAGAAAACCAAAAGTTAGCAACATTATTGAAAGTGGAGAGAGTGCAGAGCTAACTCAACGAGAGAGGCTCAGTGATCAGCTTGACAAGGGAACTTTAGAGTGTTTGGTGTGTTgtgaacgggtgaaacaaatTGATCCAGTTTGGTACTGCAGCAACTGTTACCATGTGCTGCATTTGAGATGTATTAGGAAATGGGCTATGAGTAGTATGGTTGAGGGTAAATGGAGATGTCCAGCTTGTCAAAACACCAGTCAAGATATCCCAGTGGAGTACCGCTGCATGTGTGGGGCTCTAAAGAACCCAGAGTACCAGCGAGGTGGCAGTGGTGCCCATACTTGTGGTCGGGCATGCAAACGACCAAGGAATTGCTCACATCCTTGCACATTACTTTGCCATCCTGGACCCTGCCCACCATGCCAGGCTACTAttaataaAAAATGTGGTTGTGGTGCGGAAACACGATCAGTGCTTTGCAGCAGTAAGCTCCCACAGGTCTGTAACCGCCAGTGCAAACGGAAGCTGGAATGTACCGTACACACATGTTCCCGAGATTGCCACGAGGGAGCATGCGACCCTTGTGAAGAGATTGTAGATCAAGTGTGCTACTGCCCGGCTGCCAAGTCCCGTTCGGTGCCCTGCACGGCGGAGACGGGCGGCAAGTCGCAGTGGTCGTGCGGCGGCGAGTGCGGGCGGNNNNNNNNNNNGGGTGGCGGCGTGCGGCGCGCACGTCTGCCGCGCCCGCTGCCACCCCGCGCCCTGCCCGCCCTGTCCGCTGCGTCCCGACAACGTGCTCACCTGCCCCTGCGGGAACACGCAGTGATAAATtattatgcatttttaagtaggaTTGGCAAAGATCAACGAAAGTCGTGCACAGATCCAATACCGCTCTGTGAGAGGATCTGTGCCAAGCCACTTCCCTGTGGACCCGCGGGAGATAAACACTTCTGCAAAGACAACTGTCATGAAGgCCCTTGCCGAGTGTGCCCTGAAACTACCGCCATACAATGTCGCTGCGGACATTCGAGCCGTGAGGTTCCTTGTTCCGAATATGAACAAATGTTATACAACGTGCTGTGCCAAAGGAAATGTAATAagAAAATGTCGTGCGGACGGCACCGCTGCCGCGCGGTGTGCTGCGGCGCACAGTCCCACCGGTGCGCGGTGGTGTGCGGCCGCACGCTCTCCTGCCAGCTGCACCGCTGCGAGGACTTCTGCCACACCGGACACTGCGCGCCCTGTCCGCGGCTCGGTTTCGAAGAGCTCCGCTGCGCTTGTGGCAAGGAAGTGGTGTTGCCGCCGATACGGTGCGGCGCGAGACCGCCCGCGTGCTCGGCACCGTGCCGCCGCCAGCGACCGTGCGGGCACGAGCCGCACCACTCCTGCCACCAGGGCGACTGCCCGCCCTGCGTCGTGCTCACCACCAAGATGTGCCACGGCAAGCACGAGGAAAGGAAGACGATTCCATGCTCTCAAGAAGAGTTTTCATGCGGTATGCCTTGCGGGAAACCGTTGCCCTGCGGCAAACACACCTGTATCAAGACTTGCCACAAAGGACCTTGCGATGCTGGCAAATGCACGCAGCCGTGCCGGTCGAAGCGTCCGGGGTGCGGGCACGAGTGCGCGGCGGCGTGCCACTCGGGCGCGTGCCCCGCGGCGGCGCCAATGATGAGTACATTAGCTGCGTCAAAAATGCAGGAAGGCGGTTCCGTGGATCTCACAGATGTTCAACGACCTGGGTCAATGCTCAAAACACTGGAGTGCGACGAGGAGTGCTACGTGGAGGCCCGCAGTCGGCGCATGGCGCTGGCGCTGCAGATCCGCAACCCCGATGTGTCCGCCAAGCTGGCGCCGCGGTACAGTGACGCCGTGCGGGCCGCCGCCGCACGCGAGCCCGCCTTCGCGGCGCACGTGCACGACCGCCTCACCGACCTCGTGCAGCTCGCCAAGAAGTCGAAACAGAAGACTCGTTCGCACTCGTTCCCGTCGATGAACCGACAGAAGCGGCAGTTTATCCACGAGATGTGCGAGCACTTTGGCTGCGAAAGTGTCGCCTACGACGCCGAGCCCAACCGGAACGTCGTCGCTACTGCCGACAAGGAAAAGTCGTGGCTGCCGGCGATGAGTGTGCTGGAGGTGCTGGCGCGGGAGGCGGGCCGCCGCCGCGTGCCGGGGCCGGTGCTGCGTGCGCCGCCGCCCGTCTCGGTGTCCGCGCCCGCGCACGCCGCGCAGGCGCAGCCCGCACCCGCTGCCAAGCCGTTTAGCGGTTGGGCAACCCTTACGTCCAGTAACGCGTGGGCGGCTCGGAGCCAACCCAAACAGGAACCGAAACAAGAGGCCAAGATCGACTACTTCGACAACCCTCCTGAAGCTTAG
Protein Sequence: MSHWNNSYAYNNQHQNPNTWNSDASRQQSNQPYYSNPNRQYDSSNQYVTFDEFLTQMQPSTSTSDTSYDALQYQNYPNNQYNVASYSGPPVQNSQLHYTYGSNTANFSNNVDIYQENIPSQLPQTQDPNRYPEELVSKSRLTATASEFVPKNALKPSNSSTQIEQAQDPHPASHNTKESKQTKSSNSTNWRERPTQAQNSDSYNTETNSSNYKPQKYNGYNKHEESNSKFDSNSYYNRRDQNRYNEYNGRNLRKNRSNENSDSGYSNSDNRSDNMRFKSRNEPSNDSQESSNYSADNLSDNVNNDENQTRNSKSRHKEPEVYRTYYNSSMPKSSQDVRNGRGESSGRGRNWAGSQRLRASDRNYVEDEQFANTYLHQREEREREKVNTRKPKVSNIIESGESAELTQRERLSDQLDKGTLECLVCCERVKQIDPVWYCSNCYHVLHLRCIRKWAMSSMVEGKWRCPACQNTSQDIPVEYRCMCGALKNPEYQRGGSGAHTCGRACKRPRNCSHPCTLLCHPGPCPPCQATINKKCGCGAETRSVLCSSKLPQVCNRQCKRKLECTVHTCSRDCHEGACDPCEEIVDQVCYCPAAKSRSVPCTAETGGKSQWSCGGECGRXXXXGGGVRRARLPRPLPPRALPALSAASRQRAHLPLREHAVINYYAFLSRIGKDQRKSCTDPIPLCERICAKPLPCGPAGDKHFCKDNCHEGPCRVCPETTAIQCRCGHSSREVPCSEYEQMLYNVLCQRKCNKKMSCGRHRCRAVCCGAQSHRCAVVCGRTLSCQLHRCEDFCHTGHCAPCPRLGFEELRCACGKEVVLPPIRCGARPPACSAPCRRQRPCGHEPHHSCHQGDCPPCVVLTTKMCHGKHEERKTIPCSQEEFSCGMPCGKPLPCGKHTCIKTCHKGPCDAGKCTQPCRSKRPGCGHECAAACHSGACPAAAPMMSTLAASKMQEGGSVDLTDVQRPGSMLKTLECDEECYVEARSRRMALALQIRNPDVSAKLAPRYSDAVRAAAAREPAFAAHVHDRLTDLVQLAKKSKQKTRSHSFPSMNRQKRQFIHEMCEHFGCESVAYDAEPNRNVVATADKEKSWLPAMSVLEVLAREAGRRRVPGPVLRAPPPVSVSAPAHAAQAQPAPAAKPFSGWATLTSSNAWAARSQPKQEPKQEAKIDYFDNPPEA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00257488;
90% Identity: iTF_00257488;
80% Identity: -