Basic Information

Insect: Cryptocheilus praepositus
Gene Symbol: stc_1
Assembly: GCA_033815515.1
Location: JAWWQZ010000271.1:468602-477165[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 2.5e+04 -4.3 1.6 15 19 517 521 516 521 0.81

2 14 0.32 4e+03 -1.6 0.2 4 10 550 556 549 559 0.92

3 14 2.3e-07 0.0029 18.1 12.1 4 19 567 582 563 582 0.93

4 14 2.6e-08 0.00033 21.1 18.9 1 18 618 635 618 636 0.97

5 14 1.5e-06 0.018 15.5 15.0 1 19 674 692 664 692 0.91

6 14 1 1.3e+04 -3.2 0.7 5 10 721 726 721 726 0.94

7 14 1.3e-06 0.017 15.6 13.6 4 18 739 753 732 754 0.86

8 14 1.5 1.9e+04 -3.8 2.0 5 10 783 788 783 788 0.93

9 14 0.0042 52 4.5 11.5 1 11 794 804 794 816 0.90

10 14 5.2e-10 6.5e-06 26.5 13.4 1 19 821 839 821 839 0.98

11 14 0.49 6.2e+03 -2.2 0.9 5 10 867 872 866 872 0.94

12 14 2 2.5e+04 -7.2 9.5 10 19 886 896 878 896 0.70

13 14 4.2e-07 0.0052 17.2 13.1 1 16 932 947 932 958 0.86

14 14 1.1e-06 0.014 15.9 14.4 1 19 964 983 964 983 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	2.5e+04	-4.3	1.6	15	19	517	521	516	521	0.81
2	14	0.32	4e+03	-1.6	0.2	4	10	550	556	549	559	0.92
3	14	2.3e-07	0.0029	18.1	12.1	4	19	567	582	563	582	0.93
4	14	2.6e-08	0.00033	21.1	18.9	1	18	618	635	618	636	0.97
5	14	1.5e-06	0.018	15.5	15.0	1	19	674	692	664	692	0.91
6	14	1	1.3e+04	-3.2	0.7	5	10	721	726	721	726	0.94
7	14	1.3e-06	0.017	15.6	13.6	4	18	739	753	732	754	0.86
8	14	1.5	1.9e+04	-3.8	2.0	5	10	783	788	783	788	0.93
9	14	0.0042	52	4.5	11.5	1	11	794	804	794	816	0.90
10	14	5.2e-10	6.5e-06	26.5	13.4	1	19	821	839	821	839	0.98
11	14	0.49	6.2e+03	-2.2	0.9	5	10	867	872	866	872	0.94
12	14	2	2.5e+04	-7.2	9.5	10	19	886	896	878	896	0.70
13	14	4.2e-07	0.0052	17.2	13.1	1	16	932	947	932	958	0.86
14	14	1.1e-06	0.014	15.9	14.4	1	19	964	983	964	983	0.97

Sequence Information

Coding Sequence: ATGGCTTCTTGGGACGGCTCCTATCACAATCCAGAAGACCCCAGGTACTTCTTGCATTCCAACGGCAACGTCCTTGGCACGGACAACCGAGACTGGGCTGTTTTTCCCAATCGGGACAGTGCCTTTCCACAGGATACTCAAAACCATTACCAGGCTGATTCTATGAGATTGCAACAAAGTAGTCCCGTATTTTACAACATCGATCGAAGTCTCAGTGCCCATGCTTACGGGTCTGTGGATCCCATAATGGATTTCTGTTCGGGAGAACAGGTTGCAGCAGCTAATTCAAGCTCGATTAATAACGAGCGGCATTTCGCAGATAGTTCTGGAACGCAACAGAGCAAACTGTATTATCGTAGGGAGAATGCCAATCATCGTAAAAAACAGAAGAGTAGTAAAGAGAATAGGCAGCAGGCGTATATGCAGTGGCCGAGCAGTGTCGAGCATTTTACGCTGCAGGCGACGGCCGAGGAATTTGTGCCGAATGGTACAAGAGCTGTGGCGCAGGAGGCGGAGAGGTCGGAGGATAGTCAGTTTTTTACAGGTGGAGACATTACGAGTTCACAAACTTCTAATTCGGGAACGGTCCCATTCTTTCCGAACAATAAAGATCGATATAATAGGAAGCAACAAGAGGATAGGAGAACAACGAATTACAGGCAAAGAGACGCTCAAAACactgccaagtttcaaaagggGAGCATGCAGAAGAATTTACATAGGCCTCCGAATGTTAAGAGCTATGGGAGATATCCGAATGATAGGTTTTTCAGTGGGAAAACTAGATCGAATAACTCTCAAGGAAATCCTGCACAgggtagaagaagaaataatggaCAGTGGCCTGTTTCTTCGATATCAGGGAGTACCAGCAAAGGGGGGCCTTTTACCGAATCGCCGCAAGATAATGGGCACTCTGTATCGGAAAACATTGCAGGGGATAAAGTTAGTTATGGACTGTACGCTAGCGACGGTGAGGTGAATGAAACAAATAATGGCATGCAACCGGATGACAGACCTAAGCGGTTTTATAAGCGTGGTAGCGATCGTGCTCAATATAAGGAAAGTGGACAGAATCAAGTATCTTCGAGAAACACGAGAAAGTATACTGGTAATGAACAAATTGATAAATACGAACTGGATTATAAGGATAGAGGTGCCAGACGTCAGGGTTACGGTAGCGCTAGGTTTAATTACAATAAACAGACTAAAGCTGAGAAAGTGAAGGATAAAGAGAGGAATAAGGATGCGATTCAAGAATGGAAGGACAAGGAACAGGGAAGCTGGGGCGAGAGGCCTGAGAGTAGGACtgggaaaaatgaaatggaGTCACGTGAGGAACACGGAAAGCATGAAAACGATGACGACGCCAGTCAAAGGGAACGCTTAACGCAACAATTGAACAAAGGGGAACTGGATTGTCTAGTCTGCTGCGAATTTATTAAACAGACCCACTACATTTGGTCCTGCGAAAATTGCTATTACGTGTTGCACTTGACGTGTGTGAAAAAGTGGGCGAAATCGTCCCAGGGTGAAAACGGATGGCGTTGTCCCGCATGCCAGAATGTCAGTTCGACCATTCCGGAGGACTCCTATTGCTTCTGCGGAAAAACGAAGACGCCCGAGTGGAATCACAGGGATGCAGCCCATTCCTGCGGCGAAATGTGCGGTCGGTCCACGTCTAAGAATAACTGTGTACATAAGTGCACGCTGCTTTGCCATCCAGGACCCTGTCCTTCGTGCACTGCCACGGTCACGAAACCTTGCGGTTGCGGTAGAACGATGCAGACTGTTCAATGTAGCACGCTGTTGATGCTGCACTGCGATGCAGTGTGCGATAAGAAATTGAACTGCGGGAAGCACACGTGCGAAAAGAAGTGCCATCATGGCGACTGCGGACCGTGCGAAAAATTGGTACAACAAGATTGTTACTGCGGCAAGAAGAATCGTGAAGTAACCTGCCAGGCCGATACATCCTCCACGTATTCTTGCGGCGACGTGTGCAGTAAGAGTTTAAACTGCGAGAAGCACAATTGTTCGGAAATCTGCCATCCGGGAGCCTGCGAGCCATGTTCGTTAACGCCTGACAAAGTGACGACCTGTTGCTGCGGACAGTCGCCTTTGACAGAGAAGCGTGAGAGTTGCCTAGATCCAATCGCGACCTGCGACAAAATATGCTCAAAACGACTCAAGTGCGGCCAGCCAGACAATCCGCACACGTGTCAAGTACCCTGCCATGTAGGAAACTGCCCGGAATGCGAACTAACGACGGACGTAAAGTGTCGCTGCGGGAATATGGACAGACAGATAGCATGTAAAGAGTTGATCACGAAGGCAGACGACGCACGCTGTGAAAAGAAGTGCACGAAGAAACGGTCCTGCGGCAAGCATAAATGCAATCAGCTGTGCTGCATCGATATCGAACATGTCTGTCCACTGCCCTGTTCGAAGACGCTTTCCTGCGGTCGTCATAAATGCGAACAAACCTGCCACAAAGGTAGATGCCAACAGTGCTGGCACACTAGTTTCGACGAACTCTACTGCGAATGCGGTGCAGCTGTAATTTATCCACCCGTGCCGTGCGGTACTCGCAGACCAACGTGCAACAAGCCTTGTTCCAGGGAACACCCATGTGGTCACGAAGTGCTGCACAACTGCCACAGCGAACCTGTCTGTCCACCGTGCACCGTTCTAACACAAAAATGGTGCTACGGCAAACACGAGCTGCGCAAAGCTGTTCCGTGCTACGTAAACGAGATATCGTGTGGCATGCCATGTAGCAAGCCGTTGTCTTGTGGCAGACACAAGTGCATAACGCTTTGTCACACTGGCCCGTGTGAAAAACCTGGCCAACGTTGTACGCAGCCGTGTACAGTTTCCAGAGACGTGTGCGGTCATAATTGTGCGGCACCGTGTCATGAGGGCAAGTGTCCTGATAGTCCCTGTAAAGAAACTGTTAAGGTGACATGTCAATGTGGACACAGGAGTATGACACGTGCTTGTGCGGAAAATGCCCGGGAGTATCAAAGAATCGCGAGTAACATACTGGCGAGTAAGATGGCAGACATGCAACTAGGTCACTCGGTTGATTTGGAGGAAGTGTTCGGCCAAGGTGCGAAGAGGCAGAATCAGTTGAAGACGCTGGAATGCAATGATGAATGCAAAACTATCGAGAGAAACCGAAGGTTGGCATTGGGCTTGCAAATAGTGAATCCCGACCTGAGTGGCAAGTTGATGCCGAGATACAGTGACTTCATGAAGCAGTGGGCGAAAAAGGATCCGCACTTCTGTCAGATGGTTCACGAAAAGTTGTCTGAGTTGGTTCAACTGGCGAAAACGTCGAAGCAGAAGTCGCGAAGCTACTCGTTCGAAAGTATGAAGCGTGACAAGCGTTATTTTGTACACGAGTCGTGTCAACATTTTGGTTGTGAAAGCCAGGCGTACGACCAGGAACCAAAAAGGAACGTCGTCGCTACGGCAGTGAAGAATAAGTGTTGGTTGCCGAGTTACAGTCTCCTCGAGATTGTGCAGAGAGAAAACGGTCGGCGAAAAGTTCCCGGGCCGATGCTGAACACTTCCAAGGATAACAGTTCCGTAAAAACTGTTTTATCACTACCGGTAAACATGAACCAAAAATTCGTGTCCGCGCCGGCATCCTCAAAGTCGCCAGGACCGGACATCGATTACTTCGACTATAACAACTGA
Protein Sequence: MASWDGSYHNPEDPRYFLHSNGNVLGTDNRDWAVFPNRDSAFPQDTQNHYQADSMRLQQSSPVFYNIDRSLSAHAYGSVDPIMDFCSGEQVAAANSSSINNERHFADSSGTQQSKLYYRRENANHRKKQKSSKENRQQAYMQWPSSVEHFTLQATAEEFVPNGTRAVAQEAERSEDSQFFTGGDITSSQTSNSGTVPFFPNNKDRYNRKQQEDRRTTNYRQRDAQNTAKFQKGSMQKNLHRPPNVKSYGRYPNDRFFSGKTRSNNSQGNPAQGRRRNNGQWPVSSISGSTSKGGPFTESPQDNGHSVSENIAGDKVSYGLYASDGEVNETNNGMQPDDRPKRFYKRGSDRAQYKESGQNQVSSRNTRKYTGNEQIDKYELDYKDRGARRQGYGSARFNYNKQTKAEKVKDKERNKDAIQEWKDKEQGSWGERPESRTGKNEMESREEHGKHENDDDASQRERLTQQLNKGELDCLVCCEFIKQTHYIWSCENCYYVLHLTCVKKWAKSSQGENGWRCPACQNVSSTIPEDSYCFCGKTKTPEWNHRDAAHSCGEMCGRSTSKNNCVHKCTLLCHPGPCPSCTATVTKPCGCGRTMQTVQCSTLLMLHCDAVCDKKLNCGKHTCEKKCHHGDCGPCEKLVQQDCYCGKKNREVTCQADTSSTYSCGDVCSKSLNCEKHNCSEICHPGACEPCSLTPDKVTTCCCGQSPLTEKRESCLDPIATCDKICSKRLKCGQPDNPHTCQVPCHVGNCPECELTTDVKCRCGNMDRQIACKELITKADDARCEKKCTKKRSCGKHKCNQLCCIDIEHVCPLPCSKTLSCGRHKCEQTCHKGRCQQCWHTSFDELYCECGAAVIYPPVPCGTRRPTCNKPCSREHPCGHEVLHNCHSEPVCPPCTVLTQKWCYGKHELRKAVPCYVNEISCGMPCSKPLSCGRHKCITLCHTGPCEKPGQRCTQPCTVSRDVCGHNCAAPCHEGKCPDSPCKETVKVTCQCGHRSMTRACAENAREYQRIASNILASKMADMQLGHSVDLEEVFGQGAKRQNQLKTLECNDECKTIERNRRLALGLQIVNPDLSGKLMPRYSDFMKQWAKKDPHFCQMVHEKLSELVQLAKTSKQKSRSYSFESMKRDKRYFVHESCQHFGCESQAYDQEPKRNVVATAVKNKCWLPSYSLLEIVQRENGRRKVPGPMLNTSKDNSSVKTVLSLPVNMNQKFVSAPASSKSPGPDIDYFDYNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -