Basic Information

Insect: Cerceris ruficornis
Gene Symbol: stc_1
Assembly: GCA_963989415.1
Location: OZ022520.1:32199930-32204431[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 1 4.2e+04 -4.4 1.6 15 19 563 567 562 567 0.81

2 13 0.029 1.2e+03 0.8 0.7 4 10 596 602 595 602 0.95

3 13 3.9e-07 0.016 16.4 9.7 2 18 612 627 611 628 0.93

4 13 4.3e-06 0.18 13.0 16.0 1 18 664 681 658 682 0.87

5 13 4.5e-08 0.0019 19.4 11.9 1 19 720 738 720 738 0.98

6 13 0.31 1.3e+04 -2.5 0.9 5 10 767 772 767 772 0.95

7 13 1.4e-06 0.06 14.6 12.8 4 18 785 799 778 800 0.86

8 13 0.0003 12 7.2 8.4 1 11 840 850 840 851 0.97

9 13 8.8e-11 3.7e-06 28.0 13.1 1 19 867 885 867 885 0.98

10 13 0.13 5.7e+03 -1.3 1.7 5 10 913 918 907 919 0.90

11 13 1 4.2e+04 -8.6 11.5 10 19 932 942 921 942 0.71

12 13 7.8e-07 0.033 15.4 14.8 1 16 978 993 978 1004 0.86

13 13 0.00015 6.2 8.1 10.8 1 19 1010 1029 1010 1029 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	1	4.2e+04	-4.4	1.6	15	19	563	567	562	567	0.81
2	13	0.029	1.2e+03	0.8	0.7	4	10	596	602	595	602	0.95
3	13	3.9e-07	0.016	16.4	9.7	2	18	612	627	611	628	0.93
4	13	4.3e-06	0.18	13.0	16.0	1	18	664	681	658	682	0.87
5	13	4.5e-08	0.0019	19.4	11.9	1	19	720	738	720	738	0.98
6	13	0.31	1.3e+04	-2.5	0.9	5	10	767	772	767	772	0.95
7	13	1.4e-06	0.06	14.6	12.8	4	18	785	799	778	800	0.86
8	13	0.0003	12	7.2	8.4	1	11	840	850	840	851	0.97
9	13	8.8e-11	3.7e-06	28.0	13.1	1	19	867	885	867	885	0.98
10	13	0.13	5.7e+03	-1.3	1.7	5	10	913	918	907	919	0.90
11	13	1	4.2e+04	-8.6	11.5	10	19	932	942	921	942	0.71
12	13	7.8e-07	0.033	15.4	14.8	1	16	978	993	978	1004	0.86
13	13	0.00015	6.2	8.1	10.8	1	19	1010	1029	1010	1029	0.97

Sequence Information

Coding Sequence: ATGGCTACCTGGGATGGATCTTACTCGGAAGACCAAAATTATTACGTATACTCGGATCAGAATGTTCCCGCACGAGCCGCTGAAAACTGGACCTTCTTTTCCGAGAATGTCAACAATGGTTATTTACCGAGTAACCGAGAGTGCTACATGCAAAATGAACCTGTGTTCGAACAGCATTGCGAAAATACTTTTTACCATGTAGACACTGACATTTCGTCAAACTTACTGCCTTTATCTAACAATTACGAAGGACAGTTTGTGGGAAACACCATAAACGGTACTCCAGTAGCATCGGGTAATCTAGAATATTATCCCAATACTGCCAAATCGCCACAGTGTTTTACGTCTGCTCAATATTGGAATAGTAATTATGGTAGAAAGTCTAGGATGGCCGATAAACATTTTGCTTCGAACACAACTCCCGATATTCAGCCACAAATTGCTGGCCCATCGACTCTGCACGCTACAGCTAATGAATTTGTACCGAATAATGCTATGTTTAAAGACGAGAAGCCTAGACCAGAAGGTAATCGTTCTGTCGGGAACCAAGAGCCTTACGTTCGAAGTTCCAGATCGAAGGTAGAGTCGGATGGCCGTGCATCTTTCGATAGATTCAAGCGTGAAAAGAAgtatgaaaaaaagagaaacacgAATATCAAAAACAGAGAGGGTCAGCAGGCTCaatttgaaaaaggaaatatatgtaaaagaaCTTACAAACAGCAAGGTAGAAACTACAACAAATTCCAAAgagataaatattttaacaacgAATTCTGTTCGGATAAGTCTCAAGAAGCCGCGGCAGACGTAGATACAAAACAGCTGTTTACGGATGCCGCGAGTAATTCTGACGTTCACGTTGGGAGAGAAGGTAGCATTTCTATGGTAAATACGAAAGAGGACAATCTTTCGATGAATGTATATACAAGCAGAAGCGAAAATTCTGCTAATGTTTCCAATCAGGAAGGAAGTAATAGATACAGAGATAATACGTCGCATATTAATAGAGGAAAGAGGCAAACTAATCGTAGCAAGGAATTCAGTTATCCCAATTTTAGTTCTAGACAATCACAGTGGAGTAACCGAAATACAACTAAATATTCGTACGATAAATACGATAGAGACGAAAATAATTATAAGGATACGAGGCACAGTTATCAAGGACACAATGGAATTAGGGAAAACCATAACAAGGATGATAGAGTCGAAACTAAAGAGAAATCGTACGGTTATCAAGAACATAATGGATTCAGGGAATACTACAACAAAGAAAGTAAGACAGAGGGTAAAGAGAGGAGGTACAACTACCAGGCGCATAATGGTTTTAGAGAATAtcataataaagaaaataagaatGAGGCTTTTAGAGAAAAGGATAAAAGTAGGAATGTAGTAGAATACAGGCATAAGGAAAATGAGAACTGGAGAAATAAAAAGGAGAGCAGCGAAAGAAGTAACGGTCAGAAACGGGGGCAAAATAAAAAGTCTTTAATCGATGACGATGCGAGTCAAAGAGAACGGCTGACAGAGCAGTTAAATAAAGGGCAATTGGAGTGCCTGGTGTGTTGCGAATACATCAAACAAACCGATTACATTTGGTCATGCTCAAACTGTTATCACGTACTGCAtttaaaatgcattcggaaatgGGCAAAATCTTCGCAAGGAGACAATGGCTGGCGATGTCCGGCGTGTCAAAACGTAAACCTAACGGTACCGAAAGATTACTTTTGCTTCTGCGGCAAGACAAGAGCACCCGAATGGAATGCCAGAGACGTCGCTCATTCCTGCAGCGAAATTTGTGGTAGAGCATTATCGAAAAATAATTGCGCTCACAAGTGCGCTCTTCTCTGTCATCCAGGATCGTGTCCAGTGTGCATAGCAATGGTGGTAAAGTATTGCGGCTGTGGTAAAACGTCCCAAACGCTGCAGTGTAGCACTCAAACTTTGCTGCACTGCAGCTCCGAGTGCGGTAAAGATTTGAATTGCGATAGACACAAATGCGAGAGAACGTGTCATCACGGTGAATGCGGAAACTGCGAAAACGTTGTCGAGCAGGAATGTTATTGCGGTAAAAATAAGCAAGAAGCAACTTGCAGCCGTGACGTTACGTTCACGTATTCCTGTGGAATGCTTTGCGAGAAACTGTTGAATTGCGGTAATCACGCTTGCAAGAAAACGTGTCATTCGGATGATTGCGAACCCTGTTCGTTAACGCCCGACAAAGTTACGACTTGCTGCTGCGGGCAAACAGCCCTGAAGGAAAAAAGGGAAAGCTGTCTAGATCCGATACCGACGTGCGACAAAGTATGCCGGAAAAATCTAAAATGCGGTCAGCCTAACAATCCACACACGTGTAAGGCGAATTGTCACGAAGGAGAATGTCCCAGTTGCGATCTAACTACTGACGTTAAGTGTCGCTGCGGGAATATGGACAGAGAGATCTCGTGCAAAGATTTAACATCGAAGGCCGACGATGCCCGCTGCGAAAAAAGATGCATCAAGAAGAGAGCTTGCGGCAAACATAAGTGTAATCAGCTGTGTTGCATAGACATCGAGCACGTTTGCCCTCTGCAGTGCTCGAAAACATTGAGTTGCGGTAGACACAAATGCGAGAGAAGCTGTCACAAAGGCAGGTGTCAACCTTGCTGGCGCAGCAGCTTCGACGAATTGTACTGCGAATGCGGAGCCGCAGTGATCTATCCTCCCGTTCCCTGCGGCACGAGAAGACCGACTTGCGAGAGGCCTTGCTCTCGTCAGCATTCATGCGGACACGAGGTGCTGCACAATTGTCACAGTGAACCGACCTGTCCACCTTGCACGGTTCTCACGCAACGGTGGTGTCACGGAAAGCACGAGCTTCGCAAAGCGGTGCCTTGCTACGTGGGAGAAATATCGTGCGGTTTGCCGTGCAGCAAGCCGCTGTCGTGTGGACGACACAAGTGCATCACTATTTGCCATTCCGGGCCTTGCGAAAAGCCTGGCCAGCAGTGCGTTCAACCGTGCACCGCTCCGAGAGAATTGTGCGGACATATCTGTGCCGCTCCTTGTCACGAGGACAAATGTCCGGACATTCCGTGCAAAGAAATGGTCAAGGTGACGTGCCAATGCGGACACAGAACAACGTCCCGGGTTTGCGCGGAAAATGCTAGGGAATATCAGAGAATAGCGAGCAGCATATTAGCCAGCAAAATGGCAGACATGCAACTCGGTCATTCGATCAATCTGAAGGAAGTGTTTGGACAGGGAGCAAAGAAACAGAATCAATGGAAAACCTTAGACTGCAACGAGGAGTGCCAGCTAGTAGAGCGAAACAGGCGAATGGCGTTGTGCTTGCAGATCGTTAATCCAGATTTAATCGGAAAGCTGATACCCCGTTACAGTGATTTCATGAAGCAATGGGCCAAAAAGGATCCACTTTTCTGCCAAATGGTTCACGAGAAGTTGACAGAATTGGTACAGTTGGCAAAGACTTCGAAGCAGAAGTCGCGAAGTTATTCCTTCGATTGCATGAACAAGGATAAGCGCCATTTTCTTCACGAATCGTGCGAACATTTCGGTTGCGACAGTCAGGCGTACGATCAAGAACCGAAGAGAAACGTCGTCGCTACTGCGGTAAAAGATAAGTGTTGGTTACCCAGCTATAGTTTAATGGAAATAGTGCAAAGAGAGAATGGTCAAAGGAAAGTTCCAGGTCCGATGCTGAGCACTCCGAAGCCTGGCGTATCCGTCAAGACGGTACTATCACTGCCGACGAGAAAAATTCCAATGCCAACGACATTATCGAATCCATCAAGCTCTTCGAAGGCCCCGGAACCTGAAATCGATTACTTCGACTATCAGGGATGA
Protein Sequence: MATWDGSYSEDQNYYVYSDQNVPARAAENWTFFSENVNNGYLPSNRECYMQNEPVFEQHCENTFYHVDTDISSNLLPLSNNYEGQFVGNTINGTPVASGNLEYYPNTAKSPQCFTSAQYWNSNYGRKSRMADKHFASNTTPDIQPQIAGPSTLHATANEFVPNNAMFKDEKPRPEGNRSVGNQEPYVRSSRSKVESDGRASFDRFKREKKYEKKRNTNIKNREGQQAQFEKGNICKRTYKQQGRNYNKFQRDKYFNNEFCSDKSQEAAADVDTKQLFTDAASNSDVHVGREGSISMVNTKEDNLSMNVYTSRSENSANVSNQEGSNRYRDNTSHINRGKRQTNRSKEFSYPNFSSRQSQWSNRNTTKYSYDKYDRDENNYKDTRHSYQGHNGIRENHNKDDRVETKEKSYGYQEHNGFREYYNKESKTEGKERRYNYQAHNGFREYHNKENKNEAFREKDKSRNVVEYRHKENENWRNKKESSERSNGQKRGQNKKSLIDDDASQRERLTEQLNKGQLECLVCCEYIKQTDYIWSCSNCYHVLHLKCIRKWAKSSQGDNGWRCPACQNVNLTVPKDYFCFCGKTRAPEWNARDVAHSCSEICGRALSKNNCAHKCALLCHPGSCPVCIAMVVKYCGCGKTSQTLQCSTQTLLHCSSECGKDLNCDRHKCERTCHHGECGNCENVVEQECYCGKNKQEATCSRDVTFTYSCGMLCEKLLNCGNHACKKTCHSDDCEPCSLTPDKVTTCCCGQTALKEKRESCLDPIPTCDKVCRKNLKCGQPNNPHTCKANCHEGECPSCDLTTDVKCRCGNMDREISCKDLTSKADDARCEKRCIKKRACGKHKCNQLCCIDIEHVCPLQCSKTLSCGRHKCERSCHKGRCQPCWRSSFDELYCECGAAVIYPPVPCGTRRPTCERPCSRQHSCGHEVLHNCHSEPTCPPCTVLTQRWCHGKHELRKAVPCYVGEISCGLPCSKPLSCGRHKCITICHSGPCEKPGQQCVQPCTAPRELCGHICAAPCHEDKCPDIPCKEMVKVTCQCGHRTTSRVCAENAREYQRIASSILASKMADMQLGHSINLKEVFGQGAKKQNQWKTLDCNEECQLVERNRRMALCLQIVNPDLIGKLIPRYSDFMKQWAKKDPLFCQMVHEKLTELVQLAKTSKQKSRSYSFDCMNKDKRHFLHESCEHFGCDSQAYDQEPKRNVVATAVKDKCWLPSYSLMEIVQRENGQRKVPGPMLSTPKPGVSVKTVLSLPTRKIPMPTTLSNPSSSSKAPEPEIDYFDYQG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -