Basic Information

Insect: Colletes gigas
Gene Symbol: stc_1
Assembly: GCA_013123115.1
Location: WUUM01000006.1:1315209-1320772[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 1.6e+04 -4.4 1.6 15 19 585 589 584 589 0.81

2 14 0.086 6.8e+02 0.3 0.4 4 10 618 624 617 624 0.95

3 14 1.7e-05 0.13 12.1 13.4 4 18 635 649 633 650 0.95

4 14 6.8e-06 0.053 13.4 13.9 1 18 686 703 686 704 0.96

5 14 3.5e-08 0.00027 20.7 9.2 1 19 742 760 742 760 0.98

6 14 7.3e-06 0.058 13.3 12.9 4 18 807 821 800 822 0.86

7 14 2 1.6e+04 -4.7 1.6 5 10 851 856 851 856 0.90

8 14 0.0006 4.7 7.1 8.4 1 11 862 872 862 873 0.97

9 14 1.5 1.2e+04 -3.7 0.6 4 10 877 883 876 883 0.86

10 14 2e-10 1.6e-06 27.8 13.8 1 19 889 907 889 907 0.98

11 14 0.81 6.4e+03 -2.9 1.0 5 10 935 940 935 940 0.92

12 14 2 1.6e+04 -7.2 10.0 10 19 954 964 946 964 0.69

13 14 0.00012 0.98 9.3 17.2 1 16 1000 1015 1000 1026 0.87

14 14 1.9e-06 0.015 15.2 15.0 1 19 1032 1051 1032 1051 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	1.6e+04	-4.4	1.6	15	19	585	589	584	589	0.81
2	14	0.086	6.8e+02	0.3	0.4	4	10	618	624	617	624	0.95
3	14	1.7e-05	0.13	12.1	13.4	4	18	635	649	633	650	0.95
4	14	6.8e-06	0.053	13.4	13.9	1	18	686	703	686	704	0.96
5	14	3.5e-08	0.00027	20.7	9.2	1	19	742	760	742	760	0.98
6	14	7.3e-06	0.058	13.3	12.9	4	18	807	821	800	822	0.86
7	14	2	1.6e+04	-4.7	1.6	5	10	851	856	851	856	0.90
8	14	0.0006	4.7	7.1	8.4	1	11	862	872	862	873	0.97
9	14	1.5	1.2e+04	-3.7	0.6	4	10	877	883	876	883	0.86
10	14	2e-10	1.6e-06	27.8	13.8	1	19	889	907	889	907	0.98
11	14	0.81	6.4e+03	-2.9	1.0	5	10	935	940	935	940	0.92
12	14	2	1.6e+04	-7.2	10.0	10	19	954	964	946	964	0.69
13	14	0.00012	0.98	9.3	17.2	1	16	1000	1015	1000	1026	0.87
14	14	1.9e-06	0.015	15.2	15.0	1	19	1032	1051	1032	1051	0.96

Sequence Information

Coding Sequence: ATGCTACGAGACACTGTAGCTTCGAAGGGGACGCACGAAGTCGAAGAAATTATGGCCACATGGGATGGTTCTTATTCAGGACCGAACGATCAAAATTACGTGTACCCTGATCAAAATACTCCAGGCACTGCTGCAGGAAACTGGACgtatttttcgaacaatttaaaCAACGATTATCTGCAAACTAATCGCGAATTCTACGTGCAAAACAATTCCGTGTACGAGCAAAATTGCCCGAACACGTTCTATCGTTCGGACGCGAACGTTGTGCCAAATCTGTTGTCCCAGACTAACAATTATCAGGAGCATTTGACAAACGCTGTAGACAATTCTCAAATATCGAATAATCTCGAATATTTTCCGACCGTCGTCAAGTCCGAACAATATTTTGTACCCGTCGATTGTTGGAGCAATAATTACGATATAAAAACATCAAAGAGCAAAGGTAATTTTGCGAAAGGAGTTAAAGAAACTGTGCCCAACGTAACCAAACAGTCAAATTTGCATGCAACGGCCGAAGAGTTTGTGCCAAATCATGTTAAACCGGATGACGAGAAGCACGAATCGAAGAATGTAAATGTTCCTTGTTCGGCCATTCAAGCGGATTCTTATATCAAGGATACCAAACTTGCTCTTAGAACATCAGATAAATACACCTTTGgtgatgtaaataaatatgaaagaaagtatgataaaagaaatgtaaattataagCCCAAAGAAGGACAAGATcagttttataaaagaaacacgtataaaaattcttatcaGCAACAAGGTAGGGCTTCTCATAAATTTCAAGGTAATAAGTACTTTGCCGATAAACATTATTCAGATAAATCGCAAGTAAATGCAAAAGACATAGGTGCTAACGTGTCGGGTAGAAATACAATAAACGGTAATAGTTCTTGTAATTATAAAGAAGCTTCTGCGATAAATTTAAACGAGAGAGAAGCCTCTTCGAGTATGAATGTAAATtcgcataaaaataaaagatcatTAAATGATGGCAGCGATAAAGGAAATACCATTACCAAAGATGAGAATGCAGAATCCAATGGAACGAAACAGTCCAATAATCGAGTCAAGGAATTTACCTATTATAACTCTGGTTCCATGCAATTGCATAATCCTCATAGAAATACAAAGAAATATCCATACAATGCTAGGCATAATAACAGAGAAGAGCACAGTTACAAAGAGAAGAAGCGCAATTATCAGGGGCATAATGTAATTTGGGATAACCAtagcaaagaaaataaacctGGTGCGAAAGAACAAATGTACAGTCACGAGGAATCTAACGAGTTTAGAAAATGTTCGAACGAGGAAGCCAGACTTAGAACAAAGGAAGTTAAGGAAAGGGGGTACAATTACCAAGGATATGTCGGATATAGGGAATACAATAAAGGTGATAAAACTGAAGTTTCCAGAGAGAAagatagaaataaaagttatacatttgaaagtaaagaaaagggaaatgaaaattggagatataaaagagaaattaatgaaaagagTAGTCTTCAAAAGCGGGAACAGAATAAGAGACCTTCGATCGACGACGTTGCGAGTCAAAGGGAAAGATTGACGGATCAACTGAATAAAGGGCAACTAGAATGTCTAGTGTGTTGCGAAAACATGAAACAGAACGATTACATTTGGTCATGTTCCAACTGCTATCATGTCTTACATttgaaatgtattaaaaagtGGGCAAAATCATCACAAGGAGaaaatggCTGGAGATGTCCAGCGTGTCAAAACGTGAGCTTAACAGTTCCCGAAGAATATTACTGCTTTTGCGGCAAGACAAGAGCACCCGAATGGAATCGTCGTGATATTGCACATTCTTGCGGCGAAGTTTGCGGTAgaatattatcgaaaaataGTTGCCCTCATAAGTGTACTCTTCTGTGTCATCCGGGATCGTGTCCACAATGCATAGCAATGGTGACAAGATACTGCGGTTGTAGCAAAACATCGCAAACGGTACAGTGCAGCAcgcataaattattgttttgcGACTGTATATGTGGCAAGGATTTGAATTGTAGCAGGCATAAATGCGAAGCGAAATGTCATCACGGGGAATGCGTAAACTGTGAAAAGACAATAGAACAAGAGTGTTACTGTGGCAAAAATAAGAGGGAAGTAACGTGTCAGAAGAACGTTTCTCTTACATACTCTTGCGAAACTGTTTGCGGCAAATTATTGGAGTGTGGTAATCATACTTGTACAAAGTTATGTCACGCGGATGCTTGCGAATCCTGTTCTTTAACCCCGGAGAAAATTACTACCTGCTGTTGCGGGCAAACACCGTTAACAGAGAAAAGACAAACGTGCTTGGATCCGATTCCAGTTTGCAGCAAAATTTGTTCGAAGAGACTGAAGTGTGGCCAACCGAataATCCTCATACGTGTAAGGTGAAATGTCATCAGGGAGAGTGTCCCGTTTGCGATTTAACCACCGACGTGAAATGCCGTTGCGGTAATATGGACAGAGAAATTCCGTGCAAAGATTTAACCTCGAAAGCTGACGACGCGCGTTGCGAAAAGAGATGCACGAAAAGAAGATCTTGCGGCAAGCATAAATGTAATCAACTCTGTTGCATAGAAGTAGAACACATTTGCCCTTTGGTGTGTTCGAAAACTTTGAGCTGCGGTAGACATAAATGTGAACAAAGTTGTCATAAAGGAAGATGTCAGCCTTGTTGGCGTAGTAGCTTCGACGAATTGTACTGCGAATGCGGGGCTGCTGTGATATATCCTCCAGTTCCCTGTGGCACGAGACGACCCACTTGCGACAAACCTTGTTCCCGTCAGCATTTCTGCGGACACGAGGTATTGCACAACTGTCACAGCGAGCCAACGTGTCCTCCTTGCACCGTCCTTACACAGAGATGGTGTCACGGCAAACACGAGCTACGGAAAGCCGTGGCGTGTTACGTAAATGAAATCTCGTGTGGTTTACCATGCAACAAACCTATCTCGTGCGGCCGGCACAAATGTATCACCATTTGTCATTGCGGCCCGTGCGAGAAGCCGGGGCAACTATGCTTTCAACCGTGCACCACGCCGAGAGAAATGTGTGGACATAATTGCGCTGCCCCCTGCCACGAGGGTAAATGCCCGGAGACGCCTTGCAAAGAAACGGTGAAGGTAACGTGTCAGTGCGGACGTAGGACCATGTCTCGCGTTTGCGCggaaaattcgaaagaatatCAGAGAAAGGCGAGCAGTATGTTGGCTAGTAAAATGGCTGACATGCAACTGGGTCATTCGGTGAATTTGGAGGAAGTTTTTGGTCAGGGGGCAAAGAAACAGAATCAGCTGAAAACGTTGGAATGTAACGaggaatgtaaaataatagaacGTAACAGAAAACTGGCGCAGGGTTTGCAAATTGTGAATTCGGATGTAAGCGGGAAGCTGATGCCCAAGTACAGCGATTTTATGAAACAGTGGGCTAAGAAGGACCTGCATTTTTGTCAAATGGTTCACGAGAAGCTAATAGAATTGGTACAATTGGCAAAAAGCTCGAAACAGAAATCGCGCAGTTATTCGTTCGATAGTATGAACAAAGATAAACGTCGTTTTGTTCACGAGTCCTGTAAGCATTTCGGTTGCGAGAGTCAGGCATACGATCAGGAACCTAACAGAAATGTTGTTGCTACTGCTGTGAAAGATCAGTGCTGGTTGCCCAGCTATAGTCTATTAGACATTGTACAACGAGAGAATGGTCAGAGGAAAGTCCCAGGTCCGATGTTGAACACTTCAAAATCCGATGGACCTGTAAAaacgattctATCACTGCCTACAAAAAGGAACCAAAATCCGGAAACGCAATCGAAAACGAAGATGTCAGATCCGGAAATAGACTACTTTGATTATCAAGGTTAA
Protein Sequence: MLRDTVASKGTHEVEEIMATWDGSYSGPNDQNYVYPDQNTPGTAAGNWTYFSNNLNNDYLQTNREFYVQNNSVYEQNCPNTFYRSDANVVPNLLSQTNNYQEHLTNAVDNSQISNNLEYFPTVVKSEQYFVPVDCWSNNYDIKTSKSKGNFAKGVKETVPNVTKQSNLHATAEEFVPNHVKPDDEKHESKNVNVPCSAIQADSYIKDTKLALRTSDKYTFGDVNKYERKYDKRNVNYKPKEGQDQFYKRNTYKNSYQQQGRASHKFQGNKYFADKHYSDKSQVNAKDIGANVSGRNTINGNSSCNYKEASAINLNEREASSSMNVNSHKNKRSLNDGSDKGNTITKDENAESNGTKQSNNRVKEFTYYNSGSMQLHNPHRNTKKYPYNARHNNREEHSYKEKKRNYQGHNVIWDNHSKENKPGAKEQMYSHEESNEFRKCSNEEARLRTKEVKERGYNYQGYVGYREYNKGDKTEVSREKDRNKSYTFESKEKGNENWRYKREINEKSSLQKREQNKRPSIDDVASQRERLTDQLNKGQLECLVCCENMKQNDYIWSCSNCYHVLHLKCIKKWAKSSQGENGWRCPACQNVSLTVPEEYYCFCGKTRAPEWNRRDIAHSCGEVCGRILSKNSCPHKCTLLCHPGSCPQCIAMVTRYCGCSKTSQTVQCSTHKLLFCDCICGKDLNCSRHKCEAKCHHGECVNCEKTIEQECYCGKNKREVTCQKNVSLTYSCETVCGKLLECGNHTCTKLCHADACESCSLTPEKITTCCCGQTPLTEKRQTCLDPIPVCSKICSKRLKCGQPNNPHTCKVKCHQGECPVCDLTTDVKCRCGNMDREIPCKDLTSKADDARCEKRCTKRRSCGKHKCNQLCCIEVEHICPLVCSKTLSCGRHKCEQSCHKGRCQPCWRSSFDELYCECGAAVIYPPVPCGTRRPTCDKPCSRQHFCGHEVLHNCHSEPTCPPCTVLTQRWCHGKHELRKAVACYVNEISCGLPCNKPISCGRHKCITICHCGPCEKPGQLCFQPCTTPREMCGHNCAAPCHEGKCPETPCKETVKVTCQCGRRTMSRVCAENSKEYQRKASSMLASKMADMQLGHSVNLEEVFGQGAKKQNQLKTLECNEECKIIERNRKLAQGLQIVNSDVSGKLMPKYSDFMKQWAKKDLHFCQMVHEKLIELVQLAKSSKQKSRSYSFDSMNKDKRRFVHESCKHFGCESQAYDQEPNRNVVATAVKDQCWLPSYSLLDIVQRENGQRKVPGPMLNTSKSDGPVKTILSLPTKRNQNPETQSKTKMSDPEIDYFDYQG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00360597;
90% Identity: iTF_00360597;
80% Identity: -