Basic Information

Insect: Boloria euphrosyne
Gene Symbol: stc_1
Assembly: GCA_951802675.2
Location: OX637880.1:2998040-3009954[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 2 3.2e+04 -4.3 1.6 15 19 489 493 488 493 0.81

2 13 0.048 7.7e+02 1.1 1.4 2 10 521 529 521 529 0.92

3 13 3.6e-05 0.58 11.0 18.1 4 19 537 552 535 552 0.93

4 13 4.7e-08 0.00076 20.3 13.2 1 18 588 605 588 606 0.98

5 13 2.2e-05 0.36 11.7 15.5 1 19 647 665 647 665 0.99

6 13 5.2e-06 0.083 13.7 11.3 1 19 706 728 706 728 0.88

7 13 2 3.2e+04 -4.7 1.7 6 10 758 762 758 762 0.95

8 13 0.015 2.4e+02 2.7 7.3 1 11 768 778 768 779 0.93

9 13 0.058 9.2e+02 0.8 0.6 4 10 783 789 782 789 0.92

10 13 6.7e-06 0.11 13.4 13.5 3 19 797 813 795 813 0.92

11 13 0.00071 11 6.9 8.5 9 18 859 868 857 869 0.92

12 13 3.8e-08 0.0006 20.6 14.0 1 17 905 923 905 929 0.83

13 13 0.015 2.4e+02 2.7 14.4 1 18 935 957 935 958 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	2	3.2e+04	-4.3	1.6	15	19	489	493	488	493	0.81
2	13	0.048	7.7e+02	1.1	1.4	2	10	521	529	521	529	0.92
3	13	3.6e-05	0.58	11.0	18.1	4	19	537	552	535	552	0.93
4	13	4.7e-08	0.00076	20.3	13.2	1	18	588	605	588	606	0.98
5	13	2.2e-05	0.36	11.7	15.5	1	19	647	665	647	665	0.99
6	13	5.2e-06	0.083	13.7	11.3	1	19	706	728	706	728	0.88
7	13	2	3.2e+04	-4.7	1.7	6	10	758	762	758	762	0.95
8	13	0.015	2.4e+02	2.7	7.3	1	11	768	778	768	779	0.93
9	13	0.058	9.2e+02	0.8	0.6	4	10	783	789	782	789	0.92
10	13	6.7e-06	0.11	13.4	13.5	3	19	797	813	795	813	0.92
11	13	0.00071	11	6.9	8.5	9	18	859	868	857	869	0.92
12	13	3.8e-08	0.0006	20.6	14.0	1	17	905	923	905	929	0.83
13	13	0.015	2.4e+02	2.7	14.4	1	18	935	957	935	958	0.74

Sequence Information

Coding Sequence: ATGTCTCAGTGGAATAATTCTTACAATTACAACAATCAATATCAGGCGCCTAATAATTGGAATGGTGATTACAATAATCAATATGTAAATCAAGCCTACTATCCTAATCCGAACAGACAATATGACCCTAGCAATCAATATGTAAGTTTTGATGAGTTTTTGTCTCAAATGCACATTTCAAATGTTCCTCAAACAAATCCTGCAAACTACAATAATATGCAATATCAGAATTATCCCAACactcaatataataatgtacctaaTTATCAAAATGGATCTACAAGCCATAATTCTCAAccagaatataatatgtatagatctGACACTGCCAGTTATTCTAATAATGGAGAATCTTATCAACAAAACATGCAAAATCAGTATAACCCAGTGACATCAGACCAGAATAATTACACAAATGAAATGGTTTTTAAATCAAAGTTAACACCAACAGCTACTGAATTTGTTCCTAAAAACTCAAAGGAAAAACCAGTTAGTAATTCTAACAGTGAATTAGCTCAAGAACCAAGCTTATCAAATACAGTGGTAACTGAATCATCTAGTAATTACTCTAAGCCATCTACTTCAACTAATTGGAGAGAAAGACCTCAAAGTTCTCATCAGGGCAACAGTTCTGCAGAGACTAACTCATTCCACAAAACCTCTAAAAATCATGATACTAATAATAggaatatgaaatatgaatcaAGATATCGTAATCAAGAAAATCAGAATAGTCAAACTGAATCTATTGGTAACAATTCAAAAAACAAAGACTCTACAAGCCGTCCCAATGAACTTAATTCTCGTAATAGAAAATCTAAAAACCGATTTCCTGAAAATAATCATGATGCAAATTATCGGAACCAAGATCATCAAGAGTTCACTAACAACCATAGATCAAATCGAAATAATGATGTTGATACATATAACCAAGATAGTAGAAGTTATCAAGATGATTCAAGTTTTGCACATGATACTAATAACTATGAAGGGGGCCAATCTAAACATTTAAAGGCTAAAAATAAAGAGTCTGATGTAGGGCGCACTTTTTACAATAGCGCAATGCCTAAGGAAAGTCAAGATGTAAGAAACGGAAGAGAGGGGTCTGGAAAAAATCGTAAATGGGCTGGTAGTCAAAGGTTAAGAGCTGCAGAACGCAATTATGTTGAAGACGAGCAGTATGCTAGTTCGTATGTGGTACATAGAGAGGAAAAAAAGGATAATGTACCAAGCCCAATGAAAGCAAGGAATAAATCAATTGTTAATACAGGAGCAAACATAGAAATGACACAAAGAGAACGTCTCAGCGAGCAGTTAGATAAAGGAACACTCGAATGCCTGGTTTGCTGTGAAAGGGTAAAGCAGATAGACCCAGTGTGGTACTGTGGCAATTGCTACCATGTATTCCATCTTCGCTGCATTCGGAAATGGGCTATGAGCAGTATGGTCGAAAGTAAATGGCGGTGTCCAGCCTGTCAGAACACAAATCAGGATATTCCAACCGAATACAGATGTATGTGCGGGGCGGTGCGCAATCCAGAGTACCAACGAGGATCCAGTGGTGCCCACACTTGCGGCAAAGCTTGTAAAAGACCAAGAAACTGTCCTCATCCTTGCACATTGCTTTGTCACCCTGGCCCTTGTCCACCATGTCAAGCTACAATTAGCAAGCAATGTGGGTGCGGCGTCGAGACCCGCTCGGTGCTCTGCAGCAGCAAGCTGCCCCAAGTGTGCGGACGACAGTGCAGCCGCCAGCTCGAATGTGGCGTGCATTCCTGCACTAAGGACTGTCATGAAGGACCCTGCGACCCTTGCGCGGAGACTGTTACTCAAATCTGCCACTGCCCCGCCGCGTCAGCCCGCACCGTGGCGTGCACGGCCGGCACGGGCGGCACGCGCACGTGGGCGTGCGGCGCGGCGTGCGGGCGCGTGCTGGCGTGCGGCGCGCACGTGTGCCGCGCGCCCTGCCACGCGCCGCCCTGCCCGCCCTGCCCGCTGCTGCCCGACAACGTGCCTACCTGTCCTTGTGGGAACACCAGAATCCTTAAGGACCAACGTAAATCTTGTACGGACCCAATACCATTGTGTGGCAACATCTGCGCCAAGCCTCTACCCTGTGGGCCCTCGGGAGATAAACATTTCTGTAAAGAAAGCTGTCATGAAGGTAATTGTCGAGTGTGCCCCGACACTACGCTGCTGCAGTGCCGCTGCGGTCACTCTAGCCGCGAAGTGCCGTGTGCAGACCTGCCGCAGATGTACAATAATGTGCTGTGTCAGAGGAAGTGTAACAAGAAGCTGTCGTGCGGGCGCCACCGCTGCCGCACGGCGTGCTGCGCGGCGACGTCGCACCGCTGCGCCGTGGTGTGCGCGCGCTCGCTGCCCTGCCAGCTGCACCGCTGCGAGGACTTCTGCCACACCGGCCACTGCGCGCCCTGCCCGCGCGTCAGCTTCGAGGAGCTGAGGTGCGAGTGCGGGCGCGAGGTGGTGCTGCCGCCGGTGCGCTGCGGCACCAAGCCGCCGCCGTGCGCCGCGCcgtgccgccgccgccgcgcctgCGCGCACCCGCCGCACCACGCCTGCCACGCCGGCGCCTGCCCGCCCTGCGTCGTGCTCACCACCAAGCGCTGCTACGGCGGACATGAGGAACGTAAAACGATCCCGTGCTCGCAAGAGGAGTTCTCCTGCGGGCTGCCGTGCGGCAAGCCGCTGCCGTGTGGGAAGCACACCTGCATCAAGACCTGCCATAAGGGCCCTTGTGATACTGGCAAATGCACGCAGCCGTGCACGGAGAAGCGCGCGCAGTGCGGGCACCCGTGCGCGGCGCCGTGCcacgcgggcggcggcggcgcctgccccgcgcccgcgccctgCCGCCGCGCCGTGCTCGCCACCTGCCCCTGCGGCCGCCGCTCCGCCGAGCGCGCCTGCTGCGACAACGCCAGGGACTATGCTAAaATGATGAGTACATTAGCGGCTTCAAAGATGCAAGAAGGTGGTACTGTCGACTTATCCGACCCTCAGCGTCCTGGCAACATGTTGAAAACGTTAGAGTGCGATGAAGAATGCCTAGTAGAGGCGCGGTCGCGCCGCCTGGCGCTAGCGCTGCAGATCCGCAACCCGGACGTGTCCGCCAAGCTGGCGCCGCGCTACAGCGAGCACGTGCGCACCACCGCGGCGCGCGAGCCCGCCTTCGCGCAGCACGTGCACGACCGCCTCACCGACCTCGTGCAACTCGCTAAGAAGTCGAAACAAAAGACTCGATCGCATTCCTTCCCATCAATGAACAGGCAGAAGAGGCAGTTCATACACGAGATGTGCGAGCACTTCGGCTGCGAGAGTGTGGCGTACGACGCAGAGCCCAATAGAAACGTTGTAGCTACTGCTGATAAGGAAAAGTCGTGGCTACCGGCGATGAGCGTGCTGGAGGTTCTGGCGCGCGAGGCGGGCAAGCGCCGCGTGCCGGGGCCCGTgctgcgcgcgccgccgcccgccgccgccgcctcgcACAAATCATCTGGAGGCTGGGCGACTTTGACGTCGAGTAACGCGTGGGCGGCGCGCAACGCTCGCAAGGAGGAGCCTAAGATCGACTACTTCGACAACCCGCCCGATAACTGA
Protein Sequence: MSQWNNSYNYNNQYQAPNNWNGDYNNQYVNQAYYPNPNRQYDPSNQYVSFDEFLSQMHISNVPQTNPANYNNMQYQNYPNTQYNNVPNYQNGSTSHNSQPEYNMYRSDTASYSNNGESYQQNMQNQYNPVTSDQNNYTNEMVFKSKLTPTATEFVPKNSKEKPVSNSNSELAQEPSLSNTVVTESSSNYSKPSTSTNWRERPQSSHQGNSSAETNSFHKTSKNHDTNNRNMKYESRYRNQENQNSQTESIGNNSKNKDSTSRPNELNSRNRKSKNRFPENNHDANYRNQDHQEFTNNHRSNRNNDVDTYNQDSRSYQDDSSFAHDTNNYEGGQSKHLKAKNKESDVGRTFYNSAMPKESQDVRNGREGSGKNRKWAGSQRLRAAERNYVEDEQYASSYVVHREEKKDNVPSPMKARNKSIVNTGANIEMTQRERLSEQLDKGTLECLVCCERVKQIDPVWYCGNCYHVFHLRCIRKWAMSSMVESKWRCPACQNTNQDIPTEYRCMCGAVRNPEYQRGSSGAHTCGKACKRPRNCPHPCTLLCHPGPCPPCQATISKQCGCGVETRSVLCSSKLPQVCGRQCSRQLECGVHSCTKDCHEGPCDPCAETVTQICHCPAASARTVACTAGTGGTRTWACGAACGRVLACGAHVCRAPCHAPPCPPCPLLPDNVPTCPCGNTRILKDQRKSCTDPIPLCGNICAKPLPCGPSGDKHFCKESCHEGNCRVCPDTTLLQCRCGHSSREVPCADLPQMYNNVLCQRKCNKKLSCGRHRCRTACCAATSHRCAVVCARSLPCQLHRCEDFCHTGHCAPCPRVSFEELRCECGREVVLPPVRCGTKPPPCAAPCRRRRACAHPPHHACHAGACPPCVVLTTKRCYGGHEERKTIPCSQEEFSCGLPCGKPLPCGKHTCIKTCHKGPCDTGKCTQPCTEKRAQCGHPCAAPCHAGGGGACPAPAPCRRAVLATCPCGRRSAERACCDNARDYAKMMSTLAASKMQEGGTVDLSDPQRPGNMLKTLECDEECLVEARSRRLALALQIRNPDVSAKLAPRYSEHVRTTAAREPAFAQHVHDRLTDLVQLAKKSKQKTRSHSFPSMNRQKRQFIHEMCEHFGCESVAYDAEPNRNVVATADKEKSWLPAMSVLEVLAREAGKRRVPGPVLRAPPPAAAASHKSSGGWATLTSSNAWAARNARKEEPKIDYFDNPPDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00775748; iTF_00775749; iTF_00457695; iTF_00774947; iTF_00458548; iTF_00778484; iTF_00781499; iTF_00777693; iTF_00248613; iTF_00160354; iTF_00247724; iTF_00621701; iTF_01182349; iTF_00723655; iTF_00214101;
90% Identity: iTF_00723655; iTF_00247724; iTF_00248613; iTF_00160354; iTF_00214101;
80% Identity: -