Basic Information

Insect: Hipparchia semele
Gene Symbol: stc_1
Assembly: GCA_933228835.1
Location: CAKOGE010000170.1:2585142-2603506[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 2.3e+04 -4.4 1.6 15 19 574 578 573 578 0.81

2 14 0.057 6.5e+02 0.8 1.5 2 10 606 614 606 614 0.92

3 14 4e-05 0.45 10.9 18.1 4 19 622 637 620 637 0.93

4 14 6.6e-08 0.00075 19.8 10.8 1 19 673 691 673 691 0.97

5 14 1 1.2e+04 -3.2 0.3 8 11 696 699 695 699 0.86

6 14 0.0011 13 6.3 13.8 1 19 732 750 732 750 0.98

7 14 5.8e-06 0.066 13.6 10.9 1 19 791 813 791 813 0.88

8 14 2 2.3e+04 -4.9 1.7 6 10 843 847 843 847 0.95

9 14 0.0025 29 5.1 7.3 1 12 853 864 853 864 0.94

10 14 0.046 5.2e+02 1.1 0.3 4 10 868 874 867 875 0.93

11 14 4e-06 0.046 14.1 14.0 3 19 882 898 880 898 0.92

12 14 0.078 8.9e+02 0.4 16.9 1 18 937 953 937 954 0.81

13 14 9.8e-08 0.0011 19.2 12.4 1 17 990 1008 990 1014 0.85

14 14 0.02 2.2e+02 2.3 11.9 1 16 1020 1037 1020 1043 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	2.3e+04	-4.4	1.6	15	19	574	578	573	578	0.81
2	14	0.057	6.5e+02	0.8	1.5	2	10	606	614	606	614	0.92
3	14	4e-05	0.45	10.9	18.1	4	19	622	637	620	637	0.93
4	14	6.6e-08	0.00075	19.8	10.8	1	19	673	691	673	691	0.97
5	14	1	1.2e+04	-3.2	0.3	8	11	696	699	695	699	0.86
6	14	0.0011	13	6.3	13.8	1	19	732	750	732	750	0.98
7	14	5.8e-06	0.066	13.6	10.9	1	19	791	813	791	813	0.88
8	14	2	2.3e+04	-4.9	1.7	6	10	843	847	843	847	0.95
9	14	0.0025	29	5.1	7.3	1	12	853	864	853	864	0.94
10	14	0.046	5.2e+02	1.1	0.3	4	10	868	874	867	875	0.93
11	14	4e-06	0.046	14.1	14.0	3	19	882	898	880	898	0.92
12	14	0.078	8.9e+02	0.4	16.9	1	18	937	953	937	954	0.81
13	14	9.8e-08	0.0011	19.2	12.4	1	17	990	1008	990	1014	0.85
14	14	0.02	2.2e+02	2.3	11.9	1	16	1020	1037	1020	1043	0.77

Sequence Information

Coding Sequence: ATGTCTCAGTGGAACAACTCCTACAATTATAACAACCAGTATCAAGCCCCAAATACATGGAATGGGGACTACAACACACAGTATTTAAATCAATCCCAGTACTATCCAACCCCCAATCCCCACCAACCAAACCCCAATCGCCAGTATGTTAGTTTTGATGAGTTTTTATCACAAATGCAAATGTCCAATGTTCCTGCAACGAATACTGCGAGCTACAATAACCTACAATATCAAAATTACCCAAATGCTCAATATAACAATGTACCTAGTTATCAAAATGGGTCAACACCCCAAAACTCTCAGGCTGACTATGCTTATGGAACAAGCACTGCCAATTTTAGTAATAATGAAGAGGTTTATCAACCTAATGTACATAATCAATATAATCAAGTAACAGATCAAAATAATTACTCTAATGAAATGGTTTCTAAGTCTAAACTCACTCCAACTGCTACTGAATTTGTGCCTAAGAGTTCTAACACTGGTAGTTCTCATAGTGAACCAACCTTAGAACCAAATTTATCAAATTTAGATTTAAACGGCTCATCAAATAGTATTTCTAAGCCATCTACCTCAACCAATTGGAGGGAAAGACCAAGTAGCTCACAGCAAAGCAGTTCATCTCATTTAGAGCCTTATAGTCAAAAACATAAAAACCAGGATACAAACCGCACCAACAAATATGAGTCAAAAAGTAGAAATCAGGAACCAGTTAGCCGTAACGATTCCAGTAACCAGAACTCTAGAGATAACTATCAGCGAGAACCCTCAGCCCGTACCAACGATAGCAACAGTCGTAATCGTAAATCAAAAAACCATCCATCCGACAATCAAGACTCTAGTTATCGTAGACAAGATACTCAAGAATACAACAGCAGATCAAATAGAAGCAGTGATAGTCAGAACCAAGAACAAAGAAATCAAAATCAAGATTCTGGTTACCGCAAACAAGACAGTAATCAAGAATATAATAGATCAAATCGAAACAGTGATTATAATACCGAAAACCAAGATCAAAAAGAGTCCAGTTACCGTAGGCAAGATAATCAAGAATACAACAGTAGACCAAATAGAAACAATGACCGTAATTCTCAGAACCAAGATTCAAAAGAGAACAGTTACCACAGACAAGACAATCAAGATTACAACAATAGATCCAATAGAAACTACAATGCCCAAAACCATCAGGATCAGAATCAATACAATGATCAAAATGATACAGATTTTGGTGACTATGAAGGGGGCCAATCAAAAAACAACTCTAAGGCTAAGAATAAAGAGTCTGATGTATATCGCACTTTTTACAACAGTTCAATGCCTAAAGATAGTCAGGATGTCAGGAATGGTAAGGGTGAAGGTTCTGGAAGAAATCGCAAGTGGGCTGGCAGTCAAAGACTCAGGGCCCCAGAACGTACAGAAGATGAACAGTATGCAAACTCATATATGCCATATAGAGAAGAGAAACCAAAGGCTAACGTACCAAGTCCTATTAGAGGGAAAACTAGAGCAGTAGGAAATCATGTAGGAGCAAATACAGACATGACTCAAAGAGAGCGCCTCAGTGAGCAGTTAGACAAGGGAACGTTGGAATGTCTGGTGTGCTGCGAGCGAGTCAAGCAGACTGACCCAGTGTGGTACTGCAGCAACTGCCACCATGTGCTGCATCTGCGCTGCATACGCAAGTGGGCTATGAGCAGTATGGTCGAAAGCAAATGGCGTTGTCCAGCTTGCCAAAACACAAACCAGGATATACCGACAGAGTACCGATGTATGTGCGGCGCAGTTCGCAATCCCGAATTTCAGAGGGGTTCGAATGGCGCCCACACTTGCGGCAGGTCGTGTAAGAGGGCGAGGAATTGTCCGCATCCCTGCACCCTACTTTGCCACCCCGGACCTTGTCCACCCTGCCAGGCTACCATTAGCAAGCAATGTGGTTGCGGAGCAGAAACTCGTTCAGTTATGTGCAGCAGCAAACTACCCCAAGTATGTGGGCGTGAATGTAAACGAAAACTCGAGTGCGGAGTTCATTTTTGTGCTAAGGACTGTCACGAAGGACCCTGCGATCCTTGCACTGAGACAGTTACACAAGTATGCCACTGCCCGGCCGCCAAGTCTCGCTCAGTGCCGTGTACGGCGGAGACAGGGTCGTGCGACACCTGGTCGTGCGATTCCTCCTGCGGACGCGTGTTGTCGTGCGGCGCGCACGTGTGCCGCTCGCCCTGCCACCCGCCCCCCTGCGCCCTGTGCCCCTTGCGACCGGAAAACGTGCCCGCCTGCCCCTGCGGACACACTAGAATTAGCAAAGACCAGCGTAAATCCTGCACGGACCCAATACCGCTGTGCGGCAATATCTGCGCTAAACCCCTCTCGTGTGGTCCGGTCGGGGATAAGCATTTCTGTAAGGAAAGCTGCCATGAAGGAGAATGTCGCGTGTGCCCCGACACAACGTTGCTTCAGTGTCGCTGCGGGCACTCCAGCCGAGAGGTGCCTTGCGCTGATCTCCCCGAAATGAACAATAATGTATTGTGCCAGAGGAAATGTAATAAGAAATTGTCATGCGGTCGTCATAGATGTAGGACGGTGTGCTGCGACGCTCAGTCGCACCGATGCGCGGTGGTGTGCGGACGCACGCTGTCGTGTCAACTGCACCGCTGCGAAGAGTTCTGTCATACGGGGCACTGTGCGCCTTGTCCTAGAGTCAGTTTCGACGAACTTCACTGTGAATGTGGCACAGAGGTCATTATGCCCCCCGTACGCTGCGGAACCAAGCCGCCCCCATGCAACTCCCCCTGTAGAAGGGAGAGACCCTGTGGTCACCCCCCACACCACAGCTGCCACTCCGGGGCCTGTCCCCCTTGTGTGGTGCTCACCACCAAGAGCTGCTATGGACGTCATGAGGAGCGCAAAACCATTCCATGTTCGCAAGAGGAGTTCTCGTGCGGGCTGCCGTGCGGCAAGCCGCTGCCCTGCGGCAAGCACACTTGCATCAAGACCTGCCACAAGGGCTCCTGCGACGCCGGCAAATGCACCCAACCGTGTGCGGAAAAGCGGCCGAGTTGCGGCCACCCGTGCTCCGCCGTGTGCCACTCGAGCGGGGGCGGCACGTGCCCCAGTGGCGCGGCGTGCAAGCGTCCCGTGTGCGCCACGTGCCCGTGCGGCCGACGCAAGGCCGAGCGCGCCTGCTGCGACAACGCGCGCGACTATGCCAAGTTGATGAGTGCGTTAGCCGCGTCTAAGATGCAAGAAGGCGGTACATTGGATTTGTCAGATGTACAGCGACCAGTTTCGATGCTTAAAACGTTGGAATGCGACGAGGAGTGCTACGTGGAGGCCCGCAGCCGCCGGCTGGCGCTGGCGCTGCAGCTGCGCAACCCCGACGTGTCCGCCAAGCTGGCGCCGCGCTACAGCGACCACCTGCGCCAGACCGCCGCGCGGGAGCCGTCCTTCGCGCAGCAGGTGCACGACCGCCTCACCGAGCTGGTGCAGCTCGCTAAGAAGTCTAAACAGAAGACGAGAGCGCACTCGTTCCCGTCGATGAACCGCCAGAAGCGGCAGTTCATCCACGAGCTGTGCGAGCACTTCGGCTGCGAGAGCGTGGCCTACGACGCCGAGCCCAACCGGAACGTGGTGGCCACGGCGGACAAGGAGAAGTCGTGGCTGCCGGCGATGAGCGTGCTGGAGGTGCTGGCGCGCGAGGCGGGCAAGCGCAAGGTGCCGGGGCCCGTGctgcgcgcgccgccgccccacgcgcccgccgccgcgcccgccacgcCCCTCGCCGCGTCCGCTTCCAAATCGTCCGGGGGGTGGGCAACGCTCACGTCGACCAACGCGTGGGCGGCGCGCAGCCAGCCCCGCGCGCAGCCCAAGCAGGAGCACAAGCAGGAAGCGAAGATAGACTACTTCGACAACCCGCCCGACAACTGA
Protein Sequence: MSQWNNSYNYNNQYQAPNTWNGDYNTQYLNQSQYYPTPNPHQPNPNRQYVSFDEFLSQMQMSNVPATNTASYNNLQYQNYPNAQYNNVPSYQNGSTPQNSQADYAYGTSTANFSNNEEVYQPNVHNQYNQVTDQNNYSNEMVSKSKLTPTATEFVPKSSNTGSSHSEPTLEPNLSNLDLNGSSNSISKPSTSTNWRERPSSSQQSSSSHLEPYSQKHKNQDTNRTNKYESKSRNQEPVSRNDSSNQNSRDNYQREPSARTNDSNSRNRKSKNHPSDNQDSSYRRQDTQEYNSRSNRSSDSQNQEQRNQNQDSGYRKQDSNQEYNRSNRNSDYNTENQDQKESSYRRQDNQEYNSRPNRNNDRNSQNQDSKENSYHRQDNQDYNNRSNRNYNAQNHQDQNQYNDQNDTDFGDYEGGQSKNNSKAKNKESDVYRTFYNSSMPKDSQDVRNGKGEGSGRNRKWAGSQRLRAPERTEDEQYANSYMPYREEKPKANVPSPIRGKTRAVGNHVGANTDMTQRERLSEQLDKGTLECLVCCERVKQTDPVWYCSNCHHVLHLRCIRKWAMSSMVESKWRCPACQNTNQDIPTEYRCMCGAVRNPEFQRGSNGAHTCGRSCKRARNCPHPCTLLCHPGPCPPCQATISKQCGCGAETRSVMCSSKLPQVCGRECKRKLECGVHFCAKDCHEGPCDPCTETVTQVCHCPAAKSRSVPCTAETGSCDTWSCDSSCGRVLSCGAHVCRSPCHPPPCALCPLRPENVPACPCGHTRISKDQRKSCTDPIPLCGNICAKPLSCGPVGDKHFCKESCHEGECRVCPDTTLLQCRCGHSSREVPCADLPEMNNNVLCQRKCNKKLSCGRHRCRTVCCDAQSHRCAVVCGRTLSCQLHRCEEFCHTGHCAPCPRVSFDELHCECGTEVIMPPVRCGTKPPPCNSPCRRERPCGHPPHHSCHSGACPPCVVLTTKSCYGRHEERKTIPCSQEEFSCGLPCGKPLPCGKHTCIKTCHKGSCDAGKCTQPCAEKRPSCGHPCSAVCHSSGGGTCPSGAACKRPVCATCPCGRRKAERACCDNARDYAKLMSALAASKMQEGGTLDLSDVQRPVSMLKTLECDEECYVEARSRRLALALQLRNPDVSAKLAPRYSDHLRQTAAREPSFAQQVHDRLTELVQLAKKSKQKTRAHSFPSMNRQKRQFIHELCEHFGCESVAYDAEPNRNVVATADKEKSWLPAMSVLEVLAREAGKRKVPGPVLRAPPPHAPAAAPATPLAASASKSSGGWATLTSTNAWAARSQPRAQPKQEHKQEAKIDYFDNPPDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01151744;
90% Identity: -
80% Identity: -