Basic Information

Insect: Agrotis ipsilon
Gene Symbol: stc_1
Assembly: GCA_028554685.1
Location: CM052962.1:4033800-4046060[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 2 3.6e+04 -4.4 1.6 15 19 609 613 608 613 0.81

2 14 0.043 7.8e+02 1.2 1.2 2 10 641 649 641 649 0.93

3 14 4.1e-05 0.73 10.9 18.1 4 19 657 672 655 672 0.93

4 14 1.6e-07 0.0028 18.6 10.4 1 18 708 725 708 726 0.98

5 14 0.0011 21 6.2 16.0 1 19 767 785 767 785 0.98

6 14 2e-05 0.35 11.9 12.7 1 19 826 848 826 848 0.87

7 14 2 3.6e+04 -5.4 2.2 6 10 878 882 878 882 0.94

8 14 0.00066 12 7.0 5.3 1 11 888 898 888 901 0.93

9 14 0.047 8.4e+02 1.1 0.3 4 10 903 909 902 910 0.93

10 14 6.7e-06 0.12 13.4 15.0 3 19 917 933 915 933 0.92

11 14 2 3.6e+04 -5.6 3.2 14 18 965 972 962 973 0.66

12 14 0.00043 7.7 7.6 9.6 10 18 980 988 977 989 0.92

13 14 4.5e-08 0.0008 20.3 14.0 1 17 1025 1043 1025 1049 0.84

14 14 0.0017 31 5.7 9.9 1 18 1055 1078 1055 1079 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	2	3.6e+04	-4.4	1.6	15	19	609	613	608	613	0.81
2	14	0.043	7.8e+02	1.2	1.2	2	10	641	649	641	649	0.93
3	14	4.1e-05	0.73	10.9	18.1	4	19	657	672	655	672	0.93
4	14	1.6e-07	0.0028	18.6	10.4	1	18	708	725	708	726	0.98
5	14	0.0011	21	6.2	16.0	1	19	767	785	767	785	0.98
6	14	2e-05	0.35	11.9	12.7	1	19	826	848	826	848	0.87
7	14	2	3.6e+04	-5.4	2.2	6	10	878	882	878	882	0.94
8	14	0.00066	12	7.0	5.3	1	11	888	898	888	901	0.93
9	14	0.047	8.4e+02	1.1	0.3	4	10	903	909	902	910	0.93
10	14	6.7e-06	0.12	13.4	15.0	3	19	917	933	915	933	0.92
11	14	2	3.6e+04	-5.6	3.2	14	18	965	972	962	973	0.66
12	14	0.00043	7.7	7.6	9.6	10	18	980	988	977	989	0.92
13	14	4.5e-08	0.0008	20.3	14.0	1	17	1025	1043	1025	1049	0.84
14	14	0.0017	31	5.7	9.9	1	18	1055	1078	1055	1079	0.83

Sequence Information

Coding Sequence: ATGTCTCAGTGGAACAACACATACGCTTACAACAACCAGTACCAAACTTGGAACAGTGACCCAAATGTCCAATATGTCAACCAAGCCTACTACCCCAACAGACCAGAGCAACCCAACCAGTATGTGAGCTTTAATGAATTTCTTTCTCAAATGCAAACCAGTGGTGCGCCCAGTGCTAACAATTACAGCAATGTGCAATATGAAAACTACCCTGCAAGGCAATATAACTACCAGAATGTACCCTCCAGTGCTCAAAACCCTCAGTTAGACAGTTATGGTTATGCAGCAACCTCAGCCAATGTGACCAGTGGCACTGAAGCATACCCAGCTAGTGTTCAAAATCAATACAACCCTGTGGCACCAACTACTAATGTTTATACAAATGCAATGATACTCAAATCTAATCTCACTCCAACAGCAACCGAATTTGTGCCAAAAGGTGCTATGGTGACACCCTCCACTAGCACTCAGAACATTCCTGAATCTAGTACTGTACATGATGATAGTGAATCTAGAAATAATTATAGCAATGTAAATGAATCTAGAAACAGTTACTCTAATATGAATGATTCACGAAATAATATCCCTAGTGCAAGTGAGTCACGAAATGCTAGTGGTAGTTCATCAGACACAAACTGGAGAGAAAGATCACAGAGCTCACAACAAAATACTGAAACAAGCCAAAAAACTGAATCATACCAACGTCACCAGGAACACCCTAGGAAACAAGAATCAAATGGTCGTTATCGCAATCATGAATCTAATGGGCGACACCAAGATTCAAACAACCGCAATCAAGAATCAAACAACCGTCATCAAGAATCAAACAACCAAAATCAAGAGCAAGACGGCAGACAGTTTGAAATTAACAACCGTAACTATGATTCTAGCAATAAAAGAGGCCAAGGAAAAGGAAATTATAAGTCAAAGAATAAAGATGATGCTCGCACCTTCTATAACAGTGCTATTAGTAAAGACAGTCAAGATGTAAGGAATGGAAGAGGAGAAACTTCAGGCCGTGGCAAGAATTGGGTTGGAACTCCAAGACTTAGAGCAATGGAACGCAATAGCACTGAAGATGAACAATATGCCAATACTTATTTACAAGGCAGAGAAGAGAGGAGCGAGACAGACAGCAAAGATCGAGAAAGTGAACACCGAGAGAGGGACAGAGATAGAGAGAGAGACACTCGTGAGAAACATAGAGATGGCAGAGATACCCATGAAAGGGAAAGAGATTACCGAGACATCCGTGAGTCTGGTAGAGACAACCGGGATATTCGGGAGAGAGACAGAGGTAACCGAGACATCCGTGAAAAGGATAGAGACAGTAGAGATTTCCGTGAAAGGGGTAGAGACTATAGAGACAGGGATAGGGGCAATAGAGACATACGAGAAAGAGATAGAGATTATCGTGATATACGCGAGAGGGACAGAGACAACAGAGATTTTCATGAGGTGGATAGAGATTACCGAGAGAACCGTGACATGGATAGAGATAATCGTGATTACCGCGAAAGAGACAGAGGTAACCGAGATATTCGCGAAAAGGACAGAGACAGGGAGAGAGCAATGAAGTCTGAGAATGTTCCCAGTCCTGTacgaaacaaaactaaatatgGCAATGATCAAGTGAACAAAGAGATGACCCAACGTGAGCGTCTAACTGAACAGCTGGACAAGGGAACATTAGAATGCCTCGTATGCTGTGACCGAGTCAAACAATTTGACCAGGTGTGGTCATGCTGCAACTGCTACCATGTCCTGCATCTGAGGTGTATCCGAAAGTGGGCTTTGAGCAGTATGGTTGAGGGCAAATGGCGGTGCCCAGCCTGCCAGAACACGAACGAGGCCATCCCCACGGAGTACCGCTGCATGTGCGGCGCCGTCCGCGCCCCCGAGTACACGCGCGGCGCCGCGGGCGCGCACACGTGCGGCCGCGCCTGCCGCCGCACGCGCGCCTGCCCGCACCCCTGCACGCTGCTGTGCCACCCCGGGCCCTGCCCGCCCTGCCAGGCAACTGTTGTCAAACATTGCGGTTGCGGCGCAGAAACCCGCTCAGTGCTCTGCAGCAGCAAGTTGCCCCAAGTGTGCGGTCGAGTCTGTGGACGTACCTTACTGTGTGGTGTTCATAACTGTGCCAAGGACTGCCACGAAGGACCCTGTGACATCTGTGCTGAGACTGTCGAACAAGTATGCTACTGCCCCGCCGCCAAGTCCCGCTCGGTGGCATGCACGCTGGAGACGGGCGCGTGCACGAGCTGGTCGTGCGGCGACACGTGCGGGCGCGTGCTGGCGTGCGGCGCGCACGTGTGTCGCGCTCACTGCCACGCGCCGCCCTGCCAGCCCTGCCAACAGCTGCCGCAGTATGTCCACACCTGTCCTTGTGGGAACACGCAATTGGCGAAAGATTCTCGCAAAGCGTGCACGGACCCGATACCGTTGTGCGGCAACATCTGTGCCAAACCGCTGCAGTGCGGCCCCGCAGGAGATAAACACTTCTGCAAACTTAATTGTCATGAAGGACCTTGTCCCGAATGCCCCGACAAGACAGTGCTGCAGTGTCGCTGCGGTCACTCCAGCCGCGAGGTGCCGTGTGCCGACCTGCCTCAGATGTACAACAATGTGCTGTGCCAAAAGAAGTGCAACAAGAAACTATCGTGTGGTCGTCACCGCTGCCGCACGGTGTGCTGCGCGGCCCCGTCTCACCGCTGCGCCGTGGTGTGCGGGCGCACGCTGTCGTGTCAGACGCACCGCTGCGAGGAGTTCTGTCACACCGGACACTGCGCGCCCTGCCCGCGAGTCAGTTTCGACGAGCTGACGTGTGAGTGCGGTGCGGAGGTGCTCCTCCCGCCGGTCCGCTGCGGCGCGCGCCCCCCCGCCTGCGCGGCCCCCTGCCCCCGCGCGCGCCCCTGCCGCCACCCCCCGCACCACTCGTGCCACTCCGGGGACTGTCCTCCCTGCGTCGTACTTACCACCAAGCGCTGCCATGGGAACCACGAGgaACGAAAAACAATACCATGTTCTCAAGATGAGTTCTCCTGCGGCCTTCCGTGCGGGAAGCCTCTACCTTGTGGCAAACATACCTGCATCAAGACCTGCCACAAGGGACCCTGTGACACTGGCAAATGCACCCAGCCATGCAACGAGAAGCGTCCGTCGTGCGGTCACCCGTGTGCGGCCCCGTGTCACTCGGCGGCGGAGGCCGGGGCCTGCCCCAGCAGCGCGCCCTGCCGCCGCCCCGTGCGGGCCACCTGCCCCTGTGGCAGGAGGCACGCGGACAGACCGTGCTGCGATAACGCTAGGGATTATGCCAAGATGATGAGCGCTCTAGCCGCTACTAAGATGTCAGAAGGTGGTTCAGTAGACCTGTCAGATGTACAGCGCCCCGGCAGTATGCTGAAAACGCTCGAATGCGACGACGAATGCCGCGTAGAAGCCCGCACCCGTCAGCTGGCCCTGGCCCTGCAGATCCGCAACCCTGACGTGTCGGCCAAGCTGGCCCCGCGCTACAGCGAGCACGTGCGAGCCACGGCCGCGCGCGAGCCTGCCTTCGCGCACCAGATACACGACAAGCTCACCGAGCTCGTGCAGCTCGCTAAGAAGTCCAAGCAGAAGACTCGAGCGCACTCTTTCCCGTCGATGAACTGGCAGAAGCGTCAGTTCATACACGAGCTGTGCGAGCACTTCGGCTGTGAGAGCGTGGCCTACGATGCTGAACCTAATAGAAACGTTGTGGCCACTGCTGATCGAGAGAAGTCGTGGTTGCCAGCCATGAGTGTATTGGAGGTGCTGGCCCGCGAGGCCGGCAAGCGACGCGTGCCCGGGCCTGTGCTGCGTGCGCCGCCTGGAGGAAGCGTCCCACTGCAGGGACAGGGAGGGAATGCCAAATCAGGTTGGGCAACCCTCACTTCAACGAACGCCTGGGCCGCTCGCAGCCAACCGAAGCCACAGCAGTCCCAACAACCGCAGCAACCAGCTGCTGAGAAAATCGACTATTTCGACAACCCGCCCGACAACTAG
Protein Sequence: MSQWNNTYAYNNQYQTWNSDPNVQYVNQAYYPNRPEQPNQYVSFNEFLSQMQTSGAPSANNYSNVQYENYPARQYNYQNVPSSAQNPQLDSYGYAATSANVTSGTEAYPASVQNQYNPVAPTTNVYTNAMILKSNLTPTATEFVPKGAMVTPSTSTQNIPESSTVHDDSESRNNYSNVNESRNSYSNMNDSRNNIPSASESRNASGSSSDTNWRERSQSSQQNTETSQKTESYQRHQEHPRKQESNGRYRNHESNGRHQDSNNRNQESNNRHQESNNQNQEQDGRQFEINNRNYDSSNKRGQGKGNYKSKNKDDARTFYNSAISKDSQDVRNGRGETSGRGKNWVGTPRLRAMERNSTEDEQYANTYLQGREERSETDSKDRESEHRERDRDRERDTREKHRDGRDTHERERDYRDIRESGRDNRDIRERDRGNRDIREKDRDSRDFRERGRDYRDRDRGNRDIRERDRDYRDIRERDRDNRDFHEVDRDYRENRDMDRDNRDYRERDRGNRDIREKDRDRERAMKSENVPSPVRNKTKYGNDQVNKEMTQRERLTEQLDKGTLECLVCCDRVKQFDQVWSCCNCYHVLHLRCIRKWALSSMVEGKWRCPACQNTNEAIPTEYRCMCGAVRAPEYTRGAAGAHTCGRACRRTRACPHPCTLLCHPGPCPPCQATVVKHCGCGAETRSVLCSSKLPQVCGRVCGRTLLCGVHNCAKDCHEGPCDICAETVEQVCYCPAAKSRSVACTLETGACTSWSCGDTCGRVLACGAHVCRAHCHAPPCQPCQQLPQYVHTCPCGNTQLAKDSRKACTDPIPLCGNICAKPLQCGPAGDKHFCKLNCHEGPCPECPDKTVLQCRCGHSSREVPCADLPQMYNNVLCQKKCNKKLSCGRHRCRTVCCAAPSHRCAVVCGRTLSCQTHRCEEFCHTGHCAPCPRVSFDELTCECGAEVLLPPVRCGARPPACAAPCPRARPCRHPPHHSCHSGDCPPCVVLTTKRCHGNHEERKTIPCSQDEFSCGLPCGKPLPCGKHTCIKTCHKGPCDTGKCTQPCNEKRPSCGHPCAAPCHSAAEAGACPSSAPCRRPVRATCPCGRRHADRPCCDNARDYAKMMSALAATKMSEGGSVDLSDVQRPGSMLKTLECDDECRVEARTRQLALALQIRNPDVSAKLAPRYSEHVRATAAREPAFAHQIHDKLTELVQLAKKSKQKTRAHSFPSMNWQKRQFIHELCEHFGCESVAYDAEPNRNVVATADREKSWLPAMSVLEVLAREAGKRRVPGPVLRAPPGGSVPLQGQGGNAKSGWATLTSTNAWAARSQPKPQQSQQPQQPAAEKIDYFDNPPDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01534476;
90% Identity: iTF_00043167;
80% Identity: -