Basic Information

Insect: Papilio machaon
Gene Symbol: stc_1
Assembly: GCA_001298355.1
Location: NW:2690594-2701064[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 2 1.4e+04 -4.3 1.6 15 19 471 475 470 475 0.81

2 16 0.12 8.4e+02 -0.2 0.8 4 10 505 511 503 511 0.91

3 16 0.00016 1.1 9.0 20.3 4 19 519 534 517 534 0.93

4 16 3.3e-08 0.00023 20.8 13.9 1 19 570 588 570 588 0.98

5 16 7.6e-05 0.52 10.0 9.9 1 19 629 647 629 647 0.98

6 16 9.7e-07 0.0066 16.1 13.2 1 19 688 710 688 710 0.88

7 16 2 1.4e+04 -5.3 2.2 6 10 740 744 740 744 0.94

8 16 0.015 1e+02 2.7 7.3 1 11 750 760 750 761 0.93

9 16 0.042 2.9e+02 1.3 0.3 4 10 765 771 764 772 0.93

10 16 3.6e-06 0.025 14.2 14.0 3 19 779 795 777 795 0.92

11 16 2 1.4e+04 -4.4 1.5 6 10 824 828 824 828 0.84

12 16 1.1 7.7e+03 -3.3 1.3 7 11 831 835 831 836 0.84

13 16 0.00048 3.3 7.5 9.4 10 18 842 850 839 851 0.92

14 16 4.3e-08 0.00029 20.4 12.3 1 16 887 902 887 910 0.90

15 16 0.012 80 3.0 10.9 1 18 917 939 917 940 0.80

16 16 0.46 3.2e+03 -2.1 0.2 8 12 956 960 955 960 0.81

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	2	1.4e+04	-4.3	1.6	15	19	471	475	470	475	0.81
2	16	0.12	8.4e+02	-0.2	0.8	4	10	505	511	503	511	0.91
3	16	0.00016	1.1	9.0	20.3	4	19	519	534	517	534	0.93
4	16	3.3e-08	0.00023	20.8	13.9	1	19	570	588	570	588	0.98
5	16	7.6e-05	0.52	10.0	9.9	1	19	629	647	629	647	0.98
6	16	9.7e-07	0.0066	16.1	13.2	1	19	688	710	688	710	0.88
7	16	2	1.4e+04	-5.3	2.2	6	10	740	744	740	744	0.94
8	16	0.015	1e+02	2.7	7.3	1	11	750	760	750	761	0.93
9	16	0.042	2.9e+02	1.3	0.3	4	10	765	771	764	772	0.93
10	16	3.6e-06	0.025	14.2	14.0	3	19	779	795	777	795	0.92
11	16	2	1.4e+04	-4.4	1.5	6	10	824	828	824	828	0.84
12	16	1.1	7.7e+03	-3.3	1.3	7	11	831	835	831	836	0.84
13	16	0.00048	3.3	7.5	9.4	10	18	842	850	839	851	0.92
14	16	4.3e-08	0.00029	20.4	12.3	1	16	887	902	887	910	0.90
15	16	0.012	80	3.0	10.9	1	18	917	939	917	940	0.80
16	16	0.46	3.2e+03	-2.1	0.2	8	12	956	960	955	960	0.81

Sequence Information

Coding Sequence: ATGTCTCAGTGGAATAATTCTTACGGCTATAACAACCAATTCCAAGCGCCGCCTAATTCGTGGAATAGAGATGTAAATGGGCAATATGTAAATCAACCTTACTATGACAACAGACAATATGAGTCAAGCAACCAATATGTAAGTTTTGAtgaatttttaacacaaatgCAGGGTAATGGTGTTCCACAAAATAATGCTTctaattacaataatgtaCAGTACCAAGCATATCCAACTAACCAATACAATTATCAGAATGTACCATCACAAAATCCACAGATGGAATTCAGTTATGGACACCACAACCCTAACACAAGTAGTACTCTGGATACTTATACAGTCAATGTTCAAAATCAATACAATCCATCTGTACCCGAGTTAAGTACTTATTCAAATGAAGTTGTAATGAATTCAAAGTTGACACCGACTGCAACAGAATTTGTGCCAAAGTGTTCCATAAATGTGGCTTCTACTTCTCAAAATACTTCTCAAGAAACTTCAGTTACAAACGATGTACCAGCTAACAAAAGTGGTAAATCATCAGAAACCAATTGGAGAGAAAGACCGAGTAATAACGAAACAGTTAACTCTCAAGTGGAAACGAACAATTTTAACcgatatcaaaaaaattataaaaatacagaagGAAATCGTAATCGTGAGTCTAATAGTCGATatgaaaataaacgtaataatgAAACAAACCAAGAATCTAACGGGCGCTACCGTAATGGACATAGTAGTAACAGTAATCAATCAAATCCACAAAATAAAGAATCATCAAACCAAAATAAAGAACCAGAAAACTCTGCTAATGATTCCTCTAACCATCAAAACGAAAATCATCGAAATTTCGAAACGGGAAACCGAAACGAAACAAGAAAATAtgcaaatgaaaataatcaaTCTAAATCAAATtctaaagcaaaaaataaagattcaGATGCAGGTCGTACCTTCTATAATagttctattaataaaaatagtcaaGATGTTAGGAATGGTAGAGGGGAAGGTTCGGGAAGAAATCGAAACTGGATTGGTAGTCAACGTCTCCGGACAACAGAACGTAATATTGTTGAAGATGAACAATATGCTAATACTTACATGCATTACAAAGATGACAGAGCGGAACGAatagcaaataataataagcatGAAAAAACCGCTAGCCCAGTTAAAGGAAGAAGTAAACCTACTAATGACTCAGGAGtTTCAGGCAACACAGCGATGACCCAACGTGAACGCCTCACCGAACAATTAGACAAGGGTACTTTAGAATGTCTGGTGTGCTGTGAAAGAGTCAAACAGACAGATTCTGTTTGGTGGTGCTCAAATTGTTACCATGTTTTACATCTTAGGTGTATAAGAAAATGGGCCATGAGCAGTTTAGTTGAAGGCAAATGGAGATGCCCGGCATGTCAAAACACGAATGAAGAGATCCCAACAGAGTACCGTTGCATGTGCGGTGCTGTTAAATCACCAGAGTACTCACGTGGCTCTGTCAGTGCTCACACTTGTGGCAAGTCATGCCGTCGACCGAGGAATTGTCCACATCCCTGCACTTTGCCCTGCCATCCCGGCCCCTGTCCACCTTGCCAGGCCACTGTCAGCAAACAATGTGGCTGCGGTGCGGAGACTCGTTCTGTGCTATGCAGCAGCAAGCTGGCGCAGCTGTGCGGGCGCGAGTGCCGGCGCAAGCTGACCTGCGGCGTACACGAGTGCCAACGCGAGTGTCACGAGGGTCCATGCGATGAATGCTCCGAAATTGTCACACAAGTGTGCTACTGCCCCGCGGCTAAGACGCGGTCAGTACCGTGCACGTCGGACACGAGTGGCGAGCACGCGTGGTCGTGCGGCGCGGCGTGCGCACGCGTGCTGTCGTGCGGCGCGCACGTGTGCCGGCGTGTCTGCCACGCCCCGCCCTGCGCGCTCTGCCCCCTGCGCCCCGACAACGTGCACTCCTGCCCCTGCGGCAACACTAAgATAGAAAAGGATCAACGAAAGTCCTGCACGGATCCGATTCCTTTATGCGGTAACATCTGTGCCAAGCCGTTGCCCTGTGGCCCGGAGGGAGATAAACACTTTTGTAAACAATTCTGTCATGAAGGTCCATGTCCAACATGTCCTGACAAGACTCTGTTACCGTGCCGTTGTGGTCACTCGAGCCGGGAGGTGCCATGCTCAGACTTGCCCGACATGCTCAACAATGTCTTCTGTCAGAAGAAATGTAACAAGAAGTTGTCTTGCGGTCGCCACCGTTGTCGTACTGCGTGCTGCGCTGCGCAGTCGCACCGTTGCGCAGTGGTGTGCGGACGAACTCTCTCCTGTCAACTCCACCGCTGTGAGGAGTTCTGTCACACCGGACACTGCGCACCCTGTCCTCGCGTCAGTTTCGAAGAACTCCATTGCGAGTGTGGCATGGAAGTGTTATTGCCACCAATCCGGTGTGGCACTCGTCCACCCGTGTGCCAAGCTCCTTGCCGACGCGAGCGACCTTGCCACCATCCACCTCACCACTCTTGTCACACCGGAGACTGCCCACCATGCGTCGTGCTCACCACCAAGATGTGCCACGGACGCCACGAGGAGCGGAAGACAATACCGTGCAGCCAGGAGGAGTTCTCGTGCGGTCTACCTTGCGGTAAACCTTTACCATGCGGCAAGCACACCTGCACCAAGACCTGCCACAAGGGACAATGCGATACTgacaaATGTAAGCAGGCGTGTACGGAGAAGCGCGCGAGCTGCGGACACCCGTGCGCTGCGCCCTGCCACGTGGACAATGGCGGAGTCTGCCCCAGCGCCGCGCCCTGCCGCCGTCTCGTGCGAGCCACATGCGCCTGCGCACGTCGCACCGCTGACAGACCCTGTCACGAGAACGCCAGAGACTACGCCAAaaTGATGAGTGCGCTGGCGGCTACAAAAATGCAAGAGGGAGGCTCCGTGGATATTTCGGAAGTGCATCGCCCCGGGGCTATGCTGAAGacCTTGGAATGTGATGACGAGTGCCGCATGGAGGCGCGCAGCCGGCAGCTGGCGCTGGCTCTGCAGATCCGTAACCCTGACGTGTCCGCCAAGTTGGCGCCGCGATACAGCGAACATGTGCGCACCACCGCCGTACGCGAACCCGCCTTCGCACAAAACGTTCACGACTGCCTCACAGAGCTCGTGCAGCGCGCTAAGAAGtctAAACAGAAGACCCGCGCACATTCATTCCCTTCAATGAATCGTCAGAAACGTCAGTTTATTCACGAGCTGTGCGAGCACTTCGGTTGTGAGAGCGTCGCATACGACGCGGAGCCCAATCGCAATGTCGTCGCCACCGCTGACAGGGAGAAgTCGTGGTTACCAGCGATGAGTGTGCTGGAGGTGCTGGCTCGCGAGGCTGGCAAGCGGCGTGTGCCGGGGCCCGTGCTGCGCGCGCCCGCAGCACCACCGCCCACACCAGCTCTCGCCACGCCCACAACATCCACCAGCAGAAGCACTGGAGGTTGGGCAACATTGACATCTACCAATGCGTGGGCAGCTCGTAGTCAGCCTGCGCGCGTCGAGCCTAAGATTGACTACTTCGACAATCCGCCTGAAAACTAA
Protein Sequence: MSQWNNSYGYNNQFQAPPNSWNRDVNGQYVNQPYYDNRQYESSNQYVSFDEFLTQMQGNGVPQNNASNYNNVQYQAYPTNQYNYQNVPSQNPQMEFSYGHHNPNTSSTLDTYTVNVQNQYNPSVPELSTYSNEVVMNSKLTPTATEFVPKCSINVASTSQNTSQETSVTNDVPANKSGKSSETNWRERPSNNETVNSQVETNNFNRYQKNYKNTEGNRNRESNSRYENKRNNETNQESNGRYRNGHSSNSNQSNPQNKESSNQNKEPENSANDSSNHQNENHRNFETGNRNETRKYANENNQSKSNSKAKNKDSDAGRTFYNSSINKNSQDVRNGRGEGSGRNRNWIGSQRLRTTERNIVEDEQYANTYMHYKDDRAERIANNNKHEKTASPVKGRSKPTNDSGVSGNTAMTQRERLTEQLDKGTLECLVCCERVKQTDSVWWCSNCYHVLHLRCIRKWAMSSLVEGKWRCPACQNTNEEIPTEYRCMCGAVKSPEYSRGSVSAHTCGKSCRRPRNCPHPCTLPCHPGPCPPCQATVSKQCGCGAETRSVLCSSKLAQLCGRECRRKLTCGVHECQRECHEGPCDECSEIVTQVCYCPAAKTRSVPCTSDTSGEHAWSCGAACARVLSCGAHVCRRVCHAPPCALCPLRPDNVHSCPCGNTKIEKDQRKSCTDPIPLCGNICAKPLPCGPEGDKHFCKQFCHEGPCPTCPDKTLLPCRCGHSSREVPCSDLPDMLNNVFCQKKCNKKLSCGRHRCRTACCAAQSHRCAVVCGRTLSCQLHRCEEFCHTGHCAPCPRVSFEELHCECGMEVLLPPIRCGTRPPVCQAPCRRERPCHHPPHHSCHTGDCPPCVVLTTKMCHGRHEERKTIPCSQEEFSCGLPCGKPLPCGKHTCTKTCHKGQCDTDKCKQACTEKRASCGHPCAAPCHVDNGGVCPSAAPCRRLVRATCACARRTADRPCHENARDYAKMMSALAATKMQEGGSVDISEVHRPGAMLKTLECDDECRMEARSRQLALALQIRNPDVSAKLAPRYSEHVRTTAVREPAFAQNVHDCLTELVQRAKKSKQKTRAHSFPSMNRQKRQFIHELCEHFGCESVAYDAEPNRNVVATADREKSWLPAMSVLEVLAREAGKRRVPGPVLRAPAAPPPTPALATPTTSTSRSTGGWATLTSTNAWAARSQPARVEPKIDYFDNPPEN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01142814;
90% Identity: iTF_01148517; iTF_01149255; iTF_01142814; iTF_01139351; iTF_01150047;
80% Identity: -