Basic Information

Insect: Apocrypta bakeri
Gene Symbol: stc_1
Assembly: GCA_018906985.1
Location: JACCIA010000005.1:14213312-14217777[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 2 1.5e+04 -4.3 1.6 15 19 505 509 504 509 0.81

2 16 0.14 1e+03 -0.4 0.1 4 10 538 544 537 545 0.94

3 16 3.5e-07 0.0027 17.5 12.5 4 18 555 569 553 570 0.93

4 16 1.2 9.4e+03 -3.4 1.5 6 10 596 600 595 600 0.90

5 16 2.4e-07 0.0019 18.0 15.6 1 18 606 623 606 624 0.98

6 16 0.067 5.2e+02 0.6 2.3 1 10 633 642 633 642 0.94

7 16 2.7e-09 2.1e-05 24.2 14.2 1 18 662 679 662 680 0.97

8 16 0.59 4.6e+03 -2.4 0.9 5 10 709 714 709 714 0.95

9 16 0.00036 2.8 7.9 12.7 4 18 727 741 720 742 0.86

10 16 1.5 1.2e+04 -3.8 2.0 5 10 771 776 771 776 0.93

11 16 0.022 1.7e+02 2.1 13.0 1 11 782 792 782 804 0.88

12 16 1.2e-08 9.5e-05 22.1 12.3 1 19 809 827 809 827 0.98

13 16 1.8 1.4e+04 -3.9 0.5 6 10 856 860 855 860 0.80

14 16 2 1.5e+04 -6.6 9.4 10 19 874 884 866 884 0.71

15 16 5.6e-07 0.0043 16.8 15.5 1 16 920 935 920 946 0.85

16 16 9.5e-06 0.073 12.9 12.0 1 19 952 971 952 971 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	2	1.5e+04	-4.3	1.6	15	19	505	509	504	509	0.81
2	16	0.14	1e+03	-0.4	0.1	4	10	538	544	537	545	0.94
3	16	3.5e-07	0.0027	17.5	12.5	4	18	555	569	553	570	0.93
4	16	1.2	9.4e+03	-3.4	1.5	6	10	596	600	595	600	0.90
5	16	2.4e-07	0.0019	18.0	15.6	1	18	606	623	606	624	0.98
6	16	0.067	5.2e+02	0.6	2.3	1	10	633	642	633	642	0.94
7	16	2.7e-09	2.1e-05	24.2	14.2	1	18	662	679	662	680	0.97
8	16	0.59	4.6e+03	-2.4	0.9	5	10	709	714	709	714	0.95
9	16	0.00036	2.8	7.9	12.7	4	18	727	741	720	742	0.86
10	16	1.5	1.2e+04	-3.8	2.0	5	10	771	776	771	776	0.93
11	16	0.022	1.7e+02	2.1	13.0	1	11	782	792	782	804	0.88
12	16	1.2e-08	9.5e-05	22.1	12.3	1	19	809	827	809	827	0.98
13	16	1.8	1.4e+04	-3.9	0.5	6	10	856	860	855	860	0.80
14	16	2	1.5e+04	-6.6	9.4	10	19	874	884	866	884	0.71
15	16	5.6e-07	0.0043	16.8	15.5	1	16	920	935	920	946	0.85
16	16	9.5e-06	0.073	12.9	12.0	1	19	952	971	952	971	0.97

Sequence Information

Coding Sequence: ATGGCCACTTGGGATGGTTCTTATCCAGAGCCAGATGGATCCAATTATTATGTTAACTCTAATAGTAACCATGCGCCTGCCAATCTTTCGACATGGGACTATTATCTTCCTAACACTAACAATGCTTATGTACAAAATGCACAAGCTCCATATGCGTTGAATTCTATGGTCTTTGAGCAAAGCACACCCAATTTGTATAATCATGTTGATAGAAATGCCATGCGTCCTATGATTCCAAATATTGGACCCGCTAACAACGCCTATTCTAATAACAGAGTACATACATCGAACAAGAAGGCTCATATGGGTCATGCCGAGCCACATGCCAGTACCAAAAATCAATTGCCATGTTTCTTTGAAGATAACAAAGCGTCGACGCAACAAGGCCCTCAAAATTATTATCATAATAATAGGAGTAACAACTATCAAAATAATGGCAAGCGTAAAGATCTAAATAAAATCTATCAGGTATCTGATTTAGCTGAACATTCAAATTTACATGCCACAGCTAACGAATTTGTACCAAACCAAAATCAGTGGGACCGAGGTGCCTCATCAAATACAAATCCAAACAAACATAATAGTAGAGGTCGTGTGAATAATGATTATCAAAATCAGAGTGGGGAACAAACAGCAGTAAATAATGTCTTTTTTGAAGACAATAAAGTAAGGTATAATGAAAAAAAATATGAGAATAAAAGAGATGCTGGCAGAAGGTGGAGGGATAATAACAGAGATACGCAGAATAGTCAACATAAACATAATCAACATAATAAAGAAGATAAAAAAGAATATATAAGAAATCAAAATTCTAGAAGATATCAGAATGATAGATATAGTCATAGTAGAAACTTTCCTGAAAAATCACACAACAATAAGCAAGATAAAGATTATTCTGATCATGCTACATCTGAATCAAATGCAAATAGTGAATTAGAAAATGTATCTGATCATCAAGACAATTTCAATAACACCAATGTGTTTCATTCATCTGTAGAAAAAGAAAACGTGCAATCTACAAGTTCTCAATCAACAAAAAATTCAAAATCATTTTCAAATAACAGTCGAGGGGACAGATATTACGATAGAAAAGAAAGATATAATCCTCGTGATCCTAGAGATAGAAAAAGTAATTATTCTGAGCACAATGGATATAACAGAAGTAATTACAATAACAGAGATAATAAATATGAGCGAAGAGAAAATAGGAATTCTCTTGGTGAAGGTCGGGATAAAGACATGACTGATTGGAGACAAAGAACAAATGAAGTTGTGAATAAAAGTACTATGCTCAAACGTCCTTATCACAAAAAATATGAACCAGATGGCGATGCAGATCAAAGAGAAAGGTTAACTGAGCAATTAAATCGTGGCCAATTAGAATGTCTCGTTTGTTGTGAATCTATCCGTCAAACCGATTATGTGTGGTCATGCAAGAATTGTTATCATGTGCTACACTTAAAGTGTGTGCAAAAGTGGGCTACGTCGTCCCAAGATGAAAGCGGTTGGCGATGTCCTGCCTGTCAGAACGTTACGTCGGAAGTGCCATCTGATTATCTTTGCTTTTGCGGCAAAATAAAAGTACCGGAATGGAATCGCCGAGACATTGCCCACTCCTGTGGCGAGATTTGTGGACGGACCCGCCCTGACGTAGCATGTGTCCATAAATGTACGCTACTCTGTCATCCAGGATCGTGCCCGCCCTGTTTAGCGATGGTCACTAAGACCTGTGGCTGCGGCCGAATGTCTAAAACGCAAAAATGCAGCACTGGTCCTCTACTCCAGTGTGAAGAAATTTGTGATCATCCACTAAATTGTGGTGTGCACAAGTGCGAAGTGAAATGCCATCACGGTAGCTGCGAGCCATGCGACAAAGTTGTTAAACAAGAATGTCACTGTGGAAAACATACCCGCGAAGAAACTTGCATTTTGGACTTATCACCAACGTATTCATGTGCGAATGTTTGTGAAAAAGTACTAGACTGTAGCAATCACAAGTGTAAAGATATTTGTCATCCAGGTCCGTGTGGACCCTGTCTCTTAAAACCTGAAACAGTTAAAAACTGCTGCTGTGGACAGACTCTTTTAACTGTTGAGAGAGTAAGTTGCTTAGACCCAATTGCAACTTGTGATAAAGTGTGTTCCAAACGATTGCAATGTGGTCAGCCAAGCAATCCTCATACCTGCCAAGCAAACTGCCATGAAAGCAATTGTCCCGAATGCGAACTGATCACTAAAGTCAAGTGCCGTTGTGGTTACATGGACAGAGAAATTCCTTGTAAAGAACTGACGACCAAGGCTGATGACGCTCGCTGCGAAAAAAAATGTACAAAGAAGCGTTCCTGTGGAAAACATAAATGCAATCAGAAGTGCTGCATCGATATTGAACATATTTGTCCACTTCCATGCTCAAAAACTTTAAGTTGTGGTAGACATAAATGTGAACAAACATGTCATAGAAGTAGGTGCCAGCCCTGTTGGCGTAGTAGCTTTGATGAGCTTTACTGCGAATGCGGTGCCGCTGTGATCTATCCTCCTGTAGCCTGTGGCACACGTCGGCCCGCTTGTGATAGACCTTGCTCACGTGAGCACCCATGCGGTCATGAAATACTGCACAACTGTCACAGTGATCCAACATGTCCACCCTGCACTGTACTCACGCAAAAGTGGTGCTATGGTGAACACGAGCTACGTAAAGCGGTTCCCTGTTATGTCAATGACGTTTCCTGTGGTCTACCTTGCAATAAGCCGATCTCTTGTGGTAGGCACAAGTGCATACAAATGTGTCATCCGGGCCCTTGTGAAAAACCCGGACAGGTATGTACTCAGCCTTGCACTGTAGCTAGAGAAATATGTGGTCACATATGTGCAGCAGCTTGTCACGAGGGTAAATGTCCCGACACACCCTGCAAAGAGACAGTCAAGGTTACCTGTCAATGTGGAAATAGGAAAATGACGCGTGTATGTGCAGAAAACTCTCGAGATTATCAAAGAATTGCTAGTGGAATTTTAGCCAGTAAAATGGCAGAAATGCAACTTGGCCATTCAGTTGATCTTGAAGAAGTATTTGGCCAAGGAGCCAGAAAACAAAATCAACTTAAGACTCTTGAGTGTAACGAAGATTGTAGAATGATTGAGAGAAATCGAAAGTTAACGCTTGGCCTTCAAATCGTGAATCCAGATTTGAGCGGCAAATTAATGCCTAAATATAGTGAACATATGAAAGAATGGGGTAAAAAAGATGCTATCTTTTGCCAAATGGTCCACGACAAGCTCACGGAACTAGTTCAATTAGCAAAAACTTCAAAACAAAAGTCAAGAAGCTATTCGTTTGAAAGTATGAATAGAGATAAAAGACAGTTTATACACGAATCATGTGAACATTTTGGTTGCGAGAGTCAAGCTTATGACCAAGAACCCAAACGTAATGTTGTCGCAACTGCTGTTAAAGATAAATGTTGGTTACCAAGTTACAGCCTCATGGAATTATTACAGAGAGAGAACGGTCAACGAAAAGTACCAGGACCAATGTTAAACAAGTCAAAACTAAACAGCACTGATAGAAGTTATAGAAGCATGAATGTTTTGCAATTACACTCAAAGAAAAATTCAGAGCCTTTGCCTACTACTTCAGCTTCTCCAACAAACTCTCCAGAACCAGTGATAGATTATTTTAATTATAATGGTTGA
Protein Sequence: MATWDGSYPEPDGSNYYVNSNSNHAPANLSTWDYYLPNTNNAYVQNAQAPYALNSMVFEQSTPNLYNHVDRNAMRPMIPNIGPANNAYSNNRVHTSNKKAHMGHAEPHASTKNQLPCFFEDNKASTQQGPQNYYHNNRSNNYQNNGKRKDLNKIYQVSDLAEHSNLHATANEFVPNQNQWDRGASSNTNPNKHNSRGRVNNDYQNQSGEQTAVNNVFFEDNKVRYNEKKYENKRDAGRRWRDNNRDTQNSQHKHNQHNKEDKKEYIRNQNSRRYQNDRYSHSRNFPEKSHNNKQDKDYSDHATSESNANSELENVSDHQDNFNNTNVFHSSVEKENVQSTSSQSTKNSKSFSNNSRGDRYYDRKERYNPRDPRDRKSNYSEHNGYNRSNYNNRDNKYERRENRNSLGEGRDKDMTDWRQRTNEVVNKSTMLKRPYHKKYEPDGDADQRERLTEQLNRGQLECLVCCESIRQTDYVWSCKNCYHVLHLKCVQKWATSSQDESGWRCPACQNVTSEVPSDYLCFCGKIKVPEWNRRDIAHSCGEICGRTRPDVACVHKCTLLCHPGSCPPCLAMVTKTCGCGRMSKTQKCSTGPLLQCEEICDHPLNCGVHKCEVKCHHGSCEPCDKVVKQECHCGKHTREETCILDLSPTYSCANVCEKVLDCSNHKCKDICHPGPCGPCLLKPETVKNCCCGQTLLTVERVSCLDPIATCDKVCSKRLQCGQPSNPHTCQANCHESNCPECELITKVKCRCGYMDREIPCKELTTKADDARCEKKCTKKRSCGKHKCNQKCCIDIEHICPLPCSKTLSCGRHKCEQTCHRSRCQPCWRSSFDELYCECGAAVIYPPVACGTRRPACDRPCSREHPCGHEILHNCHSDPTCPPCTVLTQKWCYGEHELRKAVPCYVNDVSCGLPCNKPISCGRHKCIQMCHPGPCEKPGQVCTQPCTVAREICGHICAAACHEGKCPDTPCKETVKVTCQCGNRKMTRVCAENSRDYQRIASGILASKMAEMQLGHSVDLEEVFGQGARKQNQLKTLECNEDCRMIERNRKLTLGLQIVNPDLSGKLMPKYSEHMKEWGKKDAIFCQMVHDKLTELVQLAKTSKQKSRSYSFESMNRDKRQFIHESCEHFGCESQAYDQEPKRNVVATAVKDKCWLPSYSLMELLQRENGQRKVPGPMLNKSKLNSTDRSYRSMNVLQLHSKKNSEPLPTTSASPTNSPEPVIDYFNYNG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01190904;
90% Identity: iTF_01190904;
80% Identity: -