Basic Information

Insect: Hesperia comma
Gene Symbol: stc_1
Assembly: GCA_905404135.1
Location: FR990023.1:15327606-15338074[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 2 3.1e+04 -4.4 1.6 15 19 501 505 500 505 0.81

2 16 0.041 6.2e+02 1.3 1.2 2 10 533 541 533 541 0.93

3 16 0.00041 6.3 7.7 15.9 4 19 549 564 547 564 0.93

4 16 0.047 7.2e+02 1.1 0.7 6 12 590 596 589 596 0.91

5 16 1.1e-08 0.00016 22.3 14.6 1 19 600 618 600 618 0.97

6 16 0.98 1.5e+04 -3.1 0.3 8 11 623 626 622 626 0.86

7 16 0.00019 2.9 8.7 12.7 1 19 657 675 657 675 0.99

8 16 4.8e-07 0.0074 17.0 11.5 1 19 716 738 716 738 0.89

9 16 0.77 1.2e+04 -2.8 2.3 5 10 767 772 767 772 0.95

10 16 0.00011 1.6 9.6 8.0 1 13 778 790 778 790 0.98

11 16 0.15 2.3e+03 -0.5 0.6 2 10 791 799 791 801 0.94

12 16 2.8e-06 0.044 14.6 15.3 1 19 805 823 799 823 0.88

13 16 0.043 6.6e+02 1.2 16.9 1 18 862 878 862 879 0.81

14 16 0.24 3.7e+03 -1.2 1.0 8 13 884 889 883 890 0.85

15 16 1.8e-08 0.00027 21.6 12.7 1 17 915 933 915 939 0.83

16 16 4.9e-05 0.76 10.6 4.8 1 13 945 956 945 957 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	2	3.1e+04	-4.4	1.6	15	19	501	505	500	505	0.81
2	16	0.041	6.2e+02	1.3	1.2	2	10	533	541	533	541	0.93
3	16	0.00041	6.3	7.7	15.9	4	19	549	564	547	564	0.93
4	16	0.047	7.2e+02	1.1	0.7	6	12	590	596	589	596	0.91
5	16	1.1e-08	0.00016	22.3	14.6	1	19	600	618	600	618	0.97
6	16	0.98	1.5e+04	-3.1	0.3	8	11	623	626	622	626	0.86
7	16	0.00019	2.9	8.7	12.7	1	19	657	675	657	675	0.99
8	16	4.8e-07	0.0074	17.0	11.5	1	19	716	738	716	738	0.89
9	16	0.77	1.2e+04	-2.8	2.3	5	10	767	772	767	772	0.95
10	16	0.00011	1.6	9.6	8.0	1	13	778	790	778	790	0.98
11	16	0.15	2.3e+03	-0.5	0.6	2	10	791	799	791	801	0.94
12	16	2.8e-06	0.044	14.6	15.3	1	19	805	823	799	823	0.88
13	16	0.043	6.6e+02	1.2	16.9	1	18	862	878	862	879	0.81
14	16	0.24	3.7e+03	-1.2	1.0	8	13	884	889	883	890	0.85
15	16	1.8e-08	0.00027	21.6	12.7	1	17	915	933	915	939	0.83
16	16	4.9e-05	0.76	10.6	4.8	1	13	945	956	945	957	0.95

Sequence Information

Coding Sequence: ATGTCCCAGTGGAACAATTCGTACGCTTATAACAACCAGTATCAAGGCCATAATACCTGGAATGGGGACATGAATGGCCAGTACCAAGCTTATTATCCTAATAGACAATTTGATACCAGTAATCAGTATGTCAGCTTCAATGAGTTCCTTGCTCAAATGCAGTCTGCTGGTGTTCCCGCCGCGAACCCTGTCGCGTACAATAACATCCAGTATCCTAACTATCCTAATAACCAATATAGTTATCAAAATATACCTGCACAAAGTGCTCAGATGGATCACAGTTATGGGGCAAATGCAACAAGTAATATTATGTCATTAAATAATGCTGAGCAGCCTCAAGTTTACCAAATGGATGCTCGTCATCATAAGCAATATGATCCAGCTTTAGCAGAAACAAATAAATACAATGAAATGGTGTTCAACTCAAAACTCACTCCAACGGCAACTGAATTTGTGCCTAAAAGTTCAGGTGTTGATGCTGCTAGCAATTCCAATAGTATACCACAACTGAACAAACCTTCAACTAGCAAAAATTTTAATGAAACTGTAAATATAAGCAATTCCAGTAGCCAAAATAAGCCTTCTAATTCAGAAACAAATTGGAGAGAGAGACCTCAAACTTCTCAGCAGAATGGAAGTTCTAATGTTGAAGAAACTGTGGATAGACAAAATAAATATTACAAACAGAATAGAAATGGGTCTGCAAACAATTATGAAAAGAACAACCATAACAGTGATTCTAATAATCATACTCAAGACTCATACTACCGCAACCAAGAAAATAGTAAGAGCAATTATGTTGGTAATGGTAACAATCATGATGGAAATAGCTCTAGATATTTGCCTGATAACAACGATGATAATGTTGAGACAAATACTCGTCACCAGGAGCGGGGCAGGAGAAACAATGACTCTAACAGTTACCAGAAGTCCAATAATCGTTATTATGATTCCAACAATCATCGTGAACAGAGCAGGAATACTGATAGCTATAGAGGAGAAGAGGGTCAATCGAGAACAAATTCCAAACATAATAATAAAAATAAGGAAACAGATGCTGGTCGTATGTTTTACAATAGTTCCATACCTAAGGGGAGTCAGGATGTGAGGAATGGTAGGGGCGATGGGTCTGGACGTCGAGGATGGGTGGGGAGTCAGCGGGTGCGACCTACCGAACGTAACATCTACGAGGATGAACAATATGCCAATACATATCTCCAGCATAGGGAAGATAAAGATAAGGCGAATAAAGAAGCCAAACCAAGTCCCTTAAGAAATAGAAATTATAAAAATGGGACCAATAGTGGAGCAAATGTAGAAATGACACAGCGGGAACGTCTCAGTGAGCAATTAGACAAAGGCACATTGGAGTGCCTGGTGTGCTGTGAACGCGTCAAGCAGACTGACTCAGTGTGGTGGTGCTCTAATTGCTACCACGTTTTGCATCTCAAATGTATAAGGAAATGGGCGTTAAGTAGTGTAATTGAGGGCAAATGGCGGTGTCCGGCGTGCCAGAACGCGTCGAACGAGATCCCGTCGGAGTACCGGTGCATGTGCGGCGCGGTCCGCAACCCGGAGTACCAGCGCGGCGCGGGCGGCGCGCACACGTGCGGCCGCGCCTGTCAGCGCCCGCGCGCCTGCCCGCACCCCTGCACGCTGCTCTGCCACCCCGGCCCCTGTCCGCTGTGCCAGGCTACTGTTAACAAACACTGCGGCTGCGGCACGGAGACGCGCTCGATCCTGTGCAGCAGCAAGCTGCCGCAGGTGTGCGGGCGCGTGTGCCACAAGACGCTCGACTGCGGCGTGCACACCTGCCAGAAGGAGTGCCACGAGGGACCCTGCGATGAATGCAAGGAAACTGTTACCCAGGTGTGCCACTGCGCGGTGGGCAAGACGCGCGTGGTGGCGTGCGAGCGCGGCGCGACCGCGCACTGGGCGTGCGGCGCGGAGTGCGCGCGCGTGCTCGCGTGCGGCGCGCACGTGTGCCGCCGCGCCTGCCACCCGCCGCCGTGCGACGCATGCCCGCTGCGCCCGGACAACGTGCGCGCGTGCCCGTGCGGGAAGACTGCGATCCAGAAAGGGCAGCGCAAATCGTGCACCGACCCCATCCCGCTGTGCGACAATATCTGCACGAAGCCGCTGCGCTGCGGGCCCGACGACGAGAGACACTTCTGCAAGGAGAAGTGTCATGAAGGTGAATGTCCGGTGTGCCCGGACAGCACGCAGCTGCAGTGCCGCTGCGGGCACTCCACGCGCGAGGTGCCGTGCCGCGACCTGCCCGAGCTCAGGAACTCTATCACCTGCCAGCGGAAGTGCAATAAGAAGCTGAGCTGCGGGCGGCACCGCTGCCGCGAGGTGTGCTGCGCGGGCGGCGAGCACCTGTGCACGGTGGTGTGCGGCCGCAGCCTGTTCTGCCAGCAGCACCGCTGCGAGGAGTACTGCCACGCGGGCCACTGCGCGCCCTGCCCGCGGCTCAACTTCGAGGAGGTCCGTTGCGAGTGCGGCGCGTCAGTGCTACTCCCGCCGGTGCGGTGCGGCGCGCGGCCGCCGGCGTGCAGCGCGGACTGCGTGCGCGCGCGCCCGTGCGGCCACCCGCCGCACCACGCCTGCCATACCGGCGACTGTCCGCCGTGCGTCGTGCTCACCGCGCGCGTGTGTCACGGGGGGCATGAGGAAAGAAAAACCATTCCATGTTCGCAAGAGGAGTTCTCGTGCGGGCTCCCGTGTGGCAAGCCGCTGCCGTGCGGCAAGCACACCTGTATCAAGATTTGCCATAAGGGGCCCTGTGATACTGGCAAATGCACGCAGCCGTGCACGGAGAAGCGTCCGTCGTGCGGGCACGCGTGCGCGGCGCCGTGCCATGCGGGCGCGACTGCGGGCGCGGGCAATGCGGGCGCTGGCGCGGGCAATGCTAGCGGTGCGGGCGGTGCGGGCAGTGTGTGTCCGAGTGCCGCGCCGTGCCGACGCGCCGTGCGTGCAACGTGCCCGTGCGGCCGTCGTTCCGCTGAGCGGGCGTGCTGCGACAACGCGCGCGATCTCGCCAGAATAATGAGCCAACTGGCTGTGTCCAAGATGCAGGAAGGCGGTTCGGTTGACTTGAGCGACGTGCAGCGTCCGGTTAATATGCTCAAAACACTGGAGTGCGACGACGAGTGCCGGCAGCAGGCGCGCGCGCGGCAGCTGGCGCTGGCGCTGCAGATCCGCAACCCGGACGTGTCGGCGAAGCTGGCGCCGCGGTACAGCGAGCACGTGCGCGCGGCGGCCGCCCGCGAGCCCGCGTTCGCGCACCACGTGCACGAGCGGCTCACCGAGCTCGTGCAGCGCGCTAAGAACTCGAAGCAGAAGACGCGGTCGCACTCGTTCCCGTCGATGAACCGGCAGAAGCGGCAGTTCATCCACGAGATGTGCGAGCACTTCGGCTGCGAGAGCGTCGCCTACGACGCCGAGCCCAATAGGAACGTCGTCGCCACAGCTGATAGAGAGAAGTCGTGGCTGCCGGCGATGAGCGTGCTGGAGGTGCTGGAGCGCGAGGCGGGCAAGCGGCGCGTGCCGGGGCCCGTGCTGCGCGCGCCCGCCGCGCCCGCCGCTACTGCGGCCGCGCCCGCCACTAGCTCCGGCACCAAATCCACAGGCGGATGGGCGACGCTGACGTCGACGAACGCGTGGGCGGCGCGCAGCGCTCGCTCCGCCCCGCAACAACAACAACAACAACAGGCACAGCCGCAGCCGCCCGCAGCGCCCAAGATAGACTACTTCGACAACCCGCCCGACAATTAG
Protein Sequence: MSQWNNSYAYNNQYQGHNTWNGDMNGQYQAYYPNRQFDTSNQYVSFNEFLAQMQSAGVPAANPVAYNNIQYPNYPNNQYSYQNIPAQSAQMDHSYGANATSNIMSLNNAEQPQVYQMDARHHKQYDPALAETNKYNEMVFNSKLTPTATEFVPKSSGVDAASNSNSIPQLNKPSTSKNFNETVNISNSSSQNKPSNSETNWRERPQTSQQNGSSNVEETVDRQNKYYKQNRNGSANNYEKNNHNSDSNNHTQDSYYRNQENSKSNYVGNGNNHDGNSSRYLPDNNDDNVETNTRHQERGRRNNDSNSYQKSNNRYYDSNNHREQSRNTDSYRGEEGQSRTNSKHNNKNKETDAGRMFYNSSIPKGSQDVRNGRGDGSGRRGWVGSQRVRPTERNIYEDEQYANTYLQHREDKDKANKEAKPSPLRNRNYKNGTNSGANVEMTQRERLSEQLDKGTLECLVCCERVKQTDSVWWCSNCYHVLHLKCIRKWALSSVIEGKWRCPACQNASNEIPSEYRCMCGAVRNPEYQRGAGGAHTCGRACQRPRACPHPCTLLCHPGPCPLCQATVNKHCGCGTETRSILCSSKLPQVCGRVCHKTLDCGVHTCQKECHEGPCDECKETVTQVCHCAVGKTRVVACERGATAHWACGAECARVLACGAHVCRRACHPPPCDACPLRPDNVRACPCGKTAIQKGQRKSCTDPIPLCDNICTKPLRCGPDDERHFCKEKCHEGECPVCPDSTQLQCRCGHSTREVPCRDLPELRNSITCQRKCNKKLSCGRHRCREVCCAGGEHLCTVVCGRSLFCQQHRCEEYCHAGHCAPCPRLNFEEVRCECGASVLLPPVRCGARPPACSADCVRARPCGHPPHHACHTGDCPPCVVLTARVCHGGHEERKTIPCSQEEFSCGLPCGKPLPCGKHTCIKICHKGPCDTGKCTQPCTEKRPSCGHACAAPCHAGATAGAGNAGAGAGNASGAGGAGSVCPSAAPCRRAVRATCPCGRRSAERACCDNARDLARIMSQLAVSKMQEGGSVDLSDVQRPVNMLKTLECDDECRQQARARQLALALQIRNPDVSAKLAPRYSEHVRAAAAREPAFAHHVHERLTELVQRAKNSKQKTRSHSFPSMNRQKRQFIHEMCEHFGCESVAYDAEPNRNVVATADREKSWLPAMSVLEVLEREAGKRRVPGPVLRAPAAPAATAAAPATSSGTKSTGGWATLTSTNAWAARSARSAPQQQQQQQAQPQPPAAPKIDYFDNPPDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01439575;
90% Identity: -
80% Identity: -