Basic Information

Insect: Nephrotoma appendiculata
Gene Symbol: stc_1
Assembly: GCA_947310385.1
Location: OX371224.1:136567222-136570195[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 1.8 7.4e+04 -4.0 1.6 15 19 290 294 289 294 0.81

2 15 0.083 3.4e+03 0.3 0.3 4 10 323 329 322 329 0.95

3 15 4e-07 0.016 17.3 17.3 3 19 336 352 335 352 0.93

4 15 1.9 7.9e+04 -4.1 1.8 6 10 378 382 378 382 0.97

5 15 2.5e-05 1 11.5 11.0 3 19 390 406 388 406 0.92

6 15 5.8e-07 0.024 16.8 12.4 1 19 446 464 446 464 0.93

7 15 0.3 1.2e+04 -1.5 0.9 5 10 494 499 494 499 0.96

8 15 0.00088 36 6.6 10.1 4 18 512 526 505 527 0.87

9 15 0.02 8.3e+02 2.3 11.3 1 11 567 577 567 589 0.91

10 15 7.2e-10 2.9e-05 26.1 15.3 1 18 594 611 594 612 0.97

11 15 1.1 4.7e+04 -3.3 1.2 6 10 641 645 640 645 0.85

12 15 2 8.1e+04 -8.6 10.9 10 18 659 668 648 669 0.72

13 15 0.00012 4.7 9.4 8.5 1 16 705 720 705 727 0.83

14 15 7.7e-08 0.0031 19.6 14.4 1 19 737 756 737 756 0.97

15 15 0.44 1.8e+04 -2.0 0.5 7 12 771 776 765 776 0.71

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	1.8	7.4e+04	-4.0	1.6	15	19	290	294	289	294	0.81
2	15	0.083	3.4e+03	0.3	0.3	4	10	323	329	322	329	0.95
3	15	4e-07	0.016	17.3	17.3	3	19	336	352	335	352	0.93
4	15	1.9	7.9e+04	-4.1	1.8	6	10	378	382	378	382	0.97
5	15	2.5e-05	1	11.5	11.0	3	19	390	406	388	406	0.92
6	15	5.8e-07	0.024	16.8	12.4	1	19	446	464	446	464	0.93
7	15	0.3	1.2e+04	-1.5	0.9	5	10	494	499	494	499	0.96
8	15	0.00088	36	6.6	10.1	4	18	512	526	505	527	0.87
9	15	0.02	8.3e+02	2.3	11.3	1	11	567	577	567	589	0.91
10	15	7.2e-10	2.9e-05	26.1	15.3	1	18	594	611	594	612	0.97
11	15	1.1	4.7e+04	-3.3	1.2	6	10	641	645	640	645	0.85
12	15	2	8.1e+04	-8.6	10.9	10	18	659	668	648	669	0.72
13	15	0.00012	4.7	9.4	8.5	1	16	705	720	705	727	0.83
14	15	7.7e-08	0.0031	19.6	14.4	1	19	737	756	737	756	0.97
15	15	0.44	1.8e+04	-2.0	0.5	7	12	771	776	765	776	0.71

Sequence Information

Coding Sequence: ATGTCACAAAATTACTATGGACCTTATTGTGATGGAGCTCAGTTTTTTAGTCAGTTTCAAAATGTCGATGCGCAGTATTACTATCATGTTAACGGTGTGCCCCAGTACAACTACTACGGAAATGAGTTTGCGCCCCAACAGCAAAGGCTCCAACAAAACAATTACCAATCTCAGTATGTACCACCGTCGACGCAGTATAGTTTTCAAATTGAGAATTCTACATTGGTTCCGACCGCTGCTGAATTTGTGCCAAGCTGGCTGAATAAGGAGGGTGAAAATGCCTCGAACGGGACCAGCTCACATAATATTCAGGAAGATGTATCAAGTACAATAGATGATCTCTCAAATTTATCTTTGAGTTCGTCGAATAAAAATGAGAATCATCGGGTGGATAGTAACCAAAGAGGATCGGGACCTAGAAGGATATCATACAAAGATAGTCGAACTGATTACCGAGAAAATGATGGATATCGGAATAATCATCGCCCTCGCTACGATAATAACTATAACAACAGTCGATATAATAATTACCGTTACGAGGATAATTCTCGCCTCAACAATAATCGAGCAAGGAACAGTTATAAAAAAGATAATGGGAAGTCAATGTATAAATCAAAATCTGGGCTACAGTCGGGAGTTCAATCATCGTCTTCGGCCGAATCCGTACCCGATCCAAAAATTGAAAAGTTGTCGCAACGTGACAATTTGTCGCACGAAATCGATTCGGGCAAGCTCGAGTGTCTTGTGTGCTGTGAAAATATCAAGCCATATCAATACATATGGTCGTGCACCAATTGCTATCATATTCTTCATTTGAATTGTACCATAAAATGGGCTCATAGCTCAAAATCGGATGATGGATGGCGCTGTCCCGCGTGTCAAAATGTTTCACAAAAAATTCCTCGTGATTATTACTGTTTTTGTGGGAAGACGAAAAATCCCCAGAATAATTACAATGATTTGGCGCACAGTTGCGGCGAATTGTGTGAACGCAAAAATGGTTGTGAACATAGTTGTACTCAACTGTGCCATCCAGGGCCATGTCCACCTTGCCAGGCAACCGTAACACGTTATTGTGGATGTGGCAAATCGAGCAGGATTATGCAATGCAATCAAAAGAATGATATCGTTTGCGAACAGATTTGTGAGAAATTACTAAGCTGTGAGTTGCACGATTGTAAACTAAAATGCCATCAAGGTGATTGTGAAGTGTGCCCCGAAAAATTTACGTTCAAATGCTATTGTGGGAAAAATTCACGAGAAGTTCCATGCGACATTGATAATGCAAATATGGCCAACTATAGTTGCGAAAAGATGTGTAATCGAATGCTGCCGTGTCAAAATCATCGGTGTCAACAAATTTGTCATCTTGGCGAATGTGGCGATTGTAAATTGGCTCCAGACTCGATCAAATCATGTCCGTGTGGAAAAACTCGGATAGTAGCGGGGCAACGTAAGTCTTGCCTTGATCCAGTACTAACGTGTAATCGGGTTTGCAAAAAGCCACTTCCATGTGGTCCACGGCGTGCACCACATTTGTGCACAGGTAAATGTCATTCAGGGAATTGTTTAGCTTGCAACAAAGAAACTCCAGTTAAATGCCGTTGCGGTCAAATGGATCAGATGGTAAAATGTCGCGAGCTTCAAACACGTGCCGATGATGCACGATGTAAGAAGCGTTGCACTAAGAAACGGAATTGTGGGAAACACAAATGCAATCAAGAGTGTTGTATTGATATTGATCATATATGCCCGATCCCTTGTAATCACCAGCTATCATGTGGAAAACATAAATGCGATAAGCCATGTCATAAGGGACGATGTCCACCTTGTTATCGCAGCTCGTTCGAAGAGCTGTACTGTGAATGCGGTGTCAATGTTATATATCCTCCAGTGCCTTGCGGGACAAAACGACCAGAGTGTGAGAATCCGTGCACCAGGGAACATTCATGCGATCATCCCGTGCAACATAATTGTCATTCGGTTGCAACCTGCCCTCCTTGTATGATACTAACCACAAAATCCTGTTATGGGAAACATGAGCAGCGCAAAACTATTCCATGTAGCCAAGAAGATTTTAGTTGCGGAATGCCGTGCAATAGGGCGTTACCATGTAATCGTCACAAATGTATTCGAAGTTGTCACAAAGATGATTGTCCCATTGAGGGTGAAGTATGCAAACAGAATTGCACCACAATTCGTACAACGTGTGGCCATAAATGCAATGCACCTTGTCACGAAGGTGATTGTCCGGATACACCGTGCCGAGAAACTGTCGAAGTCACCTGCCAATGTGGAAATCGGAAACAAACTCGTACATGCCACGATTTTGCGAAAGATTTTCGGCGCATTGCCACTGCCAATCTAGCATCATCTATGCAGGAAATGCAACGTGGCCAATCGGTAGAGCTCAGCGATATATTTGGTCCAGTTCGAGTAAACACATCTAGTAACAAGACACTGGAATGTACTGAGGAGTGTCGTGTGGTCGATCGAAATCGTCGACTTGATATTGCACTACAGATTCGAAATCCAGATGTTTCGTCGAAACTCCAACCAAAGTATTCCGATTACTTAAGGTCGTGGGGCAAGAAGGATCCTAAATTTATCGAAACGGTGCACGATAAATTAACTGAATTGGTGAAATTATCGAAAGAGAGTAAACAAAAATCTCGTAGTCATTCGTTCCCAACCATGAATCGTGATAAGAGGCAAGTGGTACATGAAATGTGCAGTATGTTTGGTGTAGAATCCGTGGCTTATGATGCGGAACCAAATCGAAATGTTGTGGCCACGGCCTATAAGGATAGGTCGTGGCTGCCAGCTATGAGTCTCCTTGAAGTTTTACAACGGGAGGGTGGTCAACGACGAATACCCGTTCCGCAGAATGCGTGGGGTATAAAAAAATGA
Protein Sequence: MSQNYYGPYCDGAQFFSQFQNVDAQYYYHVNGVPQYNYYGNEFAPQQQRLQQNNYQSQYVPPSTQYSFQIENSTLVPTAAEFVPSWLNKEGENASNGTSSHNIQEDVSSTIDDLSNLSLSSSNKNENHRVDSNQRGSGPRRISYKDSRTDYRENDGYRNNHRPRYDNNYNNSRYNNYRYEDNSRLNNNRARNSYKKDNGKSMYKSKSGLQSGVQSSSSAESVPDPKIEKLSQRDNLSHEIDSGKLECLVCCENIKPYQYIWSCTNCYHILHLNCTIKWAHSSKSDDGWRCPACQNVSQKIPRDYYCFCGKTKNPQNNYNDLAHSCGELCERKNGCEHSCTQLCHPGPCPPCQATVTRYCGCGKSSRIMQCNQKNDIVCEQICEKLLSCELHDCKLKCHQGDCEVCPEKFTFKCYCGKNSREVPCDIDNANMANYSCEKMCNRMLPCQNHRCQQICHLGECGDCKLAPDSIKSCPCGKTRIVAGQRKSCLDPVLTCNRVCKKPLPCGPRRAPHLCTGKCHSGNCLACNKETPVKCRCGQMDQMVKCRELQTRADDARCKKRCTKKRNCGKHKCNQECCIDIDHICPIPCNHQLSCGKHKCDKPCHKGRCPPCYRSSFEELYCECGVNVIYPPVPCGTKRPECENPCTREHSCDHPVQHNCHSVATCPPCMILTTKSCYGKHEQRKTIPCSQEDFSCGMPCNRALPCNRHKCIRSCHKDDCPIEGEVCKQNCTTIRTTCGHKCNAPCHEGDCPDTPCRETVEVTCQCGNRKQTRTCHDFAKDFRRIATANLASSMQEMQRGQSVELSDIFGPVRVNTSSNKTLECTEECRVVDRNRRLDIALQIRNPDVSSKLQPKYSDYLRSWGKKDPKFIETVHDKLTELVKLSKESKQKSRSHSFPTMNRDKRQVVHEMCSMFGVESVAYDAEPNRNVVATAYKDRSWLPAMSLLEVLQREGGQRRIPVPQNAWGIKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01460819;
90% Identity: iTF_01459166;
80% Identity: -