Basic Information

Insect: Drosophila neoperkinsi
Gene Symbol: stc_1
Assembly: GCA_037043555.1
Location: JBAMBG010000804.1:7482-10855[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 1.9 1.1e+04 -3.5 0.5 15 18 244 247 243 248 0.79

2 15 2.7 1.6e+04 -3.9 1.6 15 19 271 275 270 275 0.81

3 15 0.02 1.2e+02 2.9 2.5 4 11 304 311 303 312 0.91

4 15 7.7e-07 0.0046 16.9 15.1 1 19 316 333 316 333 0.93

5 15 2.8 1.7e+04 -4.0 1.4 6 10 359 363 358 363 0.87

6 15 3.2e-08 0.00019 21.4 11.4 1 18 369 386 369 387 0.96

7 15 3 1.8e+04 -6.1 3.9 7 13 391 397 391 398 0.74

8 15 2.7e-09 1.6e-05 24.8 12.9 1 19 427 445 427 445 0.98

9 15 3.1e-05 0.19 11.8 17.0 4 19 493 508 486 508 0.88

10 15 0.078 4.7e+02 1.0 11.6 1 11 548 558 548 570 0.79

11 15 6.3e-10 3.8e-06 26.8 15.5 1 18 575 592 575 593 0.97

12 15 2.1 1.3e+04 -3.6 1.8 6 10 622 626 620 627 0.61

13 15 3 1.8e+04 -5.7 9.6 9 18 639 649 629 650 0.79

14 15 3.6e-08 0.00021 21.2 12.6 1 16 686 701 686 709 0.95

15 15 1.1e-07 0.00064 19.7 12.5 1 19 719 738 719 738 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	1.9	1.1e+04	-3.5	0.5	15	18	244	247	243	248	0.79
2	15	2.7	1.6e+04	-3.9	1.6	15	19	271	275	270	275	0.81
3	15	0.02	1.2e+02	2.9	2.5	4	11	304	311	303	312	0.91
4	15	7.7e-07	0.0046	16.9	15.1	1	19	316	333	316	333	0.93
5	15	2.8	1.7e+04	-4.0	1.4	6	10	359	363	358	363	0.87
6	15	3.2e-08	0.00019	21.4	11.4	1	18	369	386	369	387	0.96
7	15	3	1.8e+04	-6.1	3.9	7	13	391	397	391	398	0.74
8	15	2.7e-09	1.6e-05	24.8	12.9	1	19	427	445	427	445	0.98
9	15	3.1e-05	0.19	11.8	17.0	4	19	493	508	486	508	0.88
10	15	0.078	4.7e+02	1.0	11.6	1	11	548	558	548	570	0.79
11	15	6.3e-10	3.8e-06	26.8	15.5	1	18	575	592	575	593	0.97
12	15	2.1	1.3e+04	-3.6	1.8	6	10	622	626	620	627	0.61
13	15	3	1.8e+04	-5.7	9.6	9	18	639	649	629	650	0.79
14	15	3.6e-08	0.00021	21.2	12.6	1	16	686	701	686	709	0.95
15	15	1.1e-07	0.00064	19.7	12.5	1	19	719	738	719	738	0.96

Sequence Information

Coding Sequence: ATGTTGCAGCAATATGCGGCGCCTGTTTTTGGCTATCAGAATGGCGATGCCGCTGGCCAACATTATCCCAATTTGTACTCAGCCTTTGGCAGTAATCCATttgctgcgcctgctgctggcggcgccTCTTTCGATTTTAGCGCTTCCAAGCTGCAGGCGACGGCGCCTGAATTTGTGCCCAACTTCGCCAAGCTCAGCCTGTCGACGAGcaaagccaacagcagcagcagtaatagcaataataataataataatagcaacaacagcaacactgcCACAATACAGCACACGCCACATGAGGCAGCTAGCAGCAATGCTCAACGAGGCTTGGCGAAGCCGCTGGCTGGCGGCAATAATtctcggcagcagcagcgacgccaggACTATCGCGAAGATCGCCACGAGGATCGCTATGAGCGTGGCAAGAAGccgcagaagcagcagcgctATGACAATCATCGCAGCAACAAAAGACGCGACGACTGGAATCGCAATCGTGACCGCATCAATGGCTATCCGCGCGCCGCCGACGAACTggacaccagcaacagcaacgacagtGCGCAGCCTTCGCCCGAGAAGCAGCTGCCACACCAAGTCTCCCCTCGGCGAGCGCCCGACAATGAGAAGCTGTCGCAGCGGGAGAAGCTGATGCGCGACATCGAGCAGCGGCGACTGGAGTGCTTAGTGTGCGTGGAGCAGATCAAGGCGCATCATGGCACGTGGTCGTGCCAGAACTGCTATCATGTGCTGCATCTCAAGTGCACCATCACCTGGGCGAGCAGTTCCAAGTCGGCGGAGGGCTGGCGCTGTCCAGCCTGCCAGAATGTGCTGCAAGAGTTGCCGCGCGAATATCTCTGCTTCTGTGGCAAGTTGAAGAATCCGCCGCTCACACGCAACGAGCTGGCGCACACTTGCGGCGAACTCTGCTGTCGCGTCGAGGGTTGCAGTCATGCGTGCACCCTACTCTGTCATCCGGGTCCGTGTCCGCCGTGCCAGGCGAACGTGTTGCGCAGCTGTGGCTGCGGACGCACCTCCAAGCTGATGCAGTGCGCCAtgaagcagcaactgcagtGCGAGGCCACCTGCGACAAGCCACTCAACTGCGCCGAGCATCGTTGCCAGCAGTTGTGCCATGCGGGCAAATGTGAGCCGTGTGCGGAGCAGGTGGAGCAACACTGCCactgtggcaagcagcagcgcGAGGTGCTCTGCACCAAGGAGAGTCAGGATAGGCGCAGCTATTCGTGCAAGGAGTGCTGCGGCAAGCCGTTGCCCTGCGGCAATCACAAGTGCAAGGATTCGTGCCACGCCGGCGCCTGTCGTCCCTGCAAGCTGAGTCCGCAGCAGATCACCAGTTGCCCCTGTGGCAAGTTGGCAGTGCCTCCGACGCAGCGCAGCAGCTGTCTGGATCCGGTGCCGACGTGCGAGGGCGCGTGTAGCAAGACGTTGCGCTGTGGCAAGCCGGCGCATCCGCATCAGTGCGCCAGCAAATGCCATTTGGGGCAGTGTCCGCCGTGCCCCAAACAGACGGCCGTCAAATGCCGTTGCGGCCACATGGATCAGCTGATCAAGTGCCGCCAGCTATCAACCCGTGCGGACGATGCACGCTGCAAACGCCGTTGCACGAAGAAACGCAGCTGTGGCAAGCACAAATGCAACGCGGAATGTTGCATCGACATCGACCATGCCTGCCCGCTGCCCTGCAATCGAACGCTGAGCTGCGGCAAACACAAGTGCGACCAGCCCTGCCACCGGGGCAATTGTCCGCCCTGCTATCGCAGCAGCTTCGAGGAGCTCTACTGCGAGTGCGGCGCCGAAGTGATCTATCCACCGGTGCCGTGTGGCACCAAACGGCCGCCCTGCAAACGGCCCTGTTCACGCACCCACGGCTGCGAGCATGTACCGCAGCACAGTTGCCATGCGGCGGCCAGCTGCCCGCCGTGCATGATGTTCACCACGAAGTGGTGCCACGGCAATCACGAGCAGCGCAAGACGATACCCTGTTCGCAGGCCAGCTTCAGCTGTGGCTTTCCCTGCGCCAAGCCGCTCGCGTGTGGCCGCCATAAATGCATCCGGCCGTGCCATGAGGGCGAGTGTCCGCAGCAGCCGGGCGAGCTGTGCCGCCAGAGTTGCACCAAGCCGCGTCCGTTGTGCGGCCACAAGTGTGCCGCTGTCTGCCACGATGGCGCCTGCCCGGAGACGCCGTGCAAGGAGCTCGTCGAGGTGCAGTGCGAGTGCGGCAATCGCAAGCAGAGCCGCAGCTGCCAGGAACTTGCCCGAGAGCACAGTCGCATTGCCACCGCCCAGCTGGCCTCCTCCATGGCGGAGATGTCGCGCGGCAACTACATGGAGCTCAGCGAAATACTCGCAcccaccaaaaacaacaaatccaaCAAAACTTTGGACTGCAACGAGGAGTGTCGTCTGCTCGAGCGCAATCGCCGCTTGGCCATTGGACTGCAGTCTCGGAATCCGGAGTCGCAGCTGAAGTCGCTGACGAAGTACTCGGAATTCCTGCGCGGCTTTGCCAAACGCAATCCGGTGCTAACCAAGAGCGTCTACGAAACGCTCAGCGATCTGGTCAAGCTGGCCAAGGAGAGCAAGCAAAAGTCACGCAGTCATTCGTTCCCCACGATGAATCGCGAGAAGCGTCAAATGGTGCACGAGCTGTGCGAAGTGTTTGGCGTGGAGTCCGTCTCCTATGACAAGGAGCCCAATCGCAACGTGGTCGCCACCGCGCACAAGGAACGCTGCTGGTTGCCCGCCACTAGCGTCATGGAGGTCCTGGCCCGCGAGTCCGGTCAGCGTCGCGTCCCGGTGCCCAGCAACAATGCCTGGGGCCTCAAGAAGTAG
Protein Sequence: MLQQYAAPVFGYQNGDAAGQHYPNLYSAFGSNPFAAPAAGGASFDFSASKLQATAPEFVPNFAKLSLSTSKANSSSSNSNNNNNNSNNSNTATIQHTPHEAASSNAQRGLAKPLAGGNNSRQQQRRQDYREDRHEDRYERGKKPQKQQRYDNHRSNKRRDDWNRNRDRINGYPRAADELDTSNSNDSAQPSPEKQLPHQVSPRRAPDNEKLSQREKLMRDIEQRRLECLVCVEQIKAHHGTWSCQNCYHVLHLKCTITWASSSKSAEGWRCPACQNVLQELPREYLCFCGKLKNPPLTRNELAHTCGELCCRVEGCSHACTLLCHPGPCPPCQANVLRSCGCGRTSKLMQCAMKQQLQCEATCDKPLNCAEHRCQQLCHAGKCEPCAEQVEQHCHCGKQQREVLCTKESQDRRSYSCKECCGKPLPCGNHKCKDSCHAGACRPCKLSPQQITSCPCGKLAVPPTQRSSCLDPVPTCEGACSKTLRCGKPAHPHQCASKCHLGQCPPCPKQTAVKCRCGHMDQLIKCRQLSTRADDARCKRRCTKKRSCGKHKCNAECCIDIDHACPLPCNRTLSCGKHKCDQPCHRGNCPPCYRSSFEELYCECGAEVIYPPVPCGTKRPPCKRPCSRTHGCEHVPQHSCHAAASCPPCMMFTTKWCHGNHEQRKTIPCSQASFSCGFPCAKPLACGRHKCIRPCHEGECPQQPGELCRQSCTKPRPLCGHKCAAVCHDGACPETPCKELVEVQCECGNRKQSRSCQELAREHSRIATAQLASSMAEMSRGNYMELSEILAPTKNNKSNKTLDCNEECRLLERNRRLAIGLQSRNPESQLKSLTKYSEFLRGFAKRNPVLTKSVYETLSDLVKLAKESKQKSRSHSFPTMNREKRQMVHELCEVFGVESVSYDKEPNRNVVATAHKERCWLPATSVMEVLARESGQRRVPVPSNNAWGLKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00496269;
90% Identity: iTF_00514573;
80% Identity: -