Basic Information

Insect: Chrysops caecutiens
Gene Symbol: stc_1
Assembly: GCA_963971475.1
Location: OZ020569.1:45012198-45015466[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 1.9 4.5e+04 -4.0 1.6 15 19 332 336 331 336 0.81

2 14 0.053 1.3e+03 0.9 0.2 4 10 365 371 364 373 0.95

3 14 1.2e-06 0.028 15.8 15.3 4 19 379 394 377 394 0.93

4 14 0.01 2.4e+02 3.2 10.7 3 18 432 447 430 448 0.91

5 14 0.77 1.8e+04 -2.8 1.4 8 13 453 458 452 459 0.79

6 14 1.8e-09 4.4e-05 24.8 15.5 1 19 488 506 488 506 0.98

7 14 7e-05 1.7 10.1 16.9 4 18 554 568 547 569 0.88

8 14 0.0064 1.5e+02 3.9 9.3 1 11 609 619 609 620 0.96

9 14 4.5e-10 1.1e-05 26.7 15.5 1 18 636 653 636 654 0.97

10 14 1.2 3e+04 -3.4 0.6 6 10 683 687 682 688 0.78

11 14 2 4.8e+04 -7.3 9.2 10 18 701 710 690 711 0.77

12 14 2.1e-08 0.0005 21.4 13.9 1 17 747 763 747 772 0.93

13 14 4.2e-07 0.01 17.2 14.0 1 19 779 798 779 798 0.96

14 14 0.64 1.5e+04 -2.5 0.1 8 12 814 818 813 818 0.80

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	1.9	4.5e+04	-4.0	1.6	15	19	332	336	331	336	0.81
2	14	0.053	1.3e+03	0.9	0.2	4	10	365	371	364	373	0.95
3	14	1.2e-06	0.028	15.8	15.3	4	19	379	394	377	394	0.93
4	14	0.01	2.4e+02	3.2	10.7	3	18	432	447	430	448	0.91
5	14	0.77	1.8e+04	-2.8	1.4	8	13	453	458	452	459	0.79
6	14	1.8e-09	4.4e-05	24.8	15.5	1	19	488	506	488	506	0.98
7	14	7e-05	1.7	10.1	16.9	4	18	554	568	547	569	0.88
8	14	0.0064	1.5e+02	3.9	9.3	1	11	609	619	609	620	0.96
9	14	4.5e-10	1.1e-05	26.7	15.5	1	18	636	653	636	654	0.97
10	14	1.2	3e+04	-3.4	0.6	6	10	683	687	682	688	0.78
11	14	2	4.8e+04	-7.3	9.2	10	18	701	710	690	711	0.77
12	14	2.1e-08	0.0005	21.4	13.9	1	17	747	763	747	772	0.93
13	14	4.2e-07	0.01	17.2	14.0	1	19	779	798	779	798	0.96
14	14	0.64	1.5e+04	-2.5	0.1	8	12	814	818	813	818	0.80

Sequence Information

Coding Sequence: atgTCCGACCTAGCGTCTTCGGACACGAATGATATGAATGGGAATGGCTACATTGATTTCAATCAATTCATTCTACAGCATAACTTTAATCGAgcatatgaaaataatttggcACAATATCATCAAGTATATGGATATGGATTGGATCCGGTCGTTTCTTACGAAGCAACTAATTATGATATAAATGCTAGTAACAATTACCATCATGCTTCTAATCATAATCAGCAAAGTACATCATCACAACAAAATGATATTGTTGCATCATCAAATCTCATTCCAACAGCAGCAGAGTTTGTACCAAGATTTGGGAGTTTGTCACTTGAAAACGGAGATCGTGAATTTCCGGTACAACCATCTACCAGTAATCCATTCTCAGTTCGTAATGAGGGCGGACATAAAAGTTCGGAGAATAATAATGTGAATTCAAGGAAGAACAATCAGGCTGCGCGTAACAACAACACTGGGGCAATTCGAAAGAACAACTACTATCAAAATCGCAATAGAAATCATGACCAAAGGTACTCAAACGACAGTCAATATCAGTTCTTTTCTAACTACTATCGTGGCAGTGGTTTCTGCAATCATAACAAGAACAAGCAATACGACCATCGTAACTCCAGGCGTCGGGACAATAGAAAAGTTCATGATGGCTATGGGTATAGGAACTCGCATGATACCAGCGATGAAAATTCCATTGAAAATGGTTTCAATCAAAATGGAGATATGTCTCCGAAAAATGGAATACATTCCCAaaatcacaatgaaaataaatctcATGCAATTCAGATTAAATCACCTGAAGAAAGTGACCAGTTTTCTCAACGAGAAAAACTGATTCAGGAAATTGAGGGTAGGAAACTTGAATGTCTTGTGTGTGTTGAGAAAATCAAGACACATCAATCGATTTGGTCATGTACGAACTGTTTTCATATATTCCATTTGTTGTGCATAACCAAATGGGCAGCAAGTTCAAAATCTGAAACAGGCTGGAGATGTCCTGCCTGCCAAAATACTACCAAGAAGGTTCCAAAAGATTACTATTGCTTTTGTGGTAAAGTCAAGAATCCTCAATACAATCGAAGTGATGTAGCTCACAGTTGCGGAGAGGTGTGTGGTCGAAAGGAACTTTGCGATCACAGTTGTACACTACTTTGTCATCCTGGTCCATGTCCACCATGTCAAGCTACTATAACACGTAAATGTGGATGTGGCAAGAAAAGTCGTATGATGCAATGCTGTCTCAAAGAGGAGTTTGTTTGCGATCAAATTTGCGAGAAATTACTGAATTGTAAAGTTCATTCTTGCTCTAAGGAATGTCATAATAGCGAGTGTGATGAGTGCGAAGAGAAGGTTGACCAAAAGTGCCACTGTGGGAAAGGTGAACGGCAAGTTGCATGTACTGCAGACTTGATCGAAAATAAGTTCTATTCTTGTGGTAAAACCTGCAATCGAACTCTATCCTGCGGTAACCATAAATGCAAAGATTCTTGCCATCCTGGTGATTGCAAACCATGCAAATTAGCCCCGGGTACAGTAATAACGTGTCCATGCGGTAAAATGCCCATTGAACCAGGATCTAGAACTTCTTGTATGGATCCGATTCCGCTTTGTGCAAATGTATGCGACAAGGTGATGAAGTGCGGACCACCAGCTTCACCACATCATTGTACGAACAAATGTCACAATGGTCAATGCCCACCATGTAACAAGCAAACTGCTGTAAAGTGTCGATGTGGTCATATGTCTCAAATGGTCAAGTGTCGACAACTATCAACAAGAGCTGACGATGCACGTTGTAAGAAACGGTGCACCAAGAAAAGAAACTGCGGGAAGCACAAATGTAACCAAGAGTGCTGCATTGATATTGATCACATATGCCCACTACAGTGTAACTACAGTTTGTCGTGCGGAAAGCATAAATGTGACCAACCATGCCATCGTGGCAACTGCCCACCATGCTATAGAAGCTCATTTGATGAACTTTATTGTGAATGCGGTGCAAGTGTTATCTATCCTCCTGTTTCGTGCGGTACAAAGCGTCCAGCTTGTTCCAAACCATGTTCACGATCTCATCCATGCAGTCATCCTGTGACTCACAATTGCCATTCAGCTTCCACTTGTCCACCGTGCGTAGTATTCACAACTCAATGGTGCTACGGAAATCATGAACAGCGCAAAACTATTCCATGTTCCCAAGAGAGTTTCAGCTGCGGATTGCCATGTGGTAAAGAATTACCCTGTGGACGGCATAAATGTATCAAACCGTGCCACAAAGGTCCTTGCCAAACTGAAGTTGAGATTTGCAAACAAAGTTGTGCTACTCTAAGGAACATGTGCGGTCACAAATGTATGGCTCCTTGCCATAATGGTGATTGCCCCGAAACACCTTGCAAGGAAATGGTTGAAGTTGTATGTGAGTGTGGTCACAGGAAACAAATGCGCACTTGTCATGACTTTTCAAGTGAATATCGTCGATTCGTTACAGCACAATTGGCTTCGTCTATGCAAGAAATGCAACGTGGGGGATCTATCGAACTCAGTGACATAATGGGACCTATGAAGATGTCGAACAACAAGACTCTCGAATGTAATGACGAATGCAAGACTATGGAAAGAAATCGTCGCATTGATTTGGCTCTGCAAATTCGAAATCCGGACTTaccatcaaaatttttaaccaaATATACTGATTTCATTCGTGGTTGGGCTAAGAAAGATCCTCAACTCGTCAAAATGATTCATGAGAAGCTCACAGAACTTGTAAAATTGTCCAAGGAAAGCAAGCAACGTTCTCGGAGTCATTCATTTCCTACAATGAATCGTGAGAAGCGTCAGCTGGTTCATGAAATGTGCGAAGTGTTTGGTGTAGAATCAGTCGCATATGATGCTGAACCTAATCGTAACGTTGTAGCTACTGCCTACAGAGATAGATCATGGTTGCCTGCAGTGAGTGTAATGGAAGTCTTACAACGTGAAAGTGGGCAACGTCGTGTACCAGTCCCGACCAACAATGCTTGGAGAATGAAGAAATAA
Protein Sequence: MSDLASSDTNDMNGNGYIDFNQFILQHNFNRAYENNLAQYHQVYGYGLDPVVSYEATNYDINASNNYHHASNHNQQSTSSQQNDIVASSNLIPTAAEFVPRFGSLSLENGDREFPVQPSTSNPFSVRNEGGHKSSENNNVNSRKNNQAARNNNTGAIRKNNYYQNRNRNHDQRYSNDSQYQFFSNYYRGSGFCNHNKNKQYDHRNSRRRDNRKVHDGYGYRNSHDTSDENSIENGFNQNGDMSPKNGIHSQNHNENKSHAIQIKSPEESDQFSQREKLIQEIEGRKLECLVCVEKIKTHQSIWSCTNCFHIFHLLCITKWAASSKSETGWRCPACQNTTKKVPKDYYCFCGKVKNPQYNRSDVAHSCGEVCGRKELCDHSCTLLCHPGPCPPCQATITRKCGCGKKSRMMQCCLKEEFVCDQICEKLLNCKVHSCSKECHNSECDECEEKVDQKCHCGKGERQVACTADLIENKFYSCGKTCNRTLSCGNHKCKDSCHPGDCKPCKLAPGTVITCPCGKMPIEPGSRTSCMDPIPLCANVCDKVMKCGPPASPHHCTNKCHNGQCPPCNKQTAVKCRCGHMSQMVKCRQLSTRADDARCKKRCTKKRNCGKHKCNQECCIDIDHICPLQCNYSLSCGKHKCDQPCHRGNCPPCYRSSFDELYCECGASVIYPPVSCGTKRPACSKPCSRSHPCSHPVTHNCHSASTCPPCVVFTTQWCYGNHEQRKTIPCSQESFSCGLPCGKELPCGRHKCIKPCHKGPCQTEVEICKQSCATLRNMCGHKCMAPCHNGDCPETPCKEMVEVVCECGHRKQMRTCHDFSSEYRRFVTAQLASSMQEMQRGGSIELSDIMGPMKMSNNKTLECNDECKTMERNRRIDLALQIRNPDLPSKFLTKYTDFIRGWAKKDPQLVKMIHEKLTELVKLSKESKQRSRSHSFPTMNREKRQLVHEMCEVFGVESVAYDAEPNRNVVATAYRDRSWLPAVSVMEVLQRESGQRRVPVPTNNAWRMKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -