Basic Information

Insect: Cephus fumipennis
Gene Symbol: stc_1
Assembly: GCA_030142355.1
Location: JARQSY010000809.1:377531-381840[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 2 2.4e+04 -4.2 1.6 15 19 454 458 453 458 0.81

2 17 0.16 1.9e+03 -0.6 0.1 4 10 487 493 486 494 0.94

3 17 2.2e-06 0.027 14.9 11.3 4 18 504 518 502 519 0.94

4 17 2 2.4e+04 -4.1 0.4 6 10 545 549 545 550 0.89

5 17 4.1e-07 0.0048 17.3 16.8 1 18 555 572 555 573 0.97

6 17 0.42 5e+03 -1.9 1.3 1 10 582 591 582 591 0.73

7 17 0.56 6.6e+03 -2.3 0.9 5 10 600 605 600 605 0.95

8 17 4.8e-10 5.7e-06 26.6 14.0 1 19 611 629 611 629 0.98

9 17 0.33 3.9e+03 -1.6 3.8 5 12 658 665 658 665 0.91

10 17 4.4e-06 0.053 14.0 16.2 4 18 676 690 669 691 0.86

11 17 2 2.4e+04 -4.6 1.6 5 10 720 725 720 725 0.90

12 17 0.0078 92 3.6 11.0 1 11 731 741 731 753 0.88

13 17 6.5e-11 7.7e-07 29.4 14.0 1 19 758 776 758 776 0.98

14 17 1.3 1.6e+04 -3.5 0.5 6 10 805 809 804 810 0.70

15 17 2 2.4e+04 -4.8 7.6 10 19 823 833 812 833 0.81

16 17 1.1e-06 0.013 15.9 14.3 1 16 869 884 869 895 0.85

17 17 7.9e-06 0.093 13.2 14.2 1 19 901 920 901 920 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	2	2.4e+04	-4.2	1.6	15	19	454	458	453	458	0.81
2	17	0.16	1.9e+03	-0.6	0.1	4	10	487	493	486	494	0.94
3	17	2.2e-06	0.027	14.9	11.3	4	18	504	518	502	519	0.94
4	17	2	2.4e+04	-4.1	0.4	6	10	545	549	545	550	0.89
5	17	4.1e-07	0.0048	17.3	16.8	1	18	555	572	555	573	0.97
6	17	0.42	5e+03	-1.9	1.3	1	10	582	591	582	591	0.73
7	17	0.56	6.6e+03	-2.3	0.9	5	10	600	605	600	605	0.95
8	17	4.8e-10	5.7e-06	26.6	14.0	1	19	611	629	611	629	0.98
9	17	0.33	3.9e+03	-1.6	3.8	5	12	658	665	658	665	0.91
10	17	4.4e-06	0.053	14.0	16.2	4	18	676	690	669	691	0.86
11	17	2	2.4e+04	-4.6	1.6	5	10	720	725	720	725	0.90
12	17	0.0078	92	3.6	11.0	1	11	731	741	731	753	0.88
13	17	6.5e-11	7.7e-07	29.4	14.0	1	19	758	776	758	776	0.98
14	17	1.3	1.6e+04	-3.5	0.5	6	10	805	809	804	810	0.70
15	17	2	2.4e+04	-4.8	7.6	10	19	823	833	812	833	0.81
16	17	1.1e-06	0.013	15.9	14.3	1	16	869	884	869	895	0.85
17	17	7.9e-06	0.093	13.2	14.2	1	19	901	920	901	920	0.97

Sequence Information

Coding Sequence: ATGGCCACTTGGGATGGTTCGTACTACGAACCTGATGATCCCAACTATCATCCATACTCCAATCATGGTGATGCAGGCCCTGGAGATCAAACATGGGGTTACTATGCTGGAAATAATTTGTCTCGTGCAAGAGGTAATCTTTATACTTCGAGCGGGTCTAGTGCTTTTGATCAGAACAGAGCTGTACCCTTTCAACAAACCAGTAGAACCAACGTTCCACCGGTTCAACAAAATGTAGCACCGTTGTCTGTCTATCAAGAGCAACCAATACCCTCACTTCTGGAAAATGTTAATCAGTGTTTCTTTGAGAATAATAGAGTACAACCACATCTTCCATCGTTCAATTATAAAAGTAGTAACTATGGAGGATGGAGTAAGAACGATAATACTGATTCTAAGTACCCAGGACAAGTGAAGAATTCATATCCAAATATAGCAGAGTATTCAAATCTACATGTTACTGCTGGTGAATTTATACCAAACAGTGCAAAACCAAGTTATTCAGAAGCACCAATTGCCAGTCTAAATAGTGCAGGGAATCAAACTAACGCACAATGCGAAGCTACAGAAATGCATCATGGAAATGCTACTGCCACGATAGAAGCAGGACCATCTAATGTCTtcttcaacaaaaaaaatagcaattaTAGGCAACCCTCAATGTcgaaggatgaagaaaaacaatacaCTAATGGAAAGCTAAATAAGAACGGTACTAAAGGCTTGCCTTACAATGACTCCCTGTCTTATCAATATAAACAAGAGAGTTCAAGACAACCTGGCAAATTACCCAAGTACAATTATAACGGTACTATCAACGAGCCCAGTTCGTCCAGTCACAATTCAGAGCAACCTCAGTCCTGgataaagaatggaaaaaagtaCTTCAGCGATGATCGTCCTGAAAGGTATCGTGAGAGAAGAGAACGCTACAGTGACAGATACGATAGTGGtcagagagagaagaggaataATTACCAGGATTATGATGgacacaaaaataattatgatgtGAGCAGCGAGAGGAGTGAAAGAAACAGAGATAAAGAGCGTAACAAGAATAGTGCCCGAGAGAACAAAGATAAAGACAGTGAAAGTTGGAGGTCAAAGAATGAAACTAGCAGCAGGAGTGGTACTCCAAAACGTAGTGGCAACAAGAAATACGATACAGACGATGATGCCAGTCAAAGGGAAAGGTTAACAGATCAATTAAATAGAGGACAACTCGAATGCCTAGTATGTTGTGATCGTATAAAGCAAACAGATCATGTTTGGTCGTGTTCCAATTGTTATCATGTATTGCATTTAAAGTGCACTAAGAAATGGGCCAAATCGTCGCAGAGTGaaaatggTTGGCGTTGTCCAGCCTGTCAGAATGTAACATCTGTGATAccagaagaatatttttgcttcTGCGGAAAGGGTAAGACGCCAGAATGGAATCGTCGTGAGGTCGCTCATTCCTGTGGGGACGTCTGCGGACGTATGCGAGCAAATACCAACTGTGTTCACAAATGTACTTTACTTTGTCATCCTGGTCCTTGTCCTTTATGTATCGCTATGGTAACAAAGTACTGTGGTTGCGGAAGGACTTCGCAAACACTCAAGTGTAGCACCGCGACGCTTTTGCACTGCGAGGCCACTTGcggtaaattattaaattgcgGGAAACACACTTGTGAAAAAAAGTGTCACCACGGCAGCTGTGAAAAGTGCGATAAAACCATACACCAAGAATGTTTCTGTGGCAAACATAATCGTGAGGTTACTTGCGACGTCGATGTTCCTTCTAAGTATACATGCGAGAACATTTGTGAGAAACTCTTAGACTGTGGCAATCACAAGTGCAAGGCTCTTTGCCATCCTGGACCTTGCGAATCTTGTTCCCTGAAACCGGAAGCCGTCACTCATTGCTGCTGCGGACAGACTCCCTTGACGGAGCAGAGAAAAAGCTGCTTAGATGAAATACCAACGTGCGAGAAGATCTGTTGCAAGCGTCTAAAGTGCGGCCAACCAAGCCATCCTCATACATGCAAGTCAAAGTGCCACGAGGGTGATTGTCCGGAGTGCGAATTGATCACAAAGGTAAAATGTCGCTGTGGCAACATGGACAAGGAAATTCCTTGCAAGGAACTAACGACAAAGGCCGATGATGCTCGTTGCGAGAAAAGGTGCACCAAGAAAAGATCCTGTGGCCGACATAAGTGTAATCAAATGTGCTGCATCGATATTGAGCATATCTGCCCATTACCTTGTTCAAAAACATTAAGCTGCGGAAGGCATAAGTGTGAGCAGACTTGCCATAAAGgaaGGTGCCAGCCCTGCTGGAGAAGCAGTTTTGATGAACTGTTCTGCGAATGTGGTGCTGCTGTTTTATATCCTCCAATTCCTTGCGGCACGAGACGTCCCGCCTGTGACAGACCTTGTTCACGACAGCACGCGTGCTCGCACGAGGTGTTGCACAATTGTCACAGCGAAGCTACGTGTCCTCCGTGCACTGTGCTCACTCAAAATTGGTGTTACGGTAAGCACGAGTTGCGCAAAGCCGTGCCGTGTCATGTGAATGAAATATCGTGCGGTTTACCGTGCAACAAACCAATATCATGCGGACGACATAAGTGCATTACACTTTGTCACGCTGGACCTTGTGAAAAACCAGGACAAGTTTGTACGCAGCCATGTACCACACCTAGGGATTTATGTGGACACATTTGTGCTTCTCCTTGTCACGAGGGAAAATGTCCTGATACTCCATGTAAAGAAATGGTCAAGgTTACCTGCCAGTGCGGTCATAGAAGTATGACTAGAGCTTGTGTTGAGAATTCGCgcgaatttcaaagaatagCCAGTGGTATACTTGCCAGTAAAATGGCAGACATGCAACTTGGTCATTCGGTGGACTTGGAAGAAGTCTTTGGCCAGGGTGCGAAGAAGCAGAATCAGTTAAAAACTTTAGAGTGTAATGATGAGTGTAAGGTTATTGAAAGAAACAGGAAACTGGCTCTGAGCTTGCAAATTGTCAATCCTGATCTGAGTGGCAAGCTTATGCCACGGTATAGCGATCTCATGAAACATTGGGCCAAGAAGGATCCTTTCTTCTGTCAAATGGTCCATGATAAATTGACGGAACTAGTTCAGCTGGCTAAAACGTCTAAGCAGAAGTCAAGGAGTTATTCTTTTGAATGTATGAATCGAGATAAGCGACACTTTGTTCATGAATACTGCGAACAGTTTGGCTGCGAAAGTCAAGCTTATGATCAGGAACCGAAGAGGAATGTTGTTGCTACTGCTGTGAAGGATAagtGTTGGATGCCGAGTCTAAGTTTATTAGAATTAGTACAACGGGAAAGTGGTCAAAGGAAGGTACCAGGTCCTATGCTCAATACGTCAAAAGCTAACTGCTCTCTAAGAAATGTCGAAGTTCTCCCCTTGCCCGCTAAGAAAGGCCACAAACTCGTGTCGATGCCGTCAACTTCAAAGTCGAAGATTAGTCAAAGATGA
Protein Sequence: MATWDGSYYEPDDPNYHPYSNHGDAGPGDQTWGYYAGNNLSRARGNLYTSSGSSAFDQNRAVPFQQTSRTNVPPVQQNVAPLSVYQEQPIPSLLENVNQCFFENNRVQPHLPSFNYKSSNYGGWSKNDNTDSKYPGQVKNSYPNIAEYSNLHVTAGEFIPNSAKPSYSEAPIASLNSAGNQTNAQCEATEMHHGNATATIEAGPSNVFFNKKNSNYRQPSMSKDEEKQYTNGKLNKNGTKGLPYNDSLSYQYKQESSRQPGKLPKYNYNGTINEPSSSSHNSEQPQSWIKNGKKYFSDDRPERYRERRERYSDRYDSGQREKRNNYQDYDGHKNNYDVSSERSERNRDKERNKNSARENKDKDSESWRSKNETSSRSGTPKRSGNKKYDTDDDASQRERLTDQLNRGQLECLVCCDRIKQTDHVWSCSNCYHVLHLKCTKKWAKSSQSENGWRCPACQNVTSVIPEEYFCFCGKGKTPEWNRREVAHSCGDVCGRMRANTNCVHKCTLLCHPGPCPLCIAMVTKYCGCGRTSQTLKCSTATLLHCEATCGKLLNCGKHTCEKKCHHGSCEKCDKTIHQECFCGKHNREVTCDVDVPSKYTCENICEKLLDCGNHKCKALCHPGPCESCSLKPEAVTHCCCGQTPLTEQRKSCLDEIPTCEKICCKRLKCGQPSHPHTCKSKCHEGDCPECELITKVKCRCGNMDKEIPCKELTTKADDARCEKRCTKKRSCGRHKCNQMCCIDIEHICPLPCSKTLSCGRHKCEQTCHKGRCQPCWRSSFDELFCECGAAVLYPPIPCGTRRPACDRPCSRQHACSHEVLHNCHSEATCPPCTVLTQNWCYGKHELRKAVPCHVNEISCGLPCNKPISCGRHKCITLCHAGPCEKPGQVCTQPCTTPRDLCGHICASPCHEGKCPDTPCKEMVKVTCQCGHRSMTRACVENSREFQRIASGILASKMADMQLGHSVDLEEVFGQGAKKQNQLKTLECNDECKVIERNRKLALSLQIVNPDLSGKLMPRYSDLMKHWAKKDPFFCQMVHDKLTELVQLAKTSKQKSRSYSFECMNRDKRHFVHEYCEQFGCESQAYDQEPKRNVVATAVKDKCWMPSLSLLELVQRESGQRKVPGPMLNTSKANCSLRNVEVLPLPAKKGHKLVSMPSTSKSKISQR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01131248;
90% Identity: iTF_01473596;
80% Identity: -