Basic Information

Insect: Theocolax elegans
Gene Symbol: stc_1
Assembly: GCA_026168455.1
Location: CM047428.1:88453921-88459483[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 2 7.4e+04 -4.2 1.6 15 19 448 452 447 452 0.81

2 16 0.13 4.8e+03 -0.3 0.1 4 10 481 487 480 488 0.94

3 16 5.6e-07 0.021 16.8 12.7 4 18 498 512 496 513 0.94

4 16 0.44 1.6e+04 -2.0 1.1 5 10 538 543 538 543 0.94

5 16 2.2e-07 0.0081 18.1 15.8 1 18 549 566 549 567 0.97

6 16 1.6 5.8e+04 -3.8 0.7 6 10 595 599 594 599 0.88

7 16 1.2e-09 4.4e-05 25.4 14.4 1 18 605 622 605 623 0.98

8 16 0.69 2.6e+04 -2.6 2.3 5 12 652 659 652 659 0.86

9 16 1.2e-06 0.044 15.8 13.7 4 18 670 684 663 685 0.86

10 16 1.5 5.4e+04 -3.7 2.0 5 10 714 719 714 719 0.93

11 16 0.0018 68 5.6 8.2 1 11 725 735 725 736 0.96

12 16 3e-10 1.1e-05 27.3 13.3 1 19 752 770 752 770 0.98

13 16 1.5 5.6e+04 -3.7 0.6 6 10 799 803 798 804 0.68

14 16 0.48 1.8e+04 -2.1 4.8 14 19 822 827 815 827 0.72

15 16 1.7e-07 0.0064 18.4 14.9 1 16 863 878 863 889 0.85

16 16 2.9e-05 1.1 11.3 12.2 1 19 895 914 895 914 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	2	7.4e+04	-4.2	1.6	15	19	448	452	447	452	0.81
2	16	0.13	4.8e+03	-0.3	0.1	4	10	481	487	480	488	0.94
3	16	5.6e-07	0.021	16.8	12.7	4	18	498	512	496	513	0.94
4	16	0.44	1.6e+04	-2.0	1.1	5	10	538	543	538	543	0.94
5	16	2.2e-07	0.0081	18.1	15.8	1	18	549	566	549	567	0.97
6	16	1.6	5.8e+04	-3.8	0.7	6	10	595	599	594	599	0.88
7	16	1.2e-09	4.4e-05	25.4	14.4	1	18	605	622	605	623	0.98
8	16	0.69	2.6e+04	-2.6	2.3	5	12	652	659	652	659	0.86
9	16	1.2e-06	0.044	15.8	13.7	4	18	670	684	663	685	0.86
10	16	1.5	5.4e+04	-3.7	2.0	5	10	714	719	714	719	0.93
11	16	0.0018	68	5.6	8.2	1	11	725	735	725	736	0.96
12	16	3e-10	1.1e-05	27.3	13.3	1	19	752	770	752	770	0.98
13	16	1.5	5.6e+04	-3.7	0.6	6	10	799	803	798	804	0.68
14	16	0.48	1.8e+04	-2.1	4.8	14	19	822	827	815	827	0.72
15	16	1.7e-07	0.0064	18.4	14.9	1	16	863	878	863	889	0.85
16	16	2.9e-05	1.1	11.3	12.2	1	19	895	914	895	914	0.97

Sequence Information

Coding Sequence: ATGGCTACATGGGACGGTTCCTACCAAGAGCCAGAAGCTTCAAATTATTATGTCAATTCGACTCATGGCAATCATCGGATGGTCAATGTACCTACTTGGAATTATTATTACCCACCTGCCAATAATATGTGTGCCCAAAATGTATCCGTCTATCCTATGAATGCACCTGTGGTCTACGAGCAAACCCAACCTAATTTGTATACTCCCATGGATGGAAATTCAATACCGCCAAGGGTCTATCCTCATAATGAAATCCACACTATTAACAATACGATTCATACAAGATCGTCCGATGTGCATGCTAATGCTAGTACTAGTCAGTCCCAAGGTTTTCTCGAAAGCAATAGAATGAATCCTCAACATCTGCAATCTTATTATTATAATAATTTACAAGTAACACCTAATGAATTTGCCTCAAACAACGATAAGCAAGATTACGGAGTTAATGCAAATGGTAATGACTCCAGCAACGATAGAATAAATAATGTTTATCCAAATCAAAGTTCTCATAGATCGTACGATACTGTTTTTTTTGAAGATAATAAAACAAGGGGCAATAGCAGAGGATTTGAGAATAAAAGACCAGAAAATTTTCAATATCATAATAATGGCAAGATTAACTATTGCAGAAGTAAAAATTTTAGGAAATATCCAAACGATAAACATAATTTCAATAGAAACGATACTGATAAACTACAGAATAATCAGTTAGGAGAAGATGAGTCAGAAAGTATAGGTTCTCAATCTACTGTAAAAAATAAACAAGAGAGAGTAAATAAATCATTAAGCAGAGATCAAAATAATTATAGTAAAAACACTACTTCACCAGATTCATCTGTCGAAGCTAATAGTTCAAAATTTGTAAAAACTTCAAAAACATTTTTAAATAATGGTCACGCGGAGAGGTATTACGATAGAAAAGTTCGATATAATCCTAGAGATTTTAAGCAAAAGAAGGTTAATTATTCTGAGAGTAACGGATATAATCGAAATCATTACAACAAAGACAATAAATATGATAGATGGGATAACAGGAACTACCCTGGTGATAGTAGAGATAAAGAAATAATTGACTGGAGACAAAAAGCAAACAACAAAGGAAAGAAAAGCACGTTACCTACAAAAAATTCTAATTACAAAAAATATGAAGCAGATGATGATGCAAGTCAAAGAGAAAGATTGACAGAACAACTAAATCGTGGTCAACTTGAATGTTTAGTATGTTGTGAATTTATTAGGCAGGCTGATTATGTTTGGTCATGTAATAATTGTTACCACGTTTTACACCTAAAATGCGTTCAGAAATGGGCAGTTTCATCACAGGATGAGAGTGGTTGGCGATGTCCTGCATGTCAAAATGTTACTTCAGATGTACCTTCGGATTACAAGTGTTTCTGTGGGAAAGCAACAGTACCAGAGTGGAATCGACGTGAAGTTGCACACTCTTGTGGTGAAATTTGTGGTCGTGCACGCGTTACTCAAAACTGTGTTCATAAATGTACTTTACTTTGCCATCCGGGCTCGTGTCCTCCTTGCGTAGCTATGGTTACCAAGTCTTGCGGATGTGGTAGAACATCTCAAACACAAAAATGTAGCGTAGGTACACTCTTGAGATGCGAAGAGATATGCGATCGTATATTAAATTGCGGTATACACAAATGCGTGGAAAAGTGTCATCATGGTAGCTGTGAGCCGTGCAACGAAATTATTAAGCAAGAATGCTTCTGTGGAAAGGAAAGTCGAGAAGAAACGTGCGTATTAGATTTATCACCATTCTACTCGTGTAAAAACGTGTGTGACAAACAGTTGGATTGCGGTAACCATAAGTGTACACAAATTTGTCATCCAGGTGAATGTTCACCGTGCGCCTTGAAACCCGAAAACGTAACACATTGTTGCTGCGGCCAAACAGCCTTAACCGAAAAAAGAGAAAGCTGCTTAGATCCAATTCCAAATTGTGATAAATTATGTTGCAAAAAGCTAAAGTGCGGACAACCATCGAATCCCCATACCTGCCAAACAAAGTGCCACGACGGTGATTGTCCCGAATGCGAACTAAGCACAAAAGTCAAATGTCGTTGCGGATTTATGGATAAAGAGATTCTCTGCAAGGAATTGACAACTAAAGCCGACGATGCTCGATGCGAGAAGAAGTGCACAAAGAAACGTTCGTGTGGGAAGCACAAGTGCAATCAAATGTGTTGCATCGACATCGACCACGTATGCCCAATTTTGTGTTCGAAAACCTTGAGCTGCGGAAAACACAAATGTGAACAAACGTGTCACAAAGGTAGATGTCAAACATGCTGGCGTAGCAGCTTCGACGAATTGTACTGCGAATGCGGAGCCTCGGTGATATATCCACCAATAGCTTGTGGTACGCGTCGTCCAGCGTGCGACAAGCCTTGTTCCCGCGAGCATCCGTGTGATCACGAAGTATTTCACAATTGTCACAGCGACCTCAACTGCCCACCGTGTACCGTGTTGACGCAAAAGTGGTGTTACGGTGAACACGAATTACGAAAAGCCGTGCCCTGTTACGTTACCGACGTCTCTTGCGGTTTACCGTGCAACAAACCGCTTTCCTGCGGTCGACACAAGTGTATTCAAATATGTCATTCAGGTCCATGCGAAAAACCTGGTCAAGTATGCACGCAACCGTGTACTATAGCCAGAGAACTTTGCGGTCACATTTGTGCCGCTAACTGCCACGAGGGCAAGTGCCCTGATACACCGTGTAAAGAGATGGTTAAGgttacgtgtcagtgtggtaatagagtgatgtctcgtgtatgcgaggagaattcccgtgactatcaaagaatagtgagtggaatattggcaagtaaaatggcggacatgcaacttggtcatacggtggatcttgaagaagtgttcggacaaagcactaggaaacaaaatcaacttcgtactctcgagtgcaacgatgattgtaaaacgatcgagagaaatcgtaaaatcactctcggtttacaaatagccaatccagatcttagtggtaaattaatgccaagatattgcgaacatatgaaacagtggggtaaaAAGGATCCCGAATTTTGTCAAATGGTCCATGTTAAGCTTACCGAACTGGTGCAATTAGCTAAATCGTCGAAGCAAAAGTCACGAAGCTATTCCTTTGAAATTATGAATCGAGACAAGAGACAATTTGTACATGAATCGTGCGAACACTTTGGTTGTGAGAGCCAAGCGTACGACCAAGAGCCAAAACGAAATGTCGTCGCTACGGCGGTCAAAGATAAATGTTGGTTGCCAAGTTATAGTTTACTAGAAGTTCTGCAGAGAGAAAATGGTCAACGAAAACCACCAATCCCAGGATCTACGTTGAACCGATCTAAATTGAATAGTTTAGACAGAAGTATAGATGTTTTACAGTTGAATCCAAAAAGAAATCTAAAAACCATGCCTGCAGCTTCCCCGTCAAAATCACCAGAACCAGAGACAGATTATTTTAATTACAAGGGTTGA
Protein Sequence: MATWDGSYQEPEASNYYVNSTHGNHRMVNVPTWNYYYPPANNMCAQNVSVYPMNAPVVYEQTQPNLYTPMDGNSIPPRVYPHNEIHTINNTIHTRSSDVHANASTSQSQGFLESNRMNPQHLQSYYYNNLQVTPNEFASNNDKQDYGVNANGNDSSNDRINNVYPNQSSHRSYDTVFFEDNKTRGNSRGFENKRPENFQYHNNGKINYCRSKNFRKYPNDKHNFNRNDTDKLQNNQLGEDESESIGSQSTVKNKQERVNKSLSRDQNNYSKNTTSPDSSVEANSSKFVKTSKTFLNNGHAERYYDRKVRYNPRDFKQKKVNYSESNGYNRNHYNKDNKYDRWDNRNYPGDSRDKEIIDWRQKANNKGKKSTLPTKNSNYKKYEADDDASQRERLTEQLNRGQLECLVCCEFIRQADYVWSCNNCYHVLHLKCVQKWAVSSQDESGWRCPACQNVTSDVPSDYKCFCGKATVPEWNRREVAHSCGEICGRARVTQNCVHKCTLLCHPGSCPPCVAMVTKSCGCGRTSQTQKCSVGTLLRCEEICDRILNCGIHKCVEKCHHGSCEPCNEIIKQECFCGKESREETCVLDLSPFYSCKNVCDKQLDCGNHKCTQICHPGECSPCALKPENVTHCCCGQTALTEKRESCLDPIPNCDKLCCKKLKCGQPSNPHTCQTKCHDGDCPECELSTKVKCRCGFMDKEILCKELTTKADDARCEKKCTKKRSCGKHKCNQMCCIDIDHVCPILCSKTLSCGKHKCEQTCHKGRCQTCWRSSFDELYCECGASVIYPPIACGTRRPACDKPCSREHPCDHEVFHNCHSDLNCPPCTVLTQKWCYGEHELRKAVPCYVTDVSCGLPCNKPLSCGRHKCIQICHSGPCEKPGQVCTQPCTIARELCGHICAANCHEGKCPDTPCKEMVKVTCQCGNRVMSRVCEENSRDYQRIVSGILASKMADMQLGHTVDLEEVFGQSTRKQNQLRTLECNDDCKTIERNRKITLGLQIANPDLSGKLMPRYCEHMKQWGKKDPEFCQMVHVKLTELVQLAKSSKQKSRSYSFEIMNRDKRQFVHESCEHFGCESQAYDQEPKRNVVATAVKDKCWLPSYSLLEVLQRENGQRKPPIPGSTLNRSKLNSLDRSIDVLQLNPKRNLKTMPAASPSKSPEPETDYFNYKG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -