Basic Information

Insect: Ephydra gracilis
Gene Symbol: stc_1
Assembly: GCA_001014675.1
Location: JXPQ01057147.1:488-4442[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 1 2.1e+04 -4.3 1.6 15 19 567 571 566 571 0.81

2 14 0.18 3.8e+03 -1.8 0.3 4 10 600 606 599 608 0.91

3 14 2e-06 0.042 14.1 18.0 1 19 612 629 602 629 0.88

4 14 6.1e-06 0.13 12.5 13.4 3 18 667 682 655 683 0.89

5 14 1 2.1e+04 -4.7 1.5 9 13 689 693 688 694 0.71

6 14 2.9e-08 0.0006 20.0 18.0 1 19 723 741 723 741 0.98

7 14 0.65 1.3e+04 -3.5 0.5 5 10 771 776 771 776 0.90

8 14 2.2e-05 0.46 10.7 15.7 4 18 789 803 782 804 0.86

9 14 0.017 3.6e+02 1.5 11.5 1 11 844 854 844 865 0.94

10 14 2.8e-10 5.7e-06 26.4 15.5 1 18 871 888 871 889 0.97

11 14 0.97 2e+04 -4.1 0.9 6 10 918 922 918 923 0.81

12 14 1 2.1e+04 -7.6 11.4 7 18 933 945 925 946 0.79

13 14 1.1e-07 0.0023 18.1 14.6 1 16 994 1009 994 1019 0.92

14 14 7.6e-08 0.0016 18.6 13.5 1 19 1026 1045 1026 1045 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	1	2.1e+04	-4.3	1.6	15	19	567	571	566	571	0.81
2	14	0.18	3.8e+03	-1.8	0.3	4	10	600	606	599	608	0.91
3	14	2e-06	0.042	14.1	18.0	1	19	612	629	602	629	0.88
4	14	6.1e-06	0.13	12.5	13.4	3	18	667	682	655	683	0.89
5	14	1	2.1e+04	-4.7	1.5	9	13	689	693	688	694	0.71
6	14	2.9e-08	0.0006	20.0	18.0	1	19	723	741	723	741	0.98
7	14	0.65	1.3e+04	-3.5	0.5	5	10	771	776	771	776	0.90
8	14	2.2e-05	0.46	10.7	15.7	4	18	789	803	782	804	0.86
9	14	0.017	3.6e+02	1.5	11.5	1	11	844	854	844	865	0.94
10	14	2.8e-10	5.7e-06	26.4	15.5	1	18	871	888	871	889	0.97
11	14	0.97	2e+04	-4.1	0.9	6	10	918	922	918	923	0.81
12	14	1	2.1e+04	-7.6	11.4	7	18	933	945	925	946	0.79
13	14	1.1e-07	0.0023	18.1	14.6	1	16	994	1009	994	1019	0.92
14	14	7.6e-08	0.0016	18.6	13.5	1	19	1026	1045	1026	1045	0.97

Sequence Information

Coding Sequence: atgcatgcaaataGTCCGCAAGGAAACGTCAACAATATGTCGCAGCTGATGCGCGGCTTCGCGTTGCATGCGGCCGACAGCGATGCGCATGTTGCCAGCAATGATAATAACCCCGCNNNNNNNNNNNNNNNNNNNNNNNNNNACCCCgctgctggtggtggtgctcctgctggtggtggtggtggtgctgctaGCTCAACAAATATGACGGCGGCCTTCTATGCAAACAATCCGGCTGCCACTGGTTCCACCAATAGTGTGCCACATATGAGTTGCGTCGACACGGCCACGGCGTCCACGGCATTCGAGCATACTGCGCGTAATAACAACCGGCAAGATTACGTAAATTTTGATCAATTCATGATGAAGCACAATTTCTTTGGCAATGGCAGCTACGCCAGCAATGGCAGCGCTTTCGGCACGCAGCCGTCAAGCACCGTACAGCAGGCAAATAACAGTTATTTCACACATGCTGCCAGCAGTGTGAGCAATAATGCAGCTGCTGCGCCCTTTGGCGGCAGCATTTATGGCCTGCAGCCGCAGTCCATGAGTCAAGGCTATAGCAATCCATTTGCCTACAACAATGCGACGTCCGTGTCAGGCAGGTTTGCAGACGAGAGCTCACACAGCGGCAACGCCGCAGCGCagcataattcaaatttattttcgaatactTGTACGGATAGCTATGCTGCTGACTGCACGCACGACGGCAGTGGTCATAAATATTACACCAATCCCTTTGCTACTGGCTTCGATCTGAAGTCGTCGAAATTGCAGGCAGATGCCAAAGAGTTTGTTCCGCGTTTTGATAATTTATCGCTGCATGACGCTGAGGTGGCAACAACGAGCAAACAAAACTACAACGCGAGCACAACGCATGTGGCCAGTGCCGATGACGGCAGCACAACACAGCGCGGCTGCATATTCGAAGACACAAGCCCTGCTGCCAATGAGGCTAGCACTGCCGCTGCTTTTAATAATGTAAACAataactacagcaacaaaaatgcacaatataccaacaataacaacaacaatgcacagaATAGTAATCGAAATCTGAGCAACGGACATGAGTCACAAAGCGGAGCGGCTACTCCAACGAAGCGCAATGGTTATCGGAATGGTGGCGGCAGTGGCGCTGGTAGTGGTgctggtggtggcggtggtagCGGGAGGCGCGCCGTGGATGCGTACGAGCGTGACGAGCATCGTTACGAACGCGGTGAGCGTGGTGACCGTTTCGCTAGCGAGCGCTATGACCGCGGCGAGCGTCATACGCGCGGCAATCGGCAGTACCGGTACGACAACCATCGGCAGAACAAGCGCCGCGACGACTGGAATCGTAATCGTGACCGCCTCAATGGTTTTCGCGTTGACGAGAAGTACGCCAATGAGAATGGCTCCAGCAGCCCACTCACGTCGCCTGAGAAAAAgtctagcaacaacaatttgtcgTCAAAGTACTCGAAGCACAGCCAGCCAGCGACATCGCCGAGTCGCGAACATGAGAAACTTTCACAGCGCGACAAGCTCATACGCGATATTGAGACACGCCGCCTAGAATGTCTGGTATGTTGCGAGTCGATTGGCTCCTATCAAAGCGTTTGGTCTTGCCGCAGCTGCTATCACATCATGCACTTGCAATGCATCATAAAATGGGCGTCGTCCTCGAAGTCTGAGGACGGCTGGCGCTGTCCTGCAtgccaaaatattgctaaagATGTGCCACGCGATTATTATTGCTTCTGTGGCAAGGAGAAGAATCCACATTTTAACCGTCAGCACACAGCGCACAGCTGCGGCGAGATGTGTGGTCGCGTCGAGGGCTGCTCGCATGCCTGCACGCTGCTATGCCATCCCGGTCCATGTCCACCGTGTCAGGCGAATGTGAAGCGCGAGTGCGGCTGCGGCCGCACAACACAGATAATGCAGTGCTGCTTGAAGAAACCGATCGCTTGCGATGCCGTCTGTGGCAAGCTGTTGAATTGCGAGCTGCACACATGTGCGGCCCAGTGTCATGAGGGCAAATGCGAGCCATGCGCTGAGAAAGTTGACCAGCGCTGCCACTGCGGCAAACAAGAGCGCCAAGTAGCTTGCACACGCGACTCCCAAGATAAACAGATGTACTCTTGTGGCAAGCCATGTGGAAAAGATCTAACCTGCGGCAATCACAAATGCAAGGACTGCTGCCATGCTGGCGATTGTCGCCCCTGTAAAATGAGCCCCGAAGTGGTGACCTCGTGCCCATGCGGCAAGATGCCTGTTCTGCAAGGTCAGCGTACTAGCTGCCTCGACGCCATACCCACTTGCGAAGGTGTGTGCAACAAGACGCTGCGCTGCGGCAAGCCCACGAACCCACATCACTGCACCAGCAAATGCCATCTGGGCAATTGCCCTCCCTGCAACAAGCAAACGGCTGTGAAATGTCGCTGCGGACATATGGATCAAATGATTAAGTGTCGCTTGTTGTCGACAAGAGCCGATGATGCGCGCTGCAAGAAGCGCTGCACCAAGAAACGTTCATGTGGCAAGCATAAATGCAATCAGGAGTGCTGCATCGATATTGATCACATCTGCCCACTGCCATGCAACTATACGCTGTCATGTGGCAAGCACAAATGCGATCAGCCTTGCCACCGCGGCAATTGTCCACCGTGCTATCGCTCCTCATTCGAGGAGCTGTACTGTGAATGTGGCGCCGAAGTGATTTACCCGCCCGTACCATGCGGCACAAAGCGGCCAGTGTGCAAAAGACCCTGCTCGCGCTCGCATCCATGCGATCATCCACCGCAGCACACTTGCCACTCGGCGGCCACATGCCCACCATGCATGATACTGACAACGAAATGGTGCTTCGGCAAGCACGANATACTGACAACGAAATGGTGCTTCGGCAAGCACGAGCAACGCAAGACCATTCCATGCTCACAGGAGAGCTTTAGCTGCGGGCTGGCATGCAACAAGCCATTGCCTTGCGGCCGGCACAAATGCATCAAATCATGCCACGAGGGACCTTGCCAAGCGCCCGGCGAAATATGCAAGCAGAGCTGCACTGTCCTCCGTGCCACATGTGGGCACAAGTGCATGGCACCCTGCCACGATGGCGACTGCCCCGACACGCCATGCAAGGAATCGGTGGAGGTACAATGCGAGTGCGGCAATCGCAAGCAAATGCGCTCTTGCCACGATCTGGTGCGTGAGTTCAGCCGCATAGCAACTGCGCAGTTGGCCTCCTCGATGGCCGAAATGCAGCGCGGCAATTATATGGAGTTAAGCGAGATACTGCAGCCAGTCAAAGTGAATAAGACCAACAAAACACTCGATTGCAACGAAGAGTGCCGTTTACTCGAGCGCAATCGACGGCTGGCCATTGGTCTGCAAGTGCGCAATCCGGATTTGACACAGAAGCTTCAAACCAAATACTCTGAATTCATACGTAATTTCTATAAGCGCGACGCCGCGCTGGTAAAGTCCATACATGACTCACTCACCACGCTGGTGAAGCTGGCAAAGGAGAGCAAGCAGAAGTCGCGCAGCCACTCGTTTCCGACAATGAACCGCGAAAAGCGTCAGCTGGTGCACGAAATGTGTGAAATGTTCGGTGTCGATTCTGTGGCCTACGATAAGGAGCCCAATCGCAACGTTGTCGCCACTGCCTTTAAAGATCGA
Protein Sequence: MHANSPQGNVNNMSQLMRGFALHAADSDAHVASNDNNPAXXXXXXXXXPAAGGGAPAGGGGGAASSTNMTAAFYANNPAATGSTNSVPHMSCVDTATASTAFEHTARNNNRQDYVNFDQFMMKHNFFGNGSYASNGSAFGTQPSSTVQQANNSYFTHAASSVSNNAAAAPFGGSIYGLQPQSMSQGYSNPFAYNNATSVSGRFADESSHSGNAAAQHNSNLFSNTCTDSYAADCTHDGSGHKYYTNPFATGFDLKSSKLQADAKEFVPRFDNLSLHDAEVATTSKQNYNASTTHVASADDGSTTQRGCIFEDTSPAANEASTAAAFNNVNNNYSNKNAQYTNNNNNNAQNSNRNLSNGHESQSGAATPTKRNGYRNGGGSGAGSGAGGGGGSGRRAVDAYERDEHRYERGERGDRFASERYDRGERHTRGNRQYRYDNHRQNKRRDDWNRNRDRLNGFRVDEKYANENGSSSPLTSPEKKSSNNNLSSKYSKHSQPATSPSREHEKLSQRDKLIRDIETRRLECLVCCESIGSYQSVWSCRSCYHIMHLQCIIKWASSSKSEDGWRCPACQNIAKDVPRDYYCFCGKEKNPHFNRQHTAHSCGEMCGRVEGCSHACTLLCHPGPCPPCQANVKRECGCGRTTQIMQCCLKKPIACDAVCGKLLNCELHTCAAQCHEGKCEPCAEKVDQRCHCGKQERQVACTRDSQDKQMYSCGKPCGKDLTCGNHKCKDCCHAGDCRPCKMSPEVVTSCPCGKMPVLQGQRTSCLDAIPTCEGVCNKTLRCGKPTNPHHCTSKCHLGNCPPCNKQTAVKCRCGHMDQMIKCRLLSTRADDARCKKRCTKKRSCGKHKCNQECCIDIDHICPLPCNYTLSCGKHKCDQPCHRGNCPPCYRSSFEELYCECGAEVIYPPVPCGTKRPVCKRPCSRSHPCDHPPQHTCHSAATCPPCMILTTKWCFGKHXILTTKWCFGKHEQRKTIPCSQESFSCGLACNKPLPCGRHKCIKSCHEGPCQAPGEICKQSCTVLRATCGHKCMAPCHDGDCPDTPCKESVEVQCECGNRKQMRSCHDLVREFSRIATAQLASSMAEMQRGNYMELSEILQPVKVNKTNKTLDCNEECRLLERNRRLAIGLQVRNPDLTQKLQTKYSEFIRNFYKRDAALVKSIHDSLTTLVKLAKESKQKSRSHSFPTMNREKRQLVHEMCEMFGVDSVAYDKEPNRNVVATAFKDR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -