Basic Information

Insect: Scaptomyza tumidula
Gene Symbol: -
Assembly: GCA_035044465.1
Location: JAWNNW010000147.1:1287734-1301579[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 4.9 1.1e+04 -2.7 1.8 50 62 336 350 319 363 0.59

2 30 8 1.8e+04 -3.7 1.6 20 74 384 439 345 446 0.55

3 30 5.1e-15 1.1e-11 45.3 4.9 1 86 571 643 571 644 0.85

4 30 2.5e-15 5.5e-12 46.3 4.6 1 87 671 740 671 740 0.83

5 30 6.1e-16 1.3e-12 48.2 0.4 1 87 762 834 762 834 0.85

6 30 4e-16 8.7e-13 48.8 5.3 1 87 928 998 928 998 0.83

7 30 6.5e-15 1.4e-11 44.9 3.4 1 86 1022 1093 1022 1094 0.82

8 30 9.8e-13 2.2e-09 37.9 0.9 1 87 1129 1197 1129 1197 0.80

9 30 5.5e-11 1.2e-07 32.3 1.9 1 86 1243 1312 1243 1313 0.75

10 30 6.2e-17 1.4e-13 51.4 0.3 1 87 1340 1410 1340 1410 0.83

11 30 3.7e-13 8e-10 39.3 2.4 1 86 1431 1500 1431 1501 0.82

12 30 1.1e-14 2.5e-11 44.1 2.2 1 86 1528 1599 1528 1600 0.85

13 30 4.6e-14 1e-10 42.2 1.8 1 85 1676 1744 1676 1746 0.80

14 30 2.5e-12 5.5e-09 36.6 0.1 1 86 1769 1837 1769 1838 0.82

15 30 7.1e-14 1.5e-10 41.6 1.2 1 86 1993 2061 1993 2062 0.80

16 30 4.5e-12 1e-08 35.8 1.0 1 62 2127 2186 2127 2204 0.79

17 30 0.00062 1.4 9.7 0.1 1 59 2209 2260 2209 2283 0.74

18 30 3.9e-11 8.5e-08 32.8 0.9 1 86 2298 2367 2298 2368 0.82

19 30 9.4e-15 2.1e-11 44.4 1.5 1 87 2426 2496 2426 2496 0.82

20 30 2.6e-13 5.7e-10 39.8 0.6 1 86 2531 2602 2531 2603 0.80

21 30 2.2e-11 4.8e-08 33.6 0.4 1 87 2613 2684 2613 2684 0.79

22 30 2.4e-13 5.2e-10 39.9 0.5 1 86 2707 2777 2707 2778 0.77

23 30 2.1e-05 0.046 14.4 0.1 1 57 2811 2862 2811 2876 0.84

24 30 9e-15 2e-11 44.5 0.1 1 86 2901 2973 2901 2974 0.81

25 30 8e-15 1.8e-11 44.6 1.4 1 86 3108 3180 3108 3181 0.84

26 30 1.1e-14 2.4e-11 44.2 1.7 1 87 3247 3318 3247 3318 0.82

27 30 1.1e-13 2.4e-10 41.0 2.5 1 86 3425 3495 3425 3496 0.84

28 30 4.2e-13 9.1e-10 39.1 0.2 1 87 3589 3659 3589 3659 0.85

29 30 4.4e-08 9.6e-05 23.0 0.1 1 58 3676 3724 3676 3730 0.87

30 30 9.3e-09 2e-05 25.2 1.8 5 85 3733 3797 3729 3799 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	4.9	1.1e+04	-2.7	1.8	50	62	336	350	319	363	0.59
2	30	8	1.8e+04	-3.7	1.6	20	74	384	439	345	446	0.55
3	30	5.1e-15	1.1e-11	45.3	4.9	1	86	571	643	571	644	0.85
4	30	2.5e-15	5.5e-12	46.3	4.6	1	87	671	740	671	740	0.83
5	30	6.1e-16	1.3e-12	48.2	0.4	1	87	762	834	762	834	0.85
6	30	4e-16	8.7e-13	48.8	5.3	1	87	928	998	928	998	0.83
7	30	6.5e-15	1.4e-11	44.9	3.4	1	86	1022	1093	1022	1094	0.82
8	30	9.8e-13	2.2e-09	37.9	0.9	1	87	1129	1197	1129	1197	0.80
9	30	5.5e-11	1.2e-07	32.3	1.9	1	86	1243	1312	1243	1313	0.75
10	30	6.2e-17	1.4e-13	51.4	0.3	1	87	1340	1410	1340	1410	0.83
11	30	3.7e-13	8e-10	39.3	2.4	1	86	1431	1500	1431	1501	0.82
12	30	1.1e-14	2.5e-11	44.1	2.2	1	86	1528	1599	1528	1600	0.85
13	30	4.6e-14	1e-10	42.2	1.8	1	85	1676	1744	1676	1746	0.80
14	30	2.5e-12	5.5e-09	36.6	0.1	1	86	1769	1837	1769	1838	0.82
15	30	7.1e-14	1.5e-10	41.6	1.2	1	86	1993	2061	1993	2062	0.80
16	30	4.5e-12	1e-08	35.8	1.0	1	62	2127	2186	2127	2204	0.79
17	30	0.00062	1.4	9.7	0.1	1	59	2209	2260	2209	2283	0.74
18	30	3.9e-11	8.5e-08	32.8	0.9	1	86	2298	2367	2298	2368	0.82
19	30	9.4e-15	2.1e-11	44.4	1.5	1	87	2426	2496	2426	2496	0.82
20	30	2.6e-13	5.7e-10	39.8	0.6	1	86	2531	2602	2531	2603	0.80
21	30	2.2e-11	4.8e-08	33.6	0.4	1	87	2613	2684	2613	2684	0.79
22	30	2.4e-13	5.2e-10	39.9	0.5	1	86	2707	2777	2707	2778	0.77
23	30	2.1e-05	0.046	14.4	0.1	1	57	2811	2862	2811	2876	0.84
24	30	9e-15	2e-11	44.5	0.1	1	86	2901	2973	2901	2974	0.81
25	30	8e-15	1.8e-11	44.6	1.4	1	86	3108	3180	3108	3181	0.84
26	30	1.1e-14	2.4e-11	44.2	1.7	1	87	3247	3318	3247	3318	0.82
27	30	1.1e-13	2.4e-10	41.0	2.5	1	86	3425	3495	3425	3496	0.84
28	30	4.2e-13	9.1e-10	39.1	0.2	1	87	3589	3659	3589	3659	0.85
29	30	4.4e-08	9.6e-05	23.0	0.1	1	58	3676	3724	3676	3730	0.87
30	30	9.3e-09	2e-05	25.2	1.8	5	85	3733	3797	3729	3799	0.73

Sequence Information

Coding Sequence: AtgtcacaacaacacaacaaccccccgcatcatcaacatcaacatcactactaccagcaacaacagcaacttcatcatcatcaacagcagcagcatcatcatttgcagcataaacaaatacaacaacaacagcacaattGGTACTCACATGTTGCTTCTTATCCGTCCCCGCATGCCGCTGCCTTTGCGCAGCCCTgtaagagcagcagcaacaacaataacaacaacattatgaATGCATACGGCGCGGGTGCAGGCGCGTATTATGGCTCTCCGGCAGCGGGTGGTGGTGGGGTCGGCTATAACCTTGAAGCAAATACTGTGGCTTATGCGCACAACCAGCTGctgcaataccaacaacatcagcaacagcagcaacaacaccagcaacagcagcagcagcagctcagtCAGCGCTCTTATATGCCGCCTCATGTGATGCACAGCTCGTATCCCTACATTAAGAGCGAGCCCATGGACCTGCCCGAAcgacaccagcaacagcagcagcagcagcagatgcaaCATTTTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTCCCAATCGTCACTCGCATGATGCTAACGGagaaatgataataaaatCGGAACCCATTGACGAACATGCTTTTAAGTCCAATTACATCGACGATAATACGCCGTTTGCCGATTTTGGTAAATATTCGGAATATAGCGACGATATGCTGAGTCCCAAGGTTGAGTTTGCCGTCAAGGATGAGGGCTATGGAAACCAAAAAAATCTGAAGCTGAACTATCCGGGACGCAAGCTGCTCTCTGCAGCTGAGCTAAGCACTATGCCTATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAACAGACCTACCTGCGTCATGTGGCCGAAAGCAATTGCAATATACACGAGTATGAATTCAAGTGCAACATTTGCGTTATGTCCTTCAGGACCATCGAAGAGCTGCACAAACACAAGGTTCTGCATCGCGCCGAAAAGTTTTTCTGCCACAAATACTGTGGCAAGCACTTTGACTCGATTGCAGATTGCGAATCGCATGAATACATGGAGCACGAATACGATAGCTTCGTGTGCAATATGTGCTCTGTTACGTTTCCGACACGAGAACAGCTGTATGCCCATTTGCCACAACACAAGTTTCAGCAGCGTTACGATTGCCCCATTTGCCGCTTGTGGTATCAAACGGCATTAGAGCTGCACGAGCATCGTATGGCGGCCCCCTACTTCTGTGGCAAGTATTATGCAGCAgcacatcagcagcaacaacaacagcagcagcagcagcagcagcaacaacaacaacagctgcaacaacctcaacaacagcagcaattgcagcaactATCACAACAGGGCAACTATAAACTGCAGGATTGTCATATGGGCACCATAGAAATGAATCACAAGGCGAATACAGCATTACCTGCAACGGCGGCACTTAGttcgctgctgcagcagcgccAGGCAAATGCTGACGGCGCCGCTTTGTATGCTTCTTCACTGAAGACGGAGGCAAATGTAAAACTCGAGCGCAGTTTTAGCAACTCCACAAGCGAATCGGGTTACAGCATGCAGGAGAGCAGTTATAATAATGCCTACGGCAGTGAAAATTCTCTGCATGGTGGAGGCGTTGGAATCGGTGGTCCTCAGGCGCATTCCTCGACGCTGGACGATTCAGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACTAGTCCGACGCTGCAGTTCTTTACGTTTCCCAaagatgaaaaatatttgcatcaGTGGCTGCACAATCTCAAAATGTTTCACTTTCCAGCCTCGAGCTATGCCAGCTTTCGTATCTGCAGCATGCACTTTCCCAAACGCTGCATTAATCGTTACTCGTTGTGCTATTGGGCGGTGCCGACATTTAATCTGGGTCACGACGATGTGGCCAATCTCTACCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTGGCTCGCTGCAGCATGCCCAACTGCACCAGTCAGCGCGGCGAAAGCAACCTCAAGTTCTACAACTTTCCTAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAATGCACGCCTGCCTGTTCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGTCACTTTGAGGAGCGCTGTATCGGCAAGTTTCGGCTTAAGCCTTGGGCGGTGCCCACACTTCATTTGGGTGTCCAATACGGCAAAATTCACGACAACCCCAAGAATCTGTATGTGGAGGAAAAGCGTTGCTGCCTCAACTTTTGCCGTCGCAGTCGCTCCTCCGATTTCAATATGTCTTTATATCGCTTCCCTAGGGATGAGGTGCTGCTGCGTCGTTGGTGCTACAATCTGCGTCTTGACCCAGCTGTGTATCGCGGCAAGAATCACAAAATATGCAGCGCTCACTTTATTAAGGAAGCATTAGGTCTACGCAAGCTTTCGCCAGgcGCAGTTCCAACGCTGCACCTGGGTCACAATGACACCTTCAATATATACGAGAACGAACTGTGGCCACCACCAACTCCCACCACACCCACCCACagtcatcagcagcagttgcagcaacaccagcttcagcagcagcaacaactgcatcaTAAATATCAGCGTCACTCGGCCGCATCCACATCGTCGTCGGCGTCATCGGCATCACACTATGTTGATCCGGAACTGAGTGCGTCTTTCACGAGCATGGGCGCTGCCGGCTCATCCTCCAGTCTCAACGTCAGCGACAGCATGGACATCTGTTGTGTGCCCAGTTGTGAAAGCAAGCGGCACAACAACGAGAATATTACATTCCACACAATTCCTAGGCGACCAGAGCAGATGCGCAAGTGGTGTCACAATCTCAAGATACCTGAGGACAAGATGCACAAAGGCATGCGAATATGTAGCCTACACTTTGAGCCCTATTGCATTGGTGGCTGCATGCGTCCGTTTGCTGTGCCCACACTGAATTTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTAATCAAGAAGCTTAACATACGCGAAACGTGTTGTGTGGCCGTTTGCAAGCGCAATCGTGACCGGGACCATGCCAATCTGCATCGTTTTCCCAGCAATGTGTCATTGCTCACCAAATGGTGTGCCAATTTGCAGCGTCCTGTACCGGATGGCACGAAACTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAGCGGTTGGAAAAGTGGGCTGTGCCCACTCTCATACTGGGACATGACAATATACCGTATCCGTTGCCAACGCCAGAGCAGGTTGCCGAGTTTTATGCCCGTCCCAGTGCACCAAACAATGGTGAGGAGCATGGCGAGTGCTGTGTGGAGACTTGTAAACGTAATCCAAGTGTTGATGACATTAAGCTTTATCGTCCACCCGAGGAGGCGCAGGTGCTGGCCAAATGGGCGCACAATCTAGATTTGGAAATTACCAAGCTGCCGAATTTGAGGATATGCAATCTGCACTTTGAATCCCACTGCATTGGCAAGCGAATGCGACCTTGGGCCATACCCACGCTCAATCTGGCCAGCAACATTGAAAATCTCTACGAGAATCCCGAACGTCAAATGCTCTACAAGCGACGCACACATCTCAAACCGGAAAGAGCCGCTCGAGGCTCTTTAGCAGGTGGTGTTAAGCCCACCTGGGTGCCACGTTGCTGCTTGCCGCACTGTCGCAAGGTGCGTGCCACACACAATGTCCAACTGTATCGTTTCCCCAAGCTCAATCGCTCCACGCTGGCCAAGTGGTCGCATAATCTGCAAGTCCCGATGGCGGGCAGCGCCCAACGTCGGCTCTGCTCCGCCCACTTTGAGCCGCATGTGCTCAGCAAGAAGTGCCCGGTGCCTTTGGCGGTACCCACACTGGACCTCAATACACCACCCGGCTACAAGATCTACCAGAATCCCGCCAAGCTTAAGGCTAAAAACCTTTGCCTTCAGCGCGTCTGCATTGTGGAAAGTTGCCGACGTCAGCGGGCGCAAGGTGTGCAGCTATTCCGGTTACCTCATAGCCCTACGCAGTTGCGAAAGTGGATGCACAACATCCGGATGCGACCCCGAGGAGCTATGCGACAACAATATCGCATCTGCTCACAGCACTTTGAGACACACTCGTTTAACGGGAAGAGATTAAGTGCGGGTGCAATTCCAACGCTAAACCTGGGTCATAAGGATGAGGACATTTTTCCGAATGAGGCGCAATCTTTCGTAGAAGAGCACTGCACCGTCGAAGGCTGTAATGCAGCCAAGGAGCAACCGGACGTACGTCTCTTCCGTTTCCCCACCGAGGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTTAAAATGAATCCAGTCGACTGCGTTGGTGTACGTATCTGCAACAAGCATTTCGAACCGGATTGCATTGGTGCAAAGCATCTGTACAAATGGGCAATTCCAACGCTCTGCCTGGGtcgcgatgatgatgacatcGAACTGATAGGCAATCCCAAGCCAGAGGATCGCTATGTTGATCCGGTCTTTAAATGCTGTGTGCCGACATGCGGCAAAACGCGCAAGTTTGACGAGGTGCAGATGAATAGCTTTCCCAAAGATCCCACACTTTTTCATCGCTGGCGTCACAATCTTCGTTTGGAGCATCTTAATTTCAAGGAACGCGAACGCTATAAGATCTGCAATGCGCACTTTGAGGATGTTTGCATAGGCAAGACGCGCCTTAACATTGGTTCAATACCAACTCTGGAACTGGGCCATGACGAGACTGAAGACTTGTTCCAAGTCAATCCCGAGGACCTGCAGAGCAATCTGTTTGGACGCCAGCGACGCGTGCAAGACTTCATGAGGGTCGGCATTAAGCAGGAGCCGCATCCGGAGCTAATTGAAGATATTAATTTGGATATTACCATGTCGGAAGccacagatacaaatataGCGCAGGTTAAAATCAAGAAATCATTGTCTGATTGCAAGTGCTGTGTGCCGAGCTGTGGACGCAGTCGCTTGGAGGATGGTGCTCGCCTTTTTCCCTTCCCGaatggcaaacagcagcaaagcaagTGGCGTCACAATCTACAGCTGTCTACTTCGGATGTAGACAAAACAACGCGCATTTGCAGCGCTCACTTTAGTCGTCGTTGCATCGATGGGAAGCAGCTGAGGAGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGCAGCCGATATATGAAAATCCAAAGAATATACCGGGCTTTTTTACACCCACATGTGCGCTGGCGCACTGTCGCAAGCGACGCAGCATTGATAACGAACTGCGCACCTATCGCTATCCCCGCAGCGAGGAGCTGCTTGAGAAGTGGCGCGTTAATCTACGTTTGTCACCAGATCAGTGTCGCGGACGCATCTGTGCGGATCATTTTGAGCCGCTGGTACGCGGCAAACTGAAGCTAAAGACGGGCGCGGTGCCTACGCTTAAATTGGGACACGATAAGGGCGTGGTCTTTGATAATGAAGCCATTAAGGCGTTACTGCAGCtggatgaggaggaggaggatgaaGATGGCGAAGGCGAAGGCGAAGGAGAGGGCGATGTCACTTTGAAGTCGTTAGTAAAAGTAAAGACTGAGAAGAAGGAGGAAGAACAGGAGCTTGAGATCGACGACGAGGAGGAACTGCAGGAGGATAATGAAGCGGAGTATAATGACGAGGTGGAGCATCCGGATTCAGAGGATCATGGTTATTTTGATCCGTTAGAGCTTGTGGAAACCTTCGCTGAGCGTCACAGCGATGATAACTCGGTGGACGAAGATAATGATGACGACGATAATGATGAGGATATTCCAGGCAATGACGATGAGCTCCTTATACCTGAAACACGGTCAATGCGACTTTCGCTGGCACCACGTCGCGAAAAAGTTGTCAACAATGTAACACCCATTTGTTGTCTGAAACATTGTCGAAAGGAGCGTACCGCACTTCATCATCTAAGCACCTTTGGCTTTCCCAAGGATCCACAGCTGTTGCTCAAGTGGAGCGCCAACCTGCAGTTGCCGCCGAAGGATTGTGTGGGTCGTGTATGCGTTGAGCACTTTGAGCCTGTAATGCTGGGCACACGCAAGCTGAAACAGAATGCCGTGCCCACTATAAAATTGGGGCATGCCACACCGCTCACCTACAGCTGCAATGGTAGGATGCTGTCGGGTATTTACGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGTAAAAGGAAACCGGAATCGAAGCTGGAGTTGGAGCCAgtgcagcaacagaaactggCGGAAATTAGGCCCGTCCGTCGCTGTTGCCTGCCCAGCTGTGGCAAGCAGTCGGAATTGCATGGCGTCCAGCTGCAGCGTCTGCCCAAAGATCGAATGATGCTACGGAAATGGCTGCACAATCTTAAGCTGCCACCGACAACGGATTGCACCCATATGTTCCTCTGCAGTGATCACTTTGAGATGAATGCACCGTGTCCAACTTTAAAACTGGGCCATATGGACACCAATATTTATAGGCACAACACACCCAGTTCCCTCAGTGCCGGCTGCCTAGTGTCCAAGTGTACTTGTGCGCGTCTCAATCTCTATCGTGGCTATGAACTGCCAGCAAATCAGCTGGTGCAGGAGGCATGGCTCCGTTGGTTACAGCTGCCCCATCCGCCATCGCCCCGGCACGCACAACTGTGTGTGATGCATTTTATGCAGCTCTATGAACAGGTGCCGCTACCCGATTCGGTGCCCGATTTTGTGCACCGCCAGCTGCGAGAAACTTACGAGCAAATATCCAGCTCCAGCATGGCCATGAAGCTACGCTGTGCTGTGCCCGGCTGCTACTCCAAGTATACGGACAATGTGCGTTTGACCAAGCTGCCAGTTTGCCCCAATACCTGCGCCAAGTGGGTTCACAACACCAAAATTCCATATGAAGCGTCTCGCCACTATGTGTATCGAATCTGTATGCTACATTTTGAGCCCATTTGCCTGGGTCCCGTGCGTCCTAAGGTGTGGGCAATGCCCACTCTGCAACTGCATCACacagataaaaatatatacttaaatcCCAAAGTGGACGGCAACCTACCACAGCCTATGGTGCCGCTGGAGCTGCCGCTGCGCATTAAAACGGAGCTGCCAATGTGCAACAGTCCAAGCTTTAGTGCTAGTGCAAGTCCCAGTCCGCGTGGCAAACTTCGCACCTGTTGCATTCCCAGTTGCGGACAGCAGGCTTCCGCTATGACACGTCTCTTTCGCTTTCCCAGCTCGGAGACCGCTTTGCTAAAGTGGCTGGTGAATACGCAACAAAAGCCGCGCTTTGTCGATACACAACGGCTGTTCATTTGTCAGGAACACTTTGAGGCGGAGGCCATTTGCCAAAATCAGCTTCGCAGCTGGGCGGTGCCCACGTTGAATTTGGGACATGATGGACAAATCATTCCAAATGCACGGCACAATGGCAACATTGCCGACAGTCAGGAGAACAAGCAGGCGCTGCAATTTATCTGGGCCAACTACTGCTCCGTGCTTAGTTGCTTTCAGCAAAGCAGCGAAGAGCTGCGTCTATATCCATATCCAACGGATCGACCAATTATTCGCAAGTGGGCCGCCAACTGTAAGCATCGAACTATGCAGGCCAGCAGCGATGGCTTCCAGGTTTGTCAGTCGCACTTCACGTCGGATTGTTTTAATCCTGGTACTGAAGAGCTAAAGGAGGATGCTGTACCCACGCTGGCGCTTAGCCGGATTGTGAATGAGGTGCGCTGTGTGGTTAATGGTTGCGTTAAAGATGAGGATGCACCGCGTCGTCTGTTCAAGATACCCAAGCTAGCCGCACAGATATCCGATTGGTGCCACAATTTGCGTCTTGATCGAACGGCCATAAGCGGCACAGATCCGCACGTATGTGAACGCCACTTTGAGGCACACTGCTTCAACGTGTATAATGCGCTGCGTTTAGGAGCTCGACCTACACTTCATTTGGGTCATGAAGACCTTGAAGATATATTGCCAAATCCAGCCAACTTTGAGGAGGATGCGTTCATGTGCTGTGTGCCCAACTGTGGGCGAACCAAGGATGCTGATAATGCCCTACTGTTTGGGCTGCCAAAGGTGCGCCAATCGGCGGAGAAGTGGCTGCAAAATATTCGCCTCGATCCGAGCAAAGAACAGCTGACCTGCCTAAGGATCTGCAGTGTGCACTTCGAGGCCAGATGTTTAGAGAATGGACGTCCCACCTATAGTGCGATGCCAACGCTTCATCTGGGTCACGAGGAACTGCAAGACATACATCAAATTGTTGAACCGTTGCCAACAAAGCAGAAGCTATATTGCAATAGAGATGGCGCCAGTCACGACTGCTGCTATCCTCAGTGTGTGGAGCTGCAAAAAAGCTATTTGCGCGTCACCTACGAGCTGCCCCAGAAGCAGGAGCTGCGTGAGCAATGGCTCTCCTACATGGGCCTAGAGGAACCGCTCGATAAGCAGCAGTTTCCCAAGCTCTGTCCGTTTCACTTGATCGTGCTCTATGATCACAGTGTTGATAACTTTTCGGCACATGCAGGCGAGGAGCTGCTGGACGCCGATTATGAGGCATCACGCAGCAGCGTTCGCATCCGTATTGTCAGCTGTGCGGTGCGTGGATGCAAAACGCTTAAGCCACGCGATGGAGGACGTCTACATGGCTTGCCCACTCGCCGTGATATGCTCGAAATGTGGCTACACAATATGCAGCTGGTGTTTTACGAGCAGCAACGGTATATGTACAAGATATGCAGCAAACACTTTGAGCCAAGATGTCTGACAGAGACAACCAAACGCTTGAAGCCCTGGAGTATGCCAACGCTGGAGCTGCCGGAGCGTCAACCGGGCGAAATGCAGCCGTTTCAGAATCCCACAGAAGAGGAGTGGCAGCATCTTAATGAGCAGCAGGTCAGCGCCAAAGAAATTGAGGAGCCACCAGAGACGTTGCTTAAGCTGGATCCGCTTTGCAAAATGGAGCCACCACCACAGCAGACGGAAATGGAATACGAAGAGGATTATGACTACAATTCACAGCAGCCACTAGAAATGCAAGCGCTGGAGGTGCTGCTTGAAGTTGGTCATGTCGAGAAGTGTGCCACATATGAGAAAATGGATACCGAACCAAATCCAGACTATACCGAGCAGCTCTCTCCATTGAGTACAAATATACCTCACAGCCACAGCATTGCGTCTGCCCAGAATGGCTTCCATTACAGTGCACGTGTGTGCAGCGTGTTTGGCTGCAATGTCAACTCGACTAATATAAATAGCAACATCAAGCTGCACAAGTTTCCCGTCTCAATGGATGCCATGCAAAAGTGGATGCACAACACCCAAGTGTCTGTGGACATAAAATTTGCTTGGCGTTTTCGCATCTGCAGTCATCATTTTATACCAGACTGCTTTCAGGGCTCGCGAATCAGGCGTGGCGCAATGCCCACTTTGCGTTTGGGATCGCGTCGACCCAAGCATATCTATGATAACGAGTTTAGTAGCCAACTACAGCTCGAATTGCAGTCGAAAGAGGAGGCCACTACTAAAATGCTTGAACCAGCACCAATCGAGTctcagcaacagttgcagtcaGCAAATATAGGCATGCGCCTACCGCGTCCTGCTCCGCCACGCAAATCCAGTAAATATTGTCAAATCGAAGGCTGCTCGAATCATTTAACCAGTGAGAATGTAACGCTACACAAGTTTCCGCACTCGGCGGACATGTGCGCCAAGTGGCAGCACAATACGCAGGTGCCCTTTGACCCAGAATATCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATATGTTTGGGCAATGTGCGGCTGATGCATGGCAGTGTGCCAACACTAAATCTGGGACCGCTTGCTCCCAAGAAAGTGtttgaaaatgatttcattCGTCTGGACAAGCCTAGAAGCAGTTTGGAACTTGGCGCAATGGAGCAATATGATGAGTTCGATGTTAATGATGACGATCAGGAGCAGGAGGATTATAGTTTGTTAGAGCCAGAGCTGCAGCTTCACGAAGGTAGCGATGAAGATGAGCAACCATATGACAATCACTTAAGCCGCAACAATTCGTTAAACTGGAGCAATCAGCAGCGGCGTTTTCCCAGTGCTAAGCAGGAAAATAACACCAGCTTCAATCCAGTCAAGTCGGGCTATGACAAATGCTCGTTGGTGCACTGCCAACGCCAGCGTTCGCATCATGGCGTTCACATCTATAAGTTTCCGCGCTCTAGTCAACTGCAGCAGCTTTGGATGCATAATTTGCTCATCCAATACGACGACCGACGGCCATGGAAAACAATGATTTGTAGCGTTCACTTTGAGCCGCACTGCATTAGTTTGCGCAAGTTGCGTCCCTGGGCGGTACCCACACTGGAACTAGGTGTAAATGTACCACAGGTGCTTTTTACGAATGAGGAGAGCCAGCGGCTGTATGCTCAGTCCGAAGCAGGCAGCGAATGTGATGAAGTCGAAGTAGACGTAGAGGACACCATGTTAGAGGACTTTGACGATGAGTTTAATGTTCATAATAatgatgccgatgccgatgccgatgatGACCAATTACAGACAGCTTCAAATGCTAAGAGGGAACGTCGCTCGCGATTTGATCCACTACTGCCGGGACAGTTGCCGCCATGGAAGATCAAATCGTGCTGCTTGCCCTACTGTTGCAGTCCTCGTGGGGATGGTATTAAGCTCTTTCGTCTGCCCAACAACATTAGCTCCATACGCAAATGGGAACGCGCAACAGGCATGCGGTTCTATGAGTCCCAGCGCAACACAAAACTCATTTGTAGTCGACACTTTGAGCCCTCGCTTATAGGCGTGCGTCGCCTTATGTCGAACGCGGTGCCCAGCCTCCACCTGGGACCAGAAGGCGCAGATGCTGAACCGCCTGCCGTTGGTCCACGTTGTTGCATGCTCGATTGTGCCGAGGATGCAAATGTTCAGCTACACAAGTTTCCAAGTGATCCCGTGCTGCTAGATCAATGGTGCCAGGCGCTTAATTTACTCGAAGTTGAAAGCTACTCCGGCAAATATATTTGTGACACGCATCTGCCCGCGAATGTGCTATGCTGCCTCATTTGTGGCGTTAAGGATGTGCAAATGCCAATGCTAGACTTTCCTGGAAATCGCAATCAGCGTACCAAATGGTGCTACAATCTTAAAATCGAGCCCCTGCCTAAGTGGGACAACTCAAAGCACATTTGCTGCAAGCATTTTGAGAGCTACTGTTTCCTTCAGCCGGGCAAATTGCTACCGGAGGCAATGCCAACGCAACACCTAAAGCATAGCGATAGCAACATATTCCTTAACGATGATATCATAGACAACAGCAAGATACTGCGCATCAAGGACGAGCCCATGGAAAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQHNNPPHHQHQHHYYQQQQQLHHHQQQQHHHLQHKQIQQQQHNWYSHVASYPSPHAAAFAQPCKSSSNNNNNNIMNAYGAGAGAYYGSPAAGGGGVGYNLEANTVAYAHNQLLQYQQHQQQQQQHQQQQQQQLSQRSYMPPHVMHSSYPYIKSEPMDLPERHQQQQQQQQMQHFQNPMAPPPAPAIPNRHSHDANGEMIIKSEPIDEHAFKSNYIDDNTPFADFGKYSEYSDDMLSPKVEFAVKDEGYGNQKNLKLNYPGRKLLSAAELSTMPICQRCKEVFFKKQTYLRHVAESNCNIHEYEFKCNICVMSFRTIEELHKHKVLHRAEKFFCHKYCGKHFDSIADCESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRMAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQLQQPQQQQQLQQLSQQGNYKLQDCHMGTIEMNHKANTALPATAALSSLLQQRQANADGAALYASSLKTEANVKLERSFSNSTSESGYSMQESSYNNAYGSENSLHGGGVGIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHFPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGVQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTTPTHSHQQQLQQHQLQQQQQLHHKYQRHSAASTSSSASSASHYVDPELSASFTSMGAAGSSSSLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHDNIPYPLPTPEQVAEFYARPSAPNNGEEHGECCVETCKRNPSVDDIKLYRPPEEAQVLAKWAHNLDLEITKLPNLRICNLHFESHCIGKRMRPWAIPTLNLASNIENLYENPERQMLYKRRTHLKPERAARGSLAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWSHNLQVPMAGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKLKAKNLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLNLGHKDEDIFPNEAQSFVEEHCTVEGCNAAKEQPDVRLFRFPTEDEDLLWKWCNNLKMNPVDCVGVRICNKHFEPDCIGAKHLYKWAIPTLCLGRDDDDIELIGNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFHRWRHNLRLEHLNFKERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETEDLFQVNPEDLQSNLFGRQRRVQDFMRVGIKQEPHPELIEDINLDITMSEATDTNIAQVKIKKSLSDCKCCVPSCGRSRLEDGARLFPFPNGKQQQSKWRHNLQLSTSDVDKTTRICSAHFSRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNELRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDKGVVFDNEAIKALLQLDEEEEDEDGEGEGEGEGDVTLKSLVKVKTEKKEEEQELEIDDEEELQEDNEAEYNDEVEHPDSEDHGYFDPLELVETFAERHSDDNSVDEDNDDDDNDEDIPGNDDELLIPETRSMRLSLAPRREKVVNNVTPICCLKHCRKERTALHHLSTFGFPKDPQLLLKWSANLQLPPKDCVGRVCVEHFEPVMLGTRKLKQNAVPTIKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPESKLELEPVQQQKLAEIRPVRRCCLPSCGKQSELHGVQLQRLPKDRMMLRKWLHNLKLPPTTDCTHMFLCSDHFEMNAPCPTLKLGHMDTNIYRHNTPSSLSAGCLVSKCTCARLNLYRGYELPANQLVQEAWLRWLQLPHPPSPRHAQLCVMHFMQLYEQVPLPDSVPDFVHRQLRETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPNTCAKWVHNTKIPYEASRHYVYRICMLHFEPICLGPVRPKVWAMPTLQLHHTDKNIYLNPKVDGNLPQPMVPLELPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASAMTRLFRFPSSETALLKWLVNTQQKPRFVDTQRLFICQEHFEAEAICQNQLRSWAVPTLNLGHDGQIIPNARHNGNIADSQENKQALQFIWANYCSVLSCFQQSSEELRLYPYPTDRPIIRKWAANCKHRTMQASSDGFQVCQSHFTSDCFNPGTEELKEDAVPTLALSRIVNEVRCVVNGCVKDEDAPRRLFKIPKLAAQISDWCHNLRLDRTAISGTDPHVCERHFEAHCFNVYNALRLGARPTLHLGHEDLEDILPNPANFEEDAFMCCVPNCGRTKDADNALLFGLPKVRQSAEKWLQNIRLDPSKEQLTCLRICSVHFEARCLENGRPTYSAMPTLHLGHEELQDIHQIVEPLPTKQKLYCNRDGASHDCCYPQCVELQKSYLRVTYELPQKQELREQWLSYMGLEEPLDKQQFPKLCPFHLIVLYDHSVDNFSAHAGEELLDADYEASRSSVRIRIVSCAVRGCKTLKPRDGGRLHGLPTRRDMLEMWLHNMQLVFYEQQRYMYKICSKHFEPRCLTETTKRLKPWSMPTLELPERQPGEMQPFQNPTEEEWQHLNEQQVSAKEIEEPPETLLKLDPLCKMEPPPQQTEMEYEEDYDYNSQQPLEMQALEVLLEVGHVEKCATYEKMDTEPNPDYTEQLSPLSTNIPHSHSIASAQNGFHYSARVCSVFGCNVNSTNINSNIKLHKFPVSMDAMQKWMHNTQVSVDIKFAWRFRICSHHFIPDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFSSQLQLELQSKEEATTKMLEPAPIESQQQLQSANIGMRLPRPAPPRKSSKYCQIEGCSNHLTSENVTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKVFENDFIRLDKPRSSLELGAMEQYDEFDVNDDDQEQEDYSLLEPELQLHEGSDEDEQPYDNHLSRNNSLNWSNQQRRFPSAKQENNTSFNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSSQLQQLWMHNLLIQYDDRRPWKTMICSVHFEPHCISLRKLRPWAVPTLELGVNVPQVLFTNEESQRLYAQSEAGSECDEVEVDVEDTMLEDFDDEFNVHNNDADADADDDQLQTASNAKRERRSRFDPLLPGQLPPWKIKSCCLPYCCSPRGDGIKLFRLPNNISSIRKWERATGMRFYESQRNTKLICSRHFEPSLIGVRRLMSNAVPSLHLGPEGADAEPPAVGPRCCMLDCAEDANVQLHKFPSDPVLLDQWCQALNLLEVESYSGKYICDTHLPANVLCCLICGVKDVQMPMLDFPGNRNQRTKWCYNLKIEPLPKWDNSKHICCKHFESYCFLQPGKLLPEAMPTQHLKHSDSNIFLNDDIIDNSKILRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_01321226;
80% Identity: -