Basic Information

Insect: Hypselothyrea guttata
Gene Symbol: -
Assembly: GCA_035045125.1
Location: JAWNNJ010001762.1:160734-175439[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 9 1.8e+04 -6.7 6.4 27 38 25 36 2 90 0.40

2 29 6.6e-15 1.3e-11 45.1 4.1 1 86 611 683 611 684 0.85

3 29 2.8e-15 5.8e-12 46.2 4.6 1 87 711 780 711 780 0.83

4 29 9.1e-16 1.9e-12 47.8 0.4 1 87 802 874 802 874 0.85

5 29 3.2e-16 6.6e-13 49.3 5.9 1 87 976 1046 976 1046 0.83

6 29 7.6e-15 1.6e-11 44.9 3.5 1 86 1070 1141 1070 1142 0.82

7 29 4.9e-13 9.9e-10 39.1 0.7 1 87 1177 1245 1177 1245 0.81

8 29 9.5e-11 1.9e-07 31.7 1.6 1 86 1287 1356 1287 1357 0.77

9 29 2.5e-16 5e-13 49.6 0.2 1 86 1384 1453 1384 1454 0.82

10 29 7.8e-14 1.6e-10 41.6 1.3 1 86 1475 1544 1475 1545 0.82

11 29 2.4e-14 4.9e-11 43.3 1.6 1 86 1572 1643 1572 1644 0.85

12 29 1.2e-14 2.5e-11 44.2 0.8 1 85 1718 1786 1718 1788 0.80

13 29 4.6e-12 9.4e-09 36.0 0.2 1 86 1811 1879 1811 1880 0.81

14 29 5.3e-11 1.1e-07 32.5 0.1 1 87 2021 2090 2021 2090 0.80

15 29 2.2e-13 4.4e-10 40.2 0.2 1 64 2152 2210 2152 2223 0.74

16 29 0.0033 6.8 7.6 0.0 1 58 2243 2293 2243 2308 0.78

17 29 1.2e-11 2.5e-08 34.6 0.7 1 86 2332 2401 2332 2402 0.84

18 29 3.6e-12 7.2e-09 36.3 4.8 1 86 2476 2542 2476 2543 0.83

19 29 9.9e-11 2e-07 31.7 0.0 1 86 2578 2652 2578 2653 0.78

20 29 1.2e-11 2.5e-08 34.6 1.0 1 87 2662 2736 2662 2736 0.82

21 29 3.9e-16 7.9e-13 49.0 0.1 1 86 2761 2833 2761 2834 0.81

22 29 2.3e-05 0.047 14.5 0.1 1 61 2867 2926 2867 2958 0.72

23 29 9.5e-14 1.9e-10 41.4 0.2 1 86 2961 3034 2961 3035 0.81

24 29 9.2e-13 1.9e-09 38.2 1.6 1 86 3164 3236 3164 3237 0.81

25 29 1.1e-12 2.2e-09 38.0 0.4 1 87 3308 3379 3308 3379 0.81

26 29 3.5e-12 7.2e-09 36.3 3.7 1 86 3501 3571 3501 3572 0.84

27 29 3.5e-11 7.1e-08 33.1 0.1 1 87 3651 3721 3651 3721 0.83

28 29 2.5e-08 5.1e-05 24.0 1.8 1 61 3736 3785 3736 3799 0.81

29 29 7.7e-10 1.6e-06 28.8 0.7 6 87 3792 3858 3788 3858 0.71

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	9	1.8e+04	-6.7	6.4	27	38	25	36	2	90	0.40
2	29	6.6e-15	1.3e-11	45.1	4.1	1	86	611	683	611	684	0.85
3	29	2.8e-15	5.8e-12	46.2	4.6	1	87	711	780	711	780	0.83
4	29	9.1e-16	1.9e-12	47.8	0.4	1	87	802	874	802	874	0.85
5	29	3.2e-16	6.6e-13	49.3	5.9	1	87	976	1046	976	1046	0.83
6	29	7.6e-15	1.6e-11	44.9	3.5	1	86	1070	1141	1070	1142	0.82
7	29	4.9e-13	9.9e-10	39.1	0.7	1	87	1177	1245	1177	1245	0.81
8	29	9.5e-11	1.9e-07	31.7	1.6	1	86	1287	1356	1287	1357	0.77
9	29	2.5e-16	5e-13	49.6	0.2	1	86	1384	1453	1384	1454	0.82
10	29	7.8e-14	1.6e-10	41.6	1.3	1	86	1475	1544	1475	1545	0.82
11	29	2.4e-14	4.9e-11	43.3	1.6	1	86	1572	1643	1572	1644	0.85
12	29	1.2e-14	2.5e-11	44.2	0.8	1	85	1718	1786	1718	1788	0.80
13	29	4.6e-12	9.4e-09	36.0	0.2	1	86	1811	1879	1811	1880	0.81
14	29	5.3e-11	1.1e-07	32.5	0.1	1	87	2021	2090	2021	2090	0.80
15	29	2.2e-13	4.4e-10	40.2	0.2	1	64	2152	2210	2152	2223	0.74
16	29	0.0033	6.8	7.6	0.0	1	58	2243	2293	2243	2308	0.78
17	29	1.2e-11	2.5e-08	34.6	0.7	1	86	2332	2401	2332	2402	0.84
18	29	3.6e-12	7.2e-09	36.3	4.8	1	86	2476	2542	2476	2543	0.83
19	29	9.9e-11	2e-07	31.7	0.0	1	86	2578	2652	2578	2653	0.78
20	29	1.2e-11	2.5e-08	34.6	1.0	1	87	2662	2736	2662	2736	0.82
21	29	3.9e-16	7.9e-13	49.0	0.1	1	86	2761	2833	2761	2834	0.81
22	29	2.3e-05	0.047	14.5	0.1	1	61	2867	2926	2867	2958	0.72
23	29	9.5e-14	1.9e-10	41.4	0.2	1	86	2961	3034	2961	3035	0.81
24	29	9.2e-13	1.9e-09	38.2	1.6	1	86	3164	3236	3164	3237	0.81
25	29	1.1e-12	2.2e-09	38.0	0.4	1	87	3308	3379	3308	3379	0.81
26	29	3.5e-12	7.2e-09	36.3	3.7	1	86	3501	3571	3501	3572	0.84
27	29	3.5e-11	7.1e-08	33.1	0.1	1	87	3651	3721	3651	3721	0.83
28	29	2.5e-08	5.1e-05	24.0	1.8	1	61	3736	3785	3736	3799	0.81
29	29	7.7e-10	1.6e-06	28.8	0.7	6	87	3792	3858	3788	3858	0.71

Sequence Information

Coding Sequence: ATGTCACAACACAACAATTCCCCGCAATCTTCTCATCTGCATCACCATCACtactatcagcagcagcagcagcaacaacaacagcaacattatcagcagcagcaacaactacaacacaagcaactgcaacaacaacatcagcagcagcaacaacaacaacacagttGGTACTCACATGTTGCTTCCTACCCCGCCCCCCATCACTTTGCGCCGCCCTGCAAaggcagcaccaacaacaacaacagcagcaacaacaacatgatgCATGCCGCCTACGGCgcatcggcagcggcagcaggtGCCTACTACAacaccccctccccctcccccgctgctgctgtggctgcctcTGCTGGGGTTGGGGGAGTGGGTGGGGGTGGGGCAGGCTATAACCTTGAGCCCAGCAGCGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcagcaacaacaacaacaacagcagcagcagttgcaacttgGACAGCGTCCCTCCTACTTGCCACACGGCTTGATGCACAGCTCGTATCCCTATATTAAAAGCGAGCCCTTGGAGCTGCCCGACGACAGAGTTgcgcgacaacaacaacagcaacatcagcagcagcagcaacaacaacattatcCGAATCCCATGGCACCTCCCCCCGCACCTCTTGCTGGCAACCGTCATTCGCTCGAAGCCAGCGGcgaaatgataataaaatCGGAACCTATTGATGAACATGCGTACAAATCGAATTACATTGATGATAATACGCCCTTTGCCGACTTTAGCAAATATCCCGAGTTCAACGATGACATGCTGAATCCCAAAGTGGAGCTGGCCGTTAAGGATGAGCTCTATGGCAATCACAAGAACCCGCTTAGCTATCCGCGTCGCAAGCTGCAGATGGAGCGCTCAGCGGAAAGCCTGCCCATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGATCTACTtgcggcatgtggcagagAGCAGTTGCAACATGCAGGAGTATGATTTCAAGTGCAACATCTGTCCCATGTCGTTCATGAGCAGCGCCGAGCTGCAGAAGCACAAGCAACTGCATAAAAGCGATATATTCTTCTGCCACAAGTACTGTGGCAAGTACTTTGATACAATTGCCGAATGCGAGTCGCACGAGTATATGCAACATGAGTATGATAGCTTTGTTTGTAATATGTGTTCCGGTACGTTTGGGACGCGGGAAGAGCTGTATGCGCACTTGCCGCAACACAAGTTCCAGCAGCGTTACGATTGCCCCATTTGCCGCTTGTGGTACCAGACGCCGCTGGAGTTGCACGAGCATCGGATAGCAGCGCCCTACTTCTGTGGCAAGTATTATGCGGGTGCACAAAGTGCAACAacgcatcagcaacagcagcagcagcaacaacacccacatcaacatcaacaacaacagcagcagcagcagcagcaacatcatgcGCAGCAACAGGCCAACTATAAACTGCAAGATTGCCACATGGGCGCTATGGAAATGCCAGCTGCCCATCACAAACAGAATTCAACGGCTTTGCCAGCGACGGCTGCACTTAGTTCACTGTTGCAGCAACGCCAGGCGAATGCAGACGGTGCCGGCATGTACTCTTCAGCGATGAAGAGCGAAGTGAACGCGAACGTGAAGCTGGAGCGCAGCTACAGCACTTCCACCAGCGAATCTGGCTACAGTCTGCACGACAGCAGCTATAACAATGCGTACGCCAGCGATACCTCCTTGAACAGTGGCTCGATTGGTGGACCGCAGGCGCACTCTTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCATTGTGCGGCGTGCGTAAGAGCACCAGCCCAACGCTGCAGTTCTTTACGTTTCCCAAGGATGACAAATATCTGCATCAGTGGCTGCACAATCTGAAAATGTTCCATATACCGGCGTCGACTTATGCGAGCTTTCGCATCTGCAGCATGCACTTTCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCTGTGCCCACGTTCAATTTGGGGCACGACGATGTGGCCAATCTGTATCAGAATCGGGAGCTAACAAACACGTTTACCACCGGCGAGGTGGCACGTTGCAGCATGCCCAATTGCACCAGCCAGCGGGGCGAGAGCAATTTGAAATTCTACAATTTCCCCAAGGATATTAAGAGTCTGATCAAATGGTGCCAGAACGCCCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGACACTTTGAGGAGCGTTGCATTGGCAAGTTTCGGCTGAAACCGTGGGCTGTGCCCACACTGCACTTGGGCGCCCAATACGGCAAGATTCACGACAATCCAAAGAACTTGTATGTGGAGGAAAAACGTTGCTGCCTCAATTTCTGTCGTCGCAGTCGTTCCTCCGACTTCAACATGTCGCTCTACCGCTTCCCCAGAGATGAGGTGCTGCTGCGACGCTGGTGCTACAATCTGCGGCTCGATCCAGTTGTCTATCGTGGCAAGAATCACAAAATATGCAGTGCTCACTTCATCAAAGAGGCGTTGGGTCTGCGCAAACTATCGCCGGGTGCGGTGCCTACGTTGCATCTAGGCCACAACGAcacattcaacatttatgAGAACGAGCTCTGGCCCCCGCCGACGCCCTCAACGCCCACCAgtctgcaacagcagcagcatcagcagcaaatgcagcagcatcaactgcagcaacagcacgcCAGCTATCACAGCAGCAAGTATCAGCGCCATTCTGCGGCTGCCTCCACTTCCTCATCTGCCAGCTCCACTTCACGTGGACATTACGTGGATCCGGAGCTAAGTGCGGCGTACATGGGCATGGGCAGCTCGGGATCATCGGGTCTGAACGTGAGCGACAGCATGGACATTTGCTGTGTGCCCAGCTGCGAGAGTAAACGGCACAATAACGAGAACATCACCTTCCACACCATACCCAGAAGGCCGGAACAGATGCGCAAATGGTGTCATAACATCAAGATTCCCGAGGATAAGATGCACAAGGGCATGCGCATCTGCAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCCGTGCCCACGCTGCACCTGGGACACGATGATGAGGACATACATCGCAATCCGGACGTCATCAAGAAGCTGAACATCAGGGAAACCTGCTGTGTGGCCGTGTGCAAACGCAATCGGGACCGGGATCATGCCAATCTGCATCGTTTCCCCAGTAATGTCACGCTGCTGACCAAATGGTGTGCCAACCTGCAGCGTCCTGTGCCGGATGGCAGCAAGCTCTTCAACGATGCCATCTGCGAGGTGCATTTCGAGGATCGTTGCTTGAGAAACAAGCGACTGGAGAAGTGGGCGGTGCCCACCCTAGTGCTGGGCCATGAAAACATCGCCTATCCTCTGCCAACACCTGAGCAGGTGGCGGAGTTCTATGCACGTCCGAGTGCGCCGAATAATGGCGAGGAGCAGGGCGAGTGTTGTGTGGAGAGCTGTAAGCGTAATCCCAGCGTGGATGACATTAAACTCTATCGTTCGCCGGAGGATACGTCGGTGCTGGCGAAATGGGCTCACAATCTGGAGATCGATGCAGCTCAGCTGCCCAACCTGCGCATCTGCAATCTGCACTTTGAGGCCCATTGCATTGGCAAGCGTATGCGTCCCTGGGCCATACCCACGCTCAATCTGTCCAGCAATATCGAGAATCTGCACGAGAATCCCGAGCACAATATGCTCTACAAGCGTCGCAAACATCACAATCGTCAAGCAGCCTCGTCGTCCCTTGTGAAACCCACTTGGGTGCCCCGTTGCTGTCTGCCCCACTGCCGCAAGGTGCGGGCGTTGCACAATGTGCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAATGGGCGCACAATCTGCAGGTGCCCATGGTGGGCAGTGCTCAGCGGCGTCTCTGCTCGGCCCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGCCCGGTGCCGCTGGCAGTTCCAACGCTGGAGCTCAATTCGCCGCCTGGCTATAAGATCTACCAGAATCCCGCCAAGTTGAAGGCCAACAAGCTGTGCCTGCAACGTGTCTGCATTGTGGAGAGCTGCCGCCGTCAGCGAGGACCCGGCGTAAAGCTGTTCCGGCTGCCCCACAGTCCAACGCAACTGCGCAAATGGATGCACAATATCAAGATGCGTCCCAGGGGCTCCATGCGACAGCAGTATCGCATCTGCTCCTCGCACTTTGAGTCGCATTCGTTCAATGGCAAGCGCTTGAGCGCGGGCGCCATACCCACGCTGGAGTTGGGCCATGAGGACGAGGATATCTATCCTAATGAAGCGCAATCGTTTGTCGAGGAACGCTGCGCTGTGGAGGGCTGTGAGGCGTCCAAGGAACAGACAGAGGTGCGTGTCTTCCGCTTTCCCACTGACGATGAGGATTTGCTGTGGAAGTGGTGCAATAATCTGAAAATGAATCCCGTGGACTGCATCGGCGTGCGCATCTGCAACAAACACTTCGAACCGGACTGCATTGGACCCAAACATCTGTACAAATGGGCCATACCCACGCTGGAGTTGGGCCACGACGATTCCGAAATCGAGCTCATACCCAATCCGAAGCCAGAGGATCGCTACGTTGATCCCATCTTCAAGTGCTGTGTTCCCACGTGCGGCAAGACGCGCAAATTCGATGAGGTGCAAATGAACAGCTTTCCCAAAGATGCGGATCTTTTCCATCGCTGGCGGCATAATCTCCGCCTTGATCATCTCAATTTCAAGGAGCGCGAACGCTACAAAATCTGCAATGCGCACTTTGAGGATATTTGTATTGGCAAAACGCGACTCAACATTGGCTCCATACCCACGCTGGAGTTGGGCCACGACGATACGGAAGATCTCTTTCAGGTGAATCCCGAGGATCTGCAGAGCAATCTGTTTGGTCGCCAGCGACGTGTGCGCACCCTCTCCATCAAGCAGGAGGAGCACTCTGAGCAGGAAGAGGAGGACATCAAGCCAAACATTAGCGTGGCGAAGGCAACAGCTATAAACACAAATCAGgttaaaataaagaaatcacTGGTGGACTGCAGGTGCTGCGTGCCTGGCTGTGATCGCAGTCGCTTGGAGGACGGCGCTCGCCTGTTTCCCTTTCCCAATggcaagcaacagcagctcaaGTGGCGTCAGAATCTGCGTCTGGAGCCCTCCGATGTGGACAAAAGCAGTCGGGTGTGCAGTGTGCATTTCAACAAACGTTGCATCGATGGAAAACAGCTGCGTGGCTGGGCCATCCCCACACAGCAATTGGGACACAACGAGCAGCCTATCTATGAGAATCCAAAGAATATTCCCGGCTTCTTTACACCCACATGTGCGTTGGCGCATTGCCGCAGGCGTCGCAGCATTGATAATGATCTGCGCACCTATCGGTATCCACGTTGCGAGGATCTGCTGGAGAAATGGCGAGTCAATCTGCGCCTGGCGCCGGATCAATGCCGAGGACGCATCTGTGCGGATCACTTTGAGCCCATGGTGCGAGgtaagctgaagctgaagacgGGGGCGGTGCCCACACTGAAGCTGGGTCACAATGAGGGCGTGGTCTTTGATAATGAGGCAATCAAAGCAGGAATGCAACAGGATGAGGACGGCGAGTTGCCAGTTCGTATTAAGAGGGAGAGAATCGATGAGGAACCCGAGAtcaaacaaaagcagcagaatGAAGATGAGGACGAGAATGAAttcgacaacgacaacgataaCGAAGGCGAAGATGAAGACAAGCAAACGAAAGTTAAAGAGGAACCAGAGCCAGATGCGGATGGGGATGAAGAGGATCATGGGTATTTCGATCCCCTGGAACTGGTTGAAACGTTTGCCGAGGATAACACCGCCGATATGGAAGATAGCGTTGACAACGATGCCAACGATGAtgaactgctgctgccggATAATCCGCCCAGAACGATGAAAGGTGTCATACATAATTCCACGCCAATTTGCGCATTAAAGCACTGTCGCAGAGAGAGCACCTCCCGCCAACTGCTGAGCACCTACGGCTTTCCCAAAAATCCCGACGTGTTGCTTAAATGGAGCGCCAATTTGCAACTGCCGCTAGAGGCGTGCGTTGGCCGCCTGTGCGTTGATCATTTTGACCCTGACGTTATCGTTAATCGCAATCTGAGGAAATATGCAGTGCCCACATTGAATCTGGGACATGAGGAACCGCTTGTCTACGACTGCAAAGGTCAGAAGGATGGCATCTATGACGAGCAGCCGCAACATTCGGTTTTTCGGCTTTCCAGCCTAAAACACTGTCGCAAAAGGAACCTAAAACAGGAGCCACAGGATCAGGCGGAAGAGAttaagagacagcgacaaaAAGGCGAAAGATGTTGCGTCATCAGTTGTGACAAAGAGCCCGCGTTGCATGGCGTGAAGCTGCATAAACTGCCCAGGGACAAACGCCAGCAACGCAAATGGTTAGATAATTTAAGGCTCGATGTCAGGCCCACAAACCTACTCAAAACTGTCGTCTGCAGCAATCACTTTGATCCCGACTTGGAGTCGTGCATGCGCGTGGAGGAGCTGGTGCCCACCTTGGATCTGGGGCACAATTGCACGCTCATGTATTACAATCAACCGAAGAGCGGCTTTGCCACGTCCTGCCTGGTGCCGAGTTGTCCCTGCGCCCGCTTGAATCTCTATCGCTGCTATGAACTGCCCGCCCATCCGATCGTGCAGCAGGCgtggctgcagtggctgcGATTGCCCAAGCCCAAGTTGGCCATCGATGCGCAGGTCTGCGTCATGCATTACATGCAGCTCTATGAGCAGGTGCCTCTGCCGCCACAGCTGCAGGGCATCGTGATGCAGCTGATGCAGCGCACCTACGACGAGATCGCGTTCTCGACGATGGCCATGAAGCTGCGCTGCGCCGTCCCCGGCTGTTTTACTAAGTATATCGACACCATCCGATTAACTGAGCTGCCAAGCTGCCCCGAAACCTGCGCTAAATGGATACACAACACCAAAATAGACTATGATCAAACGCGACATTACATGTACCGCATCTGTTTGTTGCACTTTGAGCCCCACTGTCTGGGCGCCGTGCGTCCCAAGTCATGGGCCATGCCcactctgctgctgcagcacgaCGAAGCGGATCTTTATTTGAATCCCAAGCAAGAGCCGCAAGCAGAGCTCGACGCAGACGAAGAAGATCTGCATTTCGAAGCACAGTCATACGATACTCAGTCGGAGCCTGAATCTACGCCTCTGGGGCTGCCCTTGAGAATAAAAACCCATCTTTCGGGCAGTACCGGCGCCAGTGCAAGTCCCAGCCCACTTGGCCAGGAACGTGTCTGTTGCATTCCAAGTTGCGgccagcagcagacgcagctcTATTCCTTCCCCAGCTCAAAGTGCGAACTGGCCAAGTGGCTGGTGaacacgcagcagcagccacgaCACGTGGACATAAAGCATCTGTTTGTATGCCAGGAGCACTTCGAACCGGAAACCTTCTCCAGGAGAAAATTTCCAAGTTGGGCTATACCCACACTAAAGTTGGGACACGATGACTATATCATACCGGTCATCAAGCCTAGTGGAGGCATTGCCTCGGTCAACGAATCCAAACAGGTTATGGAATACATCTGGCAGAACTATTGCTCCGTGTTGTCTTGCTTTCAACGGCGCAGCGATGAAGTGCGTCTACTGCCCTATCCCACGGATGCGGTCATCAGGCGCCAATGGGGAAACTACTGCGGACACAATCTGTACAGCAACGGCCTGCATGGCAGCGATGGATATCAGGTGTGCTCAGCGCATTTTACAGCCGACTGCTTTGATCGAATCACTGGAGAACTTAAGGAGACTGCTATGCCAACGATTGAGCTGTCCCATTCCAAAGCTTGGCATTGTGTGGTCACTGGTTGTGTTAGGACCGGGCTTAAACGACGCAGTCGACTGTATCAGATGCCCAAACGTTGCAGTCAGCTGACTGATTGGTGTCACAATCTGCAGCTGAATCCGGCCACCATCCAGATGTCAGAGCGGCCCCAGTATGTTTGTGCGCTGCACTTCGAGAGAGAATGCTTTAAAAAACTGTATCAATTGCGTGCTGGGTCTGTGCCCACGTTGCATTTGGGCCATTCGGCAGACATCGAGCTGCGCATGTATCCGAAGCAATGGGCTAAGGAAACGGAAGTCACGTTCTGCTGTGTGCCCAATTGTAAACGTACCAAGGAGGGCGGCAAGGAGGAGATCAAGCTGTTTACATTCCCCAGGCAGAAGGCATTGATAGATCGTTGGTTGTACAACATACGCCTGAAGCTGAACAGCGATGAGGTGCCCATGATGAGGGTTTGCGACGCCCACTTTGCGCCACATCACTTGAACGGCGATCAGCTGAAGCTCAAAGCGGTGCCAACACTGGGATTGGGCCACAATGATCTGAGGGACATCTACCGTGCGGGCACAACTTTTGTCAAGCCCATCAAACGGTACTTGAATCGCAACGGCATGAGTTTCGAGTGTTGTTTTCCGCTGTGCACGGAGCTGCAGAAGTCATACCAAAGAATTAACTACGAGCTGCCAGAGTCGGAGGCACTCTATAACAAATGGCTGGATTACATGGGCATCGAGGACCCCCTGCAGCTTGAAAAGGAGAAGGAGCAATCGTTAAAGCTATGCCCGCTGCACTTGGTCATGATGGTCGAGTACAGCAGCGAGCACTTTGAGGAGCATCAGTCGGATGAGCTGATGGAACAGAACTACAAAGCGGCCAAGAGCAGCGTTCGCCTGCGAGCCATTAGTTGTGGTGTGCTCGGTTGCAAGTTCATTCAATCGCGTGATGGCGGTCCTCTGCATAGTCTGCCGACGCGTAAGGATCTGCTGCAGAGGTGGGTGCATAACATGCAGATTGTGTTCTATGAGAAGGAGCGCTATCTCAACAAGATCTGCAGTCAGCACTTTGAACGCACCTGTTTCATGGACGACGTCACACGCCGTCTGAAACCCTGGAGCGTGCCTACACTGCAGCTGCCCGAGGTGCAGGAGGGTGCGAAGCCAGCTTACGGGCATATTACGGAAGCAGAATGGCATGCGATGACAAAACTATGGAAGGCAGAGAAGCTGCAAATGGAATTGGACGTGAAGAAGGAGGAACCACCTGAAGAGGTCATTACGGATGCTCCAATAAAGCAGGAGCCGGAGCAACCAGAAAAATCAGCGCAGCCAGAACAGTTGCTGGATGAAAGCAATTCGCAGCAGCCGTTGGATATGGGAGAGTTGGAGGTGCTGCTGGAGGTGGGACATGTGGAGCAGTGCTCCACCTACGAGCAAGCGTATACAAAGCCTCCGTTGGACGTAAGTGCAGTCGTAAGACCCTCATACTTGACGGCGAGCCGGAATAGCAATCGCTATTGCTGCGTCAGGGGCTGCAGTGTCACAATTCATAATATGGGCGACGATGTGAAGCTGCATTGTTATCCGCTGCCGGTGGAGGCCAGATACAAATGGATGCACAATACGCAGGTGAATGTGGATGTGAATCATGCGCATCGTTATCGCATTTGCAGCTATCACTTTAAGCCCGAATGCTTCAATGGCACGCGCTTGCGACGTGGCTCGATGCCCACATTGCAATTGGGCTCAAATCATCCAAAAAATATCTACGACAGCGAATTCGAGCTGCCTGCTGCTCAAACTGAGTACCACTTGCCCAATCACCTGTCTGCGGTTAAGCTAAGCGAAGCGACTAATCCTGTTTCCAACCATttgatgggtacagggtatatcaataatatcgCGTTGTGCCTGCCACCTGCCGGACCGCCGCTTCGGATGAATCGGTTCTGTCAGATCGATAGCTGCTCCAACTGCCTGGGCGTCGGCTACATAACACTACACAAGTTTCCCGCATCGCCAGAGATGTACACGAAGTGGCACCACAATACGCAGATACCCTTTGATCCCAGATTCCCCTGGCGCTATCGCATCTGCTCGGCACACTTTGAGCCCAGATGCCTGATGTACTTGCGCCTGCTGCCTGGCAGCGTGCCCACGCTCAACTTGAGTCCAAGTGCGCCGGAGCAGCTGTTTGAAAACGAGTTCGAAGTGTGTAAACAGGAGAACGAAGAGCTGGAGCAGAGCGACGGCGAGCAACAATGGCCGATTAAGCAGGAACGAATCGAGCAGTCGCAGTCAAATCCAGAGGAAGAGGAATGGGATatggagcaggaggagcaggaacAGCAGGAGATGAGCTTCCTGGAGCCAGAGATGCAGCTGTATGAGGAAcaggatgcggatgcggatgcgaatgGCTATGCCGAACAGTCCATAACGGATTATCAGTTTGACTACAACAGCTGCCAGGACATAAAACCCAGGACTGTCGATGGCTTCAATCAAGTCAAGCCTGGCTACGACAAGTGCTCGTTGGCGCATTGCCAGCGAACGCGTTCCCAGCACGGCGTGCATCTCTACAAGTTTCCACGCTCgcatctgctgcagcagcgttGGATGCACAATCTGCGCGTTCGGTACGACGAGCGACGTCCATGGAAGACGATGATCTGCAGCGCACACTTCGAGCCGCATTGCATACAACTGCGCAAGCTCTGCTTTGGCTCTGTGCCCACGTTGGAGCTGGGCGATAACATACCAGAAACGATCTATACCAACGAGGAGACCCAGCAGCACCTGCAGGAGAACTACGAGGACTCGCTGCCAGCTGATCACCACGAAGACGAGCAGAGTCTCGGTGTGCCGGAGTACAGTCTGGAAGAGGAACAGTTTGAGTATAAAGTAAGGCCCATCAGAGGTCGCGGGCGTCCGCCACGCGATGAGGCGGGCCTCTGGCCATCGACGAAAATCAAAATGTGCGCTCTACCTCATTGCCGCAGTCCACGCGGCGAGGGCATCAAACTGTTTCGGCTGCCCAACAAAGTGTGCGACATCAGGAAATGGGAGCTGGCAACTGGCTTGGTCTTCAGCGAAACCCAACGCAACACAAAACTCATCTGCAGTCGTCACTTCGATCCGCAGCTGATCGGTGTGCGACGTCTCATTTACAACGCTGTGCCGACGCTCAATTTGCGGCCCCCAAGAGGGACGATGCCTGCTAATCAGGCACGCTGTTGCATCGAGGGTTGCGCTGAGAGCAAGCTGCAGCGGTTTCCAAGTGaTCCCCAGTTGAGAGCACAATGGTGCCAAGCGCTCAACCTTCCGGATGATTGCGAAAGCTACCACGATAAACACATTTGTGCAGCTCATCTGCCTCAGGATGTGCTCAGTTGCTTGATTTGTGGCGACGAGGAGGAGATGCAGCTGCCGTTGCTGGCATTCCCTGAGAATCGTAATCATCGCGCCAAATGGTGTTATAATCTCAAGATCGAACCCATACCCAAATGGGACAACTCCAAACGTGTTTGCAGCAAACACTTTGAGCGCTATTGCTTTCTGGCGCCTGGCCAATTGGTGGCCGAGGCAGCGCCGACGTTGCATTTGAAACACTCGGACGGTAATATATTCCTAAACGATTATGCCATAGATCCTAACAAGGTGATGATTAAGGAGGAGCCTCTCGAGCACAGCGACGATCTGATGCTCTAA
Protein Sequence: MSQHNNSPQSSHLHHHHYYQQQQQQQQQQHYQQQQQLQHKQLQQQHQQQQQQQHSWYSHVASYPAPHHFAPPCKGSTNNNNSSNNNMMHAAYGASAAAAGAYYNTPSPSPAAAVAASAGVGGVGGGGAGYNLEPSSVAYAHNQLLQYQQQQQQQQQQQQQQQLQLGQRPSYLPHGLMHSSYPYIKSEPLELPDDRVARQQQQQHQQQQQQQHYPNPMAPPPAPLAGNRHSLEASGEMIIKSEPIDEHAYKSNYIDDNTPFADFSKYPEFNDDMLNPKVELAVKDELYGNHKNPLSYPRRKLQMERSAESLPICQRCKEVFFKKQIYLRHVAESSCNMQEYDFKCNICPMSFMSSAELQKHKQLHKSDIFFCHKYCGKYFDTIAECESHEYMQHEYDSFVCNMCSGTFGTREELYAHLPQHKFQQRYDCPICRLWYQTPLELHEHRIAAPYFCGKYYAGAQSATTHQQQQQQQQHPHQHQQQQQQQQQQHHAQQQANYKLQDCHMGAMEMPAAHHKQNSTALPATAALSSLLQQRQANADGAGMYSSAMKSEVNANVKLERSYSTSTSESGYSLHDSSYNNAYASDTSLNSGSIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASTYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPVVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTSLQQQQHQQQMQQHQLQQQHASYHSSKYQRHSAAASTSSSASSTSRGHYVDPELSAAYMGMGSSGSSGLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNIKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVTLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVESCKRNPSVDDIKLYRSPEDTSVLAKWAHNLEIDAAQLPNLRICNLHFEAHCIGKRMRPWAIPTLNLSSNIENLHENPEHNMLYKRRKHHNRQAASSSLVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLELNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGPGVKLFRLPHSPTQLRKWMHNIKMRPRGSMRQQYRICSSHFESHSFNGKRLSAGAIPTLELGHEDEDIYPNEAQSFVEERCAVEGCEASKEQTEVRVFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFEPDCIGPKHLYKWAIPTLELGHDDSEIELIPNPKPEDRYVDPIFKCCVPTCGKTRKFDEVQMNSFPKDADLFHRWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDDTEDLFQVNPEDLQSNLFGRQRRVRTLSIKQEEHSEQEEEDIKPNISVAKATAINTNQVKIKKSLVDCRCCVPGCDRSRLEDGARLFPFPNGKQQQLKWRQNLRLEPSDVDKSSRVCSVHFNKRCIDGKQLRGWAIPTQQLGHNEQPIYENPKNIPGFFTPTCALAHCRRRRSIDNDLRTYRYPRCEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHNEGVVFDNEAIKAGMQQDEDGELPVRIKRERIDEEPEIKQKQQNEDEDENEFDNDNDNEGEDEDKQTKVKEEPEPDADGDEEDHGYFDPLELVETFAEDNTADMEDSVDNDANDDELLLPDNPPRTMKGVIHNSTPICALKHCRRESTSRQLLSTYGFPKNPDVLLKWSANLQLPLEACVGRLCVDHFDPDVIVNRNLRKYAVPTLNLGHEEPLVYDCKGQKDGIYDEQPQHSVFRLSSLKHCRKRNLKQEPQDQAEEIKRQRQKGERCCVISCDKEPALHGVKLHKLPRDKRQQRKWLDNLRLDVRPTNLLKTVVCSNHFDPDLESCMRVEELVPTLDLGHNCTLMYYNQPKSGFATSCLVPSCPCARLNLYRCYELPAHPIVQQAWLQWLRLPKPKLAIDAQVCVMHYMQLYEQVPLPPQLQGIVMQLMQRTYDEIAFSTMAMKLRCAVPGCFTKYIDTIRLTELPSCPETCAKWIHNTKIDYDQTRHYMYRICLLHFEPHCLGAVRPKSWAMPTLLLQHDEADLYLNPKQEPQAELDADEEDLHFEAQSYDTQSEPESTPLGLPLRIKTHLSGSTGASASPSPLGQERVCCIPSCGQQQTQLYSFPSSKCELAKWLVNTQQQPRHVDIKHLFVCQEHFEPETFSRRKFPSWAIPTLKLGHDDYIIPVIKPSGGIASVNESKQVMEYIWQNYCSVLSCFQRRSDEVRLLPYPTDAVIRRQWGNYCGHNLYSNGLHGSDGYQVCSAHFTADCFDRITGELKETAMPTIELSHSKAWHCVVTGCVRTGLKRRSRLYQMPKRCSQLTDWCHNLQLNPATIQMSERPQYVCALHFERECFKKLYQLRAGSVPTLHLGHSADIELRMYPKQWAKETEVTFCCVPNCKRTKEGGKEEIKLFTFPRQKALIDRWLYNIRLKLNSDEVPMMRVCDAHFAPHHLNGDQLKLKAVPTLGLGHNDLRDIYRAGTTFVKPIKRYLNRNGMSFECCFPLCTELQKSYQRINYELPESEALYNKWLDYMGIEDPLQLEKEKEQSLKLCPLHLVMMVEYSSEHFEEHQSDELMEQNYKAAKSSVRLRAISCGVLGCKFIQSRDGGPLHSLPTRKDLLQRWVHNMQIVFYEKERYLNKICSQHFERTCFMDDVTRRLKPWSVPTLQLPEVQEGAKPAYGHITEAEWHAMTKLWKAEKLQMELDVKKEEPPEEVITDAPIKQEPEQPEKSAQPEQLLDESNSQQPLDMGELEVLLEVGHVEQCSTYEQAYTKPPLDVSAVVRPSYLTASRNSNRYCCVRGCSVTIHNMGDDVKLHCYPLPVEARYKWMHNTQVNVDVNHAHRYRICSYHFKPECFNGTRLRRGSMPTLQLGSNHPKNIYDSEFELPAAQTEYHLPNHLSAVKLSEATNPVSNHLMGTGYINNIALCLPPAGPPLRMNRFCQIDSCSNCLGVGYITLHKFPASPEMYTKWHHNTQIPFDPRFPWRYRICSAHFEPRCLMYLRLLPGSVPTLNLSPSAPEQLFENEFEVCKQENEELEQSDGEQQWPIKQERIEQSQSNPEEEEWDMEQEEQEQQEMSFLEPEMQLYEEQDADADANGYAEQSITDYQFDYNSCQDIKPRTVDGFNQVKPGYDKCSLAHCQRTRSQHGVHLYKFPRSHLLQQRWMHNLRVRYDERRPWKTMICSAHFEPHCIQLRKLCFGSVPTLELGDNIPETIYTNEETQQHLQENYEDSLPADHHEDEQSLGVPEYSLEEEQFEYKVRPIRGRGRPPRDEAGLWPSTKIKMCALPHCRSPRGEGIKLFRLPNKVCDIRKWELATGLVFSETQRNTKLICSRHFDPQLIGVRRLIYNAVPTLNLRPPRGTMPANQARCCIEGCAESKLQRFPSDPQLRAQWCQALNLPDDCESYHDKHICAAHLPQDVLSCLICGDEEEMQLPLLAFPENRNHRAKWCYNLKIEPIPKWDNSKRVCSKHFERYCFLAPGQLVAEAAPTLHLKHSDGNIFLNDYAIDPNKVMIKEEPLEHSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -