Basic Information

Insect: Scaptodrosophila latifasciaeformis
Gene Symbol: CG10628_1
Assembly: GCA_037075145.1
Location: JBAMCM010000217.1:23765482-23781157[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.8e-15 4.1e-12 46.9 3.5 1 86 763 835 763 836 0.86

2 28 2.7e-15 6.2e-12 46.3 4.8 1 87 863 932 863 932 0.83

3 28 3.7e-16 8.4e-13 49.1 0.9 1 87 954 1026 954 1026 0.85

4 28 1.1e-16 2.6e-13 50.7 4.5 1 87 1110 1180 1110 1180 0.82

5 28 3.9e-14 9e-11 42.6 4.5 1 86 1204 1275 1204 1276 0.81

6 28 3.4e-13 7.8e-10 39.6 0.7 1 87 1311 1379 1311 1379 0.80

7 28 1.9e-10 4.3e-07 30.8 1.8 1 86 1421 1490 1421 1491 0.76

8 28 1.4e-17 3.1e-14 53.7 1.0 1 86 1518 1587 1518 1588 0.82

9 28 1e-11 2.4e-08 34.8 2.0 1 85 1609 1677 1609 1679 0.78

10 28 3.9e-16 9e-13 49.0 1.8 1 86 1706 1777 1706 1778 0.85

11 28 6.8e-14 1.6e-10 41.8 4.0 1 87 1851 1921 1851 1921 0.82

12 28 1.8e-12 4.1e-09 37.3 0.3 1 85 1944 2011 1944 2013 0.81

13 28 9.2e-14 2.1e-10 41.4 2.5 1 87 2139 2208 2139 2208 0.82

14 28 6.3e-16 1.4e-12 48.3 0.6 1 86 2273 2342 2273 2343 0.86

15 28 0.00011 0.25 12.3 0.0 1 61 2368 2421 2368 2442 0.68

16 28 4.3e-12 1e-08 36.0 0.1 1 86 2455 2524 2455 2525 0.82

17 28 1.8e-14 4e-11 43.7 0.2 1 87 2574 2644 2574 2644 0.78

18 28 1.7e-12 4e-09 37.3 2.5 1 86 2683 2751 2679 2752 0.78

19 28 1.2e-12 2.9e-09 37.8 1.2 1 87 2788 2860 2788 2860 0.80

20 28 8.3e-14 1.9e-10 41.5 0.0 1 87 2885 2956 2885 2956 0.81

21 28 3.6e-06 0.0084 17.1 0.2 1 58 2988 3037 2988 3058 0.81

22 28 1.3e-11 2.9e-08 34.5 1.8 1 87 3079 3151 3079 3151 0.77

23 28 9.8e-15 2.3e-11 44.5 2.4 1 87 3322 3393 3322 3393 0.82

24 28 5.1e-13 1.2e-09 39.0 4.7 1 86 3445 3515 3445 3516 0.82

25 28 1.4e-16 3.3e-13 50.4 5.3 1 86 3613 3683 3613 3684 0.84

26 28 7.1e-15 1.6e-11 45.0 0.1 1 87 3757 3827 3757 3827 0.86

27 28 1.9e-08 4.3e-05 24.4 0.2 1 61 3854 3905 3854 3928 0.80

28 28 7.3e-11 1.7e-07 32.1 0.1 6 87 3940 4008 3937 4008 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.8e-15	4.1e-12	46.9	3.5	1	86	763	835	763	836	0.86
2	28	2.7e-15	6.2e-12	46.3	4.8	1	87	863	932	863	932	0.83
3	28	3.7e-16	8.4e-13	49.1	0.9	1	87	954	1026	954	1026	0.85
4	28	1.1e-16	2.6e-13	50.7	4.5	1	87	1110	1180	1110	1180	0.82
5	28	3.9e-14	9e-11	42.6	4.5	1	86	1204	1275	1204	1276	0.81
6	28	3.4e-13	7.8e-10	39.6	0.7	1	87	1311	1379	1311	1379	0.80
7	28	1.9e-10	4.3e-07	30.8	1.8	1	86	1421	1490	1421	1491	0.76
8	28	1.4e-17	3.1e-14	53.7	1.0	1	86	1518	1587	1518	1588	0.82
9	28	1e-11	2.4e-08	34.8	2.0	1	85	1609	1677	1609	1679	0.78
10	28	3.9e-16	9e-13	49.0	1.8	1	86	1706	1777	1706	1778	0.85
11	28	6.8e-14	1.6e-10	41.8	4.0	1	87	1851	1921	1851	1921	0.82
12	28	1.8e-12	4.1e-09	37.3	0.3	1	85	1944	2011	1944	2013	0.81
13	28	9.2e-14	2.1e-10	41.4	2.5	1	87	2139	2208	2139	2208	0.82
14	28	6.3e-16	1.4e-12	48.3	0.6	1	86	2273	2342	2273	2343	0.86
15	28	0.00011	0.25	12.3	0.0	1	61	2368	2421	2368	2442	0.68
16	28	4.3e-12	1e-08	36.0	0.1	1	86	2455	2524	2455	2525	0.82
17	28	1.8e-14	4e-11	43.7	0.2	1	87	2574	2644	2574	2644	0.78
18	28	1.7e-12	4e-09	37.3	2.5	1	86	2683	2751	2679	2752	0.78
19	28	1.2e-12	2.9e-09	37.8	1.2	1	87	2788	2860	2788	2860	0.80
20	28	8.3e-14	1.9e-10	41.5	0.0	1	87	2885	2956	2885	2956	0.81
21	28	3.6e-06	0.0084	17.1	0.2	1	58	2988	3037	2988	3058	0.81
22	28	1.3e-11	2.9e-08	34.5	1.8	1	87	3079	3151	3079	3151	0.77
23	28	9.8e-15	2.3e-11	44.5	2.4	1	87	3322	3393	3322	3393	0.82
24	28	5.1e-13	1.2e-09	39.0	4.7	1	86	3445	3515	3445	3516	0.82
25	28	1.4e-16	3.3e-13	50.4	5.3	1	86	3613	3683	3613	3684	0.84
26	28	7.1e-15	1.6e-11	45.0	0.1	1	87	3757	3827	3757	3827	0.86
27	28	1.9e-08	4.3e-05	24.4	0.2	1	61	3854	3905	3854	3928	0.80
28	28	7.3e-11	1.7e-07	32.1	0.1	6	87	3940	4008	3937	4008	0.75

Sequence Information

Coding Sequence: ATGGTGCAAgtctttaagtttttattagaTTCATCAAAGGCGaaaacagtaCGTGCCCACTTTCGACCTAGTTTCTTGGACACACTTCGTCTGACTGTTCGAGGGGGACATGGTGGAAACGGATTACCGAAGTACGGCGGCGTAGGTGGACAAGGAGGATGTGTTTACTTTGTGGCCAAGGAGGGCCTGACATTGCGCAAGGTAGCTCAAGTATCAAAGGATAAACGTATTTCGGCATCCAGTGGAGAAGATAGTAGCAAAATGAACATTCTTGGACGTCGCGGTGTGGACCAGCGTATTGAAGTACCAGTAGGGGTCCAGGTGTACGatgagaaattcaaattactgGCGGACTTGAATGAAAATGGTGCCACTTGTATAGCTGCAAGCGGAGGCATGGGCGGTTGCACGACCAGCAATTTTATTGGTCGACCCGGCGAAAGTCACACCGTTAATTTGGATCTGAAGCTTATAGCTGATGTGGGACTTGTTGGATTTCCAAATGCCGGCAAAAGTACACTACTTAAAGCCATATCCAATGCCAAACCGAAAATTGCTGCCTATCCTTATACACACTTGTTAAACATGGAGCAGGCAAACTACCATGGACATGTTCTGCCTCAccatcagcaacagcaacatcatcaacaagaacaacatcagcaacaacagcagcaccaactccaccaccaccaatcACATCAAACgcaacaacataaacaaatacagCCCAGTTGGTACTCACATGTTGCTTCCTACCCATCGCATGCAGCGGCCTTTTCAGCGCCCTGCAAGAACATGAATATGAATGCCTACTGCGGCGGTCCCAGTGGCACGCATGGGTATTATGGTGGTGGGGGCGGGGGTGTTGGTGTAAGTGGCGTTGTCAATGTCAAcactggtggtggtggaatGGGCTATAACCTTGAGACCAACTCTTCAAACACCGTAGCCTATGCACATAATCAATTGCttcaataccaacaacaacaacagcagcagcatcaacaacatcagcaacatAGCCAGCGCCCCTATATTTCGGCACATGGATTTATGCATAATCCAACGACATATCCCTATATTAAAAGTGAGCCTATGGAACGCTCCGATGACAGACAGAGGCAACTTTATAACCCGCCCAATCCTATGGCCCCGCCTCCGATTCCTACCCCCAGCCATTTAGATGTGAGCAATGACATGATTATAAAATCGGAGCCCATTGATGAGCATGCTGCATTCAAATCCAATTATATTGATGATAACACGCCATTTGCCGATTTCAGTAAATTTACCGAATATAATCAAGACATGTTAAATTCGAAGGTGGAGTTAACAGTCAAAGAGGAAGTTGGCTATGGGAATATTGGTCAAAAgAATGCCATCAACTATCCCAGACGTAAAATGCAAGTCGAGCGGTCGGACAGTTTGCCCATTTGCCAGCGCTGCAAAGAGGTCTTCTTCAAAAAACAAACCTACATTCGTCATGTGGCCGAGAGCAGTTGCACCATCCAGGAGTATGACTTTAAGTGTAACATTTGTCCTATGTCGTTTATGAGTGTGGAGGAGCTGCACAAACACAAGCAACTTCATCGGGcggaaaaattcttttgccaCAAATACTGTGGCAAATTCTACGATACAATAGCTGACTGTGAATCGCATGAGTACATGCATCATGAATACGatagttttgtttgtaatATGTGCTCTGGAACTTTTGCCACTAGAGAACAACTATTTGCCCACTTGCCACAGCACAAATATCAGCCTCGCTTCGATTGTCCCATCTGCCGGTTGTGGTATCAGACGCCTCTTGAATTGCACGAGCATCGTATGGCTGCACCGTATTTCTGTGGGAAATATTATGCACCTGCCGGAGGAGGAGCCCTTCAACAgaatcaacaacaactaatGCAGCAGCAATCGGATTATAAGTTGCAAGATTGCCACATGGGAAACATTGCAATGAACTCTACACTGCATAAAGCTTCTACATCGAATACTATAGCCAATCCTCTCCCTGCAACAGCTGCTCTTAACTCCCTGTTGCAACAACGACAGTCCAATGCAGAAAATGCTCCGGTCTTCGCGTCCACCATGAAATCCGATGTGAAACTAGAACGTAGCTACAGTAACTCAACCAGCGAGTCTTCATACAGTCTGcacgaaaataattttaacaatgCCTATGGCAGCGATACTTCTATGAATCTGGGTGGAGCTGGTGGTCTGCAATCTCAATCTGCAAATTCTTCAACACTGGACGACTCAGACGATGCTTTGTGCTGTGTGCCGCTGTGCGGTGTACGTAAAAGCACCAGTCCTACACTCCAGTTCTTTACTTTCCCCAAAGATGATAAATATCTGCACCAATGGTTACACAACCTCAAGATGTTTCACATACCGGCTGCTACCTATATGAACTACAGGATCTGTAGCATGCACTTTCCCAAAAGGTGTATTAATCGATATTCTCTTTGCTATTGGGCAGTGCCCACCTTTAATTTGGGGCACGACGATGTAGCCAATCTATATCAAAATCGTGAACTCACAAATACATTCACCACCGGAGAAGTGGCACGCTGCAGCATGCCCAACTGCAATAGTCAACGTGGAGAAAGTAATCTTAAGTTTTACAACTTTCCCAAGGATATTAAAAGCCTGATTAAGTGGTGCCAGAATGCCCGTTTGCCAGTTCAAGCCAAGGAACCGCGCCACTTTTGTAGCCGCCATTTTGAAGAGCGTTGCATTGGCAAATTCCGTCTGAAACCTTGGGCAGTGCCAACATTGCATTTGGGCACGCAATATGGAAAAATACATGACAATCCAAAGAATCTGTATGTAGAGGAGAAACGCTGTTGTCTGCCCTTCTGCCGACGAAGTCGTTCGTCGGATTTTAACATGTCGCTGTATCGCTTTCCTCGCGATGAAGTTTTGCTCAAACGTTGGTGCTATAATCTGCGTCTGGATCCATGTGTTTATCGCGGCAAGAATCACAAAATCTGCAGTGCTCATTTTATCAAGGAGGCGTTGGGTCTGCGTAAACTCTCACCAGggGCCGTGCCAACTTTGCATTTGGGTCACAATGACACTTTTAACATTTATGAAAACGAGTTGTGGCCACCACCTACGCCAGCCACACTTTCCAATCATCACCAACACCAGACAAAGAGCTATCAACGTCTTTCTTTGGCCTCGACTTCGTCGTCGACTAGCTCTACATCCTTGTATATGGACTCGGATATGAATGCATCCTTTGGTAGCTTGACAGCCGGTGGCTCTGGTTCATCTTCAGCTCTAAACGTAACCGAATGTATGGATGTCTGCTGTGTTCCTGGCTGTGAGAGTAAGCGCCACAACAACGAGGATATCACTTTCCACACCATACCACGTCGACCGGAACAAATGCGTAAATGGTGCCATAATCTGAAAATACCCGAAGAGAAAATGCACAAGGGAATGCGCATTTGTAGCCTCCACTTTGAGCCATACTGCATCGGTGGTTGCATGCGTCCCTTTGCTGTGCCTACACTACATCTGGGCCACGATGACGATGATATTCACCGCAACCCTgatgtaattaaaaaactcAACATCCGGGAAACGTGCTGCGTCCAGGTCTGCAAGCGAAATCGCGATCGCGATCATGCTAATTTGCATCGTTTTCCCTCCAATGTTGCCCTGCTGAATAAATGGTGTGCCAATCTTCACAAGCCTGTACCGGATGGAACCAAGCTGTTCAACGATGCCATCTGCGAAGTACACTTTGAAGACCGTTGCCTGCGCAACAAAAGACTGGAAAAATGGGCCGTACCGACGCTTGTACTAGGCCATGAAAATATACCATATCCCTTGCCCACCGAGGCGGAAGTGGCCGAGTTCTACGCCCGCCCCAGTGCACCCAATAATGGTGATGAAGATGGTGAATGCTGTGTGGAGACTTGCAAGAGAAATCCTAGTGTGGATGACATCAAGCTCTACCGTCCACCAGAGGATGCTGAAGTGCTTGCGAAGTGGGCTCACAATCTAGAAATCGATGTGGATCAGCTTTCTAATCTGAGAATATGCAATCTTCATTTTGAGTCGCATTGCATAGGTAAACGGATGCGCCCCTGGGCCATACCCACTCTTAATCTTGCCACTAACATAGAAACTTTATACGAGAATCCAGAACAGCTGCTCTATGCCCGGCGCCAGGGCAAAGAACACACCTCAGACTTGCCATCCTCATCGAGCAAGCCCACCTGGGTACCACGATGCTGTTTGTCGCACTGCCGCAAAGTCAGGTCTATCCACAATGTTCAGCTTTATCGTTTCCCTAAGGCCAATCGTTCTACCCTGGCCAAGTGGGCCCACAATCTTCAAGTACCCATGGTGGGTAGTGCGCAGCGCCGTTTGTGCTCGGCTCACTTTGAACCTCATGTCCTCAGCAAAAAATGTCCTATACCTTTGGCAGTGCCAACCCTTGATCTAAATACCCCACCAGGCCTGAAGATTTACCAGAATCCAGCTAAGCTTAAGGTGCCTAAGATGTGCTTACAAAGAGTATGCGTTGTAGAAAGCTGTCGACGGCAACGAACTCATGGGGTCCAGCTCTTCAGGTTCccccacaacaacaatcagtTTCGAAAGTGGTTGCATAATATTAAAAAGCGCCCCAAGGTGGGCATGCGGGCACAATATCGTGTGTGCTCCATGCATTTTGAGGCGCAATCATTCAATGGTAAGCGGCTGAGTGCCGGAGCCATACCCACCTTAGAATTGGGTCATGATGATGAAGATATTTATCCCAACGAGGCGCAATCCTTTGTAGAAGAGCACTGCACAATAGAAGGATGTAGTTCTGCCAAAGAACAGCCGGAAGTGCGTCTGTTCCGGTTCCCTACAGATGACGAGGATCTGCTTTGGAAATGGTgtaacaatttgaaaatgaatccCGTAGACTGCTTTGGTGTTCGGATTTGCAACAAGCATTTTGACGTGGAGTGCATTGGACCCAAACATCTCTATAAATGGGCCATCCCCACCAAGGCTCTGGGCCACGATGActctgaaattgaattgatacCGAATCCCAAACCAGAGGAGCGTTATGTTGATCTGATTTTCAAATGTTGTGTACCTAGTTGTGGCAAGACGCGAAAGTTCGACGAAGTTCAGATGAACAGTTTTCCCAAGGATCCCGATTTGTTCCACAAGTGGCGTCATAATCTGCGCCTAGATCATCTTCAGTTTAGAGAACGCGAACGTTACAAAATCTGTAACGACCACTTCGAGGATATGTGCATAGGCAAGACACGCCTTAACATAGGTGCCATACCAACACTGCAGTTGGGTCATGACGACAAGGAAGATCTGTTTCAGGTCAATCCAGAGGAGTTGCAGAGCAATCTCTTTGGTAGGCAACGCCGCTTAACCCGACCCAAGCTCATAAAGCAGGAACTGGGAGTAGTTCAAAATGAGACTAAGTCTGAAATCGATGAATCCATGACACAAGCTACCGACATAAATGCCGCACaggtgaaaattaaaaattctgacCTTAAATGCTGTATAAGGAGTTGTGGCAAGAGTCGTCTAGAACACGGGGTCAGGCTCTTCCCGTTTCCCAGCGGCAAGCAGCATCAAAACAAATGGTGCCATAATCTTCAACTGCAGTCCAATCAACTAGACAAGACCACCCGCGTTTGTAGTATCCACTTCAACAAACGATGCATCGATGGCCGACAGCTGCGTGGCTGGGCTATGCCCACTTTGCATCTGGGACATGCCGAGCGACCTATTTATGAAAATCCCAAGAATATTCCGGGCTTCTTTACACCTACCTGCGCTTTGAATCATTGCCGAAAGAGGCGAAGCATTGACAATGCATTGCGTACATATCGGTATCCAAGGAGTGAGGAACTGTTAGAGAAGTGGTGTGCCAACTTGAAACTGGAACCAGGTCAGTGTCGCGGACGTATCTGCGAGGATCACTTTGAGCCTCTGGTAAGGGGTAAACTGAAGTTGAAGACTGGGGCAGTGCCTACCGAAAATCTGGGCCACACTGAAAGCCCTGTCTATGATAATGAAGCAATCAAAAACGCCTTGGAGGCTGAGGAGGAAGCTGGCCTGTGTGGAGCTGTGGAGACTGTCAGATCTGCAATTAAGTTTAAGTGCGAATCATTCGACTCAGAAGAGGAAGCTGAGCAGGCAAAAAATCATTACTATGATCCCCTGGAGCTGGTAGAGACATGTGCGATTCCTCTCTCAGAGAATGACCACACGGAGCAAGAAGATGACGAGGAAGACGAGGACATAAATGAAGATGAGAATCTGGAGCTAGTTCTACCGGATAGAATTACTCCACCACTTCAACAATCACTCTTGTTAAAAAAACGTGAAAAGCCAGCAAACAATGTCACACCAATATGCTGTCTCAAGCATTGCCGCAAAGAGCGCACAGCCATCCATCACCTTAGTACATTTGGATTTCCTAAAGACTATAATCAATTGCTCAAGTGGTGCgccaatttaaaattacagCCTGAAAGCTGTGTAGGCCGTATCTGCATAGAACACTTTGATCCTGAGGTCTTGGGTAGCCGCAAGCTCAAGCAGAATGCCGTGCCCACCATAAATGTTGGCCACGATTTACCTCTTGTATATGCCCACAATGGGGTGGAACTCAATTTGGAACCAGATTATTACGAGCAACCGGAACGTTCGGATTTTCGGCTTTGGAGCCTGAAACATTGTCGGAAAAGGAAGCCTTCAGATCAGACAGATCCACCGGATCTGATGACTGTTAGGGGCGGAGATGGCTCTAGCGCCTGTAGCGTCCATAGCTGCGGGGAAACTTCAGGCTTTAATGACGTACGTCtttataaatttccaaaagacCGGGCCACACTGCGCAAATGGTTACACAATCTCAAATTCGCAGGGTTGAATACATCGGCGCTACAACGCATTTGCTCGGAACACTTTGAGCCGCAATGCCTAAAAAATAAGCAGTTGCTTCCCCACGCTATCCCCACTCTAAGGCTCGGCCATTCAAGTTTAAACATTTACCGCAATTGGAGACTTAAAACGCTAGTGGGGACAAACCATAAAACCTGTTTAGTGCCCAATTGCCTTTGTGTTCGACTAAGATTAACGAAGAATTACGAGCTACCTCTAAACAATTTGGTGCGTCAAGTCTGGCTAATGCATCGGAATCTACCAACTCCTCCAGAGAGTGACCCAGCTTACATTTGTGCATTACACTTTATGGAAATGTACGAACAGGTATCAGTAAAAGTGCCTGAGAAAGTACACTCAGAATTACAGAGGGTCTATGACAGCATAAGATCTTCAGCTATAGTCCAAAAATTGATCTGCGCCATTCCTGGCTGCTACTCGAAGTATACCGATGGCATTACGCTGACCAAATTGCCTATGCAAGGGCAAATTTGTTCCAAGTGGCTGCACAATACCAAGATCAGATATGAACCTTCTCGTCATTATATGTACAGGATTTGTATGCTGCATTTTGAGAGCCATTGTATGGGTCCCGTCCGCCCCAAGGCTTGGGCCGTGCCTACTCTAATGTTACATCATAGTGGAGAGATCTTTCAAAACTTGAAAACAACACGATCCCGAACTACATTGTTTACCATGCCCTTGAGCATTAAGACAGAGTGCGTGGAAAGCTTGAGTAAGACCAGCCCAAGCCCCAAGTTTGTTCCCAAGATTTGTTGCGTAAAAGACTGTGGGCAGATATCTACGCAAGGGAGTTCTTTGGGCTTCTTTCGTTTCCCCAGCACCGACCTGGCTCTTCAAAAATGGTGTATCAACACTCAGCAACGAATTACCACGGTGGCCAATCTTTATGTTTGTGGGATGCACTTTGAGACTGAGGCAATAAGCCACAGAGAGCTGCGAGCCTGGGCTGTGCCAACATTAAATTTGGGGCATAAAAATTATGTGATTCCAAATGTGCGACACAATGGCGATTATGCCAACACTCAAGACGATGAAGAGTCCCTTCAGTACATCTATCAGAATTATTGTTCGGTGATCTGCTGTTTTCAACGATGCAGTGATATGGGATTACGTCTCTATTCCTATCCAGAGGATAAACAGATGGTAAGAAAATGGGCTGGTAACTGCAGACATCGTACGATGAAGGCTACCAGCCATCGCTACAAGGTTTGCCAACTTCACTTTGCCGAAGACTGCTTTGAGCCAGACACAAAGGAGTTACGTGATGGTTCGGTGCCAACACTGCAACTGGGCTCGGAGAGAATGCCAGAAGAACTGTACCAAAGTGCTTGGTGTGACGGTATGCTAACCAAGGCACCTTCGTGCTTAAATACATCCAATACGTTGCACAAATGTATCGTCCATCATTGTTCGTATAAACTTGCAAATGACCAAACAGTTTTGAGGCTATATGATTTCCCCAAGTCTTTTAAGGCCATTACCAAGTGGTGCCATAATCTGGGTCTACAGATAGATTTTTCGCATCGCATGTATATTTGTCAGCAACACTTCGAACCCCAGTGCTTTAATGAAGCTCTTCAACTACAGCGTGGAGCTGTTCCCACCCTGAACCTTGGTGAAAACGCGCCTATTAATTTAATACGGAATCCAAATGTGTTTAAATCGCCTGTTTTGGAGCCTGTATGCTGCGCTCCCGGTTGTGGCAAAGCAAGGCTTAACGGAGTGGTGTCTCTTATCGGCTTTCCAAAATTGAGAGTTTTAGCCGAAAAGTGGTTGTATAATCTACGTTTAGATACAGATGTTCAACTCGATCGCGCCAAGGTCTGTAGCTCCCACTTTGAACCCGCCTGTTGGTCAAGCACATCACGACTCAAGATTGGAGCACTACCGACTTTAAATTTGGGACACGAGAATGcagatatttttcatataaacaaacaactaCTAGGAAAAGGCTTCAAATATCACAACGGCATAACTAGCATCTATCACTGCTGTTACCCTCAGTGCCGCGAGTTTGCCAAGCCTATGATGCATTCAGCCTTCGCTCTGCCCTCTGCGCCAGCTCTACGCTCCTCTTGGTTAAAGCACATGCAGGTTGTGGCATCTTCAGAAAAAGACAATTTGTGTCCTCTCCATTTCGTTATTCTGTATGAGAAAAGCGCTGAATTGGAAGGCAATGCAGAGTGCCCGTCTGAGGAGCTTGAAAGTCTTCAAAAGTCTTATAAGGAAGCCCGAGCCAATGTGACAGTGCGAAAGATTAGCTGTGCAGTAAATGAGTGTCGAAGTCTGCAGGCTCGTGATGGCTGTACTCTTTTTAGTCTGCCGCATCGAGAAGAGTTGCTGGCCAGGTGGCTGCACAACACGAAAATTCAGTATGATTCCCATCATATTTATATGCTAAAAGTGTGCGATAAACATTTTAAGGccgattcttttatttatccCAAGAAGATAAATCCTTGGTGCGTACCTACTCTGAATTTGCCGCCACGCGACGATGGCACGGAGATCTTACCAGATTTCAGCGAAGACGAATGGAAACAGCtaactaaaaaatatgcacAGATTGATAATAATCTGAGCAATGTTAAGCACGAGCCCGATGATGATTCCAACTTGGAACCAATTGTAAAAATAGAACATGTGGAATCGGAGGTCGACACCGAAGGCGAGCAGGTTGAGTCCGAATCTGAGGAAATTATCGATCACATAGTCTTTAACAGGGAAAAGACCTTGGAATCAGAAGATggtgaaagtgaaaatttggTCCCAGCTTACAGTGAACACCTGGTGGACGAAGAAGATGCTAACTCAAATTCTTTGCCCTTCGAAATGGAAGCACTCGAAGTGCTTCTAGAAGTGGGACACGTGGAGAAGTGTACCAGCTACGAGCAGATGAACAGAAGTGGGAACTCTTCTAGCCCAGCCCCTGGGCCTGGAAGCCGTGGTGCTCATTTTTATCGTAGTACCCTAAACTACAGTGCCAGGAACTGTTGCATTCAGGGCTGTCGGTTAACTGTGCGAGATGCCGaaatcaaaatgcacaaaTTTCCCTCGTCAGTAGAGTTGCTTCGAAAGTGGATGCACAATACCCAGGTTGATGTGGATACCAATCACGCCTGGCGGTATCGCATTTGTAGTCATCATTTCGAGCCCGAATGCTTCAATGGATATCGGTTCCGCAGTGGCACCATGCCTACATTACACCTAGGACCCAACCGGCCTGAGCTCATCTACGAGAATGAATTCGACAAGGTGGTGTCTCATccagaatttgaaataaaaaacatgcAGTCCTTGAGCATGTCCTCGATGCTTGAGAGTCAAGAAGTTCGTCCCCGAAAGAAATCAAGTAAATTCTGCCAGGTCGAGGGCTGTTTCAATCACCTAACCAGTCCAAATATCACACTCCACAAATTTCCTCACTCACTAGATCTTTGTAAAAAATGGCAGCACAACACTCAGGTACCGTTTGTCCCCGAATTTCGCTGGCGCTATCGTATATGTAGTGCTCACTTCCATCCATTCTGCTTGATGAATACGAGACTACTGCATGGAAGTGTGCCTACTCTGAAATTGGGACCTCTAGCTCCAACTGAATTATATGAAAACAGTTTTCAATCCATCAATATGGCGAATGGCAAAAATTCACATACCGCGATGGCCCGGAGTTCGCCGGAGGAAGAGGATGATGATATAGCTCTATTAGTACCAGAGTTGAAACTGGAGGTTAATGAAAGCAACGAATTGAACTTCACAAAGGACCTGCCAGAAATTAAGAATGAAGATAACAGGAAGCCTCACTTCCGTATGAAACAGGagagaaatttgatttataatgaCATCAAGTCAGGCTATGGAAAATGCTCACTGATACATTGTCAGAAGCAAAAGTCTCAGCACGGCGTACATATTTACAAGTTTCCTAAGTCTGAAAACCAAAGACAACGGTGGATGCATAATCTGCGTATCAGATACGATGAAAGTCGACCCTGGAAATACCTGATTTGTAGTGAGCATTTTGAGGAGCAGTGTGTTCGCCAGCGAAACCTAAGAAAGTGGGCTGTACCCACACTACGATTGGGTAACAATGTCCCCGAAGTTCTCTATACGAATGAACAATGCAAAGAAATGATTGCGCCTTCAAGTTGCACTGAAGACAgtaatgatgataatgatgatgacggtGAAGATTGCGAATTGGAACCTTTAAAACGGGCAACCATAAAAACTGAAGAGCCTTCCCGGAAAGAcgtagaaattaattttaggcAGCCCGCTAACAAAATTAAGGTGTGCTGTTTACCTTATTGTCGTCGCCCTCGCGGTGATGGCATAAAACTATTCCGGCTGCCCAACAACATTGCCACAATACGCAAGTGGGAGCAGAACACGGGCATGACTTTCAAAGAGTCACAGCGCAACACTAGACTCATTTGCAGCCGACACTTTGAGCCCGATCTAATTGGAGTCCGTCGGCTTTCTCAAGGCGCTGTACCCACACTTAATCTTGGCAAAATACCAAAGGATTTCACAGGACCTGCCTCGTCCTTGACAAGTAATTTGCATCGATCGGAGCGTCCAAGTTGCTGCATGGCCGACTGTAGGCGCACTCCCACGAATAAACTATACAAATTTCCAAGTGATCCAAGTGTGCTGCTTCAGTGGTGTCATGTTTTAAAGTTGGGTGATGTCCAACGATATCGGGGAAGATATATTTGTTCAGCCCATCTGCCTGCTAAGGTGCTAAATGGTCACAAGCTGCGTCAAGGAAGTGAATTGCCGCCTTTAAAGAAGCGTTTTCCGACAGTACAACCATCAGTTTCCACCCGAACATGTCTAGTCTGCGGTCAGATTTCTGGAGAAAAATCTCTACTATTGGACTTCCCGGAAAACAGGAACATGCGTGCCAAATGGTgctacaatttaaaaattgaactcTTGGCCAAATGGGATAATTCTCATCACATCTGCTCCAATCATTTTGAGAGTGCTTGCTTTGCCAACGTGGCACTGGGACAACTGCTGGCGGATGCAGTGCCCACGTTGCATTTGAAGCACAACGATCAGAATATATTCTTAAATGACTTCACCCTACATGAGCCGATGAAAAATGGAATAGGCATTAAAGATGAGCCCATAGATGATGACGATTTGCTGCTGTAG
Protein Sequence: MVQVFKFLLDSSKAKTVRAHFRPSFLDTLRLTVRGGHGGNGLPKYGGVGGQGGCVYFVAKEGLTLRKVAQVSKDKRISASSGEDSSKMNILGRRGVDQRIEVPVGVQVYDEKFKLLADLNENGATCIAASGGMGGCTTSNFIGRPGESHTVNLDLKLIADVGLVGFPNAGKSTLLKAISNAKPKIAAYPYTHLLNMEQANYHGHVLPHHQQQQHHQQEQHQQQQQHQLHHHQSHQTQQHKQIQPSWYSHVASYPSHAAAFSAPCKNMNMNAYCGGPSGTHGYYGGGGGGVGVSGVVNVNTGGGGMGYNLETNSSNTVAYAHNQLLQYQQQQQQQHQQHQQHSQRPYISAHGFMHNPTTYPYIKSEPMERSDDRQRQLYNPPNPMAPPPIPTPSHLDVSNDMIIKSEPIDEHAAFKSNYIDDNTPFADFSKFTEYNQDMLNSKVELTVKEEVGYGNIGQKNAINYPRRKMQVERSDSLPICQRCKEVFFKKQTYIRHVAESSCTIQEYDFKCNICPMSFMSVEELHKHKQLHRAEKFFCHKYCGKFYDTIADCESHEYMHHEYDSFVCNMCSGTFATREQLFAHLPQHKYQPRFDCPICRLWYQTPLELHEHRMAAPYFCGKYYAPAGGGALQQNQQQLMQQQSDYKLQDCHMGNIAMNSTLHKASTSNTIANPLPATAALNSLLQQRQSNAENAPVFASTMKSDVKLERSYSNSTSESSYSLHENNFNNAYGSDTSMNLGGAGGLQSQSANSSTLDDSDDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPAATYMNYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLPFCRRSRSSDFNMSLYRFPRDEVLLKRWCYNLRLDPCVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPATLSNHHQHQTKSYQRLSLASTSSSTSSTSLYMDSDMNASFGSLTAGGSGSSSALNVTECMDVCCVPGCESKRHNNEDITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVQVCKRNRDRDHANLHRFPSNVALLNKWCANLHKPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIPYPLPTEAEVAEFYARPSAPNNGDEDGECCVETCKRNPSVDDIKLYRPPEDAEVLAKWAHNLEIDVDQLSNLRICNLHFESHCIGKRMRPWAIPTLNLATNIETLYENPEQLLYARRQGKEHTSDLPSSSSKPTWVPRCCLSHCRKVRSIHNVQLYRFPKANRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPIPLAVPTLDLNTPPGLKIYQNPAKLKVPKMCLQRVCVVESCRRQRTHGVQLFRFPHNNNQFRKWLHNIKKRPKVGMRAQYRVCSMHFEAQSFNGKRLSAGAIPTLELGHDDEDIYPNEAQSFVEEHCTIEGCSSAKEQPEVRLFRFPTDDEDLLWKWCNNLKMNPVDCFGVRICNKHFDVECIGPKHLYKWAIPTKALGHDDSEIELIPNPKPEERYVDLIFKCCVPSCGKTRKFDEVQMNSFPKDPDLFHKWRHNLRLDHLQFRERERYKICNDHFEDMCIGKTRLNIGAIPTLQLGHDDKEDLFQVNPEELQSNLFGRQRRLTRPKLIKQELGVVQNETKSEIDESMTQATDINAAQVKIKNSDLKCCIRSCGKSRLEHGVRLFPFPSGKQHQNKWCHNLQLQSNQLDKTTRVCSIHFNKRCIDGRQLRGWAMPTLHLGHAERPIYENPKNIPGFFTPTCALNHCRKRRSIDNALRTYRYPRSEELLEKWCANLKLEPGQCRGRICEDHFEPLVRGKLKLKTGAVPTENLGHTESPVYDNEAIKNALEAEEEAGLCGAVETVRSAIKFKCESFDSEEEAEQAKNHYYDPLELVETCAIPLSENDHTEQEDDEEDEDINEDENLELVLPDRITPPLQQSLLLKKREKPANNVTPICCLKHCRKERTAIHHLSTFGFPKDYNQLLKWCANLKLQPESCVGRICIEHFDPEVLGSRKLKQNAVPTINVGHDLPLVYAHNGVELNLEPDYYEQPERSDFRLWSLKHCRKRKPSDQTDPPDLMTVRGGDGSSACSVHSCGETSGFNDVRLYKFPKDRATLRKWLHNLKFAGLNTSALQRICSEHFEPQCLKNKQLLPHAIPTLRLGHSSLNIYRNWRLKTLVGTNHKTCLVPNCLCVRLRLTKNYELPLNNLVRQVWLMHRNLPTPPESDPAYICALHFMEMYEQVSVKVPEKVHSELQRVYDSIRSSAIVQKLICAIPGCYSKYTDGITLTKLPMQGQICSKWLHNTKIRYEPSRHYMYRICMLHFESHCMGPVRPKAWAVPTLMLHHSGEIFQNLKTTRSRTTLFTMPLSIKTECVESLSKTSPSPKFVPKICCVKDCGQISTQGSSLGFFRFPSTDLALQKWCINTQQRITTVANLYVCGMHFETEAISHRELRAWAVPTLNLGHKNYVIPNVRHNGDYANTQDDEESLQYIYQNYCSVICCFQRCSDMGLRLYSYPEDKQMVRKWAGNCRHRTMKATSHRYKVCQLHFAEDCFEPDTKELRDGSVPTLQLGSERMPEELYQSAWCDGMLTKAPSCLNTSNTLHKCIVHHCSYKLANDQTVLRLYDFPKSFKAITKWCHNLGLQIDFSHRMYICQQHFEPQCFNEALQLQRGAVPTLNLGENAPINLIRNPNVFKSPVLEPVCCAPGCGKARLNGVVSLIGFPKLRVLAEKWLYNLRLDTDVQLDRAKVCSSHFEPACWSSTSRLKIGALPTLNLGHENADIFHINKQLLGKGFKYHNGITSIYHCCYPQCREFAKPMMHSAFALPSAPALRSSWLKHMQVVASSEKDNLCPLHFVILYEKSAELEGNAECPSEELESLQKSYKEARANVTVRKISCAVNECRSLQARDGCTLFSLPHREELLARWLHNTKIQYDSHHIYMLKVCDKHFKADSFIYPKKINPWCVPTLNLPPRDDGTEILPDFSEDEWKQLTKKYAQIDNNLSNVKHEPDDDSNLEPIVKIEHVESEVDTEGEQVESESEEIIDHIVFNREKTLESEDGESENLVPAYSEHLVDEEDANSNSLPFEMEALEVLLEVGHVEKCTSYEQMNRSGNSSSPAPGPGSRGAHFYRSTLNYSARNCCIQGCRLTVRDAEIKMHKFPSSVELLRKWMHNTQVDVDTNHAWRYRICSHHFEPECFNGYRFRSGTMPTLHLGPNRPELIYENEFDKVVSHPEFEIKNMQSLSMSSMLESQEVRPRKKSSKFCQVEGCFNHLTSPNITLHKFPHSLDLCKKWQHNTQVPFVPEFRWRYRICSAHFHPFCLMNTRLLHGSVPTLKLGPLAPTELYENSFQSINMANGKNSHTAMARSSPEEEDDDIALLVPELKLEVNESNELNFTKDLPEIKNEDNRKPHFRMKQERNLIYNDIKSGYGKCSLIHCQKQKSQHGVHIYKFPKSENQRQRWMHNLRIRYDESRPWKYLICSEHFEEQCVRQRNLRKWAVPTLRLGNNVPEVLYTNEQCKEMIAPSSCTEDSNDDNDDDGEDCELEPLKRATIKTEEPSRKDVEINFRQPANKIKVCCLPYCRRPRGDGIKLFRLPNNIATIRKWEQNTGMTFKESQRNTRLICSRHFEPDLIGVRRLSQGAVPTLNLGKIPKDFTGPASSLTSNLHRSERPSCCMADCRRTPTNKLYKFPSDPSVLLQWCHVLKLGDVQRYRGRYICSAHLPAKVLNGHKLRQGSELPPLKKRFPTVQPSVSTRTCLVCGQISGEKSLLLDFPENRNMRAKWCYNLKIELLAKWDNSHHICSNHFESACFANVALGQLLADAVPTLHLKHNDQNIFLNDFTLHEPMKNGIGIKDEPIDDDDLLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -