Basic Information

Insect: Deroplatys truncata
Gene Symbol: -
Assembly: GCA_030765065.1
Location: CM060986.1:221178431-221181090[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 20 0.049 8.4e+02 2.5 0.2 18 28 85 94 79 96 0.77

2 20 0.02 3.5e+02 3.7 0.1 18 29 123 133 117 135 0.78

3 20 0.049 8.4e+02 2.5 0.2 18 28 161 170 155 172 0.77

4 20 0.019 3.2e+02 3.8 0.1 18 29 199 209 193 211 0.78

5 20 0.017 3e+02 4.0 0.1 18 29 237 247 231 250 0.78

6 20 0.019 3.3e+02 3.8 0.3 17 29 274 285 269 287 0.79

7 20 0.031 5.4e+02 3.2 0.2 20 29 314 323 307 325 0.80

8 20 0.019 3.3e+02 3.8 0.1 18 29 351 361 346 363 0.78

9 20 0.019 3.2e+02 3.8 0.1 18 29 389 399 383 401 0.78

10 20 0.019 3.2e+02 3.8 0.1 18 29 427 437 421 439 0.78

11 20 0.019 3.2e+02 3.8 0.1 18 29 465 475 459 477 0.78

12 20 0.0048 82 5.8 0.1 18 30 503 514 497 516 0.79

13 20 0.018 3e+02 3.9 0.2 18 29 541 551 534 553 0.76

14 20 0.019 3.2e+02 3.8 0.1 18 29 579 589 573 591 0.78

15 20 0.019 3.2e+02 3.8 0.1 18 29 617 627 611 629 0.78

16 20 0.031 5.4e+02 3.2 0.2 20 29 656 665 649 667 0.80

17 20 0.019 3.3e+02 3.8 0.1 18 29 693 703 688 705 0.78

18 20 0.019 3.2e+02 3.8 0.1 18 29 731 741 725 743 0.78

19 20 0.019 3.2e+02 3.8 0.1 18 29 769 779 763 781 0.78

20 20 0.019 3.2e+02 3.8 0.1 18 29 807 817 801 819 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	20	0.049	8.4e+02	2.5	0.2	18	28	85	94	79	96	0.77
2	20	0.02	3.5e+02	3.7	0.1	18	29	123	133	117	135	0.78
3	20	0.049	8.4e+02	2.5	0.2	18	28	161	170	155	172	0.77
4	20	0.019	3.2e+02	3.8	0.1	18	29	199	209	193	211	0.78
5	20	0.017	3e+02	4.0	0.1	18	29	237	247	231	250	0.78
6	20	0.019	3.3e+02	3.8	0.3	17	29	274	285	269	287	0.79
7	20	0.031	5.4e+02	3.2	0.2	20	29	314	323	307	325	0.80
8	20	0.019	3.3e+02	3.8	0.1	18	29	351	361	346	363	0.78
9	20	0.019	3.2e+02	3.8	0.1	18	29	389	399	383	401	0.78
10	20	0.019	3.2e+02	3.8	0.1	18	29	427	437	421	439	0.78
11	20	0.019	3.2e+02	3.8	0.1	18	29	465	475	459	477	0.78
12	20	0.0048	82	5.8	0.1	18	30	503	514	497	516	0.79
13	20	0.018	3e+02	3.9	0.2	18	29	541	551	534	553	0.76
14	20	0.019	3.2e+02	3.8	0.1	18	29	579	589	573	591	0.78
15	20	0.019	3.2e+02	3.8	0.1	18	29	617	627	611	629	0.78
16	20	0.031	5.4e+02	3.2	0.2	20	29	656	665	649	667	0.80
17	20	0.019	3.3e+02	3.8	0.1	18	29	693	703	688	705	0.78
18	20	0.019	3.2e+02	3.8	0.1	18	29	731	741	725	743	0.78
19	20	0.019	3.2e+02	3.8	0.1	18	29	769	779	763	781	0.78
20	20	0.019	3.2e+02	3.8	0.1	18	29	807	817	801	819	0.78

Sequence Information

Coding Sequence: ATGCACAATATCAAGCAGTTCTTCAAagttattttcctcaaatttctaAATGCTGCTTCCGACGAAGAGATTCACAATGCGGCAGTTGTTCTTCAAAATGAATATGAGGAAGATTCATCTAGTGAATTCCCAGACCAGGTCATAGACTTACGCACGGCATGCTACCTATTTCTAACTATTGCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTGAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTAGTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGGTCATTTTCCAAGCTGAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAAGTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTAGTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTGCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGTCTATAAAGAACAATCTGTGGAATTCCATGACAGATTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCCTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCTTGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGCCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGCCTATAAAGGACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAATTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAGCGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATATCTAACTATTGCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGTCTATAAAGAACAATCTGCGGAATTCCATGACAGATTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGCCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGCCTATGAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCTTGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGCCTCTTCGGCCGAACGATCATTTTCGAAGCTAAAGCCTATAAAGGACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAATTACTGTCTCTTCGGCCGAACGATCATTTTCCAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATGCTACCTATTTCTAACTATTCCAGTTACTGTCTCTTCGGCCGAACGATCATTTTTGAAGCTAAAGCCTATAAAGAACGATCTGCGGAATTCCATGACAGACTTATGCACGGCATAA
Protein Sequence: MHNIKQFFKVIFLKFLNAASDEEIHNAAVVLQNEYEEDSSSEFPDQVIDLRTACYLFLTIAVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLVLTIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLSIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLVLTIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIAVTVSSAERSFSKLKSIKNNLWNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSLTDLCTACYLFLTIPVTASSAERSFSKLKPIKDDLRNSMTDLCTACYLFLTIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSMTDLCTACYLFLTIPITVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKSDLRNSMTDLCTACYLYLTIAVTVSSAERSFSKLKSIKNNLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSMTDLCTACYLFLTIPVTASSAERSFSKLKPMKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSLTDLCTACYLFLTIPVTASSAERSFSKLKPIKDDLRNSMTDLCTACYLFLTIPVTVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSMTDLCTACYLFLTIPITVSSAERSFSKLKPIKNDLRNSMTDLCTACYLFLTIPVTVSSAERSFLKLKPIKNDLRNSMTDLCTA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -