Basic Information

Insect: Mycalesis mineus
Gene Symbol: -
Assembly: GCA_034621355.1
Location: CM067884.1:3361072-3371175[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.11 4.2e+02 1.4 0.0 9 29 282 301 280 304 0.72

2 18 0.76 2.8e+03 -1.3 0.1 19 29 337 347 334 349 0.71

3 18 0.76 2.8e+03 -1.3 0.1 19 29 383 393 380 395 0.71

4 18 0.012 44 4.5 0.1 3 29 406 431 405 434 0.86

5 18 0.012 44 4.5 0.1 3 29 444 469 443 472 0.86

6 18 0.012 44 4.5 0.1 3 29 482 507 481 510 0.86

7 18 0.76 2.8e+03 -1.3 0.1 19 29 543 553 540 555 0.71

8 18 0.76 2.8e+03 -1.3 0.1 19 29 589 599 586 601 0.71

9 18 0.76 2.8e+03 -1.3 0.1 19 29 635 645 632 647 0.71

10 18 0.012 44 4.5 0.1 3 29 658 683 657 686 0.86

11 18 0.012 44 4.5 0.1 3 29 696 721 695 724 0.86

12 18 0.012 44 4.5 0.1 3 29 734 759 733 762 0.86

13 18 0.012 44 4.5 0.1 3 29 772 797 771 800 0.86

14 18 0.012 44 4.5 0.1 3 29 810 835 809 838 0.86

15 18 0.012 44 4.5 0.1 3 29 848 873 847 876 0.86

16 18 0.012 44 4.5 0.1 3 29 886 911 885 914 0.86

17 18 0.012 44 4.5 0.1 3 29 924 949 923 952 0.86

18 18 0.092 3.4e+02 1.6 0.2 1 11 993 1003 993 1005 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.11	4.2e+02	1.4	0.0	9	29	282	301	280	304	0.72
2	18	0.76	2.8e+03	-1.3	0.1	19	29	337	347	334	349	0.71
3	18	0.76	2.8e+03	-1.3	0.1	19	29	383	393	380	395	0.71
4	18	0.012	44	4.5	0.1	3	29	406	431	405	434	0.86
5	18	0.012	44	4.5	0.1	3	29	444	469	443	472	0.86
6	18	0.012	44	4.5	0.1	3	29	482	507	481	510	0.86
7	18	0.76	2.8e+03	-1.3	0.1	19	29	543	553	540	555	0.71
8	18	0.76	2.8e+03	-1.3	0.1	19	29	589	599	586	601	0.71
9	18	0.76	2.8e+03	-1.3	0.1	19	29	635	645	632	647	0.71
10	18	0.012	44	4.5	0.1	3	29	658	683	657	686	0.86
11	18	0.012	44	4.5	0.1	3	29	696	721	695	724	0.86
12	18	0.012	44	4.5	0.1	3	29	734	759	733	762	0.86
13	18	0.012	44	4.5	0.1	3	29	772	797	771	800	0.86
14	18	0.012	44	4.5	0.1	3	29	810	835	809	838	0.86
15	18	0.012	44	4.5	0.1	3	29	848	873	847	876	0.86
16	18	0.012	44	4.5	0.1	3	29	886	911	885	914	0.86
17	18	0.012	44	4.5	0.1	3	29	924	949	923	952	0.86
18	18	0.092	3.4e+02	1.6	0.2	1	11	993	1003	993	1005	0.91

Sequence Information

Coding Sequence: atgGATGAAGATGAGTTTAATTCAAATGACGCAGGAACTGAGGTGACCATTTTAGAATGCCGGACTTGTTTGCATGTAATGAGTCCAGACGCTATTTTATTCAACATTTTCGAAAAGTGGTCCCCACCTTGGGACGGGATGGCGGACACTATCGCTGAAGATATAGAGAAGCTTGCTAATATAAAGGTTCAGGAGTCAGATAGACATTCAAAAGTAATATGCAGGACTTGTTATGAGCTACTACACTCTGCTTGCACATTCACAACAGcagtgaaaataaataatgacatactACAACAcagATACCCTCCTGAGCCAGATATACCAGACATAGATGCAGCTTGGCCTAGACCAATACAAATAAGCAAATCTgttaatagtttaataaatgaaaactcTATGAACTTTGATATTAAACAAGAAGTTTTATCAGATGATGGATACACTGTTGAAAATGGTATATATGAGAATGGGGATAATATATCTGAGATGGACATCAAGGTTGAGCCTGAGGAAATGATTCATGATGATTTGAAGCAACCATCGGAGCAGATTATGaatgGGTCAATATCTTCTGACACATTTGAGATTGACATGACACAACATTTAACAAATGGAAGCAGTGCAGatcatttaataacaaaaataaaggaGGAACTGTTAAGTGAAGAGGAGACTGAACTGATGCAAAACGATCTACCGCTGGAATGTCTACTGTGTACTAAACACTTTAAAAGTGTCACTGGACTGAAGGCTCATGTAATAGCTCATCATTCATACAAATCTGTTAAGAGAAAGAATGACTGTTTGTCTCCTGAACGAAATAaagGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAAGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAAGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAAGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAAGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAAGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTTTCCCAACGCCCACAGACCTGATGTTGCGCAGTGACGACAGTAAGAACGTGTGCTACGCGTGCAACGAGGCGTTCGACACGTTCGCTCTGCTGACCAAACACAGTCGCAAGTGTAAGGCGATCACCAGGCAACAGCACAAGAGACCGAAAACTCTGAACGATGTTATTAGACCGCCACCACAAGACGAGCCGAAATTAAAATGCACCCAATGCGATGAAACTTTCACAGACATGTACTACGTGACCATACATCAAGAGATACACCATCCGACATCGACCGCTGAGAAAACAGACTTGCAACAGGACAAGGAAATGGAAACTGAAACACTGGAGAATATATTCAGTGAAAGTGGTGACTTATAg
Protein Sequence: MDEDEFNSNDAGTEVTILECRTCLHVMSPDAILFNIFEKWSPPWDGMADTIAEDIEKLANIKVQESDRHSKVICRTCYELLHSACTFTTAVKINNDILQHRYPPEPDIPDIDAAWPRPIQISKSVNSLINENSMNFDIKQEVLSDDGYTVENGIYENGDNISEMDIKVEPEEMIHDDLKQPSEQIMNGSISSDTFEIDMTQHLTNGSSADHLITKIKEELLSEEETELMQNDLPLECLLCTKHFKSVTGLKAHVIAHHSYKSVKRKNDCLSPERNKGFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVISDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVISDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVISDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVISDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVISDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCFPTPTDLMLRSDDSKNVCYACNEAFDTFALLTKHSRKCKAITRQQHKRPKTLNDVIRPPPQDEPKLKCTQCDETFTDMYYVTIHQEIHHPTSTAEKTDLQQDKEMETETLENIFSESGDL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01021663;
90% Identity: iTF_01021663;
80% Identity: iTF_01021663;