Basic Information

Insect
Dicycla oo
Gene Symbol
-
Assembly
GCA_948252095.1
Location
OX411723.1:31409629-31413744[-]

Transcription Factor Domain

TF Family
zf-GATA
Domain
zf-GATA domain
PFAM
PF00320
TF Group
Zinc-Coordinating Group
Description
This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 26 0.1 3.7e+02 1.9 0.0 3 16 18 31 17 36 0.86
2 26 0.1 3.7e+02 1.9 0.0 3 16 71 84 70 89 0.86
3 26 0.1 3.7e+02 1.9 0.0 3 16 124 137 123 142 0.86
4 26 0.1 3.7e+02 1.9 0.0 3 16 177 190 176 195 0.86
5 26 0.1 3.7e+02 1.9 0.0 3 16 230 243 229 248 0.86
6 26 0.1 3.7e+02 1.9 0.0 3 16 283 296 282 301 0.86
7 26 0.1 3.7e+02 1.9 0.0 3 16 336 349 335 354 0.86
8 26 0.066 2.3e+02 2.5 0.0 3 16 389 402 388 407 0.87
9 26 0.24 8.5e+02 0.7 0.0 3 15 442 454 441 459 0.86
10 26 0.1 3.7e+02 1.9 0.0 3 16 495 508 494 513 0.86
11 26 0.066 2.3e+02 2.5 0.0 3 16 548 561 547 566 0.87
12 26 0.066 2.3e+02 2.5 0.0 3 16 601 614 600 619 0.87
13 26 0.066 2.3e+02 2.5 0.0 3 16 654 667 653 672 0.87
14 26 0.1 3.7e+02 1.9 0.0 3 16 707 720 706 725 0.86
15 26 0.1 3.7e+02 1.9 0.0 3 16 760 773 759 778 0.86
16 26 0.066 2.3e+02 2.5 0.0 3 16 813 826 812 831 0.87
17 26 0.066 2.3e+02 2.5 0.0 3 16 866 879 865 884 0.87
18 26 0.1 3.7e+02 1.9 0.0 3 16 919 932 918 937 0.86
19 26 0.066 2.3e+02 2.5 0.0 3 16 972 985 971 990 0.87
20 26 0.1 3.7e+02 1.9 0.0 3 16 1025 1038 1024 1043 0.86
21 26 0.1 3.7e+02 1.9 0.0 3 16 1078 1091 1077 1096 0.86
22 26 0.066 2.3e+02 2.5 0.0 3 16 1131 1144 1130 1149 0.87
23 26 0.1 3.7e+02 1.9 0.0 3 16 1184 1197 1183 1202 0.86
24 26 0.1 3.7e+02 1.9 0.0 3 16 1237 1250 1236 1255 0.86
25 26 0.066 2.3e+02 2.5 0.0 3 16 1290 1303 1289 1308 0.87
26 26 4.8 1.7e+04 -3.4 0.1 6 18 1339 1351 1338 1353 0.83

Sequence Information

Coding Sequence
ATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACATATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTACAGCCACGCTACGGCACGATGAAACAATGCTACGCGACAGCCACGTGACAGCTAAGCGACAGCTATGCGAGAGCTACACCACAGCTAACTAA
Protein Sequence
MLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTIAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTYSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTFHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHIPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTATATLRHDETMLRDSHVTAKRQLCESYTTAN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-