Doo027298.1
Basic Information
- Insect
- Dicycla oo
- Gene Symbol
- -
- Assembly
- GCA_948252095.1
- Location
- OX411723.1:31409629-31413744[-]
Transcription Factor Domain
- TF Family
- zf-GATA
- Domain
- zf-GATA domain
- PFAM
- PF00320
- TF Group
- Zinc-Coordinating Group
- Description
- This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
- Hmmscan Out
-
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc 1 26 0.1 3.7e+02 1.9 0.0 3 16 18 31 17 36 0.86 2 26 0.1 3.7e+02 1.9 0.0 3 16 71 84 70 89 0.86 3 26 0.1 3.7e+02 1.9 0.0 3 16 124 137 123 142 0.86 4 26 0.1 3.7e+02 1.9 0.0 3 16 177 190 176 195 0.86 5 26 0.1 3.7e+02 1.9 0.0 3 16 230 243 229 248 0.86 6 26 0.1 3.7e+02 1.9 0.0 3 16 283 296 282 301 0.86 7 26 0.1 3.7e+02 1.9 0.0 3 16 336 349 335 354 0.86 8 26 0.066 2.3e+02 2.5 0.0 3 16 389 402 388 407 0.87 9 26 0.24 8.5e+02 0.7 0.0 3 15 442 454 441 459 0.86 10 26 0.1 3.7e+02 1.9 0.0 3 16 495 508 494 513 0.86 11 26 0.066 2.3e+02 2.5 0.0 3 16 548 561 547 566 0.87 12 26 0.066 2.3e+02 2.5 0.0 3 16 601 614 600 619 0.87 13 26 0.066 2.3e+02 2.5 0.0 3 16 654 667 653 672 0.87 14 26 0.1 3.7e+02 1.9 0.0 3 16 707 720 706 725 0.86 15 26 0.1 3.7e+02 1.9 0.0 3 16 760 773 759 778 0.86 16 26 0.066 2.3e+02 2.5 0.0 3 16 813 826 812 831 0.87 17 26 0.066 2.3e+02 2.5 0.0 3 16 866 879 865 884 0.87 18 26 0.1 3.7e+02 1.9 0.0 3 16 919 932 918 937 0.86 19 26 0.066 2.3e+02 2.5 0.0 3 16 972 985 971 990 0.87 20 26 0.1 3.7e+02 1.9 0.0 3 16 1025 1038 1024 1043 0.86 21 26 0.1 3.7e+02 1.9 0.0 3 16 1078 1091 1077 1096 0.86 22 26 0.066 2.3e+02 2.5 0.0 3 16 1131 1144 1130 1149 0.87 23 26 0.1 3.7e+02 1.9 0.0 3 16 1184 1197 1183 1202 0.86 24 26 0.1 3.7e+02 1.9 0.0 3 16 1237 1250 1236 1255 0.86 25 26 0.066 2.3e+02 2.5 0.0 3 16 1290 1303 1289 1308 0.87 26 26 4.8 1.7e+04 -3.4 0.1 6 18 1339 1351 1338 1353 0.83
Sequence Information
- Coding Sequence
- ATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTATAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACATATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACATTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATATTGCTACGACAAACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTGCGACATGCTACACCACAGTTACGATACTGCTACGACACACTCCACTACAGCTACAGCCACGCTACGGCACGATGAAACAATGCTACGCGACAGCCACGTGACAGCTAAGCGACAGCTATGCGAGAGCTACACCACAGCTAACTAA
- Protein Sequence
- MLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTIAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTYSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTFHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHIPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDTATTHSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDKLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRQTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDIATTNSTTAATCYTTVTILLRHTPLQLRHATPQLRYCYDTLHYSCDMLHHSYDTATTHSTTATATLRHDETMLRDSHVTAKRQLCESYTTAN
Similar Transcription Factors
Sequence clustering based on sequence similarity using MMseqs2
- 100% Identity
- -
- 90% Identity
- -
- 80% Identity
- -