Basic Information

Insect: Cosmia pyralina
Gene Symbol: -
Assembly: GCA_946251865.1
Location: CAMIUE010000086.1:19577-21904[-]

Transcription Factor Domain

TF Family: zf-BED
Domain: zf-BED domain
PFAM: PF02892
TF Group: Zinc-Coordinating Group
Description: The BED finger, which was named after the Drosophila proteins BEAF and DREF, is found in one or more copies in cellular regulatory factors and transposases from plants, animals and fungi. The BED finger is an about 50 to 60 amino acid residues domain that contains a characteristic motif with two highly conserved aromatic positions, as well as a shared pattern of cysteines and histidines that is predicted to form a zinc finger. As diverse BED fingers are able to bind DNA, it has been suggested that DNA-binding is the general function of this domain [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 0.024 19 6.7 2.6 18 43 9 31 5 32 0.93

2 19 0.036 29 6.2 0.2 17 44 36 60 32 60 0.81

3 19 0.0023 1.9 10.0 0.1 18 43 68 90 65 91 0.87

4 19 0.00015 0.12 13.8 0.9 17 43 98 121 95 122 0.90

5 19 0.015 12 7.4 4.0 18 44 129 152 127 152 0.94

6 19 0.00014 0.11 13.9 1.4 14 43 156 182 153 183 0.89

7 19 0.0097 7.9 8.0 0.5 18 44 189 212 185 212 0.90

8 19 0.0065 5.3 8.5 0.5 17 43 219 242 214 243 0.85

9 19 0.4 3.2e+02 2.8 0.1 17 43 253 276 244 277 0.79

10 19 0.91 7.4e+02 1.7 0.5 14 43 298 324 281 325 0.73

11 19 0.41 3.3e+02 2.8 0.0 15 27 358 370 354 384 0.80

12 19 0.032 26 6.3 4.3 16 43 404 428 396 429 0.86

13 19 0.55 4.5e+02 2.3 4.4 14 29 431 446 427 458 0.73

14 19 0.057 46 5.5 6.5 13 43 459 486 451 494 0.74

15 19 0.73 5.9e+02 2.0 2.7 18 44 493 516 489 516 0.83

16 19 1.2 9.3e+02 1.3 0.8 18 28 523 533 519 546 0.82

17 19 0.00014 0.11 13.9 1.9 5 43 604 641 603 642 0.85

18 19 7.4 6e+03 -1.3 0.3 15 39 659 685 653 693 0.81

19 19 2.7 2.2e+03 0.1 0.2 13 28 687 702 677 704 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	0.024	19	6.7	2.6	18	43	9	31	5	32	0.93
2	19	0.036	29	6.2	0.2	17	44	36	60	32	60	0.81
3	19	0.0023	1.9	10.0	0.1	18	43	68	90	65	91	0.87
4	19	0.00015	0.12	13.8	0.9	17	43	98	121	95	122	0.90
5	19	0.015	12	7.4	4.0	18	44	129	152	127	152	0.94
6	19	0.00014	0.11	13.9	1.4	14	43	156	182	153	183	0.89
7	19	0.0097	7.9	8.0	0.5	18	44	189	212	185	212	0.90
8	19	0.0065	5.3	8.5	0.5	17	43	219	242	214	243	0.85
9	19	0.4	3.2e+02	2.8	0.1	17	43	253	276	244	277	0.79
10	19	0.91	7.4e+02	1.7	0.5	14	43	298	324	281	325	0.73
11	19	0.41	3.3e+02	2.8	0.0	15	27	358	370	354	384	0.80
12	19	0.032	26	6.3	4.3	16	43	404	428	396	429	0.86
13	19	0.55	4.5e+02	2.3	4.4	14	29	431	446	427	458	0.73
14	19	0.057	46	5.5	6.5	13	43	459	486	451	494	0.74
15	19	0.73	5.9e+02	2.0	2.7	18	44	493	516	489	516	0.83
16	19	1.2	9.3e+02	1.3	0.8	18	28	523	533	519	546	0.82
17	19	0.00014	0.11	13.9	1.9	5	43	604	641	603	642	0.85
18	19	7.4	6e+03	-1.3	0.3	15	39	659	685	653	693	0.81
19	19	2.7	2.2e+03	0.1	0.2	13	28	687	702	677	704	0.83

Sequence Information

Coding Sequence: ATGTATCAAAATCAATTAGATTTCGTTTGCGACTACTGCTCGAGGacttttacaagaaaatataacTTACAAACTCATATTGAAAACTGTCATATTAACTCTTCATGCCACTGTGATATTTGTGGCCAGAATTTTGGCAGTCCGGCTGGATTGATACAACATTTATCCAGAGGCCATAACAATTATGGCCAGCCCTTCCCAGAATGTGAActatgcggacgaatttttacTAGAAAACAGAACATAACGTCACATATGATTACTGTGCATTTACAAGGTCTTGGCTATGAAATTCGGTGTCGGTTTTgcgaaaaaacttttactacagaaCGGAATTTGAAAAGGCATGTCAATCAATTGCATAATCCTGATGTTGAGTATCCTACGTGTAACGAATGTCAcaaggtttttaaaggaaaacacTCGCTGATAACACATATACACTCAGTACATAAAATAAGCGAGAGAGACGCTATCAAATGCCATTTGTGCGAAAAAGTGTACACGAATAACAGGAACCTGAAACGACATATAGAAATGTTTCATGGCGTAAAAGGGGAGTTTAGATGTGATATCTGCCCGAAGGTATACACTTCGAACCAGAGTTTGAGACGGCATGCAAGGACACGGCACAACACCGACAGTCAGGAACATATGACATGCAACTTCTGCATGAAAGTTATAATCGGGCGAGAAAATTTCGACAGCCATATACAGTTCCACCACCAAGACACCGAAATGGAAGGTAGAAACGAATATGTGTGCGAATCTTGCCACAAAACCTTCGAAGAAGAGTTTTATTTGAGACAACACGTAAAATCAGAACATTCGTTTAAAACTTTCTATAAGTATTGCAGGAAATCGTTACTCAAACAATACGGAATGGACACGCAAAATATATACAACTGTGAATATTGTGACAATTCTTTTTTAACTGTCTACGAGCTTAAAGATCATATGCGCATCAACCACGACACTGAGTATTCGCTATCAACTTGCAACGTCtgttttaataagtttttttgtaaagaaactATGTCTGCGCATAGAAATGTGTGTCTGCCACCGCCAAACGTGAACACATGCAGTCACTGCGACAAACTCTTCACTGATATTTCAAGCTTAGAATTTCATACGAGAATCTTTCACCCCCAAGCGCAAATCGCTGATTCTAACATTTCATCTACAAACATTGATGAAGACGCTGTTTCGTTCAAATGTGAGCATTGTGAGCGCATCTATTACAGCGACAGATCCCTCAGGCATCATATGAAGCTAAAACACACGACAGACGAAGAAGTAGAATGTGAATTGTGTGGAAAAATCTGCAGTAACAAGTATTATTTAGCTTCTCATATAAAAATCGTCCATAACAACGACTCTTGGTCGAGATGCGAATATTGTGATAAACAGTTTAAATCGAAAAGGAATATCAGAAGGCATATTGAATACACTCATTTGGGCATGCAGCGACACAAGTGTATTGAGTGTGAGACGTTGTTTAAGGAAAAACGGAGCTTGAGAAAACATGTTCGGACGAAGCATCCTAATTCGGCGGCTTTTCCTCAGTGCCACATATGTCACAAACGATTTGAGTCGGCCAAGTCTTGCAAGATACATCTTAAACTGTTGCATTCTTTCAACATGAACACCTACCCGTGTCACCTCTGTTCCGTATCGTTCAGTTCGAATGAGGcgctaaatatacatttagagacgAAACATTTAGCCGAAGATCAAATATACAAATGCGAGGAATGCAATTTAGTCTTTAAAGGGCAAGAAAAGTTTGACGCTCACAACGATGTCTGCCACGTCAATTTAGTCCCTACGATCAAGCAGAAAGTTCTTCCTAGATGCATTCTTTGCATGAAAGATTTTAGCACAAGGAAAactttgaagcggcatataaagAAATTTCACGAAGATTTTGATGTGGATGAATTAGCGACTTATGGGTCGAGGCGAAGAACGTTTACAGTTGAATGTGAAGAGTGCATAAAAAGTTTCAACGATGATTTTCATTTGAGCGTGTATAATCAGTTAAAGCATTTGAGTGATTGGGAAGTTTTTAAGTGTGGGACTTGTTTTGAGACATATAACTCCTTGGAGTTCGCGATACAGAGGTATAAGGTAACCAACGCCGATGCtactaaaagcaaaatgattCTGAGCGAACTTTGTACCGCTGAGATGAGTGAAGAAGAGCATGACTTCTCTAACTTCGGCGCTCTGCATGATATGTTGCCGGAGAGTACTACCGATGATTTACAAGTCAAATTAGAAGATTTGGAGACTGACATCAAGACGGAGCCAGCGTCGCCGTAA
Protein Sequence: MYQNQLDFVCDYCSRTFTRKYNLQTHIENCHINSSCHCDICGQNFGSPAGLIQHLSRGHNNYGQPFPECELCGRIFTRKQNITSHMITVHLQGLGYEIRCRFCEKTFTTERNLKRHVNQLHNPDVEYPTCNECHKVFKGKHSLITHIHSVHKISERDAIKCHLCEKVYTNNRNLKRHIEMFHGVKGEFRCDICPKVYTSNQSLRRHARTRHNTDSQEHMTCNFCMKVIIGRENFDSHIQFHHQDTEMEGRNEYVCESCHKTFEEEFYLRQHVKSEHSFKTFYKYCRKSLLKQYGMDTQNIYNCEYCDNSFLTVYELKDHMRINHDTEYSLSTCNVCFNKFFCKETMSAHRNVCLPPPNVNTCSHCDKLFTDISSLEFHTRIFHPQAQIADSNISSTNIDEDAVSFKCEHCERIYYSDRSLRHHMKLKHTTDEEVECELCGKICSNKYYLASHIKIVHNNDSWSRCEYCDKQFKSKRNIRRHIEYTHLGMQRHKCIECETLFKEKRSLRKHVRTKHPNSAAFPQCHICHKRFESAKSCKIHLKLLHSFNMNTYPCHLCSVSFSSNEALNIHLETKHLAEDQIYKCEECNLVFKGQEKFDAHNDVCHVNLVPTIKQKVLPRCILCMKDFSTRKTLKRHIKKFHEDFDVDELATYGSRRRTFTVECEECIKSFNDDFHLSVYNQLKHLSDWEVFKCGTCFETYNSLEFAIQRYKVTNADATKSKMILSELCTAEMSEEEHDFSNFGALHDMLPESTTDDLQVKLEDLETDIKTEPASP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00447464;
90% Identity: iTF_00072251;
80% Identity: iTF_00374458;