Basic Information

Insect: Oeneis ivallda
Gene Symbol: -
Assembly: GCA_029955525.1
Location: JARPMR010000026.1:8766838-8771275[-]

Transcription Factor Domain

TF Family: SAND
Domain: SAND domain
PFAM: PF01342
TF Group: Other Alpha-Helix Group
Description: The DNA binding activity of two proteins has been mapped to the SAND domain. The conserved KDWK motif is necessary for DNA binding, and it appears to be important for dimerisation [1]. This region is also found in the putative transcription factor RegA from the multicellular green alga Volvox cateri. This region of RegA is known as the VARL domain [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.0055 93 4.2 0.0 24 53 47 76 34 81 0.84

2 14 0.0066 1.1e+02 4.0 0.0 24 53 108 137 97 142 0.87

3 14 0.0056 95 4.2 0.0 24 53 169 198 157 204 0.85

4 14 0.029 5e+02 1.9 0.0 26 53 207 234 201 238 0.87

5 14 0.011 1.8e+02 3.3 0.0 24 53 266 295 254 299 0.84

6 14 0.02 3.5e+02 2.4 0.0 24 53 327 356 315 361 0.82

7 14 0.033 5.6e+02 1.7 0.0 24 51 384 411 372 414 0.80

8 14 0.019 3.2e+02 2.5 0.0 24 53 429 458 417 463 0.82

9 14 0.019 3.2e+02 2.5 0.0 24 53 486 515 474 520 0.82

10 14 0.016 2.8e+02 2.7 0.0 24 53 543 572 531 588 0.80

11 14 0.023 3.9e+02 2.3 0.0 24 53 600 629 588 633 0.84

12 14 0.019 3.2e+02 2.5 0.0 24 53 657 686 645 691 0.82

13 14 0.029 5e+02 1.9 0.0 24 53 714 743 702 747 0.82

14 14 0.017 2.8e+02 2.7 0.0 24 53 775 804 763 807 0.82

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.0055	93	4.2	24	53	47	76	34	81	0.84
2	14	0.0066	1.1e+02	4.0	24	53	108	137	97	142	0.87
3	14	0.0056	95	4.2	24	53	169	198	157	204	0.85
4	14	0.029	5e+02	1.9	26	53	207	234	201	238	0.87
5	14	0.011	1.8e+02	3.3	24	53	266	295	254	299	0.84
6	14	0.02	3.5e+02	2.4	24	53	327	356	315	361	0.82
7	14	0.033	5.6e+02	1.7	24	51	384	411	372	414	0.80
8	14	0.019	3.2e+02	2.5	24	53	429	458	417	463	0.82
9	14	0.019	3.2e+02	2.5	24	53	486	515	474	520	0.82
10	14	0.016	2.8e+02	2.7	24	53	543	572	531	588	0.80
11	14	0.023	3.9e+02	2.3	24	53	600	629	588	633	0.84
12	14	0.019	3.2e+02	2.5	24	53	657	686	645	691	0.82
13	14	0.029	5e+02	1.9	24	53	714	743	702	747	0.82
14	14	0.017	2.8e+02	2.7	24	53	775	804	763	807	0.82

Sequence Information

Coding Sequence: ATGACGCGGAGCAACTACGAGATCCATCTCAAGTACTCCAGGAGCCACGCCGACCGGGAAGGACTCAAATCCATCTCAAGTACACCAGGAGCCACGCAGACCGGGAAGGACTCCAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGATCCATCTCAAGTACTCCAGGAGCCACGCCGACCGGGAAGGACTCAAATCCATCTCAAGTACACCAGGAGCCACGCAGACCAGGAAGGACTCCAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGATCCATCTCAAGTACTCCAGGAGCCACGCCGACCGGGAAGGACTCAAATCCATCTCAAGTACACCAGGAGCCACGCAGACCGGGAAGGACTCCAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGATCCATCTCAAGTACTCCAGGAGCCACGCCGACCGGGAAGGACTCAACGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGAAACATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAAAACATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGATAAGAAGTTCATGACGCGGAGCAACTACGAGAAACATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAAAACATCTCAAGTACGCCAGGTGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCCAAACGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGATAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGATAAGAAGTTCATGACGCGGAGCAACTACGAGAAACATCTGATGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCTGACCGGGAAGGACTCAAGTGAGGTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTGGCCTGCGATAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGATAAGAAGTTCATGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAACACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGTGTAGCCTGCGATAAGAAGTTCCTGACGCGGAGCAACTACGAGAGACATCTGAAGCACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAAACCATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGAGTTTCTTGTTCAGACCCACGCCAGCGGGAAGCAGTACGCCTGCGTAGCCTGCGACAAGAAGTTCATGACGCGGAGCAACTACGAGAACCATCTCAAGTACGCCAGGAGCCACGCCGACCGGGAAGGACTCAAGTGA
Protein Sequence: MTRSNYEIHLKYSRSHADREGLKSISSTPGATQTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYEIHLKYSRSHADREGLKSISSTPGATQTRKDSSEFLVQTHASGKQYACVACDKKFMTRSNYEIHLKYSRSHADREGLKSISSTPGATQTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYEIHLKYSRSHADREGLNGKQYACVACDKKFMTRSNYEKHLKYARSHADREGLKNISSTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYEKHLKYARSHADREGLKNISSTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYERHLKYARSHADREGLNTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYERHLKHARATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYERHLKHARSHADREGLNTPGATPNGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYERHLKHARSHADREGLNTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYEKHLMHARSHADREGLNTPGATLTGKDSSEVLVQTHASGKQYACVACDKKFMTRSNYERHLKHARSHADREGLNTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYERHLKHARSHADREGLNTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFLTRSNYERHLKHARSHADREGLKTISSTPGATPTGKDSSEFLVQTHASGKQYACVACDKKFMTRSNYENHLKYARSHADREGLK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01092358;
90% Identity: iTF_01092358;
80% Identity: iTF_01092358;