Basic Information

Insect: Sitodiplosis mosellana
Gene Symbol: -
Assembly: GCA_009176505.1
Location: VUAH01000026.1:77739-80025[+]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.0018 35 4.3 4.5 8 16 116 124 115 128 0.84

2 10 0.17 3.3e+03 -2.0 7.5 11 21 172 182 170 183 0.79

3 10 0.46 8.8e+03 -3.4 0.4 13 19 201 207 201 208 0.84

4 10 0.011 2.2e+02 1.7 5.9 3 21 311 329 309 330 0.86

5 10 0.0064 1.2e+02 2.5 3.0 9 15 346 352 346 353 0.94

6 10 0.02 4e+02 0.9 5.3 9 15 419 425 418 426 0.91

7 10 1.3e-09 2.6e-05 23.9 2.0 8 19 438 449 434 451 0.93

8 10 0.84 1.6e+04 -4.2 1.2 8 18 468 478 467 480 0.72

9 10 0.74 1.4e+04 -4.1 9.7 8 20 521 532 520 534 0.81

10 10 3.6e-07 0.007 16.1 5.7 10 21 611 622 604 622 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.0018	35	4.3	4.5	8	16	116	124	115	128	0.84
2	10	0.17	3.3e+03	-2.0	7.5	11	21	172	182	170	183	0.79
3	10	0.46	8.8e+03	-3.4	0.4	13	19	201	207	201	208	0.84
4	10	0.011	2.2e+02	1.7	5.9	3	21	311	329	309	330	0.86
5	10	0.0064	1.2e+02	2.5	3.0	9	15	346	352	346	353	0.94
6	10	0.02	4e+02	0.9	5.3	9	15	419	425	418	426	0.91
7	10	1.3e-09	2.6e-05	23.9	2.0	8	19	438	449	434	451	0.93
8	10	0.84	1.6e+04	-4.2	1.2	8	18	468	478	467	480	0.72
9	10	0.74	1.4e+04	-4.1	9.7	8	20	521	532	520	534	0.81
10	10	3.6e-07	0.007	16.1	5.7	10	21	611	622	604	622	0.95

Sequence Information

Coding Sequence: ATGTGTTTAACATACGATCAAATTGAACAGGCATGTGGATTTTTGGTGCGTGGCGAATTTAACACATTTCTTTATTGCTGCAAAGTTTGCCgtgttgaatttgaatcgGGCCCACACTTGGAATCACACATTTTATCAGAGCATGATGATGACAAAAGTGGCATTTTGACGAATGATGGTTTTATGGACGAATCAATATCGACCGATTCACCAATTGAAATCGATCCGACAAACGTCAAAATTGAACCGGATGATCCGATTTATTTGGTCGAAGACGATTTTAATGATGATTTTAATGATTCAGCAGCTGTTGAAGTGATTGTTCCAAGAAATTCGGCGGTTGTTCCAAAACGACCAGTCGGACGGCCACGGAAGAATAAACATTTGATTGATATCCCGGTGGAAAGTAAATATGGTACACGAAATGCTGGAGCATTCAAAGAAGGTATTTACAACTACGATGCCAATGACAGAGGCGATAAATTTGGTGGTTATGCTAACGTCGGTAAAAGACGACCAGGACGACCACGTGGAGCaaaagataagaaaaaacgcaGAGGTAGAAGAAACCTGTTGGTTGATGATGAGAGCAAATATTTTGGTCGACCTTCATCCAGTAAACATGACAATTTGAACAGCAAAACAGTCAAAGCAGAACGGCAAAGAGGTCAGCAATTGAAAGCAATGAACGAAGGAATGAGCAGCGACGATGAACCAACACAAGTGAACACCAATGGACTTGAAAGTGTGTTACAGCATCGTTTGTCGGGTAATCGGAAGTGGCGACACGATGCCAGCAATGACGAATTTGGCCATGTCGACGTTGGAAACAGCGACAGAAATTGTAAATGGAATAACAACCACAATTACATTGATGACGACAGCGATATTTTTGATGATTTGGATGGAGGTGAGCCGAGCCAACACCGAACTCAAAATCCAGTCGGTAAACGTCGACCAGGACGGCCGCGTGGAGCgaaagataagaaaaaacgTGCCGCCAGAACATTTGCATCGGTCAGCGGATCGATTCTAAAGAAACCACGAGGTCGACCGTCAATGAAACAAGAATTGACACCGTACAATGATGGCCACAGCTATGAGCCAATCTCAACTGAAAATCATACTCACCGTCCAAAAGCCGAAAAAAGTGTTGCAACTCTCAGTCAATcagatttcaatttcagctATGCTGAACCATTCAACGCCGGTGAAGATATGCCATTCGATGTTAAGTCGGGAATTCTCGTTGCTAAAAAACCACGAGGTAGACCGCGCAAACACCCAAAACCTGCCGTTGATGTCACAATTCCGAAACGACCACGAGGTCGACCACGGGGCTCAAAGACTCAAAAACACTATCACAGTGATATCGTTGGTGTGGATTTTGAAGAATTGCCGCCACAAAGACTGCGAGAAAGGCCATCGGGTCAACGAAATTGGATCGACGATGACAGTGGAAGCGATAGCAACAGCAAACGTGGTAACGATGGTGGCGAAAACCAAAGCCATGTCAATATTGGTGAATCAATTTTATCCAATGCTATATGTTCAATTGGTCCGAAGCGACGCGGCAGACCGCCTGGCctgaagaagaacaaaatcaTCAATCTTAGACCGATCAAAATCGAATTAGATGATTCAGTTGCATACGAGCCAAGCGATCAACCACTCGAAATAAGCAACTGGCCGACAGAGCACGATAGTCAAGCGGCTTCTACGAGCATTAGCAACTTCTGCAAACCATTCGAAATCCAACTTGAAGACATCTACAGCTCAAACCAAGTGCAAAATTGGCTCGAACCAACATCCGGATCTGAATCGACTTCTAGACCGAGAGGACGTCCGCCTGgatctaaaaataaataccacTAA
Protein Sequence: MCLTYDQIEQACGFLVRGEFNTFLYCCKVCRVEFESGPHLESHILSEHDDDKSGILTNDGFMDESISTDSPIEIDPTNVKIEPDDPIYLVEDDFNDDFNDSAAVEVIVPRNSAVVPKRPVGRPRKNKHLIDIPVESKYGTRNAGAFKEGIYNYDANDRGDKFGGYANVGKRRPGRPRGAKDKKKRRGRRNLLVDDESKYFGRPSSSKHDNLNSKTVKAERQRGQQLKAMNEGMSSDDEPTQVNTNGLESVLQHRLSGNRKWRHDASNDEFGHVDVGNSDRNCKWNNNHNYIDDDSDIFDDLDGGEPSQHRTQNPVGKRRPGRPRGAKDKKKRAARTFASVSGSILKKPRGRPSMKQELTPYNDGHSYEPISTENHTHRPKAEKSVATLSQSDFNFSYAEPFNAGEDMPFDVKSGILVAKKPRGRPRKHPKPAVDVTIPKRPRGRPRGSKTQKHYHSDIVGVDFEELPPQRLRERPSGQRNWIDDDSGSDSNSKRGNDGGENQSHVNIGESILSNAICSIGPKRRGRPPGLKKNKIINLRPIKIELDDSVAYEPSDQPLEISNWPTEHDSQAASTSISNFCKPFEIQLEDIYSSNQVQNWLEPTSGSESTSRPRGRPPGSKNKYH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -