Basic Information

Insect: Megalurothrips usitatus
Gene Symbol: -
Assembly: GCA_026979955.1
Location: CM049607.1:7084628-7090240[+]

Transcription Factor Domain

TF Family: DM
Domain: DM domain
PFAM: PF00751
TF Group: Zinc-Coordinating Group
Description: The DM domain is named after dsx and mab-3 [2]. dsx contains a single amino-terminal DM domain, whereas mab-3 contains two amino-terminal domains. The DM domain has a pattern of conserved zinc chelating residues C2H2C4 [1]. The dsx DM domain has been shown to dimerise and bind palindromic DNA [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2e-09 2.1e-06 26.9 8.3 5 37 388 421 386 428 0.88

2 5 0.011 12 5.3 10.0 3 37 460 496 458 506 0.83

3 5 0.13 1.4e+02 1.9 0.2 3 27 510 535 508 536 0.83

4 5 3.8e-14 4.1e-11 42.0 14.1 4 45 965 1006 962 1010 0.90

5 5 1.4e-09 1.5e-06 27.3 11.8 1 36 1145 1181 1145 1189 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2e-09	2.1e-06	26.9	8.3	5	37	388	421	386	428	0.88
2	5	0.011	12	5.3	10.0	3	37	460	496	458	506	0.83
3	5	0.13	1.4e+02	1.9	0.2	3	27	510	535	508	536	0.83
4	5	3.8e-14	4.1e-11	42.0	14.1	4	45	965	1006	962	1010	0.90
5	5	1.4e-09	1.5e-06	27.3	11.8	1	36	1145	1181	1145	1189	0.89

Sequence Information

Coding Sequence: ATGGAGGCGAAAGTTCGCGGCATCCGAATGTGCGTGCGGAGCATTCGGCGGACGCTGCTGGGCCACAACCCCCTGGAGCCGGAGCGGCGCCGCCCTAAAGAGCGGGCGGACGAGGTGAAGCCTGAGCAGGTCCTGATGAGCCCCGGCTTCCCGCCGCTGCCCAGTGACCCCCCGCCGGCGACGCCCCCGCCGCCCCCGCAGCCGCTGGACGCGCTGGACGAGAATGGCAACGAGCCCAAAGACACCTGGAACGACGACCTGGGCCTGGAGTCGCTCGGCGACGCCCTGAAGAGGGAGAAGGAGCTCATCAGCCAGTGGAGCTGGGACGACATGGTGGTCCTCTCCGACATCAAGGACGCCGAcgacgatgccggggaccggagccgcagccggagtcggtaccgcagcaggagccgcagcaggagccgcagcaggagccgcagccggcgccgcagccccggccgaggccggcgacgcagccgcagccggagccgccgccggagccgcagccgggaccgcagaggccggcgccggcgccgcagcagtagcagtagcagcgacagccggacccgcggccgcagccgccgggggcgtggccgcggtcgtggccgaggctcatcgtcatcgcggtccagcagcagccggGCCTCGTTCGCGTCGAGCGCGGAGCGCCGCGCCCAGAAGGTGAAGCGGCTGTACCGCAAGAACCGCAGCAGCCGGAGCCGCAGCCGCAGCCGCTCCCCGTGCATCGTGTCGCGCTGCGTGGTGGGGGTGGGGGAGCGCGCCCGGCGCAGCAGCGGCAGTGGCGGCGGCAGGCCGACGGCCGCCACCAAGCCCCCCGCCCGGGAGGAGGCGTCCTCGACGCCGGCCTCGGCGTCAGCGTCCGGACTCGCGGACTCGGACTCGACGTGGGACATGAGCGAGAGCACCCCGACGCCAAGCCAGACCCCGACCTCCCCCAGCCCCCCGCCCCCGCTGCCGCCCCCTCCGCCTGGGGCCCTGGCGCCTGGGCCGGACCCCCGCCCTGACGGCCGAGCCGCCGCCCGGTCCGAGGGCCGCAGTTCGCGGCGCCCTGAGGGCCGCGGGGGCCTCCGCTGTGACGCCGACGACACGGACCCGTCCTCCCGCCCGGGCAGGTCGTCCTGGCGGTCGGGCGTGCCCTGCAACCTCTGCCGCAATCACGGCGTGTACGTGGTGTACGGCCCGGGCCACAAGTTCCGGTGCTCGTACGCGAGCTGCTGCTGCGACTCGTGCATCGCCACCATCCTGGAGCATCGGCGCGACCCCACGCAGGTGTTCCTGTTCCTGCAGGACAAGGTCACGATTGAGGAGGAGGTGCGCCGCGGCTGCCGGCCGCAGGTCTGGAACGGGCAGCCGGTCAAGTGCCAGTACTGCGTGAACCACGGCCACCCCGCCGACTTCAGCTCGGTGCACAGCCGCCGCTGCGTGCTGAAGCGCTCGTGCTGCTGCAACGCGTGCCTGCGCACCACCGTCTTCATGCGGGCCAAGACGGCCTCCCGCACCTCCAAGATGTGCGTCGACTGCGAGCACACGGGGCTCTACGTCCAGGACGACCCCCTGCACTCGCGGGAGTGCCGCTTCCGCGTCGGGCCGCGGGCCCAGTACGGCCTCCAGCAGGGCCTCCAGCAGGGCCTCCTTGTGAGCGACGGCGAGGACGTGCTGAGCGTCAAGGACTCGTCCAGGGACCCCCGGCTGTCGCGGAGGGATGACAGCGCCGCCCCGCCCGCGCCGCCCCCGCCGCTCCCTGTCAAGGACATCCCGACGCCTCCGGCCGTCGTCGGGGACTTGCGCCAGCCTGCGCCGCCTGGGGTGGACGACGACGAGGGTCAGGACGTGCCGCCGCCCGCCGCACACAGTCCGCCGGCGCCTGTGCCCGCCCCTCAGATCCTTCCGGCGCCCAAGCCCGCCCCTGAAGACCCCCCGGCGCCTCAGCCCGCCCCGCCGGAACCCAAGATAAAACTGAATATTGCCGAGTACCAGGCTGCCATCGCCGCCAAGCTCAAGAGGGAGCCGCCGTCTCCCGTCAAGAAGCTGGACTTCCTCCCACCGCTGCCGCCCTTCTCGCCCGTCAAGAAGCGCCCCAAGCTGGAGCTATCGGCCGTGAAGAAGCAGGACTCCACCTCGCCCGTGAAGAGAGTTCAGGTCGGGCTGGCGAATCCCGCCCACGTGAAGAAGCACGAGTCCCCAGTGAGGAAGCTGGACGTCAAATTTGGCCACCGTGCGATCAAGAAAGAGCGGCCGTCGCCAGTGAAGGTGCGGAAGATGTCCGTGTCCTCACCCGTCAAGCTGAAGGAGGAGGCGCTGTCCCCCGTGAAGCCGCCCAGGAAGGAAGTGGCCTCTCCAGACGCGCCCAGGATCACCCCGTCGGAGCAGGAGGAGGAGGAGCGGAGTACTGCGAAGCTGCCCCCTCCAGCCCCGGAAGTGCCCGAGGACGGCGTTGGCGCCCAGGGCCCCGGCGAGGCGGTGGCGCGCACTGACGTCCAGCGGCCACCCTCCCCTCCGAGTGGCGAGGCGCCGCCCCCTGCGGAGCGGGCCGCGGAGGAGAGCGTGGACGCCATCTCGGCCTTCCTGCAGCACTCGGAGGAGGCCTCTCTGCGCGCGGCGGCCGGCGACGACGTGAACCTGGACGACATCGACCTGGAGGCGCTCCTCGACGACATAGAGCCGGACGTGGAGGTGGCCGACGTAGGCGCGGAGCAGGCCGGCGCGCGCACTGTGGCGCCCCCCGCCACGCCCACCACCTCACCCCCGGCCACCCCCAAGAGGAAGTACACGAAGAGGTGCACCCTGAAGGAGCCGGCGCGTTCCTCCCCGCGGAAGGCGGCGGCGGCGGCCGCCGCCAACCACTCGCCCTCGTCGTCTTCGCCACGGCTTTGCCAGCTGTGCCGAAACCACGACGTCAAGTCCGCCTGGAAGGGCCACAAGCGGAGCTGCGCCTTCCAGCACTGCCACTGCGCGGCCTGCGCGCTGACCAGGGCCAAGCGCCGGGAGCAGAGCATGCAGCACCAGATGCATCGCGAACTCAGCAAGCCCGACGGGAGCTCGGACAGTTTGGCGGTTTTGGAGCACGTAAAGGAGCTCGAGCTCTTGCCCTGCACGACGCTCCCTCAGCAGCCCGCCGAGGACGAGAAGCCGGAGCGGTCCGCGAGCACCCTGAGCAGCGCGTCGAGCCTCGGCGCCCGCCACACCGTCGTGTTCGTGTCGGACACCCCCGTCGATCAGGACGACGACGACGATGTGGACGACACCCTGTCGGACAGGCTGGTCATCGACATGGATGGCGCGTCGTCGGACCGCGTCTCCACTCCGGCCACGTCCGACTGCGGGGCCCCGCTCTTTGACGGCGAGGTGCCCGAGCACGCGATGAAGGTCGACGACGAGGCGGAGGGCGGCGAGGAGTCCCTCCTGGGCAGGGAGAGGCAGTGCGCCTACTGCCGGCACCACGGCAAGGCGCGGCTGCTGCGCGGCCACAAGTCCAGCTGCCCTTACCGCCTCAGCTGCAAGTGCCTCCTCTGCGAGAAGCGGGCGCGCGCCCAGGGCATCCGGCCCGCCCCCGCGGCCACCACCGCCCGCTCCATCCCGGTGTCCATCCCCATCGCCCCGCTGCCCTCCCTCATGCCGCTGACCCTGGCGCCGCTGGTCAAGAGGGGCCGCGGTCGGCCGCGCGGACGCGGGCGAGGCCGCGGCCCGGCACGGAGGACGGCGCCGAGCTCGTCGGAGCAGCTGGAGCTGGAGGACGACGTGGAGGTGCGGCTCTGCGTGGACGCCACGACGCCGGTCTGCCTCTCCTTCTCGTTGACTTCTCCACTGACTGATTCATCTCTCTGTCTGCTAGGAGACCTCCTCGGATAG
Protein Sequence: MEAKVRGIRMCVRSIRRTLLGHNPLEPERRRPKERADEVKPEQVLMSPGFPPLPSDPPPATPPPPPQPLDALDENGNEPKDTWNDDLGLESLGDALKREKELISQWSWDDMVVLSDIKDADDDAGDRSRSRSRYRSRSRSRSRSRSRSRRRSPGRGRRRSRSRSRRRSRSRDRRGRRRRRSSSSSSDSRTRGRSRRGRGRGRGRGSSSSRSSSSRASFASSAERRAQKVKRLYRKNRSSRSRSRSRSPCIVSRCVVGVGERARRSSGSGGGRPTAATKPPAREEASSTPASASASGLADSDSTWDMSESTPTPSQTPTSPSPPPPLPPPPPGALAPGPDPRPDGRAAARSEGRSSRRPEGRGGLRCDADDTDPSSRPGRSSWRSGVPCNLCRNHGVYVVYGPGHKFRCSYASCCCDSCIATILEHRRDPTQVFLFLQDKVTIEEEVRRGCRPQVWNGQPVKCQYCVNHGHPADFSSVHSRRCVLKRSCCCNACLRTTVFMRAKTASRTSKMCVDCEHTGLYVQDDPLHSRECRFRVGPRAQYGLQQGLQQGLLVSDGEDVLSVKDSSRDPRLSRRDDSAAPPAPPPPLPVKDIPTPPAVVGDLRQPAPPGVDDDEGQDVPPPAAHSPPAPVPAPQILPAPKPAPEDPPAPQPAPPEPKIKLNIAEYQAAIAAKLKREPPSPVKKLDFLPPLPPFSPVKKRPKLELSAVKKQDSTSPVKRVQVGLANPAHVKKHESPVRKLDVKFGHRAIKKERPSPVKVRKMSVSSPVKLKEEALSPVKPPRKEVASPDAPRITPSEQEEEERSTAKLPPPAPEVPEDGVGAQGPGEAVARTDVQRPPSPPSGEAPPPAERAAEESVDAISAFLQHSEEASLRAAAGDDVNLDDIDLEALLDDIEPDVEVADVGAEQAGARTVAPPATPTTSPPATPKRKYTKRCTLKEPARSSPRKAAAAAAANHSPSSSSPRLCQLCRNHDVKSAWKGHKRSCAFQHCHCAACALTRAKRREQSMQHQMHRELSKPDGSSDSLAVLEHVKELELLPCTTLPQQPAEDEKPERSASTLSSASSLGARHTVVFVSDTPVDQDDDDDVDDTLSDRLVIDMDGASSDRVSTPATSDCGAPLFDGEVPEHAMKVDDEAEGGEESLLGRERQCAYCRHHGKARLLRGHKSSCPYRLSCKCLLCEKRARAQGIRPAPAATTARSIPVSIPIAPLPSLMPLTLAPLVKRGRGRPRGRGRGRGPARRTAPSSSEQLELEDDVEVRLCVDATTPVCLSFSLTSPLTDSSLCLLGDLLG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -