Basic Information

Insect: Incurvaria masculella
Gene Symbol: dmd-4_2
Assembly: GCA_946894085.1
Location: CAMPPJ020000103.1:1-7078[+]

Transcription Factor Domain

TF Family: DM
Domain: DM domain
PFAM: PF00751
TF Group: Zinc-Coordinating Group
Description: The DM domain is named after dsx and mab-3 [2]. dsx contains a single amino-terminal DM domain, whereas mab-3 contains two amino-terminal domains. The DM domain has a pattern of conserved zinc chelating residues C2H2C4 [1]. The dsx DM domain has been shown to dimerise and bind palindromic DNA [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 6.2e-09 3.1e-05 24.7 1.3 26 47 4 25 2 25 0.96

2 4 2.6e-09 1.3e-05 25.9 13.1 3 47 26 65 25 65 0.94

3 4 1e-12 4.9e-09 36.8 11.6 1 47 131 172 131 172 0.96

4 4 6.9 3.4e+04 -4.3 0.8 3 9 811 817 811 818 0.67

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	6.2e-09	3.1e-05	24.7	1.3	26	47	4	25	2	25	0.96
2	4	2.6e-09	1.3e-05	25.9	13.1	3	47	26	65	25	65	0.94
3	4	1e-12	4.9e-09	36.8	11.6	1	47	131	172	131	172	0.96
4	4	6.9	3.4e+04	-4.3	0.8	3	9	811	817	811	818	0.67

Sequence Information

Coding Sequence: GCAACCGCGTACCGCCACTGCCAGTGTCCCAAGTGCGGGCTCATCAAGGAGAGGCAGCGCATTGTGGCGGCACAGACCAAGTGTGTACGCTGCCGCATCCACGTGTGTGGCCACAGGAAGGCAACCGCGTACCGCCACTGCCAGTGTCCCAAGTGCGGGCTCATCAAGGAGAGGCAGCGCATTGTGGCGGCGCAGGTAATGCGATACAATCAAACCCCAGGCATACTGAGCAACGGCGGCAGAAGCAGGCGCGCGGGAGACCAAGTGTGTGCGCTGCCGCAACCACGTGCGTGGCCACAGGAAGACAAGCGCGTACCGCCACTGCCAGTGTCCCATGTGCGGGCTCATCAAGGAGAGGCAGCGCATTATGGCGGCGCAGAAGCAGGCGCGCGGGAGACCAAGTGTGTGCGCTGCCGCAACCACGTGCGTGGCCACAGGAAGACAAGCGCGTACCGCCACTGCCAGTGTCCCATGTGCGGGCTCATCAAGGAGAGGCAGCGCATTATGGCGGCGCAGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAAAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGAAGGATCTACGGCATGCGGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAAAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGAAGGATCTACGGCATGCGGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAAAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGAAGGATCTACGGCATGCGGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAAAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGAAGGATCTACGGCATGCGGGTGGCGCTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGTAGGATCTACGGCAAGCGGGTCACTTCTGATTTCTCCGTGGCTGTAGGTGGCGCTGAAGCGACAGCAGATGGCGAGAAAAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGGCGCCGCGATGGACAGGCTTCCCCCGGGTAGGATCTACGGCAAGCGGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGAGCCGCGATGGACGACTTTCCCCCGGGAAGGATCTACGGCATGCGGGTCACGTGCCCGTGATCCAGTGGCGCTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGAGCCGCGATGGACGACTTTCCCCCGGGAAGGATCTACGGCATGCGGGTCACGTGCCCGTGATCCAGTTCTGATTTCTCCTTCTGATTTCTCCGTGGCTGTAGGTGGCGCTGAAGCGACAGCAGATGGCGAGGAAAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGGCGCCGCGATGGACAGGCTTCCCCCGGGTAGGATCTACGGCATGCGGGTGGCGTTGAAGCGACAGCAGGCGGCGGAGGACAAGATAGCACTACACCTGGCGGCGGCTGAGAGCGGCGCCGCGATGGACAGCCTTCCCCCGGGAAGGATCTACGGCATGCGGGTCACGCAGCCGTGCCCCAGTCCCGATGCGGAACCTGATTCTCTCCACGACCAAGAGCCAATCCACATCGACAGCGAGACTAGCGACTCGCACCCTGAATGCTGCTCCACCTCCTCAAACTCTCCGCGCGCCTCTTCAACCGCTTCCTCCAAGCACAGAGATGGTGACAGCGGGCGGTGCGGGGAGGAGGGGAGCACGGTTAGTGCGGCGGGCCTGGACATGCTGAGCAAACTGTTTCCCGGCAAGAAGCGTGCTGTGCTGGAGCTCGTTCTGCGCCGCTGCAACCACGACCTGCTGCGCGCCGTCGAACACTTCAACACAACGCAGCTCGTGCTACTCCGCTGCAACCGGGACCTGCTGCGCGCCGTCGAACACTCCAACACCACGCAGCTTGTGCTGCACTGCTGCAACCACAACCTGCTACGCGCCGACGATCACTTCTACATCTCACAGGGCCAGAAGCCCCCAACGGCGCCGGACAGCCACGCCGACTCGTCCGCCGGGCGCTGGTCCGCCTTCCGGCCCGTGGCGCCGCGCGGCGAGCTGCTGCCGCTGTCGCTAGTGATGGGGAGGGTGTGCCCGGAGTGGGTGCTGCCGCTGCCCGCGCTGTCGGCGCCGCTGCTGCTGCCGCTGCAGCACGCCGCGCACGCGCCTCCGCCGCCGCCGCCCTGCCTGCCTGACTGCCGCCAGTGCAACGCGCCGCGCTAG
Protein Sequence: ATAYRHCQCPKCGLIKERQRIVAAQTKCVRCRIHVCGHRKATAYRHCQCPKCGLIKERQRIVAAQVMRYNQTPGILSNGGRSRRAGDQVCALPQPRAWPQEDKRVPPLPVSHVRAHQGEAAHYGGAEAGARETKCVRCRNHVRGHRKTSAYRHCQCPMCGLIKERQRIMAAQVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGMRVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGMRVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGMRVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGMRVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGKRVTSDFSVAVGGAEATADGEKKIALHLAAAESGAAMDRLPPGRIYGKRVALKRQQAAEDKIALHLAAAESEPRWTTFPREGSTACGSRARDPVALKRQQAAEDKIALHLAAAESEPRWTTFPREGSTACGSRARDPVLISPSDFSVAVGGAEATADGEEKIALHLAAAESGAAMDRLPPGRIYGMRVALKRQQAAEDKIALHLAAAESGAAMDSLPPGRIYGMRVTQPCPSPDAEPDSLHDQEPIHIDSETSDSHPECCSTSSNSPRASSTASSKHRDGDSGRCGEEGSTVSAAGLDMLSKLFPGKKRAVLELVLRRCNHDLLRAVEHFNTTQLVLLRCNRDLLRAVEHSNTTQLVLHCCNHNLLRADDHFYISQGQKPPTAPDSHADSSAGRWSAFRPVAPRGELLPLSLVMGRVCPEWVLPLPALSAPLLLPLQHAAHAPPPPPPCLPDCRQCNAPR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -