Basic Information

Gene Symbol
-
Assembly
GCA_902151455.1
Location
CABFWB010003122.1:13381-14772[+]

Transcription Factor Domain

TF Family
CUT
Domain
Homeobox|CUT
PFAM
PF02376
TF Group
Helix-turn-helix
Description
The CUT domain is a DNA-binding motif which can bind independently or in cooperation with the homeodomain, often found downstream of the CUT domain. Multiple copies of the CUT domain can exist in one protein (eg Swiss:P10180).
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 22 0.011 1.4e+02 4.7 0.0 21 42 8 30 6 35 0.83
2 22 0.0017 21 7.4 0.0 21 42 34 56 32 61 0.87
3 22 0.00086 11 8.3 0.1 22 42 61 82 58 95 0.80
4 22 0.0055 68 5.8 0.0 22 42 87 108 84 112 0.84
5 22 0.005 62 5.9 0.0 22 42 113 134 110 140 0.84
6 22 0.0056 69 5.7 0.0 22 42 139 160 136 164 0.84
7 22 0.0055 69 5.7 0.0 22 42 165 186 162 190 0.84
8 22 0.0041 51 6.2 0.0 21 42 177 199 168 204 0.82
9 22 0.0055 69 5.7 0.0 22 42 191 212 188 216 0.84
10 22 0.0056 69 5.7 0.0 22 42 204 225 202 230 0.84
11 22 0.0055 69 5.7 0.0 22 42 217 238 214 242 0.84
12 22 0.0052 64 5.8 0.0 22 42 230 251 227 256 0.84
13 22 0.0056 69 5.7 0.0 22 42 243 264 241 269 0.84
14 22 0.0055 67 5.8 0.0 22 42 269 290 265 294 0.85
15 22 0.0052 64 5.8 0.0 22 42 282 303 279 308 0.84
16 22 0.0056 69 5.7 0.0 22 42 295 316 292 320 0.84
17 22 0.0021 26 7.1 0.0 21 40 320 340 306 346 0.53
18 22 0.0055 69 5.8 0.0 22 42 334 355 331 359 0.84
19 22 0.0069 85 5.4 0.0 22 42 347 368 344 372 0.87
20 22 0.0053 66 5.8 0.0 21 38 385 402 379 420 0.85
21 22 0.083 1e+03 2.0 0.0 21 42 411 433 402 438 0.78
22 22 0.066 8.1e+02 2.3 0.0 21 35 437 451 433 456 0.81

Sequence Information

Coding Sequence
ATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGAATGTTCTCGGAGGATGCTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATATTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGCTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCGGAAGATGTTCTCGGAAGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGAATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGAATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGCTCTCAGAGGAGGTTCTCAGAGGATGTTTTTAGAGGATGTTCTCAGAGGATGTTCTCAGAGAATGTTCTCGGAAGATGTTCTCGGAAGATGTCCTCAGAGGATGTTCTCGGAAGATGTCCCCAGAGGATGCTCTCAGAGGATGTTCTCAGAGGATGTTATCAGAGGATGTTCTCGGAAGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCAGAGGATGTTCTCGGAAGATGTTCTCGAAATATGTTCTCAGAGGATGGATCCTTATTACAATcagttttaa
Protein Sequence
MFSEDVLRGCSQRMFSEDVLRECSRRMLSEDVLRGCSQRIFSEDVLRGCSQRMLSEDVLRGCSQRMFSEDVLGRCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDVLRGCSQRMFSEDALRGGSQRMFLEDVLRGCSQRMFSEDVLGRCPQRMFSEDVPRGCSQRMFSEDVIRGCSRKMFSEDVLRGCSQRMFSEDVLEICSQRMDPYYNQF*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-