Basic Information

Insect: Agriphila geniculea
Gene Symbol: dl_1
Assembly: GCA_943789515.1
Location: CALSUL010000333.1:583652-614054[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 1.3e-51 2.2e-47 163.0 0.3 2 123 52 177 51 182 0.94

2 9 3.7e-07 0.0059 18.4 0.0 92 123 180 211 172 216 0.87

3 9 2.4e-07 0.0039 19.0 0.0 84 122 206 244 204 249 0.86

4 9 6.9e-07 0.011 17.5 0.0 93 122 249 278 245 282 0.92

5 9 6.5e-07 0.011 17.6 0.0 93 122 283 312 279 317 0.92

6 9 5.9e-07 0.0095 17.7 0.0 93 123 317 347 313 352 0.91

7 9 5.5e-07 0.0089 17.8 0.0 93 123 351 381 346 386 0.91

8 9 6.5e-07 0.011 17.6 0.0 93 122 385 414 381 419 0.92

9 9 1.3e-24 2.1e-20 75.2 0.0 83 169 409 495 407 495 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	1.3e-51	2.2e-47	163.0	0.3	2	123	52	177	51	182	0.94
2	9	3.7e-07	0.0059	18.4	0.0	92	123	180	211	172	216	0.87
3	9	2.4e-07	0.0039	19.0	0.0	84	122	206	244	204	249	0.86
4	9	6.9e-07	0.011	17.5	0.0	93	122	249	278	245	282	0.92
5	9	6.5e-07	0.011	17.6	0.0	93	122	283	312	279	317	0.92
6	9	5.9e-07	0.0095	17.7	0.0	93	123	317	347	313	352	0.91
7	9	5.5e-07	0.0089	17.8	0.0	93	123	351	381	346	386	0.91
8	9	6.5e-07	0.011	17.6	0.0	93	122	385	414	381	419	0.92
9	9	1.3e-24	2.1e-20	75.2	0.0	83	169	409	495	407	495	0.95

Sequence Information

Coding Sequence: ATGAAAAGTAGGCGCGGTATTACAAGCAGAGGTTGTGTTAAACGATGCATTTATGTGTGCGCAGTGGAGCTGATATTCTCGGAGGAACCTGCCCTGCAGTCGGCGGTGGCGGCGACGGCCCCGCCCAGCGCCATGCAGGCGGCGCCCTACGTCTACATAGTCGAGCAGCCCGCGCCCAAGTCACTCAGGTTCCGCTATGAGTGCGAGGGGCGGTCGGCGGGCTCGATTCCCGGCGTGCACAGCACGCCCGAGAGCAAGACCTTCCCCGCCATCAAGGTGTGCGGCTACAAGGGCTGCATGGTCATCGTCGTCTCCTGCGTCACCAAAGACGAACCTTACAAACCGCACCCGCACAACCTGGTGGGGCGCGACTGCCAGATGGGCGTGTGCACCGTGAAGGTGAAGACGGAGGGCGACGCCGACCAGTGCCAGGTGCAGTTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACGCCAGGTGCAGTCAAGAACCTCGGCATCCAGTGCGTCAAGCGCCGCGACATCGCCGAGGCGCTGCGCGTGCGCCAGGACCTGCGCGTCAACCCCTTCAAGACTGGATACAGTCATAAGAGCCAGCCACAGAGCATCGACTTGAACGCCGTGCGGCTCTGCTTCCAAGTATTCCTCACCGATGACACCTACAAGGTGCAACGAGCTTTACAGCCGGTGGTGTCAGAAGTGGTGTACGACAAGAAGGCCATGTCGGACCTGCTGATAGTGCGCTCCTCGCACTGCTCCGGGCCCGTGCGCGGGGGCACCACGGTCATACTGCTGTGTGAGAAGGTGACGCGCGAGGACACGGAGATCTGGTTCTTCCACGAGGAGTGGACGGAGCGCGTGCCGCCCGAGTTCGTGCACAAGCAGCTCGCGCTCGTGTTCAAGACGCCGCCCTACAAGGACAAGTACCTGGCCGACCCCGTCACGGTACAGTTCCAGTTGCACCGAGTGTCCGACAGCGCCAAGAGCAACACGTACACTTTCGAGTACATCCCCGAGGGACAAGGTACCCGGAAACCGCTGCCAGACCTCGCCTCTCTGGCCGCACTTTTACCCCCCTCCCGCCCCCTCTCTAACTCCTTGATCCCCTCCGAATCCCCCCCAGACCCCAACAACAACGAGAACGCTCTAGTTTCCTCCACGAGCGATTCTCTGAGCCCGGACGATTCCGTTTCCGTGACAATCGACGTCAACGGAAACGGCGACGTCGAAATGCCGGATTCGAACGAAAAAAGCCTCAACGAACTGTTAGACCAAGTCGCGGAACTGGACGAGATATACACGGAGAACCGCACGCGTCTAGAAAATATGACCACTTTAAACGATGAGGATTTGGAAGATTTTAACGACGCCGGAACTTACACTAGCTTGCAGTTAGCTTTTAGGAATCCGGTCCCGATTTCTGAACCGGAGCCGTTCGAGGAGACGCCGATTAGCTACCGCGGCCCCATCATAGAGTTCGCGCCTTTGAAACGAGACACCGACGACAAAgctccccccctcccccctaaAAGGGTCCGCAAAATATCCACTACTGAGCCGTTCAAATCGAGTCAAACCTCCGTCGATAGCATCATTAAACCGGGCAGACAGCTGCCCGTCACCAGAAACCCCGAAGTTCTAGTCACTAAATCGGAAATGACGGTCGCACGGAGCGAACCGGCTCTACCTCCCGTGAAAAAACGCTCGTTTTTCTCTCGTCTCTTCCGAAGAAAGGACAAATCTCCCGCGCCTAGCGTCAAATCCGAAGGTCGTAAAGAAAAGAACTCTAAACCCGTCGGCCGGTCGATCAGCAGCGTATCCGGGCAGCGTCCGTCCCGGTTCAAATCGTCCGTTTCGCACACCTCGTTAAAAGACAACACGTCAAACGCAGGGTTAAGTTACGCCGATAGTATAACTCATATATCGCTTCACGCGGACGAAGAGGAGAAATCCGCGTCGCAACCCTGCTTGCATCCGCTCGGTGCGGATGTTCCGGAGGGATCTATATTGGTAGCGGAAAGCGTATTAGCTTTGGACGCGAACGCGTTCCGCAAACTGCAGGACGATTTAGATATTACGGATGCGGAACATTACGCGCTGTATATGGCGGTCGCGCCGCACGCCACTGCGTCAGAGTTCGATGAAACGAGCTGCTATTATTCGCCCGTCGATACTAGCAagtttcataatcataattaa
Protein Sequence: MKSRRGITSRGCVKRCIYVCAVELIFSEEPALQSAVAATAPPSAMQAAPYVYIVEQPAPKSLRFRYECEGRSAGSIPGVHSTPESKTFPAIKVCGYKGCMVIVVSCVTKDEPYKPHPHNLVGRDCQMGVCTVKVKTEGDADQCQVQFKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTPGAVKNLGIQCVKRRDIAEALRVRQDLRVNPFKTGYSHKSQPQSIDLNAVRLCFQVFLTDDTYKVQRALQPVVSEVVYDKKAMSDLLIVRSSHCSGPVRGGTTVILLCEKVTREDTEIWFFHEEWTERVPPEFVHKQLALVFKTPPYKDKYLADPVTVQFQLHRVSDSAKSNTYTFEYIPEGQGTRKPLPDLASLAALLPPSRPLSNSLIPSESPPDPNNNENALVSSTSDSLSPDDSVSVTIDVNGNGDVEMPDSNEKSLNELLDQVAELDEIYTENRTRLENMTTLNDEDLEDFNDAGTYTSLQLAFRNPVPISEPEPFEETPISYRGPIIEFAPLKRDTDDKAPPLPPKRVRKISTTEPFKSSQTSVDSIIKPGRQLPVTRNPEVLVTKSEMTVARSEPALPPVKKRSFFSRLFRRKDKSPAPSVKSEGRKEKNSKPVGRSISSVSGQRPSRFKSSVSHTSLKDNTSNAGLSYADSITHISLHADEEEKSASQPCLHPLGADVPEGSILVAESVLALDANAFRKLQDDLDITDAEHYALYMAVAPHATASEFDETSCYYSPVDTSKFHNHN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -