Basic Information

Insect: Drosophila subpulchrella
Gene Symbol: Nfat5_1
Assembly: GCA_014743375.2
Location: NC:23903292-23947441[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1.6 5.8e+03 -3.2 4.5 106 122 185 201 164 218 0.45

2 5 4 1.5e+04 -10.5 11.7 88 122 325 359 297 396 0.58

3 5 5.3e-37 2e-33 115.5 0.6 1 168 485 644 485 645 0.97

4 5 0.22 8e+02 -0.4 0.0 46 71 741 766 734 786 0.82

5 5 2.2 8.2e+03 -3.7 8.0 105 126 973 994 950 1034 0.46

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1.6	5.8e+03	-3.2	4.5	106	122	185	201	164	218	0.45
2	5	4	1.5e+04	-10.5	11.7	88	122	325	359	297	396	0.58
3	5	5.3e-37	2e-33	115.5	0.6	1	168	485	644	485	645	0.97
4	5	0.22	8e+02	-0.4	0.0	46	71	741	766	734	786	0.82
5	5	2.2	8.2e+03	-3.7	8.0	105	126	973	994	950	1034	0.46

Sequence Information

Coding Sequence: ATGCTTTTGAAATTCACAAAAACCAGTGGCGCTGGACCCTCGTCCGTACCGCTGCTGCCCCCCAACCCCTCGCCGGGCTCCAGTTCGCCGTCCATgcaggcaacaacaacaacgtaCGCGGCCCGCGGAACAGGCATGAGGATGACCATGTCCACGAATTCCACAATGAGTGCGCGAATACATCGGAAGGGATTTCGCATACCATCGAAAAGACAGCCGGGTAAGGGATTGCCCGGTAAGCTGCATACCATCACCAGGGCGGGTCCCGGCAAGCTTGTTCCTGGGAAGCGAATACCACAACGACCCCATCCGCCGCCCTGCGACAACTCCAACGACAGTGGCCTGGGGTTCGACCAGCACACGGAGCTGAGGTCCTCGGCGGgggcggggggcgtggccgaCGCTGGGGGCAGTGGGAGCGGCACCAACTCCGGCCAGCGGTCCAGTTTGCTGGTCAATAGTGCGCTAACCAACACAGTGGCTGCTGCAGCGGCCGCAGCAGCTGCTGCAGTGGCCAGCAACACGttgcagcaacatcagcagcaccaccagcagcagcagcagcaacaacagcaacaacagcagcaacagcaacagcagcagcagcaacaacagcagcagcagcaacattcaCCGCAGCAGCATTTAATACGAGCGATACCTGTATCAAGATCGCGGCACGACAAGAAAATGATGGGTCACTATCTGGAGGATCTGGAGGATCACCTGATATCGGCGTCCTCCTCGGAGGATTCGGCCGCCTCGACGCCGCCCTGTTTGGACGAGGATACGGGCTTTGTGAACGACAGCAGCTCGACGACCATTGGTGGCAATAGCAACTCGGATCCATTTGGAGGGGTTTTCCAGGCCACCGAAGCAGCCGTGGCAGCAGCCGTAAATGCCTTCAccctgcaacagcaacagcagcagcagcagcaacatcaggtgcagcagcaacatcagccgagccagcagcagcagcaacagtttCAGTACAACGGATTGctgttgcagcagcagcagcagcagcaacatcctCATCCCCATCAgaatcagcagcagcagcatcatcagaatcagaatcatcagcatcatcagcatcaccatcatcatcatcgacATGGCAAGCACATCAAACGCAAGAAGCTCGAGTGCAATCAGGTGGAACTGGACAACGATGATGCCTGCAGCGAGGATGAGTTTATCCGTAAGATTGCCAGCACGGTGGCGGTGACATCAGCGGCGGATGACACGCCCCCCCCGCCCCCAGTGGCCGCCCCCGcacctgccacgcccactgtaagcCTCCTGCCGCGCATcaccaacagcaacagcaacaacaacactgAGACAAAATTCATATCGGCCAGGACTGTCACCCGGGTGGCGAACAAGCGACAGCCCACCACCCCGCTGAACAGCATCGCCAGCTCCAACGATGGCCTGGTGCAGCTGGAGATCGTCTCCCAGCCGGAGCAACAGCATCGGGCCCGCTACCAGACGGAGGGCAGCCGTGGGGCAGTCAAGGATCGCAGTGGCAACGGATTTCCCATCGTCCGACTGGCCGGCTACGACAAGGGCGCCGTCCTCCAGGTGTTCATCGGCACTGATATTGGACGCGTGGCGCCGCACATGTTCTATCAGGCCTGCAAGGTCGCCGGCAAGAACTCGACGCAGTGCAACGAGAAGAAGGTCGACGGCACCATGGTCATCGAGATCGATTTCAAGCCCGAAACGGACATGACCATCACCTGCGATTGCGTTGGCATCCTGAAGGAACGCAATGTGGATGTGGAGCACCGCTTTCCGGAGCACCTGGCGCAGAAGAACAAGAAGAAGTCAACCCGCTGCCGGATGGTCTTCCGCACCCAGCTGACCCGTGACGATGGCACCACCGAGACCCTCCAGGTCTGCTCGAATCCcatcatctgcaCTCAACCACCTGGCGTACCGGAGATATGCAAGAAGTCTTTGAACTCGTGTCCCGTCGACGGCGGCCTCGAGCTCTTCATCATTGGCAAGAACTTTCTCAAGGACACGCACGTGGTGTTCCAGGAGACCTACGACAGCGTCAATGGCGACGATCCGGCCACAGAGATTGCAGTGCGCCAGCAGCTCATCGGCGGAACAGCCGCCCTGTGGGAACAGAGCGTTCTGCCGGACAAGGAGTATCTCCACCAGACCCATCTGATTTGCACGGTGCCGCCGTATCTGCAGAGTATCGTCAAGCCGGTCCAGGTGCAGGTGTCGATCGTCTCCAGCGGCAAGAAGAGCGAACCGCACACGTTCACCTACACGCCCAAGGGACAGTACACGACGCTGGCGGCGGCCAGCACGTTAAGTAACACAATCCACGCCCAAGATGTGAGCGGTTTCATGGACACCACATCGGCGCCGGGTGCGAGTTGCCCCAGTGGTTGGAGCGGGGCCAGCGGTTCCGGGAATCCATCAGTTCCGGGCGACAACGTGGAGGCCAAGCATGAGATCGATTCGGGCATGATGCCGCCACCGATTACCACTCAAATACCGATGGGCGTTCGCCGCTCCTCGCTGCCCAGTGTCACGCCCATGATCACCGATCAGCAGCTGGTCCATCTAAATGCGGCGGTGGCCAATGCGGAGGCCCTGAAGACGGAACTCCTCGATGACAGCAACTCGCACAGTCCCCTGACCGGCGAGTCCACGCCGGATAGCCCGAATGCAGCCCTGCAGTATCATCGCTTTGTGCGAAAGCCCAGCCTGGACACGATTATGTACGATCAGTCCAACAGTCTGCCCGGCTTCCCGGCCGTTGTGGCACCGGCAACAGCTGCTGCCGTGGCCGCTGCCGTGGATATCGATCCGGCCGCGGTGGCTGTGGCAGTGGAACTGGCCGTCAAGAATGAGATTGTAAAGCATGTGgtgcagcagcatcagcagatGCAGGAGCAAATGCaggaacagcagcagcagcaacagcagcagcagcagcagcaacaacagcagcagcaaccccagcagcagcaacagcagcagcagcaccaacagcagcagcaacagcagcaacaggtgCACAAATTCATCGATGAGCTGACCAAATCCACATCGGTGGTTACCAGCAATGGGACCAGTGAGCCAGCTCTGTTCACCTCGTCGGCGGTGATTGATCACGCTCTGACCGATATTCTGCAAGCCAAGGTGGGCATTGCCCCGCCCAATGTGGTGCTGGAGAGGAGCTTGTCCCTGAGCTCCACGAACTCCAGCAGTTCCATGAGCGGCAGCGAGAGTTCCCCCAACAGTTCACCCCTGACCCAGGATATCATACTCAATTCAGAGCCGGCAGCAGCGCTGGCCGGAGCAGCTGCCTTGGGCGGCCCATCGCCCGTCGATGTCACCGGTGGCCTGTCCACCGATATCATCATGAATCCCGCTGTTTCACCCTCGACGATTTTGTGCTCCGCCAATGGAGCGGCCACGGCAGTGGTGCCCAATATACTGGCACCCCATCAGGTGACCATGGCCAACTCCATATTGAACGACATAGCCATGCAGCCGGAACCCACACAGCAGGATGCAGCGGTGGCTGCTTTGGCGCTGAGTAACATCATGATGAGTCCGCCCACGGCGGCATCGGGTGTGGGTGTGGTGGACGAGCTGCCACCCACGCCGGTGGCTATGCAGCCCGAGGTGGCGGCCACTGCCACATCAACGGCGGTGAGCAACATGATCATCAAGGCAGCGGCGGACTTTATAACCAcccaggagcaggagcagcaccACTATCATCATCATGGTCGCGTCCACTCCCATTCGCCCCAGGCAGCCGTGGGTGTGAGCGGTAATCCCGCCGAGACGGCATCAGATCCTTTGGTCAATTTGTTACTGAACCACTCAAACACACCGGAAACAGCggctgctgccgctgcagcGGTGGCTGTGGAGGCGGCCAATTTCCAGTCGATGAATCACAGCCATCACTCGCACCATGGCCATCATGGTCACGGTCACAGTCATGGCCACGGCCACGGACGCGTCACGGGACACGTTGCGGGCCATGTGACTAGCCACCATCATGGCCACCACTTGCCGGTGGTGCCGCCGACACCACAAGAATCTCTGATCGTTGCGCTGGCCAGCGAGAATGCGCTGCAAAAGTCGGTAGCCACCGCCGCGGTGACCACAAATGGAGCTGTGATGACGCAACAGGCATCCGCACCCAATACCGCCGGGAGCATCCTGCCGGCAGCGGTTGGAGCGGTGGCTGCGGCGGCGGCAGTGGCGGTACAGCCGCCCATTCCCCAGGAGCTGACCACGATGTCGGATCAGGATTTGATCAGCTACATCAATCCGAGCACCTTCGATCAGCTTTAA
Protein Sequence: MLLKFTKTSGAGPSSVPLLPPNPSPGSSSPSMQATTTTYAARGTGMRMTMSTNSTMSARIHRKGFRIPSKRQPGKGLPGKLHTITRAGPGKLVPGKRIPQRPHPPPCDNSNDSGLGFDQHTELRSSAGAGGVADAGGSGSGTNSGQRSSLLVNSALTNTVAAAAAAAAAAVASNTLQQHQQHHQQQQQQQQQQQQQQQQQQQQQQQQQQHSPQQHLIRAIPVSRSRHDKKMMGHYLEDLEDHLISASSSEDSAASTPPCLDEDTGFVNDSSSTTIGGNSNSDPFGGVFQATEAAVAAAVNAFTLQQQQQQQQQHQVQQQHQPSQQQQQQFQYNGLLLQQQQQQQHPHPHQNQQQQHHQNQNHQHHQHHHHHHRHGKHIKRKKLECNQVELDNDDACSEDEFIRKIASTVAVTSAADDTPPPPPVAAPAPATPTVSLLPRITNSNSNNNTETKFISARTVTRVANKRQPTTPLNSIASSNDGLVQLEIVSQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLAGYDKGAVLQVFIGTDIGRVAPHMFYQACKVAGKNSTQCNEKKVDGTMVIEIDFKPETDMTITCDCVGILKERNVDVEHRFPEHLAQKNKKKSTRCRMVFRTQLTRDDGTTETLQVCSNPIICTQPPGVPEICKKSLNSCPVDGGLELFIIGKNFLKDTHVVFQETYDSVNGDDPATEIAVRQQLIGGTAALWEQSVLPDKEYLHQTHLICTVPPYLQSIVKPVQVQVSIVSSGKKSEPHTFTYTPKGQYTTLAAASTLSNTIHAQDVSGFMDTTSAPGASCPSGWSGASGSGNPSVPGDNVEAKHEIDSGMMPPPITTQIPMGVRRSSLPSVTPMITDQQLVHLNAAVANAEALKTELLDDSNSHSPLTGESTPDSPNAALQYHRFVRKPSLDTIMYDQSNSLPGFPAVVAPATAAAVAAAVDIDPAAVAVAVELAVKNEIVKHVVQQHQQMQEQMQEQQQQQQQQQQQQQQQQQPQQQQQQQQHQQQQQQQQQVHKFIDELTKSTSVVTSNGTSEPALFTSSAVIDHALTDILQAKVGIAPPNVVLERSLSLSSTNSSSSMSGSESSPNSSPLTQDIILNSEPAAALAGAAALGGPSPVDVTGGLSTDIIMNPAVSPSTILCSANGAATAVVPNILAPHQVTMANSILNDIAMQPEPTQQDAAVAALALSNIMMSPPTAASGVGVVDELPPTPVAMQPEVAATATSTAVSNMIIKAAADFITTQEQEQHHYHHHGRVHSHSPQAAVGVSGNPAETASDPLVNLLLNHSNTPETAAAAAAAVAVEAANFQSMNHSHHSHHGHHGHGHSHGHGHGRVTGHVAGHVTSHHHGHHLPVVPPTPQESLIVALASENALQKSVATAAVTTNGAVMTQQASAPNTAGSILPAAVGAVAAAAAVAVQPPIPQELTTMSDQDLISYINPSTFDQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536540;
90% Identity: iTF_00536540;
80% Identity: -