Basic Information

Insect: Drosophila simulans
Gene Symbol: Nfat5_1
Assembly: GCA_016746395.1
Location: NC:13111505-13149333[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.93 3.2e+03 -2.4 3.1 113 129 184 200 165 218 0.47

2 5 0.74 2.5e+03 -2.1 2.7 83 141 306 365 296 385 0.71

3 5 5.3e-37 1.8e-33 115.5 0.7 1 168 463 622 463 623 0.97

4 5 0.11 3.6e+02 0.6 0.0 45 73 719 747 710 768 0.80

5 5 1 3.5e+03 -2.6 6.5 103 129 949 975 929 1007 0.54

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.93	3.2e+03	-2.4	3.1	113	129	184	200	165	218	0.47
2	5	0.74	2.5e+03	-2.1	2.7	83	141	306	365	296	385	0.71
3	5	5.3e-37	1.8e-33	115.5	0.7	1	168	463	622	463	623	0.97
4	5	0.11	3.6e+02	0.6	0.0	45	73	719	747	710	768	0.80
5	5	1	3.5e+03	-2.6	6.5	103	129	949	975	929	1007	0.54

Sequence Information

Coding Sequence: ATGCTTTTGAAATTCACAAAAACCAGTGGCGCTGGACCCTCGGCCGTACCGCTACTGACCCCCGCCCCCGCGCCGGGCTCCAGTTCGGCGTCCAtgcaggcaacaacaacaagttaCGCGGCCCGCGGAACAGGCATGAGAATGACCATGTCCACCAATTCCACAATGAGTGCGCGAATACATCGAAAAGGATTTCGCATACCATCGAAAAGACAGCCGGGTAAGGGATTGCCCGGCAAGCTGCACACCATATCCAGGACGGGTCCTGGCAAAATGGTTCCTGGGAAGCGAATACCACAGCGACCCCATCCGCCGCCCTGCGACAACTCGAACGACAGTGGGCTGGGTTTCGATCAGCACACGGAGCTGAGATCCTCGGCAGgagctgggggcgtggctgatCCGGCGGCCAATGGAGGCAGTGGCTCCAATTCCGGCCAGCGATCCAGTTTGCTGGTCAATAGCGCTTTAACCAACACAgtggctgctgcagcagccgcagcagctgccgcgGTGGCCAGCAACAcgttgcagcagcatcagcagcaccaccaacagcagcagcagcaacagcagcagcaacaacagcagcagcagcagcaacaacagcagcagcagcaacattcaCCGCAGCAGCATTTAATCAGAGCGATACCTGTATCAAGATCGCGGAACAACACGAAAGTGATGGCTCACTGTCTGGAGGATCTGGACCTGATATCGGCGTCCTCGGAGGACGGCTCGGCCATTGCGCCGCCGGCCGTTTTGGACGAGGACACGGGCTTCGTGAACGACACCAAAACGACGACAGCCGGTGGCAATAGTAGCTCGGATCCATTTGGAGGCGTCTTCAAGGCAACCGAGGCAGCCGTGGCAGCAGCCGTTAATGCCTTCAatctgcaacagcagcagcattcggtgcatcagcagcagcagcatcaactcTTTCAGTACAACGGATTGCTgttgcagccgcagcagcagttgcagcaccagcagtcgcagtcgcatcaccaccagcaacaacaacaacagcatcaccGCCATGGCAAGCATATCAAACGCAAGAAGCTCGAGTGCAACCAGGTGGAGCTGGACAACGATGATGCCTGCAGCGAGGATGAGTTCATCCGCAAGATTGCCAGTTCGGTAACGATGTCACCCGCGCTCGAGGCCACGCCCTCGCCGCCGCCCATTGCCGCCTCCGTTGCACCTGCCACGACCATTGTTAACCTCCTGCCGCTcatcagcagcggcaacaacaacaacaacaacaacattgagACAAAATTCATATCGGCCAGGAATGTCACTCGCGTGGCTAACAAACGTCAACCCACTACCCCGCTGAACAGCGTCGCCAGCTCCAACGATGGCCAGGTGCAGCTGGAGATCTTGTCGCAGCCGGAACAACAGCATCGGGCTCGCTACCAAACGGAGGGCAGCCGCGGTGCCGTCAAGGATCGCAGCGGCAATGGATTCCCGATCGTCCGACTGACCGGATACGATAAGGTTGCCGTCCTCCAGGTCTTCATCGGCACGGACATTGGACGCGTGGCACCGCACATGTTCTACCAGGCCTGCAAGGTCGCCGGCAAGAACTCGACGCAGTGCAACGAGAAGAAGGTCGACGGCACCATGGTCATTGAGATCGATTTCAAGCCCGAAACGGACATGACCATCACTTGCGATTGCGTTGGAATCTTGAAGGAACGCAATGTGGATGTGGAGCACCGATTCCCCGAGCATCTGGCGCAAAAGAACAAGAAGAAATCGACTCGCTGCCGGATGGTGTTCCGCACCCAGCTGACCCGTGACGATGGCACCACCGAGACCCTCCAGGTCTGCTCGAATCCAATCATCTGCACTCAACCACCTGGCGTGCCGGAAATATGCAAGAAATCATTAAACTCCTGTCCCGTTGATGGCGGCCTCGAGCTGTTCATTATCGGCAAGAACTTCCTGAAGGACACACACGTGGTGTTCCAGGAGACGTACGACAGCGTCAACGGCGACGATCCGGCCACGGAAATTGCAGTGCGCCAGCAGCTTATCGGCGGAACAGCCGCTCTTTGGGAACAGAGTGTTCTGCCGGACAAGGAGTACCTTCACCAGACTCATCTGATTTGCACGGTGCCACCGTATCTGCACCAGAACATCCTGAAGCCGGTCCAGGTTCAGGTGTCGATCGTCTCCAGCGGCAAGAAGAGCGAACCGCACACGTTCACCTACACGGCCAAGGGACAGTACACGACGCTGGCGGCGGCCAGCACGTTAAGTAACACAATCCACGCCCAAGATGTGAGCGGTTTCATGGACACCACATCAGCGTCCAATGCGAGTGGCTCCAGTGGTTGGAGTGGGGCAGGCGGCTCCGGAAGCAACCCATCTGCAGGCGATAATGTGGAGGCCAAGCACGAGATCGATTCGGGCATGATGCCTCCGCCCATCACCACCCAAATACCGATGGGCGTTCGACGCTCCTCGCTGCCCAGTGTCACACCCATGATCACGGACCAGCAGCTGGTCCATCTCAACGCAGTGGCGGCCAGTGCCGAGGCCCTGAAGACGGAACTCGACGACAGCAACTCGCACAGCCCCCTGACCGGTGAATCCACACCGGACAGCCCCAACGCAGCCTTGCAGTATCATCGCTTTGCACGAAAGCCCAGCCTGGACACCATTATGTACGATCAGTCGAACAGTCTGCCCGGTTTCCCGGCCGTTGTGGCGCCGGCTACAGCTGCCGCCGTGGCCGCAGCAGTTGATATTGATCCGGCGGCGGTGGCCGTTGCGGTGGAAATGGCCGTAAAAAACGAGATTGTGAAGCATGTcgtgcagcagcaccagcagatGCAGGAGCAAATgcacgagcagcagcaacagcaacagcagcaacaacagcagcagcaacagcagcagcaacaacaacagccccaacaacagcaacaacagcagcagcaacaggtgcaCAAGTTCATTGATGAGCTGACCAAATCCACTTCGGTGGTTTCCAGCAATGGCACCACCGAACCAGCTCTGTTCACCACCTCGGCGGTGATCGATCATGCCCTGACCGATATTCTGCAGGCCAAAGTCGGCATTGCGCCGCCCAATGTGGTGCTGGAGAGGAGTTTGTCCCTAAGCTCCACAAACTCCAACAGCTCCATGAGTGGCAGTGAGACTTCGCCGAATAGTTCACCTTTGACGCAGGATATCATACTCAATTCGGAACCGGCAGCAGCTCTGGCCGGAGCTGCTGCCTTGGGTGGCCCGGCGCCTGTCGATGTCACCGGTGGTCTGTCCACCGATATCATTATGAATCCCGCCGTTTCACCCTCGACTATTTTGTGCTCCGCAAATGGAGCGGCCACTGCCGTAGTGCCGAATATACTCGCACCTCACCAAGTGACCATGGCCAACTCCATTTTGAACGACATTGCCATGCAGCCGGAACCTACACAGCAGGATGCAGCTGTTGCAGCCTTGGCATTGAGTAACATCATGATGAGTCCACCCACCGCGGCATCGGGTGTGGGAGTTGGGGACACACTGCCACCAACACCAGCGACTATGCAGCCAGAGGTCGCAGCCACTGCCACATCCACTGCGGTCAGCAACATGATTATTAAGGCGGCGGCGGACTTTATAACCacccaggagcaggagcaacaccactaccaccaccacGGTCGCGTCCACTCCCATTCGCCACAGGCAGCTGTCGGAGTGAGCGGTATTCCTGCCGAGACGGCATCGGATCCATTGGTTAACCTGCTATTGAACCACTCAAACACACCAGAAACAGcggctgctgccgctgccgcagtAGCTGTTGAAGCGGCCAACTTCCAGTCGATGAATCACAGTCACCACAGCCATCATGGTCATCATGGTCACAGTCACGGCCACGGCCATAGTCGCGTCCCAGGACACGTATCCGGGCATGTGACCAGTCACCATCGTGGTCACCACTTGCCGGTGGTGCCGCCGACACCACAAGAATCTCTGATCGTTGCGCTGGCCAGCGAGAATGCTCTGCAAAAGTCGGTGGCCACCGCCGCAGTGACCACCAATGGAGCAGTGATGACGCAGCAGGCATCTGCCCCGAACACAGCGGGCAGCATACTTCCGGCGGCGGTTGGAGCGGTAGCTGCGGCGGCCGCCGTGGCGGTGCAGCCGCCCATTCCCCAGGAGCTGACCACGATGTCGGATCAGGATCTGATCAGCTACATCAACCCGAGCACCTTTGATCAGCTTTAA
Protein Sequence: MLLKFTKTSGAGPSAVPLLTPAPAPGSSSASMQATTTSYAARGTGMRMTMSTNSTMSARIHRKGFRIPSKRQPGKGLPGKLHTISRTGPGKMVPGKRIPQRPHPPPCDNSNDSGLGFDQHTELRSSAGAGGVADPAANGGSGSNSGQRSSLLVNSALTNTVAAAAAAAAAAVASNTLQQHQQHHQQQQQQQQQQQQQQQQQQQQQQQHSPQQHLIRAIPVSRSRNNTKVMAHCLEDLDLISASSEDGSAIAPPAVLDEDTGFVNDTKTTTAGGNSSSDPFGGVFKATEAAVAAAVNAFNLQQQQHSVHQQQQHQLFQYNGLLLQPQQQLQHQQSQSHHHQQQQQQHHRHGKHIKRKKLECNQVELDNDDACSEDEFIRKIASSVTMSPALEATPSPPPIAASVAPATTIVNLLPLISSGNNNNNNNIETKFISARNVTRVANKRQPTTPLNSVASSNDGQVQLEILSQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLTGYDKVAVLQVFIGTDIGRVAPHMFYQACKVAGKNSTQCNEKKVDGTMVIEIDFKPETDMTITCDCVGILKERNVDVEHRFPEHLAQKNKKKSTRCRMVFRTQLTRDDGTTETLQVCSNPIICTQPPGVPEICKKSLNSCPVDGGLELFIIGKNFLKDTHVVFQETYDSVNGDDPATEIAVRQQLIGGTAALWEQSVLPDKEYLHQTHLICTVPPYLHQNILKPVQVQVSIVSSGKKSEPHTFTYTAKGQYTTLAAASTLSNTIHAQDVSGFMDTTSASNASGSSGWSGAGGSGSNPSAGDNVEAKHEIDSGMMPPPITTQIPMGVRRSSLPSVTPMITDQQLVHLNAVAASAEALKTELDDSNSHSPLTGESTPDSPNAALQYHRFARKPSLDTIMYDQSNSLPGFPAVVAPATAAAVAAAVDIDPAAVAVAVEMAVKNEIVKHVVQQHQQMQEQMHEQQQQQQQQQQQQQQQQQQQQPQQQQQQQQQQVHKFIDELTKSTSVVSSNGTTEPALFTTSAVIDHALTDILQAKVGIAPPNVVLERSLSLSSTNSNSSMSGSETSPNSSPLTQDIILNSEPAAALAGAAALGGPAPVDVTGGLSTDIIMNPAVSPSTILCSANGAATAVVPNILAPHQVTMANSILNDIAMQPEPTQQDAAVAALALSNIMMSPPTAASGVGVGDTLPPTPATMQPEVAATATSTAVSNMIIKAAADFITTQEQEQHHYHHHGRVHSHSPQAAVGVSGIPAETASDPLVNLLLNHSNTPETAAAAAAAVAVEAANFQSMNHSHHSHHGHHGHSHGHGHSRVPGHVSGHVTSHHRGHHLPVVPPTPQESLIVALASENALQKSVATAAVTTNGAVMTQQASAPNTAGSILPAAVGAVAAAAAVAVQPPIPQELTTMSDQDLISYINPSTFDQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536540;
90% Identity: iTF_00592167; iTF_00539435; iTF_00504461;
80% Identity: -