Basic Information

Insect: Drosophila obscura
Gene Symbol: Nfat5_1
Assembly: GCA_018151105.1
Location: NW:98221-161022[-]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 3.4 1.2e+04 -4.3 1.5 111 128 171 188 162 199 0.44

2 4 3.4e-37 1.2e-33 116.1 0.8 1 168 428 587 428 588 0.97

3 4 1.4 5.1e+03 -3.0 0.0 49 69 688 708 681 723 0.81

4 4 0.12 4.4e+02 0.4 2.6 102 132 901 931 888 967 0.57

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	3.4	1.2e+04	-4.3	1.5	111	128	171	188	162	199	0.44
2	4	3.4e-37	1.2e-33	116.1	0.8	1	168	428	587	428	588	0.97
3	4	1.4	5.1e+03	-3.0	0.0	49	69	688	708	681	723	0.81
4	4	0.12	4.4e+02	0.4	2.6	102	132	901	931	888	967	0.57

Sequence Information

Coding Sequence: atgctttTAAAATTCACAAAAACCAGTGGAGCTGGCAATGCTGGACCGGGCTCTGTGGCGGGATCCAGTTCATCCTCAATGCAAACGACCACATCGTATGCCGCTCGCGGAACAGGCATGCGGATGACCATGTCAACCAATTCCACAATGAGTGCCCGAATACATCGCAAGGGATTTCGGATACCCTCGAAAAGACAGCCCGGAAAGGGCTTGCCAGGCAAACTGCATACCATAACTAGGGCGGGTCCTGGCAAGATAGTTCCCGGGAAGCGAATACCACAACGTCCTCATCCGCCGCCTTGCGACAACTCTAACGACAGTGGGCTGGGCTTCGACCAGCACACGGAGCTGCGATCCTCATCGGGGCCAGGAGTAGCCGATCCGGGTAGTGCGAATGGAGGAGGCATTGGCATGGTCCAGCGGACGAATCTGCTGGTGAACAGCTCCCTTACGAACACggtggctgctgcggcggcggcagctgcagctgcagtggcAAGTAACAcgttgcagcagcatcaccaacagcatcagcagcaccaacagcagcagcagcagcaacaccaacagcaacattcACCGCAGCAGCATTTAATTCGGGCGATACCTGTATCAAGaTCGCGGCACACCAAGAAAATGCTGAACGCCTTTCTGGACGACTTGGATCTGGCCAACTCTAACTCGGAGGAATCGACGGCCTCAACTTCCCTTTCTTGCTCGACGACGCCCAGCCCGGATGCGGACACTGGCCTCGGCAATCACAACGGGACCTCTCGCAACAGCTCGGATCCATTTGGTGGCGTCTTCCAGGCCACCGaggcagctgtggcagccgcTGTGTCAGCCTTTAATgtccagcatcagcagccccttccgcaacaacagcagcagcaactgcaacagcaattTCAGTATCCTGGAATGGgcgtgcaacagcagcatcagcatcagcaccagcggAACGTGGCTCGGAGCGGGGGCAAGCATATCAAGCGCAAGAAGCTCGAGTGCAaccagctggagctggacaaCGACGACGCCTGTAGCGAAGACGAGTTCATTCGCAAGATAGCCAATGCGGCCAACGGGGTCTCTTTCTCATCTGGAGAAGCGGCTCCTGTGGCGGCCGCACGGCCTCCGCCTGCCATGACTAGTGTGCTGCCACGCAACGGCCATGAGACAAAATTTATTTCGGCCCGGACTGTCACAAGGGTAGCTAACAAGCGTCAGCCCACGACGCCGCTAAACAGCGTTGCCAGCTCGAACGACGGCCACGTGCAACTAGAGATCGTCTCACAGCCGGAGCAACAGCACCGGGCCCGCTACCAGACCGAGGGCAGTCGCGGGGCGGTCAAGGATCGCAGCGGCAACGGGTTCCCCATTGTCCGGCTGACAGGCTACGACAAGGGCGCCGTGCTGCAGGTCTTTATTGGAACGGACATTGGCCGTGTGGCGCCACATATGTTCTATCAGGCTTGCAAGGTGGCTGGCAAGAACTCGACCCAGTGCAACGAGAAGAAGGTCGACGGAACCATGGTCATCGAGATAGATTTCAAGCCAGAGACGGACATGACCATCACCTGCGATTGCGTTGGCATTTTGAAGGAACGCAATGTCGATGTGGAGCACCGCTTTCCCGAGCACTTGACACAGAAGAACAAGAAGAAATCGACTCGCTGCCGGATGGTGTTCCGCACTCAGCTGACCCGTGATGATGGCACCACCGAGACCCTCCAGGTCTGCTCCAATCCCATAATTTGCACTCAACCCCCAGGTGTGCCGGAAATAGGCAAGAAGTCGCTCAATTCGTGCCCCGTCGATGGCGGCCTCGAGCTCTTCATCATCGGCAAGAATTTTCTTAAGGACACCCACGTGGTGTTTCAGGAGACCTACGACAGCGTCAACGGCGACGACCCCGCGACCGAGATCGCTGTGCGACAGCAGCTGATTGGCGGCACAGCCGCTCTATGGGAACAGAGCGTGATGCCCGACAAGGAATATTTACACCAGACGCATCTCATATGCACAGTGCCACCGTATCTTCACCAGAACGTGATCAAGCCGGTCAGCGTCCAGGTGTCGATCATATCGAGCGGCAAGAAGAGCGAGCCGCACACCTTCACCTACACGCCGAAGGGCCAGTATTCGACACTAGCGGCTGCCAGCACGTTAAGTAGCACAATTCACGACCAAGATGTGAACAACTTTATGGACACCACAGCAGCGCCATCGACCAGCGGGTCGAACTGGTCGACAAATCCGCAGGCATCTGGATCCGGTTCGGGACCAGCCTCCAGTGGCGAGGGGGTGGTGGAGACCAAGCACGAGATAGACTCGGGCATGATGCCCCCACCGATCACCACACAGATACCGATGGGCGTTGTGCGCCGCTCGTCGCTGCCCAGCGCCTCACCCATGATCACGGATCAGCAGCTCGTCCACCTCAATGCGGTGGCCGTGGCCAGTGCCGAGGCCTTGAAGAGCGAGCTACTCGACGACAGCAGTACGCACAGTCCACTCACAGCGGAGCCCACCCCGGATAGCCCCAACGGCATGCAGTACCACCATCAGACGCACTTTGCCCGCAAGTCCAGCCTCGACACGATCATGTTCGATCAGTCTAGCAGTTTGCCCGGGTTCCCCGTCACAGGCGTTGATATTGACTCCGCTgctgtggcggtggctgtggAGCTGGCCGTAAAGAACGAGATTGTCAAGCACGTGgtgcaacagcatcagcagcatcagcagcagcaacagcagcagcagcaacagcagcagcaacagcaacagcagcagcagcagccacagcagcagcaggctacagcggcggcagcagcgagCGTGCACAAGTTCATCGACGAGCTGACAAAGTCCACATCGGTGGTCACCAGCAATGGAACCACAGAGCCAGCACTCTTTACCAGTGTGGCGGTGATCGATCACGCTCTGACCGACATTCTGCAGTCGAAGGTGGGCGTGCTGAGCCACGGCAACCACCAAACAGGAGGCCCACCCAACGGTGTGCTCGAGCGGAGTCTGTCGCTCGGATCGACCAACTCGAGCAGCTCGTTGAGCGGCAGCGAGTCCTCCCCAAACAGCTCGCCGCTCACCCAGGACATCATACTAAACTCGGAGCCGGCCGCTGCTCTGGCCGGTGCCGCCGGCCTCGCTTCGTCTCCCGTCGATGTAGGCGCAGGCCTCTCCACCGATATCATCATGAACCCCGCCGTCTCGCCATCTACCATACTTTGTTCGGCCAACGGGGCAGCCACTGCGGTGGTGCCCAACATACTAGCGCCCCACCAAGTGACCATGGCCAACTCCATATTGAACGATATAGCCATGCAGCCGGAGCCGACGCAGCAAGATGCAGCCGTGGCTGCCCTAGCGCTGAAGAACATAATGATGAGTCCGCCGACGTCAGCTGGTGGGGTAGTAGATACCCTTCCACCGACACCGGCTGCCTTGCAGCCGGAagtggctgccacagccacttcGACAGCGGTTAGCAACATGATCATCAAGGCGGCCGCTGACTTCATCACCacccaggagcaggagcagcacaaCTACCATCACCAGCACACCCGTACCCACACCCATTCGCATACACACTCGCATACACGTTCGCCGCAGTCTGGCGTTTCAGTGGCTAACAATGTCGTTGAGGCTGGCGAGGATCCGTTGGTCAATCTCCTTCTGAGTCACTCAACCCCACCGGAGAcggcagccgcagctgctgcagccgtgGCCGCGGAGGCTGCCAGCTTTCAGTCGCTTTCAGGTCACGGTCACGGCCATAGCCATAGTCATAGCCACAGTCatagtcacagtcacagtcacagccacagccacagtcatgGCCACGGTCACGGCCATGCTCACTCGCACGGCCACGCCCACTTGCCGGTTGTAGCGACCTCACCACAAGAATCTCTGATCGTTGCATTGGCCAGCGAGAATGCGCTGCAGAAGTCCGTGGCCACCGCCGCGGTCACCACCAATGGAGCCGTGATGACCCAACAGGCCTCGGCACCCTCCACGGCGGGAAGCATTTTGCCAGCGGCTGTCGGagccgtcgctgctgctgcggccgtGGCTGTCCAGCCCCCCATACCCCAGGAGCTGACCACGATGTCTGATCAGGACCTGATCAGCTACATAAATCCAAGCACCTTCGATCAGCtgtaA
Protein Sequence: MLLKFTKTSGAGNAGPGSVAGSSSSSMQTTTSYAARGTGMRMTMSTNSTMSARIHRKGFRIPSKRQPGKGLPGKLHTITRAGPGKIVPGKRIPQRPHPPPCDNSNDSGLGFDQHTELRSSSGPGVADPGSANGGGIGMVQRTNLLVNSSLTNTVAAAAAAAAAAVASNTLQQHHQQHQQHQQQQQQQHQQQHSPQQHLIRAIPVSRSRHTKKMLNAFLDDLDLANSNSEESTASTSLSCSTTPSPDADTGLGNHNGTSRNSSDPFGGVFQATEAAVAAAVSAFNVQHQQPLPQQQQQQLQQQFQYPGMGVQQQHQHQHQRNVARSGGKHIKRKKLECNQLELDNDDACSEDEFIRKIANAANGVSFSSGEAAPVAAARPPPAMTSVLPRNGHETKFISARTVTRVANKRQPTTPLNSVASSNDGHVQLEIVSQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLTGYDKGAVLQVFIGTDIGRVAPHMFYQACKVAGKNSTQCNEKKVDGTMVIEIDFKPETDMTITCDCVGILKERNVDVEHRFPEHLTQKNKKKSTRCRMVFRTQLTRDDGTTETLQVCSNPIICTQPPGVPEIGKKSLNSCPVDGGLELFIIGKNFLKDTHVVFQETYDSVNGDDPATEIAVRQQLIGGTAALWEQSVMPDKEYLHQTHLICTVPPYLHQNVIKPVSVQVSIISSGKKSEPHTFTYTPKGQYSTLAAASTLSSTIHDQDVNNFMDTTAAPSTSGSNWSTNPQASGSGSGPASSGEGVVETKHEIDSGMMPPPITTQIPMGVVRRSSLPSASPMITDQQLVHLNAVAVASAEALKSELLDDSSTHSPLTAEPTPDSPNGMQYHHQTHFARKSSLDTIMFDQSSSLPGFPVTGVDIDSAAVAVAVELAVKNEIVKHVVQQHQQHQQQQQQQQQQQQQQQQQQQQPQQQQATAAAAASVHKFIDELTKSTSVVTSNGTTEPALFTSVAVIDHALTDILQSKVGVLSHGNHQTGGPPNGVLERSLSLGSTNSSSSLSGSESSPNSSPLTQDIILNSEPAAALAGAAGLASSPVDVGAGLSTDIIMNPAVSPSTILCSANGAATAVVPNILAPHQVTMANSILNDIAMQPEPTQQDAAVAALALKNIMMSPPTSAGGVVDTLPPTPAALQPEVAATATSTAVSNMIIKAAADFITTQEQEQHNYHHQHTRTHTHSHTHSHTRSPQSGVSVANNVVEAGEDPLVNLLLSHSTPPETAAAAAAAVAAEAASFQSLSGHGHGHSHSHSHSHSHSHSHSHSHSHGHGHGHAHSHGHAHLPVVATSPQESLIVALASENALQKSVATAAVTTNGAVMTQQASAPSTAGSILPAAVGAVAAAAAVAVQPPIPQELTTMSDQDLISYINPSTFDQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00487081; iTF_00514665; iTF_00600830; iTF_00517486; iTF_00603125; iTF_00535834; iTF_00580467; iTF_00471384; iTF_00574585; iTF_00484219;
90% Identity: iTF_00603125;
80% Identity: -