Basic Information

Insect: Drosophila kanekoi
Gene Symbol: Nfat5_1
Assembly: GCA_037075305.1
Location: JBAMCE010000451.1:1263312-1285354[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 3 1.1e+04 -3.8 1.9 106 129 244 267 237 277 0.54

2 5 1e-36 3.8e-33 114.9 1.0 1 168 567 726 567 727 0.97

3 5 0.68 2.5e+03 -1.7 0.1 39 73 817 851 811 870 0.78

4 5 0.052 2e+02 1.9 1.8 82 130 1025 1073 1019 1085 0.50

5 5 1.9 7e+03 -3.1 1.6 115 127 1348 1359 1313 1375 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	3	1.1e+04	-3.8	1.9	106	129	244	267	237	277	0.54
2	5	1e-36	3.8e-33	114.9	1.0	1	168	567	726	567	727	0.97
3	5	0.68	2.5e+03	-1.7	0.1	39	73	817	851	811	870	0.78
4	5	0.052	2e+02	1.9	1.8	82	130	1025	1073	1019	1085	0.50
5	5	1.9	7e+03	-3.1	1.6	115	127	1348	1359	1313	1375	0.52

Sequence Information

Coding Sequence: ATGCGCTTCACTTACAATCAGTATAAATATTACGAGTCCGGCTATCGTATTCCATCCAAAATGCACAACCTGAGCCATCATCAcggcggcaatggcaatggcagtgCTGGCAagatcaacagcaacaacagcaacagcaacaacaacaacaacagcaacaacggcggccacagcaacaaccatCACTACAACCACcatcacagcaacaacaacaacaacagcaacaacaataatacaaacacaaatccATATCAACATCATTACAAAACCAATTTTGGCATGCGCATGACCATGTCCACAAACTCAACGATGAGTCCGCGGATACATCGCAAGGGCTTTCGGATACCATCGAAAAGACAGCCGGGCAAGGGACTGCCGGGTAAACTGCACACCATAGCCCGGACGGGGCCCGGAAAGCTTGTGCCTGGCAAGCGAATACCACAGCGACCGCATCCGCCGCCCTGTGACAATTCGAACGACAGCGGCCTGGGATTTGATCAGCACACGGAGCTGCGCAACggtgcggctgctgttgctgctgatgccagGAGCAATGGTGCcaacagcgccagcagcagtagcagcagcagcagcagcagtagcagcaacagcagcagcagcagtagcagcagcagcagcagcggtaacagcagcggcaacagcagcgcctcAGGCAGTGGGCAGCACACAAATCTGTTGGTTAACAGCGCGTTGAACAACAGCGTTGCCGTCACCAACTCGCTGCAACAGCATcatcaacaccagcagcagcagcagcagcaacagcagcagcagcaacatcatcagcaaccgcagcaacaTTCACCGCAGCAGCATTTAATACGCGCGATACCCGTTTCAAGatCGCGCCATGCCAAGAAAATGCTCAACTATCTGGATGATATTGAGCCGGACTCGTCGGCATCATTTGTGGATGAACTGGCCACGCCACCCAGCAACGATGAGGACACCGGCTTTGGCACGGACAGCAACCAGGCAACTGCCtcagcaacaggaacaacaacaacagcggcaacggcaacaacaacacaaacggCAACGCTCAGCTCTGAGCTTTTTGGCGGATTCTTTAACACAACAATGGGCCATAAGGGCGCCGATGTGGTACTTGCTGTGCAACACCAGCTGCATGATCAACAGCAGCTACATTTCCAGCACCAAcagttgcagccgcagcagcagcaacaacaacagcagcagccgctgcatcagcagcagcaacagcatcaattTCACTATCCCGGATTACATttgcagctccagcagcaggagaGCAGCAGTGGGACGGAAAGCGGCGGAGGAGGACGCGGTGGCAAGCATCTGAAACGTCGGAAGCTCGAATGCAATCAAGTGGAGCTCGACAATGATGATGCCTGCAGCGAGGATGAGTTTATACGCAAAATTGCCACCGTTGTGGCCGACAGCGCAGCCAGCAGCGAGGCGGGCAACATCGGCATTGAGAGCATCGGCAGCATTGGCAACATTGGTGGCGCCACAGCACGTTGCATGTCCGCAGAAACTATGAGCCACACCAGCAGCAAGATCCACGGCAggagcagcaccagcaccagcgaGCCAAAATTCATTGGAACGCGCGCCGTGACCCGCGTGGCCAACAAAAGGCAACCAACGACACCATTGAACAGCATCGCCAGCTCCAATGATGGCCATGTCCAGCTGGAGATTGTCTCCCAGCCGGAGCAACAGCATCGCGCCCGTTACCAGACCGAGGGTAGCCGCGGCGCAGTCAAGGATCGCAGCGGCAACGGTTTCCCAATTGTCCGGCTAACCGGCTATGAAAAATCAGCCGTGCTCCAGGTGTTCATTGGCACGGACATCGGACGCGTCGCACCGCATATGTTCTATCAGGCGTGCAAGGTGGCTGGCAAGAATTCGACGCAGTGCAACGAGAAGAAGGTCGACGGCACCATGGTCATTGAGATTGATTTCAAGCCCGAAACGGACATGACCATCACCTGCGATTGCGTTGGCATCCTTAAGGAACGCAATGTCGATGTGGAGCACCGTTTCCCGGAGCACCTGGCacagaagaacaagaagaagtcAACACGTTGTCGCATGGTCTTTCGCACGCAGCTAACACGCGACGATGGCAGCACTGAGACGCTGCAGGTCTGCTCCAATCCCATCATATGCACTCAGCCACCAGGCGTACCAGAGATCTGTAAAAAATCCCTCAACTCTTGCCCCGTGGATGGCGGTCTGGAGCTGTTCATCATTGGAAAGAACTTTTTGAAGGACACGCACGTTGTGTTCCAGGAGACCTACGACAGTGTCAATGCCGATGATCCGGCGGCCGAGATAGTGGGCCGTCAGCAGCTGATCGCTGGAACGGCAGCGCTTTGGGAACAGAGCGTGTTGCCCGACAAGGAGTATTTGCATCAGACACATTTGATCTGCACAGTGCCGCCATATCGGCATCAGAATCTGCTAAAGCCGGTCAGCGTTCAGGTGTCAATCATCTCGAGCGGCAAGAAGAGCGAGCCGCACACCTTCACCTACACCCCCAAGGGCAGCTATACGACTCTAGCGGCGGCCAGCACGTTAAGTAGCACAATGCATAGCCAAgATGTTGCCAACTTCATGGACACGAGCAACGCGCCCGCCAACAACTCCGCCTGGGTGggcaacaatggcagcagcaatgccGCCGCCGTTGTCGCCGCGGGCGGAAACGTTGTGGAAACGAAACATGAACTGGATTTGGGCATGATGCCGCCGCCGATCACAACACAGATACCGATGGGACTGCGCCGCTCCTCGCTGTCCGGCGCGACGCCCATGATAACGGACCAGCAGCTGGTGCATTTGAGCAGCGCGGATGCGGCACTGAAGAGCGAACTGCTGGACGAGAACAGCTCGCTCAGCCCCCATACAGCCGAAGCGCTCCACTCGCCGGAGGCACTCAATCCGTGCAGCCCCAATGCGCTGCAGTATCATGCGCACTATGCGCGCAAGGCCAGCCTGGACACGATCATGTACGATCAGTCGAATAGTATGCCCGGCTTTCCAGTGCCCGCTGCATCAACTGTGGAACTGGATCCCGCCTCCGCGGTCGCTGTGGCCGTTGGCCTGGCCGTCAAGCACGAAATTGTCCAGCATgtggtgcagcagcagcaacaacagcaacaacagcagcaacagcagcaacagcaacagcagcaacaacagcagcagcagcagtcggcgGCCAATGTGCACAAGTTCATTGATGATCTGACCAAGTCCACGTCTGTGGTCAACAGCAACGGCACAAGTGAGCCGGCGCTGTTCACCGGCTCGTCGGTCATCGACCACGCCCTCACGGACATACTCCAACAGAAGGTGGGCGTACTGAcgcacccgcacacacacacgcacacgcacggacacggacacccAACGGCGACAGCTGCGCCCAGCGTACTAAAGCGAAGCCTCTCcataagcagcaacaactcgaACTCGAGCTCGTTGTCGGGCAGCGAAACATCACCAAATAGCTCGCCGCTAACGCAGGACATAATCCTCAACTCGGAGCCGGCGGCCGCGTTGGGCGCCGGCCTGCCATTGCAGCAGTTGGCAGCAGTgcccgctgcggctgcggcagctgtgGCCAATGCTGGCGGCGCTTTGTCCACGGACATCATCATGAATCCGGCTGTGTCGCCGTCAACCATACTCTGTTCGGCAAATGGCGCTGCCACCGCTGTGGTGGCCAACATATTGGCGCCCCATCAGGTGACCATGGCCAATTCGATACTGAACGACATCGCCATGCAGGCGGAGCCGACGCGACAggatgcagctgttgctgccttgGCGCTGAGCAACATTATGATGAGTCCGCCGAATGCCGCCGCGGGCGTCGATGTCGGTGACACCCTGCCGCCGACACCCGCTGTCATGCAGCCGGAGgtggctgccacagccacCTCGACGGCCGTTAGCAACATGATAATAAAGGCAGCTGCTGATTTTATAACTACACAAGAGCAGGAACAGCATCAttatcaccagcagcagcagcatcaacagcaacagcagcaacagcaccagcagcagcagcagcatgcgcATGCCCATTCGCACTCACAtccgcatccacatccacattctCACCCACATCCACACCCACatccacaacagcagcagcagcaggcagcaaatgcGGCCGCTACTGGCGGAGATCCGCTGGTCAATCTGCTGTTGAACCACACCACATCGGCGGAAACAGTCGCCGTGGAGGCAGCCActgctgccgccgtcgccgccggcTTCCCAGCACTGTCAGCTGTGCACCTGCCCGTTGTGCCGCCCACACCACAAGAATCTCTCATTGTTGCGCTGGCCACTGAGAACGCATTGCAAAAGTCTGTGGCCACTGCGGCCGTTACCACCAATGGAGCTGTGATGACACAGCAGGCATCGGCGCCCAGCAGCGCCGGCAGCATTCTGCCAGCCGCCGTTGGCGCCGTCGCTGCGGCCGCCGCAGTCGCTGTGCAGCCGCCCATACCCCAGGAGCTGACCACAATGTCCGACCAAGATCTAATCAGTTACATCAATCCGAGCACCTTCGATCAGCGTAAGTAG
Protein Sequence: MRFTYNQYKYYESGYRIPSKMHNLSHHHGGNGNGSAGKINSNNSNSNNNNNSNNGGHSNNHHYNHHHSNNNNNSNNNNTNTNPYQHHYKTNFGMRMTMSTNSTMSPRIHRKGFRIPSKRQPGKGLPGKLHTIARTGPGKLVPGKRIPQRPHPPPCDNSNDSGLGFDQHTELRNGAAAVAADARSNGANSASSSSSSSSSSSSNSSSSSSSSSSSGNSSGNSSASGSGQHTNLLVNSALNNSVAVTNSLQQHHQHQQQQQQQQQQQQHHQQPQQHSPQQHLIRAIPVSRSRHAKKMLNYLDDIEPDSSASFVDELATPPSNDEDTGFGTDSNQATASATGTTTTAATATTTQTATLSSELFGGFFNTTMGHKGADVVLAVQHQLHDQQQLHFQHQQLQPQQQQQQQQQPLHQQQQQHQFHYPGLHLQLQQQESSSGTESGGGGRGGKHLKRRKLECNQVELDNDDACSEDEFIRKIATVVADSAASSEAGNIGIESIGSIGNIGGATARCMSAETMSHTSSKIHGRSSTSTSEPKFIGTRAVTRVANKRQPTTPLNSIASSNDGHVQLEIVSQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLTGYEKSAVLQVFIGTDIGRVAPHMFYQACKVAGKNSTQCNEKKVDGTMVIEIDFKPETDMTITCDCVGILKERNVDVEHRFPEHLAQKNKKKSTRCRMVFRTQLTRDDGSTETLQVCSNPIICTQPPGVPEICKKSLNSCPVDGGLELFIIGKNFLKDTHVVFQETYDSVNADDPAAEIVGRQQLIAGTAALWEQSVLPDKEYLHQTHLICTVPPYRHQNLLKPVSVQVSIISSGKKSEPHTFTYTPKGSYTTLAAASTLSSTMHSQDVANFMDTSNAPANNSAWVGNNGSSNAAAVVAAGGNVVETKHELDLGMMPPPITTQIPMGLRRSSLSGATPMITDQQLVHLSSADAALKSELLDENSSLSPHTAEALHSPEALNPCSPNALQYHAHYARKASLDTIMYDQSNSMPGFPVPAASTVELDPASAVAVAVGLAVKHEIVQHVVQQQQQQQQQQQQQQQQQQQQQQQQQSAANVHKFIDDLTKSTSVVNSNGTSEPALFTGSSVIDHALTDILQQKVGVLTHPHTHTHTHGHGHPTATAAPSVLKRSLSISSNNSNSSSLSGSETSPNSSPLTQDIILNSEPAAALGAGLPLQQLAAVPAAAAAAVANAGGALSTDIIMNPAVSPSTILCSANGAATAVVANILAPHQVTMANSILNDIAMQAEPTRQDAAVAALALSNIMMSPPNAAAGVDVGDTLPPTPAVMQPEVAATATSTAVSNMIIKAAADFITTQEQEQHHYHQQQQHQQQQQQQHQQQQQHAHAHSHSHPHPHPHSHPHPHPHPQQQQQQAANAAATGGDPLVNLLLNHTTSAETVAVEAATAAAVAAGFPALSAVHLPVVPPTPQESLIVALATENALQKSVATAAVTTNGAVMTQQASAPSSAGSILPAAVGAVAAAAAVAVQPPIPQELTTMSDQDLISYINPSTFDQRK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00530727; iTF_00616680; iTF_00562954; iTF_00490555; iTF_00505884; iTF_00573089; iTF_00472836; iTF_00597926; iTF_00493418; iTF_00540138; iTF_00544993; iTF_00544241; iTF_00509591; iTF_00599354; iTF_00512491; iTF_00476396; iTF_00567310; iTF_00495633; iTF_00538005; iTF_00502295; iTF_00519690; iTF_00546426; iTF_00568028; iTF_00551357; iTF_00516027; iTF_00559264;
90% Identity: iTF_00530727;
80% Identity: -