Basic Information

Insect: Eustalomyia histrio
Gene Symbol: Nfat5_1
Assembly: GCA_949748255.1
Location: OX456525.1:7187173-7236975[-]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 4 5.1e+04 -4.7 3.2 107 137 75 105 68 141 0.43

2 3 1e-35 1.3e-31 111.3 1.9 1 168 356 515 356 516 0.97

3 3 0.89 1.1e+04 -2.4 1.6 119 168 1109 1158 1086 1159 0.70

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	4	5.1e+04	-4.7	3.2	107	137	75	105	68	141	0.43
2	3	1e-35	1.3e-31	111.3	1.9	1	168	356	515	356	516	0.97
3	3	0.89	1.1e+04	-2.4	1.6	119	168	1109	1158	1086	1159	0.70

Sequence Information

Coding Sequence: ATGTCTACCATGTCCACCATGAGCCCGCGTATACATCGTAAAGGTTTTCGGACACCATCAAAAAGGCATCCGGGCAAAGCATTTCCTGGCAAATTACATTCAGTTTCAAGGctGGCTCCTGGTAAAATGGTGCCTGGTAAACGTTTTCCTCCCAGACCACATCCACCACCCTGTGATAATTCAAATGATAGTGGCTTTGGTTTTGATCAACATGTTGaaattcaacaacaacaacaccagcatcatcatcaacaacaacagcagcaacaacaaccacaacatAATAACAGCCCTAATTCAAGTACAAATTTAAGCAGTAATATTAACACTCCCTCGTCGTCAattcatcaacaacaacaacagcagcagcaacatcatcatcaccaaCAAACTTCATCAgcaaatattaacaataatCATCATCATAGTTCTacatcaacagcaacaacatccAATCTACAACATTCACCCCAACAACATTTAATTAGAGCTATACCTGCCTCAAGATCTAGACCGGCTAAAAAATTACCCTACTTAAATGATGATACTGAAAATACTGATTCAGAAGATGAAGATTTTTGTACCGATGATTCAGATGATTATTATGGCGGAAGACatcgcaaaaatataaaaatagcaaGTCAAcaattattatcatcatcatcatcattgtcgTCCTCATCgtcgtcgtcatcatcatcgtcatcatcgtcatcatcatcatcatcgacaTCACCGCAATCGGGTTCTTATCATCACAATGGCGGCGGTAAGGGTTATGGTATAAAACGTAAAAGAATTGAAACCATACCGGTAGATTTAGATAATGATGATGCTTGCAGTGAAGATgcttttatacgaaaaattgcTAGTGCTGCCAGCACTAATATGAGTGTAGAAAATGCTACGACGGTGACTATAATTCCCAGACCGGTACAACTACCGGCACCAAATCCATCAAaATTTATTGCCGCCAGTTCTAGAGCAATGACCAGAGTGGCTCATAAACGTCAACCTGTTACCCCACCAAACAGTGTGGCTACTTCATCAAATGGTCGCATACAATTAGAAATTGTTTCTCAACCCGAACAGCAGCATAGAGCcagATATCAAACTGAGGGCAGTCGTGGCGCTGTTAAAGATCGTAGCGGCAATGGTTTTCCCATTGTCCGTTTAGTGGGCTATAATAAGTGTACCACCTTGCAAGTGTTTATTGGTACCGATATTGGTCGTGTTGCTCCTCATATGTTTTATCAAGCCTGCAAAGTTGCCGGTAAAAATTCCACACAGTGTAATGAGAAGAAAGTTGATGGTACTGTCGttattgaaattgattttaagcCAGAACAAGAAATGACCGTAACATGTGATTGCGTTGGAATTCTTAAGgaACGCAATGTCGATGTCGAACATCGTTTTCCCGAACATCtagcacaaaaaaataaaaagaaatcaacaCGATGTCGCATGGTCTTTCGCACACAGTTAACACATGACGATGGTACCTTAGAAACATTACAAGTGTGTTCAAATCCAATTATTTGCACTCAACCACCGGGTGTAccagaaatttctaaaaaatcccTCAATTCTAGCCCAGCTGATGGTGGTcttgaattatttataattggtaaaaattttctcaaagaCACACATGTGATATTTCAAGAAACCTATGATACAAACAACGATGATGATCTCAAATCCAACGGAACTGCAATATGTGGAGGACCATTGTGGGAACAAACAGTGTTACCTgataaagaatatttacaacaaACTCATTTAATATGCACTGTTCCCCCCTATATAGATCAGAATATATTGAAACCGGTTAGTGTACAAGTGGCAATTATTTCAAGCGGTAAAAAAAGTGAATCCCATACATTTGTTTATACGCCAAAGGGCACTTATACACCATTAGCGGCTGCAACTACATTAGgtagtacaacaacaaataccctacaacaacagcaacacggTAGCTTATCATCTGGACAagATACTACCACATTTATGGATACAACACCCGATCTGACAGCCGATGTTGTTGTGGCAGCAACTGCCAACTCTCTATGGCCTACAAATGAGACAAAACATGAAATTGATGCTGACATGATGCCACCACCCATAACCACACAAATGCCCATGGTGGTGAGACGACCTTCCCTGAATACTACCCAACCTCTGATCAGTGATCAACAGCTGGTGCATTTAAATGCTGTGGTAGCAGCAGAAGCTTTAAAAACTGAACTTTTGGATGAATCTTCACAGAATTCTTTAGCTGATGCTATAAATTCTCCGGAAGCAGTGGTGGCTGCTGCTTGTGCCCAAGTAACAGGAGTGGGTGGTCCACAAAGTCCAACCACATTGCAATTTCATTCGCGTTATGGTCGCAAGACAAACATGGAAACGATAATGTTTGATAATAATAGTATGCCGGGTTTTCCGGTAGCACCAGCCACTGCGACCACAACACCCATGGAAGTGGCAGTAGCCGCTGCTGTTGAGATGGcagtaaaaaatgaaatagcCAAGGCAGTGTCAGTGGCCAAGGTGGATAAATTCATAACAGATTTAGCTCAGTCGGCAAATGTTACAGATGCAGCAAATCCCGTACAAGAACCAACATTATTTGGTGTCACCAATACCGCAGCCATTGATCATGCCCTTACCGATATTTTAgccaccacaccacaaacaaCAGCCGTTGCTGCCGCTGCTGCAGCAGCTGTTGTCTTGGAACGCAGTCTATCGAATTCATCAGCCACCTCTTCGTCAGCCTCAGGTTCACCTTTATCTGGCTCCTCACCTTCAAACTCATTAACCAATCATAATTCTCCTATAACacaagatattatattaaattccgAACCGTCGGTACAATTAACGCCGGCATTAACACCGCTACAGCAACTGTTGCCGCCCAACACATCTCCAACTGTTAGCGTTAGTCCTGAAGTAGCTGCCGCATCCGGTCTAACCACCGACATTATAATGAATCCCTCCGTTTCGCCCTCTACTATATTGTGTTCGGATAATGGTGCTGCGACGGCGGTGGTACCCAATATTATGGCACCTCATCAAGTCACCATGGCCAATTCCATACTCAATGATATTGCTATGCAAGCACAACCGACACAACAAGATGCTGCCGTTGCGGCTTTAGCTCTAAGTAACATTATAATGTCACCACCCAGTGATACTTCCGTTACCGTACCTCCCACACCCGCCCACACTATGCAACCAGAAGTTACAACAGCCACTTCCACTGCTGTTAGTAATATGATTATTAAAGCTGCTGCCGATTTTATATCGAATCAAGAGCAACAGAGCCAACATCAGCAtcatcagcagcagcagcagcatcaaCAACTTCATATTCATCAGCCGAGTCATCAGTCACAATcgccacaacaacaacaacaacaaataatgtcTTCACAAACGGTTACTGTGGATCCTTTATCTTGTAACCCGTTGAATTTATTAATGAATCACACGGacgtaacaacaacaacacaagcCACCATAACAACAGCAAATTCTATAAATGATCCAGTACCCTCACAACAGTATTCATTAGGAATTAATACACCACCCCAAGAATCTCTGATTGTTGCATTGGCTACTGAAAATGCATTGCAAAAATCAGTGGCAGCGGCAGCTATAACCACAAATGGAGCAGTGGTAACACAAGAAACAGCAGCACCCAACACACCCAATTTACATCCAGCCGCTGCGGCAGCCGTAGGAGCAGTAGCAGCCGCCGCAGCAGCGGCAGCTGTAGCACCCATACCACAAGAATTAACAACCATGTCCGATCAAGATTTATTAAGTTATATAAATCCCAGCACTTTTGATCAAGGTATGTAA
Protein Sequence: MSTMSTMSPRIHRKGFRTPSKRHPGKAFPGKLHSVSRLAPGKMVPGKRFPPRPHPPPCDNSNDSGFGFDQHVEIQQQQHQHHHQQQQQQQQPQHNNSPNSSTNLSSNINTPSSSIHQQQQQQQQHHHHQQTSSANINNNHHHSSTSTATTSNLQHSPQQHLIRAIPASRSRPAKKLPYLNDDTENTDSEDEDFCTDDSDDYYGGRHRKNIKIASQQLLSSSSSLSSSSSSSSSSSSSSSSSSSTSPQSGSYHHNGGGKGYGIKRKRIETIPVDLDNDDACSEDAFIRKIASAASTNMSVENATTVTIIPRPVQLPAPNPSKFIAASSRAMTRVAHKRQPVTPPNSVATSSNGRIQLEIVSQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLVGYNKCTTLQVFIGTDIGRVAPHMFYQACKVAGKNSTQCNEKKVDGTVVIEIDFKPEQEMTVTCDCVGILKERNVDVEHRFPEHLAQKNKKKSTRCRMVFRTQLTHDDGTLETLQVCSNPIICTQPPGVPEISKKSLNSSPADGGLELFIIGKNFLKDTHVIFQETYDTNNDDDLKSNGTAICGGPLWEQTVLPDKEYLQQTHLICTVPPYIDQNILKPVSVQVAIISSGKKSESHTFVYTPKGTYTPLAAATTLGSTTTNTLQQQQHGSLSSGQDTTTFMDTTPDLTADVVVAATANSLWPTNETKHEIDADMMPPPITTQMPMVVRRPSLNTTQPLISDQQLVHLNAVVAAEALKTELLDESSQNSLADAINSPEAVVAAACAQVTGVGGPQSPTTLQFHSRYGRKTNMETIMFDNNSMPGFPVAPATATTTPMEVAVAAAVEMAVKNEIAKAVSVAKVDKFITDLAQSANVTDAANPVQEPTLFGVTNTAAIDHALTDILATTPQTTAVAAAAAAAVVLERSLSNSSATSSSASGSPLSGSSPSNSLTNHNSPITQDIILNSEPSVQLTPALTPLQQLLPPNTSPTVSVSPEVAAASGLTTDIIMNPSVSPSTILCSDNGAATAVVPNIMAPHQVTMANSILNDIAMQAQPTQQDAAVAALALSNIIMSPPSDTSVTVPPTPAHTMQPEVTTATSTAVSNMIIKAAADFISNQEQQSQHQHHQQQQQHQQLHIHQPSHQSQSPQQQQQQIMSSQTVTVDPLSCNPLNLLMNHTDVTTTTQATITTANSINDPVPSQQYSLGINTPPQESLIVALATENALQKSVAAAAITTNGAVVTQETAAPNTPNLHPAAAAAVGAVAAAAAAAAVAPIPQELTTMSDQDLLSYINPSTFDQGM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -