Basic Information

Insect: Ceratosolen solmsi
Gene Symbol: Nfat5_1
Assembly: GCA_000503995.1
Location: NW:1021715-1055314[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.7 1.1e+03 -1.5 0.3 112 141 100 128 88 144 0.48

2 3 6.3e-31 9.7e-28 96.3 0.4 1 168 290 452 290 453 0.90

3 3 6 9.2e+03 -6.9 7.0 87 129 1104 1149 1072 1198 0.45

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.7	1.1e+03	-1.5	0.3	112	141	100	128	88	144	0.48
2	3	6.3e-31	9.7e-28	96.3	0.4	1	168	290	452	290	453	0.90
3	3	6	9.2e+03	-6.9	7.0	87	129	1104	1149	1072	1198	0.45

Sequence Information

Coding Sequence: ATGGCTCCCGACCTCGAGAAAAAACGAGAGCCGAGGAGGGCATCTGGTGCGGTAGCACACTTCCGAAATCCAGACGCCGTTGGAGGCATGCAATTATTGCAACGATGCTCGGGCAACTTCTTTGGAGATTATTATCGACACGGTACTAGCACAGACGTCACGGAAGGTATCTCATCGTCGACAGTGATCGGGGCAAACTTGAGGAACAGCAGCGGCTCAGCCAATAGCGGACCGGCTTCCTCGAGTCGGCCCCAAAATAACCCCACACACACAGCCAACACTCGCAGCAGAGTTGgtcagcaacagcaacagcagcagcagcagcagcagcagcaacagcaaacACAAGTGCAACGTGCCCATCATCGTAACCAAGCGAGAATTCCGCTCACTTCGTCGCTGATTAACCGTGCCCCAGGCGGATTGAGAAGCTCGGATGAACAACTCGGCACAAGATCCGCAGGAAACAACACACAGGACCTTTGTGACAATTCTAACGACTCCGGCCTCGGATTCGAGGAGCGTCAACAGCAACATCTCAACAAAGCTGCTGCGTGGAACGAAGGTGCCGGCGAGGAGGATACAAAGCGCCGTAAAATGGACATTAAACTCGAATCTGAGGATGCAAACTTTGCTTTTCCGGAAGTAGTCCAGGGCTCGCAAAGCGAAGGCAAAATTTCAACGAGAAATGGAATTGTGGGAACTACTCGgacaaataacaatataaatggaTCGGTTGGACGAGTGGTTGGCGTGACAAGACCGCGGCCGCATCTTGGTGTATTAGCCAAGAGGCCACCGGTACATCAAGGCCCGATTACTTTAACCTCCCAGCTTTCTAGTGTATCGAGAAACGGTAAAACACAGTTGCAGATCATCTGCCAGCCAGAGCAGCAGCATCGTGCGCGTTATCAAACCGAAGGCTCGCGAGGAGCCGTTAAAGATCGCACGGGAAATGGATTTCCAATTGTCCGTCTAATGGGCTATGACAAGCCAGCAACTCTCCAGGTGTTTATCGGAACGGACCTTGGCCGTGTCGCCCCGCACATGTTCTATCAAGCTTGTCGCGTCAGTGGTAAGAATTCGACGCCGTGCGTCGAACGCAAAGTCGATGGAACGATCGTCATCGAGGTCGATATGGAGCCAGCTAAGGATATGCTGGTAACGTGCGACTGCGTCGGGATACTTAAAGAGCGCAATGTCGATGTGGAGCATCGTTTCCCACAGGAGGCAGGCATATTGCAGGGACGCAGTAAAAAGAAGTCGACGCGATGTAGGATGGTTTTTCGTACCACCGTTACATACGACGACGGCACTCACGAGACGCTCCAGGTCTGCTCGCAGCCTATTGTTTGCACTCAGCCGCCAGGTATACCAGAAATCTGCAAGAAATCTCTAACGTCGTGTCCATGCACCGGTGGACTCGAGCTATTTATCCTGGGCAAAAATTTCCTAAAGGATACCCGTGTAGTCTTCCAGCTCGATAGCGATAATATCAGTTCGTCGCTCGAGCCTCATTGGGAATGCACCGTCTTACCCGACAAAGAGTTCCTGCAGCAGACGCATCTCGTCTGCGTAGTGCCGGCATACAGCCGACAGGATCTCGCACCCTCGGAAACCATAAGTATCAAGTTATATGCCGTATCCTCGGGTAAGACAAGCGAGCCACATGCATTCCTTTATACTGCCACCTCGGCCCCACCTACACCCTCGATCGGTAAATTGGAGAACACACCCGGGGGCCTAATTGCATCGAATGCAGACACTGTTCTGACCTCAAAACTGCCTTCCACGCCTCTCGTCGTTTCCGGAAACGTCACAACAAACGGTCTACTTCCATCGACGGCCTCCGCTGCAGCTAACTTCCTCGGATCTATCCAATCACCGAGTACGGCCTCGGTGGCATCCGTTAATCCAGAGGTTTTAAAGAACGATCCGAGCCCACCGCCAGTCACGGCTGCATCCACCGTAACTCCGGTTATGTTATGGAGCTCTCAATCAACCAATAACCAGGGTAATGCAGCGGACGTAATGATGCCACCACCGCCAAACATGGTAGCCAATCCTCTTATGACACGGAGATCATCCTCGAGTCTGCAGTTAATCCTACCGGATAACCTAAAAACCGAGGTACTCGACGAGAACAGCGAAAGCAGCCTGATGGGAGATAATAGTATGACGGGCATAACGAGCTCAACGCACAACGCCACAGCCGGTTCTCTCGATCAGCTGATGAACGATAATTCAAGAGATTCGTCACAGAACAATCTTATTAGAAATACTGTATCCAGCAATGGCTCACCAGTACAGGAAGCATTGATGGGCGTTGTTGATCTCATACGCAACCAGCATCCATTAAGCATTGTGTCACAACAGTCAACTTTTAGGGGACTGCACGAACAGACGCAGGTAAAAGTTTTAAGTCCTCATCACATCAACAAAGATGCCAGTCCAATCATGGCTAACGAGGCAAATATCTCAGGCAGCATGCAAAGTCCGGGTGTTGTGGATCTACGCATGAAGCACCATCAATCTGAATTTAATGGCATCGGTAATGGTAATTTGGGTAGTTTTGCTGCGACTCCTGCTGATCAGCCACTGCCTGCTCAAAGTGGCCATAGCAtcgaaaaatatcttaatcaaATTGAGTCAACGGCACCGAAGAAGACCGATGTCCAGGAAGCGAATTTTGTACGAGCTTCGATAATAGCGAGTAGTCAGCAACAATCGTCAAACCTTCTATCCGCCAGGACGACGACAGTGCCTCTCGACGAATTAGTTAATTCGGCCGTCGATTCCCATCAAATGGTTTCACCTCTCAGACCTACGAACTCCAGTCCAAGCGcaataattaatcatgtaACGTCAGTTGTCGATCACGATTCACTTAATAGCCCCCAGCAATCAACTAGGACCAGTCCACCTATTCCCGTGAAGACGATGCTTTTGGAAGCTCTTATGCCAACTACGAATGTTTCATCATTAAGtgtcGACGGTGGTGCCACCGTAACGAGTGTGCCAGTTCAGGTGCAAGAAGGTACCGCGGACGATAGCCTGCTTAAAACAATAAACGCTGCGTTAATGCCGAGCATCCAGGAGTCGCCGATTGTGAGTGCAGCTGCGGCTGCCGCAGTCGTTAATGTGAATCCGAGCGTCAGCGTAAGCTCGCATAATCCATTGCAAGTAACGAGCGAAGTCATGCCAAATGTTGCTACTGCTATTCAAGCACTAGCCCAACAAGATCCAGTTGCCATGCAGCAGCAGGTGCAACAAGTTGAACAAGTCGTCGCCCAGGCCCAACAACAAGTCGAACAGGTTGTAGCTCAGGCCCAGCAACAGGCGGTCCAAGCCGTGCAGCAGGCCCAGCAGCAGGTCGTTCAACAAGTGGTTCAGCACGCCCAAGTAGTTCAGCAAGCCGTTCAAAAGGTCCAGGCGGCTCAGGAAGCGCCAGCGGCTCAAGCGACACAGGAGGTCGTTCAACAAGCCGTCCAGCAGGCAACGCACGAAGTCGTCCAGCAGGTACAGGCGGTACAGCAGGCTGTACAGCAGGCACAAGCTGCCCAAGCCATGCAGCAGGCGGTTCAACAAGACATTGGCTCGATGTTGAATCAGCCCGCGGGTTTTGTCGCTGAGGCGAGCTCCGCTCTAGCGAGTGGAGCCGCACAAGAGCCCAGTCAGCAAAGGCTTACCACCGCGGCCGAGCAGGCCATCAATAACGTTATCACAAACGCCACCCAAGACATTATCAATAACAGGCCAATTACCACAACGACAGCTCATGCCATCATagctactaaaaatattttaaatagtgtcGCAACCCAGagCGCTCAATTAATGAACAGTGCCATGGAAGGCATCCTGCCAAAATCTCCGGTTGCGCAGCAAACAATCGTCGAGCAAGTGACGAGCAAGTCGCCGTCGACCGGACCAATGACCATGCAAACATCGAGCAATAGAGCATCGGTCGTCAGTCAGCAAACGCCAATGCAGCAGAACAATGAGCCCCAACAACAGGTACAACAAGCGAATGGCGGTGTCGTGAGAAAATCAGAAGCGCCTACCAACGGTATGATGACGCAAGATCTAATGACAGACCACGAGCTACTCAGCTACATCGACGCTAGTTGCTTCGATCCGCAAAACGGATTTCTTATGTAA
Protein Sequence: MAPDLEKKREPRRASGAVAHFRNPDAVGGMQLLQRCSGNFFGDYYRHGTSTDVTEGISSSTVIGANLRNSSGSANSGPASSSRPQNNPTHTANTRSRVGQQQQQQQQQQQQQQQTQVQRAHHRNQARIPLTSSLINRAPGGLRSSDEQLGTRSAGNNTQDLCDNSNDSGLGFEERQQQHLNKAAAWNEGAGEEDTKRRKMDIKLESEDANFAFPEVVQGSQSEGKISTRNGIVGTTRTNNNINGSVGRVVGVTRPRPHLGVLAKRPPVHQGPITLTSQLSSVSRNGKTQLQIICQPEQQHRARYQTEGSRGAVKDRTGNGFPIVRLMGYDKPATLQVFIGTDLGRVAPHMFYQACRVSGKNSTPCVERKVDGTIVIEVDMEPAKDMLVTCDCVGILKERNVDVEHRFPQEAGILQGRSKKKSTRCRMVFRTTVTYDDGTHETLQVCSQPIVCTQPPGIPEICKKSLTSCPCTGGLELFILGKNFLKDTRVVFQLDSDNISSSLEPHWECTVLPDKEFLQQTHLVCVVPAYSRQDLAPSETISIKLYAVSSGKTSEPHAFLYTATSAPPTPSIGKLENTPGGLIASNADTVLTSKLPSTPLVVSGNVTTNGLLPSTASAAANFLGSIQSPSTASVASVNPEVLKNDPSPPPVTAASTVTPVMLWSSQSTNNQGNAADVMMPPPPNMVANPLMTRRSSSSLQLILPDNLKTEVLDENSESSLMGDNSMTGITSSTHNATAGSLDQLMNDNSRDSSQNNLIRNTVSSNGSPVQEALMGVVDLIRNQHPLSIVSQQSTFRGLHEQTQVKVLSPHHINKDASPIMANEANISGSMQSPGVVDLRMKHHQSEFNGIGNGNLGSFAATPADQPLPAQSGHSIEKYLNQIESTAPKKTDVQEANFVRASIIASSQQQSSNLLSARTTTVPLDELVNSAVDSHQMVSPLRPTNSSPSAIINHVTSVVDHDSLNSPQQSTRTSPPIPVKTMLLEALMPTTNVSSLSVDGGATVTSVPVQVQEGTADDSLLKTINAALMPSIQESPIVSAAAAAAVVNVNPSVSVSSHNPLQVTSEVMPNVATAIQALAQQDPVAMQQQVQQVEQVVAQAQQQVEQVVAQAQQQAVQAVQQAQQQVVQQVVQHAQVVQQAVQKVQAAQEAPAAQATQEVVQQAVQQATHEVVQQVQAVQQAVQQAQAAQAMQQAVQQDIGSMLNQPAGFVAEASSALASGAAQEPSQQRLTTAAEQAINNVITNATQDIINNRPITTTTAHAIIATKNILNSVATQSAQLMNSAMEGILPKSPVAQQTIVEQVTSKSPSTGPMTMQTSSNRASVVSQQTPMQQNNEPQQQVQQANGGVVRKSEAPTNGMMTQDLMTDHELLSYIDASCFDPQNGFLM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00309283;
90% Identity: iTF_00463782;
80% Identity: -