Basic Information

Insect: Anthophora plumipes
Gene Symbol: Nfat5_1
Assembly: GCA_951804975.1
Location: OX638122.1:15408294-15417201[-]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.9 3.6e+04 -2.8 0.3 111 131 91 111 75 132 0.56

2 3 2.3e-31 9.4e-27 96.7 0.5 1 168 268 430 268 431 0.89

3 3 3 1.2e+05 -7.1 8.2 68 147 1107 1126 1037 1181 0.44

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.9	3.6e+04	-2.8	0.3	111	131	91	111	75	132	0.56
2	3	2.3e-31	9.4e-27	96.7	0.5	1	168	268	430	268	431	0.89
3	3	3	1.2e+05	-7.1	8.2	68	147	1107	1126	1037	1181	0.44

Sequence Information

Coding Sequence: ATGAGATCCAGAGTTAGGCTAAGGTCTCATGTTAGGATACTTTACCCTATTGTTAAGCAGTATCGAAGGGTTAAGCAAAACTTCACATCTTCAGCGACAACTTTCCATCAATTCGAGGAATTGAAACTACTTATTGTTGTATATGAACAAAGCCCTTCTTCTCTAGGTAACAATGCAAGAGGAAGATCGTCAACGGTGACAGGATCTGTTCCAAGGAGCACCGTCACTTCGAGCAATCGCGCACACTCCGCTACGAGGAGGATCAGCCATCAGCAACgccaacaacagcaacagcaccAACAACAACCACAAgcacagcaacaacagcaacagtcGAGGATACCCTTGGGATCCTTACGAAGCTCGGATGAGCACGGATCAAGAGCAAACTCTGCACAGGACGTTTGCGACAATTCGAACGATTCTGGGCTTGGTTTCGAGGAACGTCAGCAACACCTCACGAACGCAAACGCTTGGAACGGCGCCGGCGAGGAGGACTCGAAGAGGAGGAAGATGGACATCAAGCTTGAGTCTGAGGACGCGAATTTCGCCTTTCCAGAGGTTGCCCATACAACGAGCCCTGAGAGCAAAACAGCCAGCAGGGGTACGTCGAATGGAATAGGGGGATTGGCGACCATTTCCGGAAGTAGAACGGGAAATGGAGGGAGTGGAAGAGTTGTCGAGGTCTCAAGAGCTCGTCCAGGCTTGGGAGTTCTCTCGAAGAGGACGCCTACTGCTCAACAGGGTCCTATCACACTCACTTCTCAACTATGTAGTGCTTCCACAGATGGAAAGGTTCAACTGCAGATTATTTGCCAACCGGAGCAACAGCACAGAGCTCGTTATCAGACAGAGGGATCTAGAGGAGCGGTGAAGGATCGTACAGGAAATGGTTTTCCAATTGTACGTCTGGTTGGTTACGATAAACCTACCACACTTCAAGTTTTCATCGGCACAGATCTTGGCCGCGTCGCGCCTCATATGTTCTATCAAGCGTGCCGTGTGAGCGGGAAGAATTCAACGCCATGTATCGAGCGTAAAATCGATGGTACCATTGTGATAGAGGTGGATATGGATCCAACGAAGGATATGATGGTCACGTGTGACTGTGTTGGTATATTGAAAGAGAGAAACGTCGATGTGGAGCATAGATTCCCACAGGAGGCTGGTGTCCTCCAGGGACGTAGCAAGAAAAAATCGACACGTTGTCGAATGGTCTTTCGTACGACGATAACTCATCCTGATGGTACCACGGAGACTCTGCAAGTTTGTTCTCAACCTATAGTTTGCACTCAACCGCCCGGTATACCGGAGATCTGCAAGAAATCACTCACGTCCTGCCCCTGCACTGGAggattagaattatttatacttgGAAAGAATTTCCTCAAAGATACTCGCGTAGTGTTTCAATTAGACAACGACGATCTGTCGAGTAGTTTAGAGCCTCACTGGGAATGCGCGGTGATACCCGACAAGGAGTTCCTTCAACAAACTCATTTGGTATGCGTGGTACCAGCTTATAGGCGGCAAGATCTAGCGCCTACGGAAACTGTCAGCGTGAAATTGTACGCGGTGTCCTCTGGAAAAACGAGCGAACCTCACACGTTCCTCTACACCGCTGCATCTACACCACCTGAACCATCTGTAGGCAAAATTGAACCTATAACACCGCCATTGGCAACCACAAATGGCGATACTACGTTAGCAACGTCTCCTACAGCGGTATCTCTAACTACAGGTGTATCATCAAACACTTTGATCAACCAAGCAGCTGCAGGAACACCGAACTTCTTGGCCACTATGCCACCTCAACAACCATCCTCTCAGACAACAGAGGCTTTGAAGAATGATCCAAGCCCACCACCAGTCACTGCTTCGTCCCAGGTAACGCCTGTGATGATGTGGGCAGCGCAGAGTCCGAATTGTCAAAATTCACCACCTGACGTGATGATGCCACCCCCAGCATTGGTAGCGAATCCTCTTCTAAATCGTAGATCATCCTCGAACCTTCAGTTAATTCTTCCGGATAATTTGAAGACGGAAGTGTTAGACGAGAACAGTGAGAATAGTATGATCAGCGAGAATAGTATGCAAAGTATACCGACGCCTACAGCGAACAGTTCCACGGGTACCAGCCCGTTGCAACAGTTGGTGAACGAGAATTCAAGGGAAACACCGCAGGCAAACATGATCAGATCGGTCCCAGTTGCAGCGAATAACTCGCCTGTACAAGAGGCAGTGAATCTCCTTGGTGTGGTCGATCTAATGCGGAACCAGCACACCTTGTCGATGGTGTCCACTCACCCAAACACCTTCGGAGGTATGCACGAACCGTCTCAAGTCAAAGTTCTAAGTCCCCATCATATCAGCAAAGAAACTAACCCGATGTTGCCGACAGAAGGCAGTCCTAACGGAACACTTCAAGGCGGCGGTGTCGTTGATCTACGGATGAAACATCATCAATCGGAGTATGGTACACTGTCGAACTTCACCGGATCACCGAATGGTCAGCTACCAGCACAGAGTGGTCACAGCGTAGAGAAATACTTGAACCACATCGAGTCGAACGTGAAAGAGGTTGATAGTCAGGAGAATGGGTTCGTGGGTACTATACAGCAACGAGCTTCCATTATCACGACAGGACGTCAACCACAACAGGGACAAGCTTCTACTATTTTAGCATCACCTCCTCAAGGGGTTAAGTTAGACACTCTAGTTAACACTGCCGCGGAATCTCATCAGCTGGTGTCCCCGTTGCGCACCGTTAACCCGACTAGTAACGCTATGATGAGCCACGTTTCCGCGGTCCCCGATCACGAAACGATCCCAAGCCCCCAACAGAACAGAACTAGCCCGCCAATTCCTGTCAAAACGATGCTCCTAGAAGCGTTGATGCCGCCACAGACGGTGCAACCTTTGACAGGAAACGGTGCCGCGTCCGTTTCGTCACCCGCGTCGGTGGTTCCAGAACAGACTAACGGCGATAGTCTACTGACCACCATAAACGCGGCTCTCCTGCCGACGATGCAGGAGCCAGCCGTAACTGCATCTGGTACGTCGAATGCTAACGTAACAGTAGCATCTCATAATCCGTTACAAGTTACGAACGAGACTATGTCGACAGCGGCGGAACATATTCCGCAGATCCAAGGTCTTATTCAGCAAGATGTTGTAGCGATGCAACAGGCACAGCAAGTGGAGCAGGTCGTTGCTCAGGCGCAGCAACAAGTAGAGCAGGTTGTCGCTCAGGCACAACAGCAAGCTGTTCAAGCTGTCCAACAGGCACAGCAGCAAGTGGTCCAGCATGTGGTGCAGCACGCTCAAGTTGTCCAGCAGGCTGTGCAACAGGTGCAAGCGGTGCAGCAGGTTCAGGCTGTACCAGCGGTACAGCAGGCTGTGCAACAGGCTACTCAGGAAGTGGTTCAACAAGCGGTGCAGCAAGCTACGCAAGAAGTGGTGCAACAGGTTCAGGCAGTTCAGCAGGCGGTACAACAGGCACAAGCTGCCCAGGCTATGCAGCAAGCTGTACAGCAAGATATCGGTTCGATGTTAAATCAACCGGCAGGTTTCGTTGCAGAGGCTAGCTCTGCATTGGCAAGCGGAGCTGCACAAGAACCGTCGCAGCAGAGGTTAACGAACGCTGCTGAGCAAGCGATTAATAATGTAATTACTAATGCTACTCAAGATATAATTAACAATCGACCGATTACCACGACAACCGCGCACGCCATCATCGCTACGAAGAATATATTGAACAGCGTGGCTACTCAAAGTGCGCAGTTAATGAACAGTGCTATGGAGGGTATTCTTCCTAAATCTCCCTCAAGTCAGAATAATATCGTCGAACAGGTCGCGAGTAAATCGCCACCGGTTGCATTACCCGTAACTCCCAACAGACAGAACGTAAACCCACCTATAGCGAACACAGCAAATAGTGCGAACGGTACGACGGTTAGAAAGCAGGAAGACGGTATGTTGCCCCAAGAGTTAACCTCGATGTCCGAACATGATCTGTTGAGCTACATAAACCCGAGCTGCTTCGATCCGCAGAACGGTTTCCTTATGTAG
Protein Sequence: MRSRVRLRSHVRILYPIVKQYRRVKQNFTSSATTFHQFEELKLLIVVYEQSPSSLGNNARGRSSTVTGSVPRSTVTSSNRAHSATRRISHQQRQQQQQHQQQPQAQQQQQQSRIPLGSLRSSDEHGSRANSAQDVCDNSNDSGLGFEERQQHLTNANAWNGAGEEDSKRRKMDIKLESEDANFAFPEVAHTTSPESKTASRGTSNGIGGLATISGSRTGNGGSGRVVEVSRARPGLGVLSKRTPTAQQGPITLTSQLCSASTDGKVQLQIICQPEQQHRARYQTEGSRGAVKDRTGNGFPIVRLVGYDKPTTLQVFIGTDLGRVAPHMFYQACRVSGKNSTPCIERKIDGTIVIEVDMDPTKDMMVTCDCVGILKERNVDVEHRFPQEAGVLQGRSKKKSTRCRMVFRTTITHPDGTTETLQVCSQPIVCTQPPGIPEICKKSLTSCPCTGGLELFILGKNFLKDTRVVFQLDNDDLSSSLEPHWECAVIPDKEFLQQTHLVCVVPAYRRQDLAPTETVSVKLYAVSSGKTSEPHTFLYTAASTPPEPSVGKIEPITPPLATTNGDTTLATSPTAVSLTTGVSSNTLINQAAAGTPNFLATMPPQQPSSQTTEALKNDPSPPPVTASSQVTPVMMWAAQSPNCQNSPPDVMMPPPALVANPLLNRRSSSNLQLILPDNLKTEVLDENSENSMISENSMQSIPTPTANSSTGTSPLQQLVNENSRETPQANMIRSVPVAANNSPVQEAVNLLGVVDLMRNQHTLSMVSTHPNTFGGMHEPSQVKVLSPHHISKETNPMLPTEGSPNGTLQGGGVVDLRMKHHQSEYGTLSNFTGSPNGQLPAQSGHSVEKYLNHIESNVKEVDSQENGFVGTIQQRASIITTGRQPQQGQASTILASPPQGVKLDTLVNTAAESHQLVSPLRTVNPTSNAMMSHVSAVPDHETIPSPQQNRTSPPIPVKTMLLEALMPPQTVQPLTGNGAASVSSPASVVPEQTNGDSLLTTINAALLPTMQEPAVTASGTSNANVTVASHNPLQVTNETMSTAAEHIPQIQGLIQQDVVAMQQAQQVEQVVAQAQQQVEQVVAQAQQQAVQAVQQAQQQVVQHVVQHAQVVQQAVQQVQAVQQVQAVPAVQQAVQQATQEVVQQAVQQATQEVVQQVQAVQQAVQQAQAAQAMQQAVQQDIGSMLNQPAGFVAEASSALASGAAQEPSQQRLTNAAEQAINNVITNATQDIINNRPITTTTAHAIIATKNILNSVATQSAQLMNSAMEGILPKSPSSQNNIVEQVASKSPPVALPVTPNRQNVNPPIANTANSANGTTVRKQEDGMLPQELTSMSEHDLLSYINPSCFDPQNGFLM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00306032;
90% Identity: iTF_01419424;
80% Identity: -