Basic Information

Insect: Polyergus mexicanus
Gene Symbol: Nfat5_1
Assembly: GCA_030449975.1
Location: JAUDSZ010000003.1:10022429-10037282[+]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.1 1.7e+04 -3.1 1.1 111 135 82 100 66 110 0.43

2 3 6e-29 9.2e-25 88.9 0.4 1 168 261 421 261 422 0.88

3 3 3 4.6e+04 -11.8 14.2 76 111 1087 1106 1006 1156 0.45

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.1	1.7e+04	-3.1	1.1	111	135	82	100	66	110	0.43
2	3	6e-29	9.2e-25	88.9	0.4	1	168	261	421	261	422	0.88
3	3	3	4.6e+04	-11.8	14.2	76	111	1087	1106	1006	1156	0.45

Sequence Information

Coding Sequence: ATGGCACCCGACCTCGAGAAGAGGCGCCAGGAATTAAGGAGGGGCAGCAGCACGACCTTGGACCATGTCAACGATCATCTGGGCATCCTCTTACAATCGAGCCGTGTAAACGGCGCTTTAACAGATCCTTATCGTTATGgtaGCAATGCAGGAGGCATATCGTCGACGGTGACAGCATCATCTATCTTGAGGAGCAACACAACTACGAATAATCGCGCTCATTCCACAACTAGGAGGGCGGTCAGTCATCAGCAACgacaacagcagcagcagcagcaacgaCAACAACAACAGCAAAAACAATCTAGAGTCCCACTATCGTCTTTTACTGGCATCACTGTAAGCTCGGATGACCACAGACCTAGAACGGGAACGACGCAAGACGAAAACTCGAACGATTCCGGCCTCGGCTCCGAGGAACGTCAACAGCACTTTAACAACGTCAATTCTTGGAACGGCGTCGGCGAGGAGGACACAAAAAGGAGAAAGATGGACATCAAACTGGAATCTGAAGATGCAAACTTCGCTTTTCCGGAAGTGACTCCCGGAACTAGTCCTGACAATAAGTCCTTGACAACCAGAACTACCGCTAATGGGATTGGTTTGGGAAATGTCTCTGGTAGTAGGACCGGAAACGGTAATTCCGTGAACAGAATCGTAGGGGTGACCAGACCTCGACCTGTCATGGGCGTGCTGACTAAGAGGACATCGACCGCTCATCAGGGGCCTATCACCCTCATCTCGCAATTGTCCAACATCTCTGTCAACGGTAAAACTCAACTGCAAATTATCTGCCAACCTGAGCAACAACACCGAGCTCGCTATCAGACGGAGGGCTCGCGGGGAGCGGTAAAGGATCGTAGCGGGAATGGCTTTCCCATCGTCCGACTGATCGGCTATGACAAACCGACGACACTGCAGGTATTCATCGGTACTGATCTGGGCAGAGTGGCGCCGCATATGTTCTATCAAGCCTGCCGAGTAAGCGGCAAAAACTCTACATCGTGCGCCGAACGGAAGATTGATGGCACGATTGTTATCGAGATTGACATGGATCCTGCAAAGGATATCACCTGTGATTGCGTCGGCATCTTGAAAGAACGTAATGTTGACGTGGAACATAGGTTCCCTCAGGAGGCCGGACTACTTCAGGGAAGAAGTAAGAAGAAGTCGACACGGTGCCGCATGGTCTTCCGCACGATTATCACGCACATTGACGGAACTACAGAGACGTTGCAAGTCTGTTCGCAGCCGATAGTCTGTACTCAACCACCTGGAATTCCAGAGATCTGCAAAAAATCTTTGACGTCTTGTCCATGCACCGGTGGATTAGAACTCATTATACTAgggaaaaattttctaaaggATACTCGAGTAGTCTTTCAGCTGGATAATGATGATGTTACAAGTCTGGAACCGCATTGGGAATGCACCGTGCTGCCGGATAAAGAGTATTTGCACCCGGCGCACTTGGTGTGCGTTGTACCTGCTTACCGCAGACAGGATCTGGCACCTACAGAGACGGTCAGCGTAAAATTATATGCAGTATCGTCCGGAAAGACCAGTGAACCGCATACTTTCCTTTATACGGCCGCTTCTACTGCCCCGCAGCCATCTATCGGCAAACTCGAATCCATTTCACCTCCACTTGGGAACGGTGACACTAATCTGGTCACATCCTCATCCGTGATGCCATTGGCTACAGATGTAGCATCCACCACTGTGGGGCCGGCGAGCTTTTTAACCAATCCTCCGACTCAACCGCAACAAACCACCTCTTCAGCAGAGACACTAAAGAATGATCCCAGTCCGCCACCAGCGGGAACGTCCCAGGTGATTCCCGTAATGATGTGGGCCTCGCAGTCTTCGAATTCACCCCCTGACGTTATGATGCCACCTCCGCTTGTGGCCAATTCTCTAATGAATCGACGACCTTCATCGAACCTACAGCTGATCCTGCCAGACAACTTAAAGACGGAAGTATTGGATGAGAACAGTGAAAATAGTATGCTGAGTGACAACAGCATGCAGAGTATCCCAACGCCAACGACAGCTACAAACGGACCGACATCTGTCGCCTCTCCCCTCCAGCAATTGGTTAACGAAAACTCCAGAGAGGCCGCATCTTCGCAAGCTGATATCATCAGAACCGCTGTCGCAACCGCTAACAACAGCCCCGTGCGAGAGGCAGTAAATGGTCTTCTTGGAGTGGTGGATTTAATACGTAATCAACATCCTCTGTCAATGGTGAATACACATCATCCGACTTCATTTGGAGGCATGCATGAGCCAACTCAGGTGCCAGTTCTTAGTCCTCATCGTCTCAAGGACACTAATGGTGTCTTGCCAACGGAAAATAGTTCCAATGGAGCAGCTCTTCAAGGCGCTGGAGTGGTGGATCTTCGCATGAAACACCATCATCATCAGCCAGACTTTAGCACGCTGTCCAATTTCACCGGTGCTTCCGGGACACAGCCGTTATCAGCGCCGACCAGTCATGTGGTAGAAAAGTATCTGAATCACATTGAATCCTCAGTGGCCACTAGCGAAGAATCTGACAATCCAGAAAACGAATTCGCCATTCAGCAGCAGCGGACTTCCATTATCTCAGGAAGCGCCCAGCAATCGGCGGCACCTCCAGGAATAATGACCACTACAGGGCAAACTTCAGTAAACGCCTTAGTAAACTCAGCAACTGAACAAATGGTCTCCCCATTGCGTGCCGTAAATCCCAATCAAACCGCAATATTGAGCCATGTGACAGCTGAGCATGAGGCAATCGGTAGCAATCAGCAGACTAGAACTAGTCCACCGATTCCAGTGAAGACGATGTTGCTGGAAGCATTGATACCGCCGCAAGCGGTGCAACCATTGGCAACGGCTACAGGTGCGACATCAGTATCGCCTGCAACAACAGTGGAACAAACAGGAGAGAGTCTGCTAACTACTATTAATGTAGCACTATTACCACAGTTGCCAGAAAATCAAGTCAACGAGGCAAATGCTACATCGAATTCCacaGTCACTGGCAATACGATGCCAGCAGAGCACCAGCAGATGCAACAGCAGATTCAAGCGCTCACACAGCAAGAAGTGGCCGTGATGCAGCAGCAGGTACAGCAAGTGGAACAAGTAGTAGCACAAGCTCAACAGCAAGTCGAGCAAGTTGTCGCGCAAGCGCAACAGCAAGCGGTCCAAGCTGTGCAACAGGCTCAGCAACAGGTGGTCCAGCAAGTAGTACAGCATGCCCAAGTAGTGCAACAAGCGGTGCAACAAGTGCAGGCAGTGCAGCAAGTTCAAGTGGCTCAAGTGGTGCAGCAAGCGGTGCAACAAGCGACTGAAGAAGTTGTGCAACAAGCGGTACAACAAGCGACGCAAGAAGTGGTGCAGCAGgtTCAAGCAGTGCAGCAAGCTGTCCAGCAGGCTCAAGCAGCCCAGGCTATGCAACAGGCGGTTCAGCAAGACATTGGCTCCATGTTGAATCAGCCCGCAGGTTTTGTAGCGGAAGCTAGTTCCGCTTTAGCCAGCGGAGCCGCTCAGGAACCCTGTCAGCAGCGTCTGACTACCGCGGCTGAACAAGCCATCAACAATGTCATCACCAACGCCACGAAGGACATCATCAACAATCGGCCCATCACGACGACCACCGCTCACGCGATCATCgctacaaaaaatattttgaatagcGTAGCGACACAGAGCGCGCAATTGATGAACAATACAATGGAAGTGATTTTGCCGAAATCTCCGTCGGCACAAAACAATATCGTCGAACAGGTCACTAGCAAATCACCACCGGTCGCACTTCCGGTCACTCCAAATCGCCAGGCTGTGAATGCCCCAATTCCCAATCCCGCCGCGAGTACTGCAGTCAACAGAAAGCCGGAGGATGGGATGCTGCCTCAAGAGCTTACCTCGATGTCGGAGCACGATCTTCTGAGTTACATCAATCCCAGTTGCTTTGAGCAACTTCCACAAAGTGGATTCCTCTTGTAG
Protein Sequence: MAPDLEKRRQELRRGSSTTLDHVNDHLGILLQSSRVNGALTDPYRYGSNAGGISSTVTASSILRSNTTTNNRAHSTTRRAVSHQQRQQQQQQQRQQQQQKQSRVPLSSFTGITVSSDDHRPRTGTTQDENSNDSGLGSEERQQHFNNVNSWNGVGEEDTKRRKMDIKLESEDANFAFPEVTPGTSPDNKSLTTRTTANGIGLGNVSGSRTGNGNSVNRIVGVTRPRPVMGVLTKRTSTAHQGPITLISQLSNISVNGKTQLQIICQPEQQHRARYQTEGSRGAVKDRSGNGFPIVRLIGYDKPTTLQVFIGTDLGRVAPHMFYQACRVSGKNSTSCAERKIDGTIVIEIDMDPAKDITCDCVGILKERNVDVEHRFPQEAGLLQGRSKKKSTRCRMVFRTIITHIDGTTETLQVCSQPIVCTQPPGIPEICKKSLTSCPCTGGLELIILGKNFLKDTRVVFQLDNDDVTSLEPHWECTVLPDKEYLHPAHLVCVVPAYRRQDLAPTETVSVKLYAVSSGKTSEPHTFLYTAASTAPQPSIGKLESISPPLGNGDTNLVTSSSVMPLATDVASTTVGPASFLTNPPTQPQQTTSSAETLKNDPSPPPAGTSQVIPVMMWASQSSNSPPDVMMPPPLVANSLMNRRPSSNLQLILPDNLKTEVLDENSENSMLSDNSMQSIPTPTTATNGPTSVASPLQQLVNENSREAASSQADIIRTAVATANNSPVREAVNGLLGVVDLIRNQHPLSMVNTHHPTSFGGMHEPTQVPVLSPHRLKDTNGVLPTENSSNGAALQGAGVVDLRMKHHHHQPDFSTLSNFTGASGTQPLSAPTSHVVEKYLNHIESSVATSEESDNPENEFAIQQQRTSIISGSAQQSAAPPGIMTTTGQTSVNALVNSATEQMVSPLRAVNPNQTAILSHVTAEHEAIGSNQQTRTSPPIPVKTMLLEALIPPQAVQPLATATGATSVSPATTVEQTGESLLTTINVALLPQLPENQVNEANATSNSTVTGNTMPAEHQQMQQQIQALTQQEVAVMQQQVQQVEQVVAQAQQQVEQVVAQAQQQAVQAVQQAQQQVVQQVVQHAQVVQQAVQQVQAVQQVQVAQVVQQAVQQATEEVVQQAVQQATQEVVQQVQAVQQAVQQAQAAQAMQQAVQQDIGSMLNQPAGFVAEASSALASGAAQEPCQQRLTTAAEQAINNVITNATKDIINNRPITTTTAHAIIATKNILNSVATQSAQLMNNTMEVILPKSPSAQNNIVEQVTSKSPPVALPVTPNRQAVNAPIPNPAASTAVNRKPEDGMLPQELTSMSEHDLLSYINPSCFEQLPQSGFLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00867919;
90% Identity: iTF_00868544;
80% Identity: -