Basic Information

Insect: Topomyia yanbarensis
Gene Symbol: Nfat5_1
Assembly: GCA_030247195.1
Location: CM058068.1:205912789-205966067[-]

Transcription Factor Domain

TF Family: RHD
Domain: RHD domain
PFAM: PF00554
TF Group: Beta-Scaffold Factors
Description: Proteins containing the Rel homology domain (RHD) are eukaryotic transcription factors. The RHD is composed of two structural domains. This is the N-terminal DNA-binding domain that is similar to that found in P53. The C-terminal domain has an immunoglobulin-like fold (See PF16179) that functions as a dimerisation domain [1-2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 7.5e-30 1.2e-25 92.6 1.3 1 168 610 769 610 770 0.92

2 4 1 1.5e+04 -2.2 0.0 47 79 857 889 848 897 0.82

3 4 0.43 6.6e+03 -1.0 0.2 79 122 1429 1473 1407 1489 0.76

4 4 2.1 3.2e+04 -3.3 0.7 140 140 1558 1558 1506 1585 0.50

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	7.5e-30	1.2e-25	92.6	1.3	1	168	610	769	610	770	0.92
2	4	1	1.5e+04	-2.2	0.0	47	79	857	889	848	897	0.82
3	4	0.43	6.6e+03	-1.0	0.2	79	122	1429	1473	1407	1489	0.76
4	4	2.1	3.2e+04	-3.3	0.7	140	140	1558	1558	1506	1585	0.50

Sequence Information

Coding Sequence: ATGCTGTTGAAATGTGCAACATCGCCGCTTAGACGTGTTCCTTCGAGTCAAACCGGATCCGGTGGTGCTTCCGGAGGAACGAGCCCGGTTGGCTCGGGCAAGGGCAAAGGGAAGAATGTTCGCAATGGAACCGCTGCTGGTGGCGGCGGCACGTGCCACGTAGACTTGGACAATGATGATGGTAAGGTTGACCTGTGTCCCCCCGGAAGTGGACACGACGTGTACAACGTGTGTGTGTTCGTTGCTTCCTACCTCCGGGAAGCTCTACTCCTGTCTGACAATCCCGTTGATCGTCGACCACTTAGGAGAGAGCGAAAAACGTGCGCGTTCGAGCGCGAGAGCGAGATAAAAGCAATGAGATACATAAGTGATCGGAAGCAGCACTCAAGTGCCGAAGAAGGAAGTGACGGTGAACGGGCACATTCGCCCGGTCGACAGCATCCGCCACCGTACGTCGGGAAGAATCGGTTGCTGCAAAGTTCCCAGTGGAGTAAGAGTTACGACTCGGTGATAAATTATTGGAATACCAGTGACCTTGGAGGACGCTGCCGGCCCGGGCCCGGAGGTGGTTCGCAGCATCAGCAACAACAGCAGTGTAGCTCGGGGCAGACGACCAGGGGATACGGAAAGCCAACAGGATATAACGCACCGGTAAAACTCAACATCAGTCCTAGTGCGACCCTTGCCTCAAAACTCCACAGAAAAGTATTACGGGTGCCCTCGAAACGCATTCCCGGCAAAGTGCACCCCGGCAAGCTTGCCTCAGTAGCTAGCAAACTGACAGCCGCTAAGCAGCGACTacaccagcagcagcaacaacaacagaacCAGCTGCAACAGCATCAGTTCAATCTTCAGCAGCTTCCGCTGCAGCGTCCTCCGGCAGCTCCCAGCGTCAACAACTGTGATAACTCCAACGACTCCGGTCTTGGATTCGACCGTAGTCTCGATAGTGCCCTCGGTGCTCAATTCCAAAGTCATCCGAATCATACCAGCTCCGCGTCGACGGCGACGGTTGGCGGTAGCGGTACCATCGGTCGGTCGATTCATCACAGCAGTACAACACCGGCGGAAGATGAGGGCGTTGAAAGTGAATCCGGACTCAGAAACCGATCGGCGACGATCAGCGTCGGTAGAGGAGCACGGGGTGGAAAGCCGGCTACTACACTGTACAGCAACCGTCGCACCGTAACCCGATCGGTTGGTAGTAGCCGCAGTAGCAGTACTGCCAGTACTAAATCGCTAAAGCGAAGTCACCTGGAGCTGGATGATGCGACTGCCTGTTCCGGGGATCTGTTCGTACTAACAACCACCAGTGGTGGCAGCATCGGAGCCAGCAACAGTACCATCGTCAAACTATCTAATCCACCAGCCAAAATGAGTGTGGGCAAGGTTAAACCGGCGGTACTTCGAACAGTGGCGGCAACGAAGAAAATCATCTTTCCCGTGACGGGAAAATCGCCCAGTGTTGGTGGTGGAAAACGTACGGTTACCATTGCGCCATTATCATCTAACAAAACATCGCTATCATCattgtcatcatcatcatctggCTCACCGTCATCATTATCCATCACGGCGGCTGATTCGACGACGTCAATGGCGCCGGCGGtgacggcggcggcggcgtcggCAACACCGGTGGTGGCGAAAGTGATGACCTCATCGTTAGCCCGCCCGATCAACCGATTACCGGGCAAACGGCCACCCCTGCTGTCATCATCGTCTTCATCCCTCGGAGGCGGAGGCACTGCCAGCGGCGCAGCATTCGGCGTAGTCACCCTACAGACCCCGCTCGTGTCTTCCTCCCAGGATGGTAATATTCACCTACAGATTCTAACCCAACCGGAGCAGCAGCACCGGGCACGCTACCAGACCGAGGGTTCCCGAGGTGCGGTGAAGGATCGCAGTGGCAACGGGTTCCCGGTGGTGCGGTTGGTAGGCCACACCAAACCCACCGTACTGCAGGTATTCATCGGGACCGATGTGGGTCGGGTAGCGCCGCACATGTTCTACCAGGCATGTAAGGTTTCCGGGAAGAATTCCACCCCCTGCATGGAACGGAAGCTCGAGGGTACCATGGTGATTGAGGTTGATGTGAAGCCGGAAAACGAAATGACCGTAACGTGCGATTGTGTGGGAATTCTGAAGGAACGCAACGTGGACGTGGAACACCGATTTCCAGACCAGAGTGGTCCTCGGGCAAAGAAGAAATCCACACGCTGCCGAATGGTGTTCCGAACGACGATCAAGCATGACGACGGGAGTGTGGAGACGTTGCAAGTTTGCTCCCAGCCGATTGTTTGCACACAACCACCGGGCGTGCCGGAAATCTGCAAGAAATCTCTAGTCTCCTGTCCTGCCGAGGGAGGTCTCGAAATGTTCATTATCGGCAAAAACTTTCTGAAAGACACCAAAGTGGTGTTCCAACGACGCAAAGCCCCCCTGGGGGCCAACTCAGCCTCGATCAGTGTTATCCCGTGGGAGCAAACGGTCATCCCGGATAAGGAGTATCTGCAGCAGACTCATCTCATCTGTACCGTCCCACCGTACGTCCGGCAGGACATACTGGAACCTGTGGTAGTACAAATCTACATCGTTTCCGCCGGCAAGAAGAGCGAGACGCACAACTTTACCTTCACCCCGAAGAATGCTCACACGGCCCTTACGGCGGCCACGACGACTGCCGTACCCGCCGGGGGTACCTTCTTTGGAACGCTTGGCAGCGGTGAGACgattggtggtggtggtggtggtggcgtAAGCGGAGGCAGCGGCGTCGGCGGTGGCGATTCCAATGGTCGAACGAATGGTAGTCCCGCTGGAGGTGGTAATACTACCGGAGCCACCGGTTTCGCTTCTCTAAACTCTAGCTTTGGTAGCAACCCAAGCGAAGATACCTTGACGCAGAACGATGGCGGTGCCGGTGGCCAGAAGCAGCAGCCCTCGCTGTTCCAGTGGGGATCCCAGCTAAGTGCGGCGCAGGATGAATTGGACACAGGAATGATGCCTCCGCCGGTGAATGTGTTGCTCATGGGAGGTAACGGTCGAAGGCCATCGCTGCTGGGTGATCAGTTGAGCATGTCGTCGCCACCGAATTTCAAGGCGGAACTGATTGATGAAAATAGTCGTAGTCCGCATAATGAGGATTCACTTGAACGTTTCCCGGATTCAACCGATAATTCCATCGATAATAGTCATATTCTGTACCGAAGGAGAAGCGTTCGGCAGCCCAGTATGGATCTGATGGAGGATAGCTCTAGTATGTCGATGTTGATCAATGAGAACAGTGCAATGGATGTAGGGGCGATGTCAGGATCGATGGTTGGTTTCCGGACGGGACTGTCTACGCTGATGGAAACGAATGAGATCAGTAATTCGGCTACATCGCCGTTGGCTTCCGAGCTGAAGGTGATGGATTTGTGCATAAAGCAAGAACAGCAGCAACTGTCTGCGACGGCTAGAAATCAGATCGAACACATGATCGCCACCAGTAGTGGTTTGGGTGGTTTAAACGAGGTAAATCAGATTAAGGCCCAACTCAATGTGGAAGGCATGTTGAATGCTGCCGTGCAGCAAGGTTCCCTGGAGAAGCAAGCTCTCGAATCCACGATTGCGTCTATGGTTGGCGGGCAACAGCAGTCCGGTATGTTGGAAATGAATTCTTTGACTGGAAACGGTGGTAGCGCCCTCTCACCAGCAATGCTTCATGGcgatatttcaaatgcaaccaGTGGCCATTCACCCCTATCCCAGGACGTTATGCTGAACTCGCAGAGTACGTTAACCGTTCCTTCGCCGGGAAATATGGTACTGTCGCCAGCATCTACGACCTCAAGTGATGTGAGTTCTCATCCGCATTCTTCTATCTCCCCGGAAATAATCTTGAATCCAACGGTGTCACCCTCGTCGATGATATGTTCACCTTCGAACGCAACGGTTGCCGCTACGGCAGCAGCAGCCGTCGCTGCGGCGGCTGCCGTTTCCGAAGGAGCCGGTCTACTAACGAATCAAGTGTTTAACAATATGGCAGCCGTAGCCGCTAATATGATCGAACAGCAGCCGAAAGAAACCACTCAAGCAGTGCAGGAAATCATTCTGAACGCTGCCGCCGAAATTCTCACATCCCAGGAACCCTCCGTCACAACCCAATCCACGATCAACGCTCTGATCTCGATGAACGCCCAGGAAATGATGACTACCTCATGCCAGCCACAGTCCCAAGCCATTATGTCCCAACAAAACCTTCTACCTCAGTGCCAACCCTCCACGATGGCTTCGAACGTTCTGACGAGTGCGttacaacagcagcaacaaatgGTTCAAACTTTGATCAACGAAAGCATCCAGCATCAGCATCAccagcaacaacagcagcaggcaGCCGAATCTCTCATGCTAAACCTAGCAGCAGCGTCCCATCAGCAGAATCTACATACATCACCCGTGCCGGAGCAGATGGAGATTGGAAACCCGATCATGCAATCGTCCGGTTCCTCCAGTCAACCACCACAGCAACCGATGGACACGACGGCACCACTGTCCACTGTCTCGACGACAACATTGTcccaacaacaacagcagcagcagcttcaGCAGCACCAACAGCAAACCTCgccccagcagcagcagcacctcTCAGCACCAGTTTCGACTGATCCAGTCCAGATGACGGTCGGTGAACAGCATCAtcgacagcagcagcagcaagcgcaacaacagcaacaacaacagcagcaacatgccgcagcagtagcagcagccAATATACCTCAGGAGTTGACCATCATGTCGGACAACGATCTCATCAGCTATATCAACCCGAGTGCATTTGATGCAGGTATGTATAGCTTTTACTCTTCCAGTTGA
Protein Sequence: MLLKCATSPLRRVPSSQTGSGGASGGTSPVGSGKGKGKNVRNGTAAGGGGTCHVDLDNDDGKVDLCPPGSGHDVYNVCVFVASYLREALLLSDNPVDRRPLRRERKTCAFERESEIKAMRYISDRKQHSSAEEGSDGERAHSPGRQHPPPYVGKNRLLQSSQWSKSYDSVINYWNTSDLGGRCRPGPGGGSQHQQQQQCSSGQTTRGYGKPTGYNAPVKLNISPSATLASKLHRKVLRVPSKRIPGKVHPGKLASVASKLTAAKQRLHQQQQQQQNQLQQHQFNLQQLPLQRPPAAPSVNNCDNSNDSGLGFDRSLDSALGAQFQSHPNHTSSASTATVGGSGTIGRSIHHSSTTPAEDEGVESESGLRNRSATISVGRGARGGKPATTLYSNRRTVTRSVGSSRSSSTASTKSLKRSHLELDDATACSGDLFVLTTTSGGSIGASNSTIVKLSNPPAKMSVGKVKPAVLRTVAATKKIIFPVTGKSPSVGGGKRTVTIAPLSSNKTSLSSLSSSSSGSPSSLSITAADSTTSMAPAVTAAAASATPVVAKVMTSSLARPINRLPGKRPPLLSSSSSSLGGGGTASGAAFGVVTLQTPLVSSSQDGNIHLQILTQPEQQHRARYQTEGSRGAVKDRSGNGFPVVRLVGHTKPTVLQVFIGTDVGRVAPHMFYQACKVSGKNSTPCMERKLEGTMVIEVDVKPENEMTVTCDCVGILKERNVDVEHRFPDQSGPRAKKKSTRCRMVFRTTIKHDDGSVETLQVCSQPIVCTQPPGVPEICKKSLVSCPAEGGLEMFIIGKNFLKDTKVVFQRRKAPLGANSASISVIPWEQTVIPDKEYLQQTHLICTVPPYVRQDILEPVVVQIYIVSAGKKSETHNFTFTPKNAHTALTAATTTAVPAGGTFFGTLGSGETIGGGGGGGVSGGSGVGGGDSNGRTNGSPAGGGNTTGATGFASLNSSFGSNPSEDTLTQNDGGAGGQKQQPSLFQWGSQLSAAQDELDTGMMPPPVNVLLMGGNGRRPSLLGDQLSMSSPPNFKAELIDENSRSPHNEDSLERFPDSTDNSIDNSHILYRRRSVRQPSMDLMEDSSSMSMLINENSAMDVGAMSGSMVGFRTGLSTLMETNEISNSATSPLASELKVMDLCIKQEQQQLSATARNQIEHMIATSSGLGGLNEVNQIKAQLNVEGMLNAAVQQGSLEKQALESTIASMVGGQQQSGMLEMNSLTGNGGSALSPAMLHGDISNATSGHSPLSQDVMLNSQSTLTVPSPGNMVLSPASTTSSDVSSHPHSSISPEIILNPTVSPSSMICSPSNATVAATAAAAVAAAAAVSEGAGLLTNQVFNNMAAVAANMIEQQPKETTQAVQEIILNAAAEILTSQEPSVTTQSTINALISMNAQEMMTTSCQPQSQAIMSQQNLLPQCQPSTMASNVLTSALQQQQQMVQTLINESIQHQHHQQQQQQAAESLMLNLAAASHQQNLHTSPVPEQMEIGNPIMQSSGSSSQPPQQPMDTTAPLSTVSTTTLSQQQQQQQLQQHQQQTSPQQQQHLSAPVSTDPVQMTVGEQHHRQQQQQAQQQQQQQQQHAAAVAAANIPQELTIMSDNDLISYINPSAFDAGMYSFYSSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -