Basic Information

Insect: Drosophila infuscata
Gene Symbol: retn_1
Assembly: GCA_035042205.1
Location: JAWNLR010000721.1:270702-289002[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 6.1e-26 1.1e-22 80.3 0.0 2 89 349 434 348 434 0.96

2 3 7.5 1.3e+04 -3.3 0.2 52 73 552 577 546 588 0.50

3 3 2.5 4.5e+03 -1.8 0.3 10 44 588 628 573 639 0.60

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	6.1e-26	1.1e-22	80.3	0.0	2	89	349	434	348	434	0.96
2	3	7.5	1.3e+04	-3.3	0.2	52	73	552	577	546	588	0.50
3	3	2.5	4.5e+03	-1.8	0.3	10	44	588	628	573	639	0.60

Sequence Information

Coding Sequence: ATGGGCCAATATGAGCCACGTTATAGCCACAAAGAAGATGAAGTCGCAGACGAggctgcggctgtggctggGGCAGGGACAGGggcggaggcggaggctgCTGCCACTAAAAACGAGGCAAGAGCGTTGACGTTACCATTTCATTATGCGCAATCGCGTCTGCGACCGCGTTTAGACCTACTCGGAATAAGAGTTGACTCCCACGGTGATCGTACGGATGACGAGATGCGCGACTGTGATTCCGTTGACGGGGAGCATCATCAGCTGAGCGCCAAGGCGGCAATTGCAGCCCGGCTCAGTCACACAGTTGCCGGCGGCGCTGGTCTCAACTTTGCCAGTCCAGAGCAGCAAACAGATCTGCCACTCAGccatcatcatcagctgcCGCCGAATCATCCGCTCAACGCCCTCGGCAGCTTTATGAGCATCGGCGGCCTACACAGCATTCCAAATCTGCAGCACAGCGATGTCCTCGAGAAGCTCAAGATGCAAGTGCGCGACATGAAAGTTGGCCTCATGGAGCAGGACTATGCAGCAGCGGCACATGCCGCAGCCTTTGGCGCCAACATGCTGCCCACAACGATCAGTACGGCGTTTCCGTTGCCCCACAATTCGGTTGCAgcggctgcggcagctgcatcTTTTGGCCATGCCACAAATGTAAATGCCAATCCGGTGCCGCCAGCCAGCAATGGCGCCAGCTACAATGGTGGACCCACAGGTGGACATGGAACAGGAGCAGCTGCTAGCGTTGGCAACAGTGGAGGTACAGGAGCAGCAGGTGTTGGAGGCAACATCGCTGGtgttaacaacagcaacaacaacaacagcagcaacaacaacaacaacaacaatgccggCAATGGTCATCCCTTTTCATTTGCATCGCCAACAGCGCCGAGCAGCACCAAAGAAGCTAATTCCGCATCAAATTCATCGACGTCCAGTGAGGCATCCAATTCATCGCAGCAGAATAATGGCTGGAGCTTTGAAGAGCAGTACAAACAAGTCAGACAGCTCTACGAAATCAATGATGATCCCAAGCGCAAGGAGTTTCTCGATGATTTGTTTTCGTTTATGCAAAAGAGAGGCACGCCCATCAATCGACTGCCCATAATGGCCAAATCGGTGCTGGATCTGTATGAGCTATATAATCTGGTGATAGCGCGCGGCGGCCTCGTCGATGTCATCAACAAGAAGCTCTGGCAGGAGATTATCAAGGGACTGCATCTGCCATCGAGCATCACCAGTGCGGCATTCACCCTGCGCACCCAATACATGAAGTATCTGTACCCCTACGAGTGCGAGAAGAAGAACCTCAGCACTCCCGCCGAACTGCAGGCGGCCATCGATGGGAATCGTCGCGAAGGACGCCGGTCCAGCTACGGCCAATACGAGGCCATGCACAGTCAGATGCCACTGACAACAATTTCGCGACCATCGTTGCCTGGTGGCATGCAACAGATGTCGCCACTGGCGCTGGTCACACATGCTGCTGCCAACAATCAGCAGGCGCAGGCAgcggccgcagcagcagcagcacatcgACGGCTGATGGGCGGACCGGCCTTTGGTCAGATGCCGAATCTGGTGACGCAGGAGATTGAGAATCGGATGATGGAATATCTGCAGCTCATACAGGCgaagaaggagcagcagcagcagcaacagattgCGCCAGTTCTTGGCGCCACACATccacaccagcagcagcaacagcagcagcagcaacaacaatcgctgcatcatcaccaacaacaacaacaacaacaccagcagcagcagcagcgacagcgctCACAAAGTCCCGAGCTGAGCACGCGCGATGCGCTCAGTGCACAGGTGGCGCTTTGGCATATGTACCACAATAGCAGTCCAACCGGTTCGGCGCACACCTCACCACAGCAACGCGAAGCCTTGAACCTTTCTGACTCGCCGCCAACTTTGAATTTGAATCACATAAAACGGGAAAGGGAACGCGATCCGACGCCAGAACCAACGGATTTGGAGGAAACGGAACATCAGCCACCGCCACCGAAACGCGTAGGCAGCGGCCTAATGCCACCCGGTTTTCCACCCAACTTTTACTTGAATCCCCACAATATGGCCGCTGTGGCAGCCGCAGCCGGCTTTCATCATCAGGCCGccaacaatcatcatcatcagcagcagcaacattcgCAGCAGCAGGATGCAGCGTCTGAGGGTGAACCAGAGGATGAGTATGGCAATGGGGAGCACAACACCACCGGCAACTCATCGTCGCTGCATGATGATAGTGAGCCACAGCAGCTGAATGGACACCACCtccaccatcatcatcatgaccATCACGATCTGCATCATGATCTTCATCAtgagcatcatcatcatcagaatCATCTGGACAAGTCGGATGACTCGGCCATTGAGAACTCACCGAGCACatcgacaacgacaacaacaacatcatcatccacATCCAAAGCGAATCGTCACAGCTCGCCAGTGTCCACAAAAAAGAAGAGcagcggcaactgcaacagcagcagcatcaccaacaacaacaagacgcAGTCCTTGTCGAGTGCGAAGGATGCAggcaagaacagcagcagtgccAGCGATGTCAAACTGAATCCTCTCGAGACGCTCAGCCTGCTCTCGGGCATGCAGTTTCAAGTGGCACGCAACGGAACCAATGCAAATGGCGAACAGCAGTTGATTGTCAATCTCGAGCTAAATGGCATTAAGTACTCGGGTGTGCTGGTGGCAGCCacccaagcagcagcagctgttggagCAACAGCCGTACCAGCAGCCAGGTCAGAGGCAGGACAAACTGAGCGGGAGCAGGCAGAGACGCCAGACGCCGCTACTGCTGAGGAGCCAGCAGTGAGGAACAGCAGCATCACTGAGGATGAGCTCAAGCATGAAAACAGCCTGGAACATGGCCAGAACGAGGCAATTGATGAGGAATCAAcgcaggaacaacaacaacagcaacaccaactgACAGATGACATTTTGAATGGAGCGAGTGTTGTTGGTGCAGGAATTGGAGGGGTTGGTGTTGGGGTCGGTGGTGCAGTGGGTGCGGTGGGTGCAAGTCTGCTTAAGGATGCTGTGGTCAGTTCATAG
Protein Sequence: MGQYEPRYSHKEDEVADEAAAVAGAGTGAEAEAAATKNEARALTLPFHYAQSRLRPRLDLLGIRVDSHGDRTDDEMRDCDSVDGEHHQLSAKAAIAARLSHTVAGGAGLNFASPEQQTDLPLSHHHQLPPNHPLNALGSFMSIGGLHSIPNLQHSDVLEKLKMQVRDMKVGLMEQDYAAAAHAAAFGANMLPTTISTAFPLPHNSVAAAAAAASFGHATNVNANPVPPASNGASYNGGPTGGHGTGAAASVGNSGGTGAAGVGGNIAGVNNSNNNNSSNNNNNNNAGNGHPFSFASPTAPSSTKEANSASNSSTSSEASNSSQQNNGWSFEEQYKQVRQLYEINDDPKRKEFLDDLFSFMQKRGTPINRLPIMAKSVLDLYELYNLVIARGGLVDVINKKLWQEIIKGLHLPSSITSAAFTLRTQYMKYLYPYECEKKNLSTPAELQAAIDGNRREGRRSSYGQYEAMHSQMPLTTISRPSLPGGMQQMSPLALVTHAAANNQQAQAAAAAAAAHRRLMGGPAFGQMPNLVTQEIENRMMEYLQLIQAKKEQQQQQQIAPVLGATHPHQQQQQQQQQQQSLHHHQQQQQQHQQQQQRQRSQSPELSTRDALSAQVALWHMYHNSSPTGSAHTSPQQREALNLSDSPPTLNLNHIKRERERDPTPEPTDLEETEHQPPPPKRVGSGLMPPGFPPNFYLNPHNMAAVAAAAGFHHQAANNHHHQQQQHSQQQDAASEGEPEDEYGNGEHNTTGNSSSLHDDSEPQQLNGHHLHHHHHDHHDLHHDLHHEHHHHQNHLDKSDDSAIENSPSTSTTTTTTSSSTSKANRHSSPVSTKKKSSGNCNSSSITNNNKTQSLSSAKDAGKNSSSASDVKLNPLETLSLLSGMQFQVARNGTNANGEQQLIVNLELNGIKYSGVLVAATQAAAAVGATAVPAARSEAGQTEREQAETPDAATAEEPAVRNSSITEDELKHENSLEHGQNEAIDEESTQEQQQQQHQLTDDILNGASVVGAGIGGVGVGVGGAVGAVGASLLKDAVVSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00511055;
90% Identity: iTF_00573828;
80% Identity: -