Basic Information

Insect: Diogma glabrata
Gene Symbol: Arid2_1
Assembly: GCA_963693315.1
Location: OY856186.1:385612152-385635778[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2.6e-24 3e-20 74.9 0.0 2 89 47 132 46 132 0.95

2 3 8.3 9.5e+04 -3.7 0.1 21 52 1324 1356 1312 1368 0.70

3 3 5.9 6.8e+04 -3.2 1.3 54 65 1535 1546 1506 1580 0.50

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2.6e-24	3e-20	74.9	0.0	2	89	47	132	46	132	0.95
2	3	8.3	9.5e+04	-3.7	0.1	21	52	1324	1356	1312	1368	0.70
3	3	5.9	6.8e+04	-3.2	1.3	54	65	1535	1546	1506	1580	0.50

Sequence Information

Coding Sequence: atgaatgtaaacgatacaaaagaaaatattttaccaTCAGAAACAAACAGTGAAGAAGTATCGAATAGTAATGtagaaaaaacagttttttttctcaAGACTGAAATTAAGAAAGAAAAAGATGACGAAGAAAAAAGTCGTGATAGTTTTTATAGGATTTTAAAGCAATTTCATGATACGAAAGGTACACCTTATCCAAAACTCCCAAAAATAGCAGGAAAGGAAGTTGATTTGCATAAGCTGTATAATATTGTAATAGGTAAAGGTGGATGGTTGAAAgTAAATAATCGCAATGAGTGGAATGATGTGTTAACGGAATGTGGATTACCTGCCAAATGTGTGAATGCTACCGTGgcaattaaacatttatatattcgaTATTTGGATAGATATGAAAAAACACATTATCATAAAGATGATAATGATGGTCGAGAGAACGATGAGGAAGAAGAAGTTCGACATAAAAGATGGTCGGCTAGATCCTTGAATTCTGTTCCAATGATTTATAACTACAATCAACATAACGTATCAGACACAGCTAGATATAGTCATAAACTCTCAACCGATTTGTATAAACCTTCagaatatgaaaaattatttatgtcCTTGCTATCACCTTTACCAAATGAACAAGATTTCGCTATAAATGTTTGTACTTTAATGGCCAACGAAAGCAAACCAACACTAAAAgttgaaaaatgtccaaaaTTAGTCGATGCATTACTTGCACATGCCGGCATATATCATCACTatacAACTCGTGAAATTTTTATAGAGTTTTATATGAAAACTCGTCGCCATTCATTGCAATCATTTTGGAATGATTGCTTAGTTGATAAACCAGACATTTTGGAATTATCATACGATGATTATTTTGCTTCAGAtgataatttaacaaaaaagaaaaatgaaattatatcaaaaataaaacaaatacacTCTTGTATCGATGATGAAAGTAGTCCAGAGGAAAAGATTATATCAAATTTAGATTTCTTATGTTTGGGGCGTGGTTTAGGAACCAACGATTACATCGGTCAAAGAGTACACCAAATTGCATCAATTCTACGTAATTTAAGTTTTATAGATGAAAATTTAGGAATTCTTGCAAAAAATCGAACATATTTACGTTTTTTGATTATGTGCTCAAATATACATTGGGGAAACTTACAGCATATGGGATTGGATATGCTAGGAAATATATCATCAGAATTGGAGTTAAATGATCCAGCTGGTGATGATTTGGCTCGATACTTATTGAAAACAATATCCGAAGGACTAGAAAGTACTGATCGTGCTGTGGTGATCAGTAGCTTGGAAATTTTATACAAACTTTGCCAGCAGGAGAATAATGAAgatgttttatataagtgtttgcATAACAAAATGTATAATCAAGTTTGCGTTTATTTATGTTTGAGTGACATTATGTTGCTATTATACACCTTAGAATGTATATATGCTCTATCATCATTGGGTGAAAAGTCTTGTAATGCTATATGCCATATCCGAGGAACAATTGATACATTAGTATCATTGGTAACCGTTGAAGCACAAAGTTATGGTCCAGATGCTTGTATTTTAATGAGAGTTGTTGAAACAGTTCCCGGAACTAATGCAACCAGTCAAAACAATCAAGTTAATGTTACGAACCTGAATAACGTTTCAATGACCAATCAAATAAGTTCAACCGATTCCAAAATTCTTGTTGTTGAGAATAAATTGAATGTATCGAGTCCTCAACCTCAAATGACTCCATCAACTTCCGTAACATCAAACATACAAATTAGTTCTCCTATTCGAACAAGTTCATCTGTAAAAGAAAACGCGAAACAATCAAGTCCAGCACCTCAAACCGAAAAAGaaattaagaaacaaaattcTTTAGCGGAAAAACAAGCACAGCAACAGATATTTCTAGAAAATGAACAATTTGCATTAACCTGGCTTCGACAAACATTCGAACCAGATCTAACATCTGTAACAAGAATAGAGCAACAAGActtgtataaattatatatgtcGGGGAGTTCTCAAATAGGTAAACGTGGATTTGTTTCTCCAATGCATTTTCCAAAATGTGTGCGATCAGTTTTTGGGAGTGGAGTTGGACCAAACCCCATCAAAATGGACCAACATGGAAAAGAAGTGACAAACTACTTTTATGAAGGAATTAAAATTCGTCCTATGACCCAACAAACATCAAATCCACCAAAACCCAGCGTAGTTGCTAAAGTGCAACCTATTAATAGTACAGTAATTCAACAACAGAAGTGCAATAATATATTAGCAACACAATTAGCTGGAAATAATAAAACTGTAAGTCCTCAGCAATTTAGTTCTCAACAAATAAATCAAGCTAAACAAACCTCGGTTATACAACAGAATCAAAAATTACTTTCCCAGGGATCAATACCGCAAACATCTTCATTATTACATAAAGTTTTAATTACACCAAATCAACAAACATCAAATATCGTAGATAATCAATCGAGTGTAATTGTATCAAGTACACAATCCACGGTAATAACATCACCCCAAACACAATCATCActtattaaaagtttattagCAAATAAGGTAACTACAGGTGATGGTGGTAACCAACAAGCTTCAACTACTAATAGTATTTCAACATGTTTAGTTTCTCCGAATGTCACTGTGCATCAGGTTGCGCAACgtcaacaaatacaaaaacaaaaagaattagCAAAgcaacaacacataaatataacattacaaaataacaacaatttaAAGTTATGTAACGCTCCCATTTTACCACCGCCATTGGCGAGTACAACACTCACTTCGAATTCTGAAAAATTAATGGAACAATCATATGTCAATCGTGACGTAGTTCCACCACTGGCACCACTTAGTGGTTCGAATGCGACAATACgtcaaataacattttcaacaaaaatCGATGAAGATTCAAATTCAACGGGAAACCATTCAATGTCTTCCTCAAGTTTAAATCAAATGGATGGTGATAGCTCGCGGACAAGCTTCGATGAAATTAATATTCATTCTGATGATGATTTATTAAACTCACGTGATATGTTATTTAAACAACAGTCGCAAGTGGTAACGGCTAATAAAATGTTAGCTGATTTATTAGAGAAAAAATCATTAGAACCGCCTAATTGTTTTAATTCTGTAATACAAAATGATAATCCACTTAAACGAAAAATCGAAGCGAGTGgggaaaatgaaattggaccCGAAGAAAAACgtataaatcatttaaataatgGCGAGTTaatggaagaaaatattgttCGACCATCAGCGAAAGCTGCTGATTTATATGCTGAGCTTGCAGCTTCGATGTTGGAAGATGAGGAAATCGAAGATGAGGCTATTAATCCAGCTAAACATATTCAAAACATCAGTTCTCAAATTCCCGCACGAATTGAGCTTAAAAAAACACCGATAATTACTCCTCCGCAACAGAGTCCACAAAAAATTCAAGCGATTGTACAACAAGGTCAAAATTTATCCAACACAATTATTCAAAATCAAACTCATTCTCATATCCATCAGCAACAACCACAACAACAAATGATAACGGTTCCAATGTCTAGACAAATCCTAATGTCACCAAATAATCAAGCTCAAGTAATGCTTTCACCGCCCACACATCATCCAATGGCAGGGCAAGTAACACAAACTACtgcaaaaatcaaaacagaAACTGGATACCAAACTGTTCCTGTTTTATTGCAACATACTCCCGCAACCAGTATGCAACTTCAAAAACAAATGAATCCTGGTAATCAAATAATTCAACATCCATCGATTATGCATCAAAATCCAAACCAAACTCAATATATTTTAACAACAAATCAACAAGGACAAACTGTAGTACTAGCTCAGAATCCTCAACCCCAAATGCATCAAACCGTTCTCGTTACACAAACACCACAACAACAAGGAACATCtgcaaaaactattataatTCTTCAACAACAACCGGGTTCAAACACTACTCAAATACAACAAGGAACAATCATGAATGCGGTTAATTCTAATTCTGGCACCCCACAAAAAGTTATAATGACAACTCAACAGGGACAACAAGTACTGGTGACACAAGTTCCAAGACCACTTCAACATCATGTAATTATGAATCATCCTCTTAATTCTGGCAATCAACAACAAATAGTTAATCAAAATAATCAGTTAATGTCATCAAACACACAACAAATAGTTATACAGACCAATCCTCAACTATTTGGAAGCAATCATCAACAACAAcatattataaatcaaaatcCACAGCAAACTATTTCACAAGTTCCGGTTTCTGTAACCTCCACAATGACGCAAACACCACAAATATTAGTCCATCATCAACAACCATATCAAGAAAGAAAACTTATTGTCGATTCAAGTTCATTGGATAAATCTACAGAATTAAAACTTAGTAATCATCAGCAAATTTTGAATATACAGCCGCAATCCCATATAATACTGCAACAACCAATTCAACAAAAATCTCATTCTGAAACTCAAGTTCAAACGACTGTTAATTCGCAACATTTACAACAAATTTCACAGTCAATTCAACAACAGTTATCACAAGCTACCCAACAGCAAATAAATCAACTTGTGCAACAACAGCAGATATCGGTGCCTGTGCAACAACACCAACAGATTTCACAATCTATTCAACAACAAATTAACCaacatatacaacaaaatataaccCAGTCcgtacaacaacaacaaacacaaTTGATTCAACCACAATTGAATCAGCCACAGCCGCCCATTACTCAATTTGTGCAACAGCAAACAACACAACAACCTGTACAACAATCCCAAACACCAATACTGAATCAAACAGCTTGTTCCACACAACAACGTccaaatcaaaatattattcaaaataataaaattcaaagtCAAAATGTTGTTCAGAATCCTGTTCCAAAGCCTGTTGTGGCGCCTGTTATAAAACATGAACCTGTTGTAAAAGTtgaaattgaattatttgataataattgGTTATGGGTTTGTGATTGGCGTGGGTGTCCAAAgAGAAAATTTCGATCAGCAATGGATGTTTATGTCCACGCTTGTACAGTTCACTGTCCTGATAATCTTGATGCTGGTGCTGATATATATTGTCAATGGGGACTTGGTCCAAACTTATGTGATAACTTACCCAGAAAACGATTTTCTTTGATGACTCATTTATTTGATCGTCACTGTACAATTGAATCATTTAAAATTGCAATGCAAAGACGACTTGCTACTGGTAATTCTGTACTACCCACTCAAACTCAACCAGTTACTATAATTAAGCAACCATCACCGCCATCAACTACTACTGAGACTACATCTACGACATCATCTACTTCATCAAAGTCGTCCAATGCTGCTATGCATGCAATTAAAAGACATGCACATGATTATGGGACATCTAAAGAATTATTgGATGAAAATGAAGGTCCTGTTACAAAGAGTATAAGGTTAACTGCGGCATTGATTTTAAGAAATCTCGTTAATTATAGCAGTTCCGCGAAAAgaAGCTTACGTTATTATGAACCACATCTAGCTGGTGTTGCACTAAGTAATGTTGAATCAAGTCGAACTATAGCCCAAGTATTATATGAAATGAACGAAACTCTCccactttaa
Protein Sequence: MNVNDTKENILPSETNSEEVSNSNVEKTVFFLKTEIKKEKDDEEKSRDSFYRILKQFHDTKGTPYPKLPKIAGKEVDLHKLYNIVIGKGGWLKVNNRNEWNDVLTECGLPAKCVNATVAIKHLYIRYLDRYEKTHYHKDDNDGRENDEEEEVRHKRWSARSLNSVPMIYNYNQHNVSDTARYSHKLSTDLYKPSEYEKLFMSLLSPLPNEQDFAINVCTLMANESKPTLKVEKCPKLVDALLAHAGIYHHYTTREIFIEFYMKTRRHSLQSFWNDCLVDKPDILELSYDDYFASDDNLTKKKNEIISKIKQIHSCIDDESSPEEKIISNLDFLCLGRGLGTNDYIGQRVHQIASILRNLSFIDENLGILAKNRTYLRFLIMCSNIHWGNLQHMGLDMLGNISSELELNDPAGDDLARYLLKTISEGLESTDRAVVISSLEILYKLCQQENNEDVLYKCLHNKMYNQVCVYLCLSDIMLLLYTLECIYALSSLGEKSCNAICHIRGTIDTLVSLVTVEAQSYGPDACILMRVVETVPGTNATSQNNQVNVTNLNNVSMTNQISSTDSKILVVENKLNVSSPQPQMTPSTSVTSNIQISSPIRTSSSVKENAKQSSPAPQTEKEIKKQNSLAEKQAQQQIFLENEQFALTWLRQTFEPDLTSVTRIEQQDLYKLYMSGSSQIGKRGFVSPMHFPKCVRSVFGSGVGPNPIKMDQHGKEVTNYFYEGIKIRPMTQQTSNPPKPSVVAKVQPINSTVIQQQKCNNILATQLAGNNKTVSPQQFSSQQINQAKQTSVIQQNQKLLSQGSIPQTSSLLHKVLITPNQQTSNIVDNQSSVIVSSTQSTVITSPQTQSSLIKSLLANKVTTGDGGNQQASTTNSISTCLVSPNVTVHQVAQRQQIQKQKELAKQQHINITLQNNNNLKLCNAPILPPPLASTTLTSNSEKLMEQSYVNRDVVPPLAPLSGSNATIRQITFSTKIDEDSNSTGNHSMSSSSLNQMDGDSSRTSFDEINIHSDDDLLNSRDMLFKQQSQVVTANKMLADLLEKKSLEPPNCFNSVIQNDNPLKRKIEASGENEIGPEEKRINHLNNGELMEENIVRPSAKAADLYAELAASMLEDEEIEDEAINPAKHIQNISSQIPARIELKKTPIITPPQQSPQKIQAIVQQGQNLSNTIIQNQTHSHIHQQQPQQQMITVPMSRQILMSPNNQAQVMLSPPTHHPMAGQVTQTTAKIKTETGYQTVPVLLQHTPATSMQLQKQMNPGNQIIQHPSIMHQNPNQTQYILTTNQQGQTVVLAQNPQPQMHQTVLVTQTPQQQGTSAKTIIILQQQPGSNTTQIQQGTIMNAVNSNSGTPQKVIMTTQQGQQVLVTQVPRPLQHHVIMNHPLNSGNQQQIVNQNNQLMSSNTQQIVIQTNPQLFGSNHQQQHIINQNPQQTISQVPVSVTSTMTQTPQILVHHQQPYQERKLIVDSSSLDKSTELKLSNHQQILNIQPQSHIILQQPIQQKSHSETQVQTTVNSQHLQQISQSIQQQLSQATQQQINQLVQQQQISVPVQQHQQISQSIQQQINQHIQQNITQSVQQQQTQLIQPQLNQPQPPITQFVQQQTTQQPVQQSQTPILNQTACSTQQRPNQNIIQNNKIQSQNVVQNPVPKPVVAPVIKHEPVVKVEIELFDNNWLWVCDWRGCPKRKFRSAMDVYVHACTVHCPDNLDAGADIYCQWGLGPNLCDNLPRKRFSLMTHLFDRHCTIESFKIAMQRRLATGNSVLPTQTQPVTIIKQPSPPSTTTETTSTTSSTSSKSSNAAMHAIKRHAHDYGTSKELLDENEGPVTKSIRLTAALILRNLVNYSSSAKRSLRYYEPHLAGVALSNVESSRTIAQVLYEMNETLPL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -