Basic Information

Insect: Chorisops tibialis
Gene Symbol: ARID2_1
Assembly: GCA_963669355.1
Location: OY770262.1:176498944-176523359[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 3.2e-24 2.6e-20 74.0 0.1 1 89 46 132 46 132 0.95

2 4 3.2 2.6e+04 -2.9 0.3 53 78 961 986 948 991 0.51

3 4 0.53 4.4e+03 -0.4 0.4 23 56 1022 1053 967 1057 0.74

4 4 1.9 1.5e+04 -2.2 0.1 38 52 1385 1399 1354 1431 0.64

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	3.2e-24	2.6e-20	74.0	0.1	1	89	46	132	46	132	0.95
2	4	3.2	2.6e+04	-2.9	0.3	53	78	961	986	948	991	0.51
3	4	0.53	4.4e+03	-0.4	0.4	23	56	1022	1053	967	1057	0.74
4	4	1.9	1.5e+04	-2.2	0.1	38	52	1385	1399	1354	1431	0.64

Sequence Information

Coding Sequence: ATGACGACAACGGACATCAAGGAGCCGGCCACGCCAGTCGGCGTGCAAAATGAAGAGAGCGTAAGCAGCACGACCAAGACGAACGCGAGTGCGAAAAAAGCATCGGGCGGCCGTGAGTTTGTCTACGACGAACGGGAGAAGGATTCGTTCTACAAAGATCTGCAAACCTTTCACGAGAATCGCAAcACACCGTTGGCCCGATTCCCGAAAGTGAGCGGCAAAGAGGTCGACCTTCATCGCTTGTATGCCGAGGTGACCAAGCGGGGCGGCTGGCTCAAAGTGAACATCCGGAACGAATGGGACGAACTGCTGCCGGTGCTCGGGATCAAGCTCAAGTGTGTGAATGCCTCGGTCGCGATCAAGTACATTTATACGCGCTACTTGGACAAGTACGAACGTCTGCACTTTTTGGGCGAGGATCCTGACCGGGTGGACGAGCCGGACGATGAGGATCGCCACCGCAAGAAGTATTCGACGACGAAGGCATTTCACTCGGTGCCGATGGTTTACAATTACGGTCAGCATGTCGTGCCCGAACCGCTCCGCACGCTGCATCGGCTATCCGTGGATATGTACAAGGGATCGGAATATGATAAGTTGCTGCTGTCGTTGATGTCGCCGCTGCCCAACGAACAGGACTTTGCTATTAATGTTTGTACGCTGATGGCGAACGAGAGCAAGCATACGCTGAAGATCGATCATTGCCCGAAGCTGTTGGACGCCCTGATGGCACATGCTGGCGTATTTTGTCACTTTACAATGCGCGATCTATTTGTCGAAATGTACACGAAAATTCGTCGACATTCCCTGCAATCTTTCTGGACGGATTGTCTCTACGATAAGCCAACTATTCTTGAACTATCATACGACGATTACTTTCAAGCACCCGATGAAAAATTCGCCAACATGGGACTATGTCGTCCGCCATTACGACTACCGTTTCGCGAAACATTCGAAGACGGTCTAACTGTCGATCCTGAAGAATATAAAAACGATGTGGGTCGCTTAGATTTTTTGGGTCTCGGACGAGGATTAGGCACGCACGATTACATTGGACAACGTGTCCACCAAGTGATCTCAATCATTCGAAATCTTAGTTTTTTTGAAGAGAATCTTCTAACGTTGGCGAAAAATCGAACTTTCATTCGATTTCTGGTGATGTGCTCGAACGTACGTTGGGGCAATTTGCATCATATGGCGCTGGATATTTTCGGAAATATTGCACTTCAAGTTGATTTGAATGATCCAACATCGGACGATTTGACGCGATGTATGCTGTCGACATTGTGCGAGGGATTGGAAGGAGAGGATCGCGGTGTGATTATCAGTTGTTTGgagattttgaataaaatatgcCAGAAGGACATTAACGAGGACTATTTGCACAAATGTTTGGACTATAAAACgtataataaaatttgtctGTTTTTATCGCTTAACGATATTATGTTGCTGCTTTACACGCTCGAGTGTATTTATGCGTTAAGTTCGCTCGGTCAGAGACCATGCAATGCGCTGATTCAGGTCAAGGGAATCATAGACACTTTGGTATCTCTGATAACTGTTGAGGCACAAAGCTACGGTCCCGACGGGTGTATTTTGATGCGTGTTGTTGAAACTGTGCCTGGAAATATGCTGCCGATGGTCGCTCAAAATATTGCTAAATTGCAAAATGCTGCCATGCAAGGTCACGTGTTGGCTAGCAAAGACAATAATCACACAGAAGTCGTCAATGCTGATGCGCAAAaAGTAACTGGAACACCTGCAGTTGTATCCGTACCAAATGCACAGACACCTGCCCGTACCGTTGTACCGCCACAGATTTCAAAGGAAGTTGCGACATCGCCACAAACTCCAATTAGCAGCAAGGCTGTTTCAAATTTAccgGAAAACGAGCAATTTGCAATCGCATGGCTATCCGCCACTTTCGAGCATACAACATCAGCATCCAGTCGCGTCGAGCAGCAAGAACTTTACAAAATGTATCTGTCAGCTAGTCAGAAAACCGGACGTCGCGGTGTCGTCTCGCCAATTCATTTTCCACGAATCGTACGAAATGTTCTCGGTCCAACAGTCGGaccaaatttaattaaaacaaccGAACCAAATGGTGTCGAATTGAATGCATTCTATTATGTTAATATTCGTGTACGGGCAAATCCAATGCCGGTTCAATATAAAGGTACAACAATACCGGCTacgaatcaatcaaatcaaactccagctaaacaacaacaacagcaaacaCAAATAAAACCACCACAACCACAAACTGTTGAGGTAGTGGTGACAAAAAAACTTGAGGTGGGTCAAAAGAATaaaatttctaagaaaaatcaggcaCAATTACAACATCAGTTGTTGCAACAACAACAACCGCAACAACTACTACAACAGCAACAATCCCCAATTACCCAGcatgttcaacaacaacaacatacgCAATCGATAAAATCATTACAGTCGCATTCAATTCCAACCCAACAGCAAACTGTTGTAGCACAACCACAAGAAAATCAACTCTCTGTGACTAAGCTGGCGGGAAAGAATGTTCATgcACAGCACGCCATTCAACAAAATTCATATCAAGCTGCGAACAATGCTACGATCGATGCGAACCAAATAAATGGAGTTCAACAGCAGctgcaacaacaacagcagcagcagcagcagccatCACCGGCGCAATCTAGCCATCTAGGTAATGGAAATGGCCCGCAAACATCTTCATCTCTCATAAAAAGCCTACTGGCAAATAAGGTAACAACATCTCCTACAGCTACTGATGTAAGCGAAACGATTGCGAGTGCAGCTCCAAATAATCCAAGTTGTTTGATTACCCAAAATGTTAATTTGCATCAGgTCGCTCAACGTCAGCAATTAAAACAGAAAGAGCTTGCGCAACAGCaatttcaacaacaacaacatcaacaacagcaacaacagcaacagctacaacaacaacagcaacaagcACCAAATCAAGTTCAACACGCAACAATAAGTTCGCTGGTAAACAATCCTGTAATACCAGCAACTTCAGTTAAAGTTGGTCAAACAACAATCAAAGCCATAACGGGAAATCCCATTCCAACGTCCGTACTTGAAAAGAAAGTAAATCAAGGATCTAGTGATTCTGTTGATAATACACACTGGGATCCGGTACCACCGTTGGCTCCGCTTAGCGCTAGCATGCTAAATTCGAAAATCGCCGGCAATGTAATCGTAGCACCCGGAAACGAAGATTCCAATTCGACTGGAAATAATTCAGTGGCTTCGAGTGTCATCAGTTCTACACAGGTTGTAACTACAGACGATGGTGAAGGATCGTTGATCAGTTTCGAAGGATTATTAGTGCCAAAATCCAAATCTGGCAGCTCATCGGTAACCGAAGATGAAGGTTCGAAAGATTCATTCAATAAATCCGCGCAAATGTTCCAAGCAAATCAAATGCTTGTCGATTTACTTGATAAGAAATCACCGGATCCGCCGATGAGCAGCGGATCGGTTAAGAGAAAACTCGACGAAGATTTAGCAAATGAAAATGACAATAATCAAAAGCGATTAGCTGGTGATAATCCAAGCGACGATATGGACATTGAAGAGGAAATGCCAATGGTTCAAGCTTCCAAAAATGCCGCCAATCTTTATGCGGAAATGGCAGCTTCGATTCTGGAAGACGAAGATTTAGACGATGAACCGGAACTCGAACAATCGATACCGATAATTCAACCGCCAGTCGAACAGAAGCAAGTCATCACAATGCCAATGCCAATTCAGCGGCAAATTATCATGGCACCGAATAATCAAATGATTCTCACGCAATCGGGTCAAGTCAATCAGACTCAGGCAACGGCCACGATTAAAACTGATGCGGGCCTTCAAACCGTTCCGTTAATTATTCAGAAACAAATTGGCCCGAACGGGCAACAAATCATGCAACCGGTTCTGCAACAACAACAGCCGCAGACGCAATATGTCCTGGCGACAAATCCGCAAGGTCAAACGTATTTAGTTGCGCAACAGCAACAACCGCAAACGCTTAATCAGGCATTGCTTCTCGCTCAGACGGGACAACAGCAAGGTACTCCGACGAAAACCATCATAATTTTGCAACAGCAGGGCGGACCGTCACAAGCTGTTGCGCAGCAACAACTACTAACAAATACGGGCGGATCACAAAAAGTTATCATGACAACGCAGCAGGGACAACAAATGATTGTCACTCAGGTTCCCCGACCCATGCAACACCATCAGCTCATAATGAATCATCCAAACGCTTCTATGATGCAGAATTGCACTACGCAAAATGTCATTCTCACCCAGACCGCACCTACTGTCCAACAATCACAAATGCAACAGCAACAATTTCAAATGCAAGCGCCTATTCATCAGCagcaaattcaaattcaatcgCCGGGCCATTCGGCAATTCAAAAGCACATACAAATGCAGCAGCAAGTCAACAATGCCCAGTTGCAGGCCGTAGCACAGCAACAGGCTTCACTGCAAGCACAAGCTGCCCAACAACAAGCGAATCTCTTATCGCAGTTACCCCATATTCCGGCAACAATAAAGATCCATCAATCCGCAATGCAAACACAAACCACCCAGACGACTCAAACATTGCCGAAGCAGCACGGCAAGCCCATTATTCAACAGCAACAGTCTGTTATCCAGCAACAGTCTGTCATACATCAACAGTCTGTTATCCAGCAACAATCAGTtatacaacaacagcaacagcagcagcaacctGTTATCCAGCAGCCGCGAGCGCAAGAAATTAAACGACAAATTATCATGTCCGGTACTGGTAGCGTCGAATTAAGTGATAATTCGAAACGTGGGCCGATTCAAACGCCATCAGTAAGTGCGCCTACGCCACCTGTAACACCGCATCCCGTACAGCAGCATCAACAACCATCCATTCCAATTAAGCAAACAAAAACAGCAACCGATTTGCAGACCGACGATGAACTCGTCGATTGGATTTGGATTTGTGATTGGCGCGGATGTCCAAGAAAACAATTCAAATCAATGGCCGAAGTGTATCGACACGCATGCACCGTTCATTGTCCCGAGAGTTTGGATCCAGCAGCGGAAATTTATTGCCAATGGGGTCCAGGAACGGGCCTCTGCGATAATATTCCACGAAAACGTTACTCACTTATGACCCATTTATTAGATCGTCATTGTACCATGGAgTCGTTCAAAGCTGCAGTTCAACGGCGTATTCTTACTGGAGTTCAGCCACCACAACATGGTCAACCGGTGACAATTATTAAGAATGCGCCTACGAATTCGTCCGAAGCCCGAGGAACATCTTCACCGACACTATCAACGTCCTCGAATAGTTCGCTACCGGCTGCTGCGAGTGCTGCAATGCACGCAATAAAACGACATTCGAGTGATTTTATCAATCCAAAGGAATTGATGgatGAAAATGAAGGTCCAGTTACGAAGAGCATACGGTTAACAGCAGCTCTAATTTTACGGAATTTGGTTAGTCATACGGCACTCGCGAAAAgaaacgtACGATTTTATGAGCCACATTTGGCCGGTGTTGCTTTAAGTAATGTTGAGTCGAGTCGGACAATATCTCAAATACTTTACGAACTTAACAACTAA
Protein Sequence: MTTTDIKEPATPVGVQNEESVSSTTKTNASAKKASGGREFVYDEREKDSFYKDLQTFHENRNTPLARFPKVSGKEVDLHRLYAEVTKRGGWLKVNIRNEWDELLPVLGIKLKCVNASVAIKYIYTRYLDKYERLHFLGEDPDRVDEPDDEDRHRKKYSTTKAFHSVPMVYNYGQHVVPEPLRTLHRLSVDMYKGSEYDKLLLSLMSPLPNEQDFAINVCTLMANESKHTLKIDHCPKLLDALMAHAGVFCHFTMRDLFVEMYTKIRRHSLQSFWTDCLYDKPTILELSYDDYFQAPDEKFANMGLCRPPLRLPFRETFEDGLTVDPEEYKNDVGRLDFLGLGRGLGTHDYIGQRVHQVISIIRNLSFFEENLLTLAKNRTFIRFLVMCSNVRWGNLHHMALDIFGNIALQVDLNDPTSDDLTRCMLSTLCEGLEGEDRGVIISCLEILNKICQKDINEDYLHKCLDYKTYNKICLFLSLNDIMLLLYTLECIYALSSLGQRPCNALIQVKGIIDTLVSLITVEAQSYGPDGCILMRVVETVPGNMLPMVAQNIAKLQNAAMQGHVLASKDNNHTEVVNADAQKVTGTPAVVSVPNAQTPARTVVPPQISKEVATSPQTPISSKAVSNLPENEQFAIAWLSATFEHTTSASSRVEQQELYKMYLSASQKTGRRGVVSPIHFPRIVRNVLGPTVGPNLIKTTEPNGVELNAFYYVNIRVRANPMPVQYKGTTIPATNQSNQTPAKQQQQQTQIKPPQPQTVEVVVTKKLEVGQKNKISKKNQAQLQHQLLQQQQPQQLLQQQQSPITQHVQQQQHTQSIKSLQSHSIPTQQQTVVAQPQENQLSVTKLAGKNVHAQHAIQQNSYQAANNATIDANQINGVQQQLQQQQQQQQQPSPAQSSHLGNGNGPQTSSSLIKSLLANKVTTSPTATDVSETIASAAPNNPSCLITQNVNLHQVAQRQQLKQKELAQQQFQQQQHQQQQQQQQLQQQQQQAPNQVQHATISSLVNNPVIPATSVKVGQTTIKAITGNPIPTSVLEKKVNQGSSDSVDNTHWDPVPPLAPLSASMLNSKIAGNVIVAPGNEDSNSTGNNSVASSVISSTQVVTTDDGEGSLISFEGLLVPKSKSGSSSVTEDEGSKDSFNKSAQMFQANQMLVDLLDKKSPDPPMSSGSVKRKLDEDLANENDNNQKRLAGDNPSDDMDIEEEMPMVQASKNAANLYAEMAASILEDEDLDDEPELEQSIPIIQPPVEQKQVITMPMPIQRQIIMAPNNQMILTQSGQVNQTQATATIKTDAGLQTVPLIIQKQIGPNGQQIMQPVLQQQQPQTQYVLATNPQGQTYLVAQQQQPQTLNQALLLAQTGQQQGTPTKTIIILQQQGGPSQAVAQQQLLTNTGGSQKVIMTTQQGQQMIVTQVPRPMQHHQLIMNHPNASMMQNCTTQNVILTQTAPTVQQSQMQQQQFQMQAPIHQQQIQIQSPGHSAIQKHIQMQQQVNNAQLQAVAQQQASLQAQAAQQQANLLSQLPHIPATIKIHQSAMQTQTTQTTQTLPKQHGKPIIQQQQSVIQQQSVIHQQSVIQQQSVIQQQQQQQQPVIQQPRAQEIKRQIIMSGTGSVELSDNSKRGPIQTPSVSAPTPPVTPHPVQQHQQPSIPIKQTKTATDLQTDDELVDWIWICDWRGCPRKQFKSMAEVYRHACTVHCPESLDPAAEIYCQWGPGTGLCDNIPRKRYSLMTHLLDRHCTMESFKAAVQRRILTGVQPPQHGQPVTIIKNAPTNSSEARGTSSPTLSTSSNSSLPAAASAAMHAIKRHSSDFINPKELMDENEGPVTKSIRLTAALILRNLVSHTALAKRNVRFYEPHLAGVALSNVESSRTISQILYELNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00203277;
90% Identity: -
80% Identity: -