Basic Information

Insect: Ptychoptera contaminata
Gene Symbol: ARID2_1
Assembly: GCA_963942525.1
Location: OZ012638.1:17240035-17248158[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.1e-25 1.9e-22 79.4 0.0 4 89 41 124 38 124 0.95

2 4 2.9 4.8e+03 -2.1 0.0 21 56 736 771 729 794 0.64

3 4 8.6 1.5e+04 -3.6 1.1 53 67 1268 1282 1237 1299 0.57

4 4 10 1.7e+04 -4.2 0.7 56 77 1555 1577 1546 1596 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.1e-25	1.9e-22	79.4	0.0	4	89	41	124	38	124	0.95
2	4	2.9	4.8e+03	-2.1	0.0	21	56	736	771	729	794	0.64
3	4	8.6	1.5e+04	-3.6	1.1	53	67	1268	1282	1237	1299	0.57
4	4	10	1.7e+04	-4.2	0.7	56	77	1555	1577	1546	1596	0.52

Sequence Information

Coding Sequence: ATGGATAACTATCAATCGAATGTATTATTTGATGGAGTTGTTGAAGATTCTGTgagtaataatagtaaatttacATTGAACAAGAAAAACATTCGCCTGAATGAAGAACGTGAAAGATTTGgtttttataaagatttaCACCATTTTCATGAAGTTCGAGggaCTCCATATGCAAGAATACCTAAAATTAGTGGAAAGGATATAGATCTTTATCAACTTTATACGAATGTAACAAGTAGAGGTGGCTGGCTAAAgGTGAATAATAAGAATGAATGGGATGATCTTTTAACAGATTTTAAATTGCCATCAAAGTGTGTGAATGCTACGGCTGCTCTTAAACAGATATACATAAGATATTTGGACAGATATGAAAAAGTTCATTTTCATGGAGACGATAATGATCGTGGTGACGACGACGATGATGAGATTCGGCATAAACGATGGTCTGCAAAAGCTTTACACTCAGTTTCAATgacatataattataatcaacatAATGTTGTTGAAGCAAATCGTGCACAGCATAAACTTTCTACTTGTTTATATCATGCTTCGGAATATGACAAATTATTGCTGTCACTGTTGTCTCCTTTACCAAATGAACAAGATTTCGGCATAAATGTGTGTACATTAATGTCAAATGAGGGTCAACAAAtacttaaaattgaaaaatgtcCTAAACTTGTTGATACATTATTAGCTCATGCTGGAATATTTAACCATTACTCCACTCGtaacatattttttgaatattattcaaaaatccGTAAACATTCACTTCAAAAATTTTGGAATGATTGTTTACATGAAAAAATACACATATTGGAATTATCGTACGATGATTTTTATTCGCCtccgtttaataaaatacaaggcGTTATTGATGATACATTTATCCGACCTAAttctgaaaaaaataattctattaaagaggctaatgatataaaaatagataaagatGAAACgcatttagattttttatgcTTAGGTCGCGGCTTAGGAACTCATGATTATGTAGGCCAACGAGTCTTACAGGTTGCATCAATATTGCGAAACTTAAGCTTTAATGACGACAATGTAGTTATGCTTGCTAAGAATAAAACGTTCGTTAGATTCTTAATAATGTGCTCAAATGCGCGGTGGAATAATTTACACCATATGGCATTAGATATGTTGGGAAACATAGCACCGGAGTTAGAATTAATAGATCCAGCATCTGACGAGTTAACTCGTTGTTTGTTTACTACAGTTAGTGAAGGATTAGAATCTCCAGATCGTGGTGTAATTATAAGTTGCTTAGaagtattatataaaatgtgtcaaaaatcaaataatgaaGAATTTATTCACAAATGGATGAACCAGAAAATGTATAATCAAAtctgtttatatttatgcCTAAGTGATATAATGTTGTTACTTTACACATTAGAGTGTATTTATGCATTAAGTACGTTAGGAGAAAAGCCATGTAACGCAATTGTTCAAGTTCGCGGAGTTATTGATACATTAGTTTCTTTAGTTACGGTTGAAGCTCAAAGTTATGGACAAGATGCGTGTATATCAATGCGTGTCGTTGAAACTGTATCAACTAGTATGATGCAACAAACACAGCATAACATTACCGCTGCAAATGTTACACATCCACCACCTCTTTCTACACCAAAGCACACACCTATATTAAACGAGTCTCCTAAACCAGCGAGTCCTATATCAACTTTAACAAGTGAAAATCAAAAATCTCAAGCTACTTTAGTAGTTCATCAGCCAAACTCGCCTGTTATTCGTTCAAGTATAATAGCACCACCGCAAACTCAGCAGCCAATGTCAAGTCCTAATCAAACTATTGTTGCCCAGCCTCAACCATCAGTTATTGCAAAACATGCTCAACAACAAGCGAATCAGGAAAATGAACAATTTGCGTTGGTTTGGCTTCGTGCTACTTTCGAACCTGCTGCATCATTATCATGTAGAGTCGAACAACAGGAAttgtataaaatgtatttgGCTGCTAGTAATAAAATAGGACGACGTGGTGTTGTCACTCCAGTACATTTTCCACGATGTGTTCGCTCTATATTTGGCGGTACCGTTGGacctaatttaataaaatctgaaCAAAATGGTATTGAGACATCATTATTTAGTTATGAAGGAATACGATTACGTACAAATCCATTAACTTTAGTACATAAAGGTGTTATTGTGtcACCGCCAACTCCACAAACAAAAACCATTGATGTTAtaccaataaaacaacaactacAAAATCAGTGTGGCGATTTTaaagtgataaataaaaatattgtatgtAGTTCCTCGACCGTTTTAACTTCAACAAcgcaaacaacaacaacaacaaatcaacaaaaacaaagtCAAATAAGTAGTGGTTTTGGTAGTAATGTTGGTGGATCTATGTTGGTTGCACAAATTTGTGGAAAAAATGTAGTTATTAATTCAcCTCAGCAATCGCCAATTTTACAACAAGTTTTGACAAATAATCCTATGGATAGTAATAATTTACTAATatcacaacaacaaaaagtaaTACAAAATGCAACTACAGGAATTGGAAATGTTcaacatcaaaaaaatataatttcaaataatagtAATGCTGTATCAAAtgtatctaataataatataataacatcaacaacatcgataccaTCTTCATTAattacatcaacaacaacatcatcatcattaataaaaagtctACTTGCAAATAAGGTAACAACAAATGATGCTAATAATAGTACAACAACAGCTAGCAATTTATCCACATGTTTGATAGCCCCAAATATTAATATGCATCAggtTGCACAAAGACAACaattgcaaaaacaaaaagaattagCTCAACAAATAGCTAATCAATCAatcggtaataataataataatcttaatcCATCTATTATATCAGCGACTACTGCATCAAATATAATGagtcaacaaaaaataacaaatgttaTAACAGCAATTAAATCATGTGGTACTCTAAtgcaaaataacattaaaccaattacaacaataatcgagaaaaaaattgataatgataatagcaataaacaaattacaaataataaatgggATCCTGTACCACCTTTAGCACCATTAAGTTGCTCACAAAATTCAATTACAATTAAGCATACAAATCAACAGCATCCATCAGTGATTGTTAACAAAATTGATGATGATTCAAATTCTACagGCAATAATTCTGTAGCATCCAGTTTGAACCAAAATCTTTTCATTGAAGATTCTGTTGAAAATTCATTGTCTAGTTTTGAAGGTTTAATTATCAAGCGTAACCAAATGTCAGAAGATGATAGTAATTCCAAAGAATCAATGAAACAATCACAAGTTGTAACCGCAAATAAAATGTTAGCTGATTTGTTGGAAAGAAAATCGTCTGATCCACCTCCATACAGTATAACAGGTGATCTGAAACGTAAAATAGATAATGTTAATGAAGCACCGGCAgctaaaaaagcacaaaagggtaaacaaaatgaaattaatggtGATGAAGCTACTCAAAGAACtgttgatgataatgataCGAGTCAAGTGAAAGCATCTACAAATATTGCTAATTTGTATGCTGAACTGGCTGCATCAATGTTAGAAGACGAAGATTTAGATGATGAGATTAAAAATGAAGCGCAACAAATGGTTGCGAAAGTAGAGCCAATTCAGAAaatgaatcaaataaaaagtgtAATACAACAAGTGGAGATGAAGCCAAAAGTAGAAATAATACAGGTAGTACCAtcgcaacagcaacaacaacagaaattAATTCAACAAGTGCATCAACAACAGCAGTCGCCTCAGCAATTACAACAAACGCAACAGGCACAACAACAATCCCAGCATCAGCAACAAGTTATTTCAATGCCTGTTCCCCTCCAGCGCCAAATTATTGTTACACCAAATAATCAAGCTCAAATGATATTGTCACCGAATAATTCAGGgcaacaacaaataacaacACAAACAACTGCAACGATAAAAACGGATACTGGTTATCAAACCGTACCTGTAATATTACAACATACACAAGCACAGGCTCAAGCAATGCAGGCAAATATTCAGAACATGCAGTTACAAAAACAAATGACAGCAAGTGGTCAATTGATGCAACCAATTTTATCATCGTCACCGGGTCAAACCCAATATGTCTTAACGACAAATCAACAGGGTCAAACAGTGGTCGTGGCTCAACCCCAGCAACATCAGCCCATGCATCAAACTGTACTTGTCACCCAAACACCTCAACAGCAAGGTACCTCtgcaaaaactataattatattacagCAGCAACCATCAGGAGGTACACACAACCAAGTTCAGGCAAATAACACATTGATGAATGCGATGAATGCTATCAATCAATCAGGACAACCacaaaaaatgattatgaCAACCCAACAAGGACAACAAGTTATAGTTACTCAGGTTCCTAGACCACTACACCATGTACTCGTGAATAATCAATTGCAACAACAAGGCAGCGTTGTTGTTTCAAACGCAAATACCATGAATACTACAAATGCCATCATTCAGTCGAAGGCATTAGAAAATAAGCAAATTCTCGTAAGTGGATCCCTAACGAGTGATAGCCATTCTCAGTTACAACAACATTTACAAATACAGCAAATTCAACAAAGTctacagcaacagcaacaacatcaacaaattcaattaacaGCGCAACAATTACAACAAATTCAAGCTGGTCAACACATTCAATTCAATCATTCTCATCAACAAGCAACGATGCAAATACAGCACATTCAACCAAATCAACAAATTCAATTGCAAACTGGTCAACATGTTCAaatacaacaacagcagccaAACCAACAAATTCAAGTTCTGCAGCATCAACCACATACAGTTCAACTGCAGTTACAACaaccacaacaacaacaacaaattcaattacaaGCAATTACTcaatcaaatcaaattaagCAACCAGTAACTCTTCAAATTCAACCTGGAACAACGCAGGCACAGATACTGTCTCAACCTCCGGTTTTAGTTCCACAGCAAACAGTTATTCAACAAAATTCTTCAATTCAAAATCAACCTATTTCGACAAATACACAAATTCAGCAAACGACGCCAGTTGTAAGTATTCAAAATGTGCAACAGAATCAACAATCATTTATACAACAACAGCCATTGGCACAAACACAACCTCCGCAACAACAAGTACAATCCCAACCACAGCAACAAACCATTCAagcacagcaacaacaacaaccctTGCAACCACAAACACAACAGTCTAATGTTAATAACCAAGCACCACAACCGTCGGAAGTTGTAGTTAAATGTGAGGATGAAATAGAACTAAATTGGTTATGGATATGTGACTGGCGAGGTTGTCCTAAAAAGAAATTTCGCTCAGCAAATGAAGTGTATCTTCATGCTTGCTCAGTACACTGTCCAGATACTTTAGAAGCCAGCGCAGAAATTTATTGTCAATGGGGGCCTGGGAATAATCTCTGTGATAATATACCGAGAAAACGTTTTTCATTAATGACACATATATCCGACCGTCATTGCACAACTGAGtCTTTTAAAATGGCAATGCAACGCCGTGTGGCGAGTGGTAACACTCAATCCTGTCAAGCAACAGTACCAGTTACAATTCTAAAAAATCCCACTGTGATCTCATCGCCATCATCACCTGCAGGTGCATCAACAACATCTACGGGTTTAAGTTCATCAAATAGTTGTGATTTGTCATCATCTAGTGAGCAATCACATTCAGCAGCATTACATGCTATAAAACGCCATGCACAAGATTTTGTTAATCCAAAGGAGTTATTGgaTGAAGGTCCAGTTACAAAAAGTATTCGCTTGACAGCGGCATTGATTTTAAggaatttagttaataatagcGTTATCGCTAAAAgaaatttacGATATTATGAGCCGCATCTAGCTGGTGTTGCATTAAGTAATGTTGAATCAAGTCGAACAATTGCACAAGTGTTGTATGAAATGAATTAA
Protein Sequence: MDNYQSNVLFDGVVEDSVSNNSKFTLNKKNIRLNEERERFGFYKDLHHFHEVRGTPYARIPKISGKDIDLYQLYTNVTSRGGWLKVNNKNEWDDLLTDFKLPSKCVNATAALKQIYIRYLDRYEKVHFHGDDNDRGDDDDDEIRHKRWSAKALHSVSMTYNYNQHNVVEANRAQHKLSTCLYHASEYDKLLLSLLSPLPNEQDFGINVCTLMSNEGQQILKIEKCPKLVDTLLAHAGIFNHYSTRNIFFEYYSKIRKHSLQKFWNDCLHEKIHILELSYDDFYSPPFNKIQGVIDDTFIRPNSEKNNSIKEANDIKIDKDETHLDFLCLGRGLGTHDYVGQRVLQVASILRNLSFNDDNVVMLAKNKTFVRFLIMCSNARWNNLHHMALDMLGNIAPELELIDPASDELTRCLFTTVSEGLESPDRGVIISCLEVLYKMCQKSNNEEFIHKWMNQKMYNQICLYLCLSDIMLLLYTLECIYALSTLGEKPCNAIVQVRGVIDTLVSLVTVEAQSYGQDACISMRVVETVSTSMMQQTQHNITAANVTHPPPLSTPKHTPILNESPKPASPISTLTSENQKSQATLVVHQPNSPVIRSSIIAPPQTQQPMSSPNQTIVAQPQPSVIAKHAQQQANQENEQFALVWLRATFEPAASLSCRVEQQELYKMYLAASNKIGRRGVVTPVHFPRCVRSIFGGTVGPNLIKSEQNGIETSLFSYEGIRLRTNPLTLVHKGVIVSPPTPQTKTIDVIPIKQQLQNQCGDFKVINKNIVCSSSTVLTSTTQTTTTTNQQKQSQISSGFGSNVGGSMLVAQICGKNVVINSPQQSPILQQVLTNNPMDSNNLLISQQQKVIQNATTGIGNVQHQKNIISNNSNAVSNVSNNNIITSTTSIPSSLITSTTTSSSLIKSLLANKVTTNDANNSTTTASNLSTCLIAPNINMHQVAQRQQLQKQKELAQQIANQSIGNNNNNLNPSIISATTASNIMSQQKITNVITAIKSCGTLMQNNIKPITTIIEKKIDNDNSNKQITNNKWDPVPPLAPLSCSQNSITIKHTNQQHPSVIVNKIDDDSNSTGNNSVASSLNQNLFIEDSVENSLSSFEGLIIKRNQMSEDDSNSKESMKQSQVVTANKMLADLLERKSSDPPPYSITGDLKRKIDNVNEAPAAKKAQKGKQNEINGDEATQRTVDDNDTSQVKASTNIANLYAELAASMLEDEDLDDEIKNEAQQMVAKVEPIQKMNQIKSVIQQVEMKPKVEIIQVVPSQQQQQQKLIQQVHQQQQSPQQLQQTQQAQQQSQHQQQVISMPVPLQRQIIVTPNNQAQMILSPNNSGQQQITTQTTATIKTDTGYQTVPVILQHTQAQAQAMQANIQNMQLQKQMTASGQLMQPILSSSPGQTQYVLTTNQQGQTVVVAQPQQHQPMHQTVLVTQTPQQQGTSAKTIIILQQQPSGGTHNQVQANNTLMNAMNAINQSGQPQKMIMTTQQGQQVIVTQVPRPLHHVLVNNQLQQQGSVVVSNANTMNTTNAIIQSKALENKQILVSGSLTSDSHSQLQQHLQIQQIQQSLQQQQQHQQIQLTAQQLQQIQAGQHIQFNHSHQQATMQIQHIQPNQQIQLQTGQHVQIQQQQPNQQIQVLQHQPHTVQLQLQQPQQQQQIQLQAITQSNQIKQPVTLQIQPGTTQAQILSQPPVLVPQQTVIQQNSSIQNQPISTNTQIQQTTPVVSIQNVQQNQQSFIQQQPLAQTQPPQQQVQSQPQQQTIQAQQQQQPLQPQTQQSNVNNQAPQPSEVVVKCEDEIELNWLWICDWRGCPKKKFRSANEVYLHACSVHCPDTLEASAEIYCQWGPGNNLCDNIPRKRFSLMTHISDRHCTTESFKMAMQRRVASGNTQSCQATVPVTILKNPTVISSPSSPAGASTTSTGLSSSNSCDLSSSSEQSHSAALHAIKRHAQDFVNPKELLDEGPVTKSIRLTAALILRNLVNNSVIAKRNLRYYEPHLAGVALSNVESSRTIAQVLYEMN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01276053;
90% Identity: -
80% Identity: -