Basic Information

Insect: Scaptomyza flava
Gene Symbol: Arid4b_1
Assembly: GCA_003952975.1
Location: RKRM01000080.1:7907-19981[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 5.2e-28 9.4e-25 86.7 0.1 1 88 300 384 300 385 0.95

2 2 9 1.6e+04 -5.4 2.2 3 20 2379 2396 2372 2405 0.63

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	5.2e-28	9.4e-25	86.7	0.1	1	88	300	384	300	385	0.95
2	2	9	1.6e+04	-5.4	2.2	3	20	2379	2396	2372	2405	0.63

Sequence Information

Coding Sequence: ATGCAGCAAGCCGATGATCCACCATCGCTGCCAGTGGGCACCGAGGTGAGCGCCAAATACAAGGGCGCCTTCTGCGAGGCCAAAGTCAGCAAAGTGGTGCGGAATATTAAGGTTAAGATTCTCTACAAGCAGGGACTTGGCTCTGGGATTGTCCCGGACGATGCCATAAAAGCGGCGCCTGGACAGCTACGCGCCGGAGCGGTCGTTGAAGTTCGGCATCCAGATCGCAAGGAATGTGTTGAGGCGACCATAACGAAAATTCAGGATTGCTCCCAATACACGGTCGTCTTCGATGATGGCGACATCACAACGCTACGTCGCACAGCGCTTTGTTTAAAAAGTGGCCGCCATTTCAATGAGAGCGAAACATTGGATCAGTTGCCATTAACACATCCAGAGCATTTCGGTAATCCAGTCGTGGGTGGTCGACGTGGTCGTCGACGTGGTCAGCTCAATGATGGTAGctccgatgatgatgacgagaGCGATGCCAAGGAGGTGGTCAATGAGAAAGAGGAGCATATTGGCAAAGTTGTTTGCGTTGAGACCGAGTCCAAGAAAAAGGACAAAGAGAAATGGTTTCCagctcttgttgttgcaccCACCGCACAGGTTAGCAAGCAGGCAACTGTGCGCATACGTGTTAAGGACGAGTATTTGGTGCGTTCGTTTAAGGATGGACGATATTATACAGTGCCCAAAAAAGAGGCAAATGAGTTTACACGCGAAATAGCAAGCAAACAGGATGTGCCCGCTGTGCAGGCAGCTCTGGAATTTCTTGATAAGAGCATATTGCCTGCCCACTGGGATCGCGACTCTCTATTCGGCTTGTCCAACTTGACCAGCGATGAGGAGGCAGAAATTGAAACGGATTCCTCGGACGATGAGCCGCACGAGGAGAAGGATCTGTTTGTGGCACAACTGTACAAGTATATGGATGATCGTGGCACACCGTTGAACAAGGTGCCATCGATCCAAAGTCGCGATGTCGATCTCTATCGCCTGTTTCGGGCAGTGCAAAAACGCGGCGGCTACAATCGTGTAACCGCCAAAAATCAATGGAAACTAATTGCAATGCGTCTTGGATTCACGCCCACATTTAGTGTTATGAATCTGGTGAAGCAGGCATATAAGAAATTTCTGCAACCCTATGGAGATTTCCATCGCAAGCTCGGCTGTTCCATGCTAATGACGTCGCGCAATTCAAATCGCAGCAAAGGTCGTAGCCTGGTGCGCGCCAATTCGGTAGCTTCGCCCAAACCGGCGGACGTTAAAACCGAgataattaacaaaatatcGATTGCCAATCAGGCACTTGccgcagcaagcagcagcagcacttcaacaacaactgcaactattacatcagcaacagcatctgCAACAgcgacatcaacaacagcagcagcagccgccgccgcatcagcaacaacaacagttgctgctaCAGCAACGAGCACCATAATTTCGCGTTCTGCATCCAGGGCAATCTCTCAATCGGCTGCTGAAGAATCGGGCAATACAAGCGAATCCAGTGTGGTTATGGAGCCAGTTAAGAAGCAACGCAAAGCATCTGCTGCCAGCACTGGCAAAGTCAAGAGTCTTGTCGAAAAATATGAGGAGAAATCAACAGTGTCATctacaagcacaacaacaacagctgttgcatcggcagcagccacagcagcagcagcatctgttACAACAGCAATCAGCACAGCAGCTTCCGCatcggcggcagcagcagcagcagcatctgcggcatctgcagcagcagcagcggcaacaagcGCTAAGGATATCAAGGACGCCGAAGCGGATGTGCCATTGTCAAAGATCaaagctgctgcagcaacaacgcgcaacaacagcatggAAAAGGAACCAAGTGTCACTGGCAGCAATGCATCAAGCAAAGCCGCTTCAGAAACTCAACGCAGTCGCGATGCATCGCCAGCAACGACGTCCACtacatcaacatcagcagctgcagcagcaacaacaacagcggcagcagcaaataCGAAAAAGGAGAAACATCAACAACGCAAACAAGTGGACAAAGGCGAAGAGAAACGCGGTAAACGCAAAAAAGATGAAATAAGTGTAGAAAAAATCGATACAGGCGATTTTGTCGTTGGCATCGGTGATAAActcaaagtcaattatcacGAAAAAAAATCGCCCAGCTCCCATGGCAGCACCTATGAAGCGAAGGTCATTGAGATCGGTGTCCAACGCGGTGTACCCATGTACCTGGTGCATTATACCGGCTGGAACAATCGCTACGACGAATGGGTGCCACGCGAGCGCATTGCCGAGAATTTAACTAAGGGCTCCAAGCAGAAGCAACGAACCATTAGCACCAGCAGCGCCAATAGTGGCGGAGCACCCACCCAAGCGCCTAATACTGGCCAATCGGCAACAAAGGATGCGTCTGCCAAAGGAGATcgcgaacaacaacagcagccaccacCAAGCGCTGGCACCGGCGCCACCTCAATGCTGCATTCGGCATCGAAAACgccaacaacatcagcagccgCATCAACGGGTGCTGGAAAACGCGGACGCGGTCGCAGCGATTCAATGCCACCACGCTCCACAACACCCTCATCGGTGGCCTCGAACTCAAGTCGCACCAAATCGCCAGCTGCCTCCCAACCGCAGCTGAAACAACATAAGCGTCCAACGCGCACTATTCTCGCTGCAAGCagcaccggtagcagcaataGTAATCTACCACGTCGCATCTCTGCCTCGGCTTCCATATCGGCCAATGTGTCCGATGCGTCGATGGCCAGTGAAACAGACACCGATTCCGATGAGCCAGTGCGTCGTCCCAAGCGGCTCAGTGTCaaggagcagcagctgatCAAAACgaaagcagctgctgctgctgcggccgcTGCAGCTAGCAAAAAGGCTGCCTCGCGACGCACCAGCGAACCAAGCGAGGAAAGCGACGAAGATGAGGATGAGCAGCCAACGCCAACACCCACTAAACAACAGACGCCAGCAGCTGTTGCACAGCAATCAAAACCAGTGCAGCGTCCGCGTGCTGGCAATCGTGCAATGAGCAGCGGAGCAGGAGTAGCCGCTGCTACTGCAGCAGCTTCATCTACTGCTGCGGCTGGCAAAGGACAGGGACGTGACTATGATCTCAGCGAGATACGTTCAGAGCTGAAAGGCTTTCAGTTGCAGGAGCGCAAGGATGCACTTGTCAAAAGTGAACCGGGTGATGGCCAAGTAAAAACCGAAACCAGCAAAACTGGCAGCTCCACTGAGCAATCGTCGGAAACCGATTCGTATATTGATGAGGATTCCCAATCATCCGATAAGCTTGAGTATCGCAAGCAAGCCGAAAAGTGTAAACCcaaaataacagcagcaattgcTGTCAATCCCAGCAACATCTTATCTAGCGATCTTAAAAAGGAAATATTTCAGTTGCATGCAACTGCATATGATGCTGGTGATGAGGAGCGTAAACCTTTGAAAGCAGAGCCCAAAGAGGAGACGCCGTCGAAGCCATTTCACAGTGGTGCCGACATTaaaccgacaacaacaataacacttATTGCACCAGCGCGTTTTGGCAACAACGCCACCAATCCAAGCGCCAAATGCACATCGGTTATTGTGGAGAAGCCGTTGACGCTGATCAAGAAACAGACAGAGAAACAGGAAACGGCAGCAAGCAAGAAACTTGAGTTGCtaaagaagcagcaacaaactgtTGCAAGCAGCACCAGCACAGATGCAGCTAAAAAGTTTGTTGAACCTGTGCTGCACAAAGAGACGGCCACATTAAAGGTCGAATTGCCGGCAGCATGTTCACCATCCTCATCCAGCTCCTCTTCCAGCTCATTCTGttccagcagcaacaattcaaCTACAACAACCGTTAGCTTGAGCAGCTCCTCGGCAACACGTTCGCTGCCGGATATGAGTAAATTGGAAATAAGTAgcggcacaacaacaacaacagcagcaacaacatcaacaacagcagcagcagtaacaacatcaacagcagcagcagctggaggAGCAACAGCTTCGGGTAGTAAGGAGACCAAATACAGCAGCATTTGCAGCGGCAGCGGTCTCAGTGGCATCAAGCTGCTCTCATCGGATGTGTATGAGTTCAAGGATACGGAACCATTTGAATTTGAGAAACGTATCTCACCTATGGCTGCAATTAGTGgaagtgcaacaacaattgtagTGCCAGCACAGCCAGCAGCTGTTACCAGCAGTAGCAGCGCCAGTTGCAGCAAAATtattgcaacaacagctgccgcagcaactacaacagcaacatcgaTTGCAGCAGGCTTTGCTGGACGTAAACAGACGCTGGTagcgacgacaacaacagcgacgacGACAATTACTACGAAACCCAATCCAATTGATCAGCATAAAATTATGTTGCACGATCAGCTTGTCTGTTCCGGCATGCTAGGAGGGCCGGGAACGGGCGCAGGAGTGGGAGCGGTAACAAACAAGACCAAAAAACGTTGTTCGCCTCTCAAAGAAGCCACACTGCTGACCAGCTCggataagcagcagcagcagcagcccaaaCAGCTTAAACTGGAGCCACAGTCTATAATTGTTGAGCAATCGCCGCCAGCAGCTAGTCCCAATATCAAGGTGGCTGCTGCAACAACTGGTTCGAAAACTCTATCATCAGCGGCAACGGCAAACGTTGCTGATTTGATGGGAAAAGTGCAGCTAACGCCAGGTTATGCCACACCATTTGATGTATTGCGCAAATCGCCCAGTTTCAACTTGAATATAACAGCTCTTAACGAAGAACTAGCGCAAACGGTGCAGGAGACAACGCGTGCTTTAACCGATGCACTGCAACCGCCAACAACGCCAGCAACACCACCAGCTGCAGTAGCAGCAGTTGCAAcggttgcagcagcagcagctgtaattatgccaactgctgctgctgcagcagcggcaacaccaacaatcGGTGTTCCCATGTCACCAAAGATGAGCACACCGCCACAAGGCATTGGCATGACTAAAACAGctggaggaggaggagcacATCAACAACGTCAACAACTAGTTGCTGGCAGTCCATTTATGGAGACGCGCAATGTATTTGAATTGAGTACATCGAATGAGGGCAGCGGCTATAGTTCCGGCGAATCGAACAAGGACAACAAACTGGAGAAGTTGGagaatgttaaaatattgctGGCGGGTGCAGCAGGTCCATTCGATTTGGATGCTGTCAAATATGAGCAAAAGCCCAGTTCCATAGCGGACAAGGTGCTCAAAGCCATTAGCCAAAAGAAAGAGGAATCTGAACAGATCAAAACTAAAACACAAATCGAAATGGATAAAGAtgatcagcagcaacagttgcaaccaCAACCGAGCAATATTAAGCTTGAGCCAAGCAGCACAAATCTTAAGCTCGACACATTGAAGATGCTCAGTGAGCCGCTCAAGATACAAACGGGTGCATCGTTACTCACCGATTTATATCAACgtgcaacaagcagcagcaatagcccCGAAACCAAATCCCTGCTAGACTCCACGCTGGCGGCCAAGAACAGTGAACTAAGTGAAACGATACAGAAACTAGAGTGCGCCATACAGCAGCGCAAGACACCAGTGGCTGGACAATCTCTAGCCTCATCCATAGCTGGAACACCGCCGGTGACAAGTACCAGTGCAATGGGTGGCAACAATTTCTCGGATGATGAGTCTATGGATAGCACCGATTCAGAGCAACGTCTGGTCATTGAGGATGTTATCATTGAGGAGCCCAGCACAATTAGTATGTGTGAGCTTAAGAGCTCTGAATCTGAGGAGGCTGCATCCAATAGTTTGACCAACAGTCCACCCGTTCAACTCGAACTTGATATGGCTGCCAGCAATAAACAGTTGTCGGGTGTCCAAGCGCCAATTGCACTTAAGCCCATGATGCTATTGCAGCCAGCGACTGGACATGTGTCATCCTTTGGTCTCAATGACTATACAAGTAGCAACATCACGGCATCAGCAACATCACTAGTAGGATCAgaagcaccagcagcaggagcagcagcagctggacCACAGTTACCAACATCAGTTGGTAAAATGGGTGGTGCTGGCGCTGGCACCATTGTTGTGCCCATTATTGTGCCCGAAATTCCTGTCTCGGTTGTGGTTGCAATGCGTCAGAGTCCAATAAATGTGTGCACCAGTGACAGTCCCGCCTCACCGCCGCCCGAGGACAAAATGGCAACGAAATATCCAATGCCATTGGATCAAACCAATACCAATTCAATTGTACTCTATAGTCCGCCACGTCTCTCAGATGAGTTGGCACATGGCGATGGGCATCATCATGTGCCATCATCATATCATCATGTACCCTATGCGCTGCAGCAGGCCAAGGAGGTGCAACCAATGTCACGTGTCTCACCAGCTGCTGCCAGTCCAGCTTTGATCAGCGATCTTGCCCACAATGAGGCGGCCATTAATTTGCTGTGTGAGGAGACTATACCGGGCAGTCCGGCTCCCAACTATACCAGCAAAGATGAACAAATGATTACTAGCACTGTTTCGGTTGCAACAACACAAGcgggagcagcagcagtagcagcaggtGCAATAACAATTGCCACCTCATCCATATCAGGCATAGCACCATTATCGCCTGatacaccaacaacaacaactactttGCAACGTGCTACACCAATTAATCAGCAACCATCGACCGCTGCCTCCGTGTCGCCCAATAGCTCGCCGGATTCGCCAGCTAGCCAGGATGATAGCAGCGAGGAGACAGGCAGCAGCAGTCTGCACAGTGCAGCCAAAAAATATGCTGAGCTCGAGAGCAATGTGCTCGGTGGCAGGCGCAAACGTCGCTCCAAACCAAGCGAGGCAGCAATGCAATCTTCAAATGTACAAATGAGTCCCACCACAGCCGCCGAGCTTTATGTGCTGGCCAAACGCCGGCGACAGCAATTGAATATCAGTATGcgcaaaccaacaacaacaacagCTGGCTCCGATACCGATGATACTTCCGATAATGTTGTGACCACACAGCGTCATAGCACACGTCAACAGATGttgccgcaacaacaacagcaacaacaacagcagcaacaacaacaactgcaacaacaacaccaacaacaccaacaacagctacaacagtTACAATTACCAACACAATCAGTACCAACAGCAACTGGTGTGCGTCCATGTCCCTATAACTTTCTCGTTGAATTGGATCCCTCGCTCAGCAACGATCAGTGCGTATCGATATTGCGCAAACAAATCCAGGATGTGCGCAAAGCCTACTATACCATTAAAAGTGAATTGGCTGTCATCGATCGAAGGCGCAAGAAGTTGCGCCGTCGGGAACGTGagaagaagcaacaacagcagttgcAGGGACAGCAACAGAGTAAAGTTTGCACCTAG
Protein Sequence: MQQADDPPSLPVGTEVSAKYKGAFCEAKVSKVVRNIKVKILYKQGLGSGIVPDDAIKAAPGQLRAGAVVEVRHPDRKECVEATITKIQDCSQYTVVFDDGDITTLRRTALCLKSGRHFNESETLDQLPLTHPEHFGNPVVGGRRGRRRGQLNDGSSDDDDESDAKEVVNEKEEHIGKVVCVETESKKKDKEKWFPALVVAPTAQVSKQATVRIRVKDEYLVRSFKDGRYYTVPKKEANEFTREIASKQDVPAVQAALEFLDKSILPAHWDRDSLFGLSNLTSDEEAEIETDSSDDEPHEEKDLFVAQLYKYMDDRGTPLNKVPSIQSRDVDLYRLFRAVQKRGGYNRVTAKNQWKLIAMRLGFTPTFSVMNLVKQAYKKFLQPYGDFHRKLGCSMLMTSRNSNRSKGRSLVRANSVASPKPADVKTEIINKISIANQALAAASSSSTSTTTATITSATASATATSTTAAAAAAASATTTVAATATSTIISRSASRAISQSAAEESGNTSESSVVMEPVKKQRKASAASTGKVKSLVEKYEEKSTVSSTSTTTTAVASAAATAAAASVTTAISTAASASAAAAAAASAASAAAAAATSAKDIKDAEADVPLSKIKAAAATTRNNSMEKEPSVTGSNASSKAASETQRSRDASPATTSTTSTSAAAAATTTAAAANTKKEKHQQRKQVDKGEEKRGKRKKDEISVEKIDTGDFVVGIGDKLKVNYHEKKSPSSHGSTYEAKVIEIGVQRGVPMYLVHYTGWNNRYDEWVPRERIAENLTKGSKQKQRTISTSSANSGGAPTQAPNTGQSATKDASAKGDREQQQQPPPSAGTGATSMLHSASKTPTTSAAASTGAGKRGRGRSDSMPPRSTTPSSVASNSSRTKSPAASQPQLKQHKRPTRTILAASSTGSSNSNLPRRISASASISANVSDASMASETDTDSDEPVRRPKRLSVKEQQLIKTKAAAAAAAAAASKKAASRRTSEPSEESDEDEDEQPTPTPTKQQTPAAVAQQSKPVQRPRAGNRAMSSGAGVAAATAAASSTAAAGKGQGRDYDLSEIRSELKGFQLQERKDALVKSEPGDGQVKTETSKTGSSTEQSSETDSYIDEDSQSSDKLEYRKQAEKCKPKITAAIAVNPSNILSSDLKKEIFQLHATAYDAGDEERKPLKAEPKEETPSKPFHSGADIKPTTTITLIAPARFGNNATNPSAKCTSVIVEKPLTLIKKQTEKQETAASKKLELLKKQQQTVASSTSTDAAKKFVEPVLHKETATLKVELPAACSPSSSSSSSSSFCSSSNNSTTTTVSLSSSSATRSLPDMSKLEISSGTTTTTAATTSTTAAAVTTSTAAAAGGATASGSKETKYSSICSGSGLSGIKLLSSDVYEFKDTEPFEFEKRISPMAAISGSATTIVVPAQPAAVTSSSSASCSKIIATTAAAATTTATSIAAGFAGRKQTLVATTTTATTTITTKPNPIDQHKIMLHDQLVCSGMLGGPGTGAGVGAVTNKTKKRCSPLKEATLLTSSDKQQQQQPKQLKLEPQSIIVEQSPPAASPNIKVAAATTGSKTLSSAATANVADLMGKVQLTPGYATPFDVLRKSPSFNLNITALNEELAQTVQETTRALTDALQPPTTPATPPAAVAAVATVAAAAAVIMPTAAAAAAATPTIGVPMSPKMSTPPQGIGMTKTAGGGGAHQQRQQLVAGSPFMETRNVFELSTSNEGSGYSSGESNKDNKLEKLENVKILLAGAAGPFDLDAVKYEQKPSSIADKVLKAISQKKEESEQIKTKTQIEMDKDDQQQQLQPQPSNIKLEPSSTNLKLDTLKMLSEPLKIQTGASLLTDLYQRATSSSNSPETKSLLDSTLAAKNSELSETIQKLECAIQQRKTPVAGQSLASSIAGTPPVTSTSAMGGNNFSDDESMDSTDSEQRLVIEDVIIEEPSTISMCELKSSESEEAASNSLTNSPPVQLELDMAASNKQLSGVQAPIALKPMMLLQPATGHVSSFGLNDYTSSNITASATSLVGSEAPAAGAAAAGPQLPTSVGKMGGAGAGTIVVPIIVPEIPVSVVVAMRQSPINVCTSDSPASPPPEDKMATKYPMPLDQTNTNSIVLYSPPRLSDELAHGDGHHHVPSSYHHVPYALQQAKEVQPMSRVSPAAASPALISDLAHNEAAINLLCEETIPGSPAPNYTSKDEQMITSTVSVATTQAGAAAVAAGAITIATSSISGIAPLSPDTPTTTTTLQRATPINQQPSTAASVSPNSSPDSPASQDDSSEETGSSSLHSAAKKYAELESNVLGGRRKRRSKPSEAAMQSSNVQMSPTTAAELYVLAKRRRQQLNISMRKPTTTTAGSDTDDTSDNVVTTQRHSTRQQMLPQQQQQQQQQQQQQLQQQHQQHQQQLQQLQLPTQSVPTATGVRPCPYNFLVELDPSLSNDQCVSILRKQIQDVRKAYYTIKSELAVIDRRRKKLRRREREKKQQQQLQGQQQSKVCT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -