Basic Information

Insect: Dilophus febrilis
Gene Symbol: Arid2_1
Assembly: GCA_958336335.1
Location: OY284469.1:53684371-53696018[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 6.7e-24 1.3e-20 73.9 0.0 2 89 90 175 89 175 0.95

2 4 1.5 2.9e+03 -0.9 0.2 13 62 863 913 850 928 0.74

3 4 0.53 1.1e+03 0.5 0.0 30 88 973 1028 960 1029 0.73

4 4 2.3 4.6e+03 -1.5 0.9 34 76 1521 1562 1519 1569 0.64

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	6.7e-24	1.3e-20	73.9	0.0	2	89	90	175	89	175	0.95
2	4	1.5	2.9e+03	-0.9	0.2	13	62	863	913	850	928	0.74
3	4	0.53	1.1e+03	0.5	0.0	30	88	973	1028	960	1029	0.73
4	4	2.3	4.6e+03	-1.5	0.9	34	76	1521	1562	1519	1569	0.64

Sequence Information

Coding Sequence: atgttttcTAATACCGCAAAtcaaatggattttttaccaTCCTCGAATCATTCTTTTCATGACGATTCATCTCAAAATCATAATCAACAAGGAACAGTAGTAGCAGCAACAAtaacaacatcatcattaaaTGCCGCCACCATCAatacaccaacaacaacaactgcCGCcgtaacaacaacaacaacaacgacgacgacgaaacCGCAATCGGCCAAGAAAAATAATCAAGGTCGTAGCATGGAATTAATAATAGATGATCGTAATCGTACAACATTCTATAAggatttatttcattttcatgaaTCCAAAGGAACTCCTTTACCACGTTATCCACGAATAAATGGATACGATATTGATTTACATAAACTTTATGGATTGGTTTGCGGACGTGGTGGTTGgacaaaaGTAAATTACAGAAATGAGTGGGATTCCTTGCTGATGGAATTTAATTTACCCGAAAAATGTGTGAATATTTCGGTTgcattaaaacaaatttatatgaGATATTTGGATCGTTATGAAAAGGTACATTTTTTGGGTGAAGATATTGAACGGGTGGATGACGTTGACGATGATAATCGTcataaaaaatggaataataaaGTGTTAACGGAAGTTccattaaaatacaattatcaACAACATAACATTACCGATGGTTTACGATCAACCCATAAATTATGTACAGATTTGTATAAATCCAGTGAATACGAACGTTTATTATTATCGTTAATGTCACCGTTACCAAATGAACAAGATTTTGCCATAAATGTTTGTACGTTGATGGCCAACGAAAGTAAACacacatttaaaattgaaaattgtccACGTCTATTGGATACACTGTTGGCGCACACCGGTGTTTTTTCTCACACATCAATGCGTGAAATATTCGTtgaatattattcaaaaattcgACATAATTCATTGTATGCATTTTGGGCAGATTGTTTACATACGAAACCGGATATATTAGAATTGGCATTCGACGATTACAATCAATTGTCGATTGATAATGGATTTCCGGGAAAAGGACCGTTGGCATTTGTAGCTGGTGGTGGGGGTCgtcataaatttatcaaatccAATCgtcaaaatgattttaatgatgatgctaataataataataataataaaaaagatataaatgaTGCCGGCATCCCTACTATTACTGCTGATGATGAtcattgtaataataataataataataataataacaatgatgatgttgatgatcaACAACAATACGATGATGGTTTAAATATGCATACAAAAGAATATCAAGAATTATTTCAATTggattttttacatttaaatcgTGGTTTGGGTACACACGATTACATTGGCCAACGAATTCATCAGATTGCATCGATATTACGGAATTTATCGTTTCAAGAGGAGAGCCTCATGACATTGGTACGAAATCGTACATTTATACGATTTTTGGTAATGTGTTCGAATGTCCGTTGGTCAAATGTTCATCATATGGCATTGGATATGTTGGGAAATGTTGCGGCTGAATTGGAATTAACGGATCCGTCGGATACGATCACCAGATGTCTTTTGTCAACCATATCCGATGGTTTGGAAAGTCAAGATCGTGGTGTTATCATCAGTTGTCTGGAAATCTTGTATAAATTGTGTCAAAAAGAATCGAATGAcgattatttacataaatgtttaaatcggaaaatttacaaacaaatttgtttatttttaacattaaatgatattatgtTATTGTTGTACACATTAGAATGTATTTATGCATTGAGTGCATTGGGTGAAAAATCATGTATTGCAATTGGACAAGTTAAAGGCGTTATCGATACATTGGTTTCATTGGTGACCGTTGAGgCACAAAGTTATGGACCTGATGGTTGTATTTTGATGAGAGTAGTTGAAACTGTACCGGCCGGTTCAATGGTCAATACAACAAATGCAACGAATATTAATCAAAATCAACAAGGTTTCATCGGTggtggtaataataatacatatacaatgaTGTCAACAGCTACAATAGCGACAGGAGGCGGAGGTACACcaacacaacaacaaatacaattaCCTACTGGATCACCAAATCATCAAGCAGCCGCAGCAGCCGCcgcaccaccaccaccacaatcTCAAATTACATCATCGGCAACAACATCCGGTACGGTGCAATCCGGAATGATTTCAACAAATCCAACGATTTGCCAAACACCGATTATGAATCAAGCTCAATTGAATAGTTTTATTTCaagtaatattataaaaaatcaaccACAACAATTcagtaacaataataataacaacgtTACCGCTACCGccaatacaaatttaaatgtaaatgtaattaataaaataaatactgaacaaaaaattatcaatcaacaacaacaacaacaacaaccaataaataatattcaacaagaacaacatcatcaacagcaacaattaatattaaaacaacaGCAATCAATTGCATTaaaacagcaacaacaacagcagcaacaacagcaaaaaaaaGGTCATACAAATGTTATTAATCATACAAGTCAATTGCAAACGCAATTTGTTCAAATTCAACAACcgcaacagcaacaacagcaacaatcacaacaacaacaagttattattaaaaatgaaatgattaattttacaaatacatCATCAATGGTACAGACGACCggatcatcatcatctataATACAATCAAATACATCAtcgaatataattaataataataataatttaataacatcATCGGTTTCATCATCAATAACTGGaacagcatcatcatcatcatcaacaataataaatccaACTACTAATCAACAAATTATTCAGGAAAATGAACAATTTGCATTGGCATGGTTAAGTGCAACATTTGAAGCGGTATCGACGATGACCACTCGCATTGAACAAAcggatttatataaaatgtttgtgaCGGCCAGTACAAGAGCCGGTCGACCCGCTGTCGTTACAGCTATGCATTTTCCACATTGTGTTCGTTCGGTATTCGGTGCAACGGTTGGTCCAAATCAAGTGAAACTTCGTCAACGATATACTGATATATTGGCAAATTATTATGAAGGTATTCGAATACGATCAAAACCATTGGTACTGTTCCATAAGGGTACGGTTATGcAAAATGTAAATCCTGGTGTTGTTGCTTCAGATCCTGTTGTTAGTGTTAAAAAAGAACCAAAATCACAGATAATTAAACAACCTTGTACAACAACAATgattcaaaatcaattaatatcaCAACAATTGGCTAATCAATtacagcaacagcaacaacagcaacagcagcaacaacaaacAATTACTGCAACTGTTGTTTcatcacaacaacaacaacaacaacaacagctaCAACAACCGAATTCAGTATTAGTTTCACAATTAACGGGTAAAAATGGTCAACAACAAACAACATATACCCAACAAATTGTACAAACACAAAGTGGTGAAAGTCGTATTGTTGTAACGCCAACCACTCAATCGAATAGAactcaacaacaacaacaacaaataatgaACCAAATAAATGTTGGTAGTGTAACGGCAACAATTATTGGTAAATCATCAAATGCACAAATAACATTAGCTGGacaacaaccacaacagcAGCAACCTCAAATGCAATTACAACAAACTGGAGTGATAACATCAACATCTGTACAACAAACACCATCATCGCTTATCAAAAGTCTTTTAGCAAATAAGGTAACTGCAATCgaaacaaataatacaattgtTAATTCGGCTGCATCAATGCAAAGTAGTAGTAATACGTCAATTATTAATGTGCATCAGCAGgTTGCTCAACGAcaacatttacaaaaacaaaaagaaattgcacaacagcagcagcagcagcaattATTAGTAGTTACTAGTAGTTCTAGTAGTAGCATTAACAACAGTACCAGCAACATCAGCAACGCCGCATCAATGATGTCAACAGGAAATATTCCCGTAATAACCGTTTCATCAtcacaacaacatcatcaaaaTCTAACGAAAACATTACAATTTCCATCAACCGTAAATAAACAGCAACAAATGACAATtccatcaacaacaacaacatctCAAACTGTATTGCCTCcattaataccatttaatgtTCAACAACAACcgcagcaacaacaacaacaattgcaATTACAACAGCATCCTTTATCTACGACAATACCATCATCAAATATTATGGTTGCAGTTAAAATGGAAACAAATGAAGATGAAATTATTATTCCAAAAATGGAATTAATAGATGCATTGGATGGCaccaatttaatattaaattgtaacGGATTAAATCCGGATGATTTATTAGTTaaaacaacatcatcattatcatcatcaccagttgtatcatcaaataaaatgttaGCCGATTTATTAGATCGTAAATCAACAGAACCaccatttaataatattatcaatagCGGTGCTGCAACAGCAACAATTAAAACTGAAAGTGGTTATCAAACGGTACCGATTATATTACAACATTCAGGACCGGGAGCCTCAATTTCAAGTGCAAATCAAAACtatcaaatacaaaaacaaataacggctagtggtggtggtggtcaACAGATTTCAATTCAACCAAGTCAAATAATTCAACAAACACAACAGCACCCACAGCAGCAAcagcatcaacaacaacaacaccaacaaacCCAATATGTATTGGCTACAAATCAACAAGgacaaacatatattttagcTCAACAACCATCAAATGCACTTAATCAAACCCAAACCGTATTATTAACACAAACAACTCAATCACAAAGTGGTGGACCaccaacaaaaacaataataatattacaacaACCAAGTAATGGTGGTCAATCACATGCAATACATCAACAACAATTTCAACAacttcaacaacaacaacaacaacaacagcaagGTGGTCAAATTACAATTggtacaaataataataataacagcaataataatagtaataattcaCAACAAAAAGTAATTATGACAACACAACAAGGTCAACAAATGATTGTAACTCAAATGCCACGTCCCGTTcaacaacaaattattatgCAACATCATCCATTAGGACcgggtaataataatattatacagcagcaacaacaacaaccacaacaaacATCAACAATTGTTCAAAATCCTTCAATTCAATCAACACAATCACCAcaaacaattcaaattcaacaaTCCCCTCAATTATTAACCCAAGCTCAATTACATCAACAATTACATCAGCAATTGcagcatcaacaacaacagcaacaacagcaacagcaacagaagcaacaacaacaaatgattGTATCATCAGCTCCACAAATTCCACAACAAATTTCACTTCAACCACAAAGTCATTTAAATGTTCAATCCGTTTCATCAACTCCATCATCATCACCGGTTttatcatcatcttcatcgaCAATTTCCGTTTTATCACAATCGGAATTTGCCGGATTACAACAGCaccagcaacaacaacaacaacagttATTATTGcatcagcaacaacaacagcaacaacaacaacaacaacaacaacaacaattgcaACATCTCGTTGAAAagaaacaaatatttataactgGCAGTGGTAATATTGAATTAACtgaaatacaacaacaaacaaaaatgaattcCACAATTGTTGGGACAACAGTTACTACTGCCGGTGTGGCTTCTGCTAATATAACCGTAAATGCATCATCAAATGTTAGTGCGAAAGTACAGCAATCTCATGGTGTTGGAACACAACAAACCATCGGTATGGTTCAACAACAGCCACAATCGCAACCACAACTGCCACTGCAGCGACAACAACAAGAATTAGTTCCAAAAACAATTCATGAATATTTACAAGAAAAACAACAagttcaacaacaacaacaacaccagcCGCAACAACCAAAAATTGTAccacatcaacaacaacaaatgcaACAACAGCCACAGTCACAAGCATCGCAACAGCAGCCACAGTCCCCAATGACCAATCAATCAAAACCGcaaaatgcaataaataatCAACAATTGCTTACGGTACAAGTTGATGAAGACTATGATCCGTCATGGTTATTCGTTTGTGATTGGCGAGGTTGTCCCAGaaaaaaattccGTTCAATAAATGATGTTTATGTGCATGCATGTCAAGTGCATTGTCCCGATAATATTGATCCAAATGCCGAAATTTATTGTCAATGGGGTCTTGGACCAAATTTATGTGATAATTTACCACGTAAACGTTTTTCATTAATGACCCATCTATTTGATCGTCATTGTACAATTGAATCATTTAATGCTGCCGTTCAACGACGTGCGACAACCATTGGATCATTACCAAATCAACCAACATCACCGgttacaattataaaaaatccaataacACCACCATCAAATGAACAGAATTCAAAATCAGCTTCTAATAATGGTGCGAttgcatcatcatcatcagcagcaGGAGCAGGAGCGGGAACAAATGTTAATTCATCGACAGCTGCAAGTGCTGCAATGCAAGCAATAAAACGTCATGCACTTGATTTTCTAAATCCAAAGGAGTTATTGgATGAAAATGAAGGACCTGTAACGAAAAGTATTCGATTAACGGCTGCATTAATTTTACGTAATCTTGTTATTTATACGAGTAATGCAAAAAAAAGTCTACGGTTTTATGAACAGCATTTGTCCGGGGTGGCATTGAGTAATGTTGAAGCGAGTCGTACAATTGCTCAGgtattatatgaaatgaatgatAAGTAG
Protein Sequence: MFSNTANQMDFLPSSNHSFHDDSSQNHNQQGTVVAATITTSSLNAATINTPTTTTAAVTTTTTTTTTKPQSAKKNNQGRSMELIIDDRNRTTFYKDLFHFHESKGTPLPRYPRINGYDIDLHKLYGLVCGRGGWTKVNYRNEWDSLLMEFNLPEKCVNISVALKQIYMRYLDRYEKVHFLGEDIERVDDVDDDNRHKKWNNKVLTEVPLKYNYQQHNITDGLRSTHKLCTDLYKSSEYERLLLSLMSPLPNEQDFAINVCTLMANESKHTFKIENCPRLLDTLLAHTGVFSHTSMREIFVEYYSKIRHNSLYAFWADCLHTKPDILELAFDDYNQLSIDNGFPGKGPLAFVAGGGGRHKFIKSNRQNDFNDDANNNNNNKKDINDAGIPTITADDDHCNNNNNNNNNNDDVDDQQQYDDGLNMHTKEYQELFQLDFLHLNRGLGTHDYIGQRIHQIASILRNLSFQEESLMTLVRNRTFIRFLVMCSNVRWSNVHHMALDMLGNVAAELELTDPSDTITRCLLSTISDGLESQDRGVIISCLEILYKLCQKESNDDYLHKCLNRKIYKQICLFLTLNDIMLLLYTLECIYALSALGEKSCIAIGQVKGVIDTLVSLVTVEAQSYGPDGCILMRVVETVPAGSMVNTTNATNINQNQQGFIGGGNNNTYTMMSTATIATGGGGTPTQQQIQLPTGSPNHQAAAAAAAPPPPQSQITSSATTSGTVQSGMISTNPTICQTPIMNQAQLNSFISSNIIKNQPQQFSNNNNNNVTATANTNLNVNVINKINTEQKIINQQQQQQQPINNIQQEQHHQQQQLILKQQQSIALKQQQQQQQQQQKKGHTNVINHTSQLQTQFVQIQQPQQQQQQQSQQQQVIIKNEMINFTNTSSMVQTTGSSSSIIQSNTSSNIINNNNNLITSSVSSSITGTASSSSSTIINPTTNQQIIQENEQFALAWLSATFEAVSTMTTRIEQTDLYKMFVTASTRAGRPAVVTAMHFPHCVRSVFGATVGPNQVKLRQRYTDILANYYEGIRIRSKPLVLFHKGTVMQNVNPGVVASDPVVSVKKEPKSQIIKQPCTTTMIQNQLISQQLANQLQQQQQQQQQQQQTITATVVSSQQQQQQQQLQQPNSVLVSQLTGKNGQQQTTYTQQIVQTQSGESRIVVTPTTQSNRTQQQQQQIMNQINVGSVTATIIGKSSNAQITLAGQQPQQQQPQMQLQQTGVITSTSVQQTPSSLIKSLLANKVTAIETNNTIVNSAASMQSSSNTSIINVHQQVAQRQHLQKQKEIAQQQQQQQLLVVTSSSSSSINNSTSNISNAASMMSTGNIPVITVSSSQQHHQNLTKTLQFPSTVNKQQQMTIPSTTTTSQTVLPPLIPFNVQQQPQQQQQQLQLQQHPLSTTIPSSNIMVAVKMETNEDEIIIPKMELIDALDGTNLILNCNGLNPDDLLVKTTSSLSSSPVVSSNKMLADLLDRKSTEPPFNNIINSGAATATIKTESGYQTVPIILQHSGPGASISSANQNYQIQKQITASGGGGQQISIQPSQIIQQTQQHPQQQQHQQQQHQQTQYVLATNQQGQTYILAQQPSNALNQTQTVLLTQTTQSQSGGPPTKTIIILQQPSNGGQSHAIHQQQFQQLQQQQQQQQQGGQITIGTNNNNNSNNNSNNSQQKVIMTTQQGQQMIVTQMPRPVQQQIIMQHHPLGPGNNNIIQQQQQQPQQTSTIVQNPSIQSTQSPQTIQIQQSPQLLTQAQLHQQLHQQLQHQQQQQQQQQQQKQQQQMIVSSAPQIPQQISLQPQSHLNVQSVSSTPSSSPVLSSSSSTISVLSQSEFAGLQQHQQQQQQQLLLHQQQQQQQQQQQQQQQLQHLVEKKQIFITGSGNIELTEIQQQTKMNSTIVGTTVTTAGVASANITVNASSNVSAKVQQSHGVGTQQTIGMVQQQPQSQPQLPLQRQQQELVPKTIHEYLQEKQQVQQQQQHQPQQPKIVPHQQQQMQQQPQSQASQQQPQSPMTNQSKPQNAINNQQLLTVQVDEDYDPSWLFVCDWRGCPRKKFRSINDVYVHACQVHCPDNIDPNAEIYCQWGLGPNLCDNLPRKRFSLMTHLFDRHCTIESFNAAVQRRATTIGSLPNQPTSPVTIIKNPITPPSNEQNSKSASNNGAIASSSSAAGAGAGTNVNSSTAASAAMQAIKRHALDFLNPKELLDENEGPVTKSIRLTAALILRNLVIYTSNAKKSLRFYEQHLSGVALSNVEASRTIAQVLYEMNDK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -