Basic Information

Insect: Incurvaria masculella
Gene Symbol: osa_1
Assembly: GCA_946894085.1
Location: CAMPPJ020000016.1:412021-438917[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 3.2e-12 1.4e-08 35.9 0.0 2 47 284 329 283 332 0.93

2 5 7.3e-11 3.2e-07 31.6 0.0 6 47 329 370 328 375 0.91

3 5 7.6e-11 3.3e-07 31.5 0.0 6 47 370 411 369 414 0.91

4 5 7.9e-11 3.4e-07 31.5 0.0 6 47 411 452 410 454 0.91

5 5 1.5e-24 6.6e-21 75.4 0.0 6 89 452 532 451 532 0.93

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	3.2e-12	1.4e-08	35.9	2	47	284	329	283	332	0.93
2	5	7.3e-11	3.2e-07	31.6	6	47	329	370	328	375	0.91
3	5	7.6e-11	3.3e-07	31.5	6	47	370	411	369	414	0.91
4	5	7.9e-11	3.4e-07	31.5	6	47	411	452	410	454	0.91
5	5	1.5e-24	6.6e-21	75.4	6	89	452	532	451	532	0.93

Sequence Information

Coding Sequence: ATGCCGCCGCGGCCGTCGTCCTCGCAGTCGGACGGCAGCGGTCCCACGTCGCGCGCCGCGCCCGCCGCCGCCGCCGCGCCGCCCGCCGCGCCCGCCATGGCGGCGCAGGGCTACCCGCCGCCCCCACCTCCCCCGCACCACGGCTACAAGCCGCCGCCGCTGCCGCCGCCCGGCGCGCACTACCCGCAGTACCCGCAGTACCCGCCGCACCCGTCGCACCCGCCGCACCCGTCGCACCCGCCGCACCCGTCGCACCCGCCGCACCCGCCGCGCAACCATCACCCCTACCCGCCGGCCGGCTACCCGCAGCCGCCCTACCGCCACCCGCCGCCGCACCACCAGCCGCCGCACCCGTCGCAGCCGCACCAGCCACCGCACCACCAACACTACCTCAAACAGCATCTAGGACACAAGCACATGGGCCCGCCGGCATCGCAGCACGGCGGCGCGGAGGTGGGCGCGGGCGCGGGCGCGATGCCTCCGCCGACAGCGCCGGACGCGCCGCCGCACGCCGCCGACAACGGGCCCGGCGCGCCCTCCGTCACGGCGCTCGTCACCACCGGCCCGGACGGCGCTTCGCTCGACGAGGCCAGCCAGCAGAGCACGCTCAGCAACGCCTCCGCAGCGTCCGGCGAGGAGGCGGCGTGCACGACGCCCAAGTCGCGCAAGGAGTTCGCCGGCGCGGCCGCGTCGCCGGCGCCGCCGCACGACGACTACGACGCGTCGCCGTCCGCCTGGCCGCGGCCGCCCTCCAGCCCCGTGTTTAACACTCACGTCCCACAGGAGACCTACAGATCCAAGAAATCAGATTCGCTCGGCAAACTTTACGAGATGGACGAGTCACCAGAACGGCGTGGCTGGGTCGAGCGACTGCTGGCCTTCATGGAGGAGAGGCGGACCCCTATCGCAGCATGCCCCACCATCTCCAAGCAGCCGCTCGACCTGTACCGCCTCTACCTGCTGGTCAGGGAGCGCGGCGGCTTCGTGGAGCGACCGCTGGCCTTCATGGAGGAGAGGCGGACCCCTATCGCAGCATGCCCCACCATCTCCAAGCAGCCGCTCGACCTGTACCGCCTCTACCTGCTGGTCAGGGAGCGCGGCGGCTTCGTGGAGCGACCGCTGGCCTTCATGGAGGAGAGGCGGACCCCTATCGCAGCATGCCCCACCATCTCCAAGCAGCCGCTCGACCTGTACCGCCTCTACCTGCTGGTCAGGGAGCGCGGCGGCTTCGTGGAGCGACCGCTGGCCTTCATGGAGGAGAGGCGGACCCCTATCGCAGCATGCCCCACCATCTCCAAGCAGCCGCTCGACCTGTACCGCCTCTACCTGCTGGTCAGGGAGCGCGGCGGCTTCGTGGAGCGACCGCTGGCCTTCATGGAGGAGAGGCGGACCCCTATCGCAGCATGCCCCACCATCTCCAAGCAGCCGCTCGACCTGTACCGCCTCTACCTGCTGGTCAGGGAGCGCGGCGGCTTCGTGGAGGTGACCAAAAACAAAACGTGGAAGGACATCGCGGGCTTGCTCGGCATTGGCGCGTCGTCATCGGCCGCGTACACATTGCGCAAACACTACACCAAAAATCTGCTTGCGTACGAGTGCCACTTTGACCGCGGCGGTATCGACCCGCAGCCCATAATCAACCAGGTGGAGGCCACCACCAAGAAGAAAAACAACAAGGCCAACAGCTCACCCTCGCCAGGCACGTCGAACACGACCGAATCGTTTCCGGGCGGAGGCGCAGGCGGCGGCGCCGGCGGCGTTGCAGCGCCCGGAGCCCCCATGGACGGCTACGGTGGCCAGTATGGTGCATACCCACCACAGCCCAACCAGCCGCAAGGCGGCGGAGGCGGGCCGGCAGCCGAGAACAACCTGGCCGCCTCCAACCCCTTCGACGAGCTCCCGCCCGGCCCGCGCCGCGCCCCAGGCTACCAGCAGGGCTATGGATATGAGGGCTACAATTCGCCGTACTCGCCCGCACGCTCTGTCTACCCTCCCTACGGACCTGAGGGTGACCGGGGTTATGGTGGCAGCGGCGAGTACCGGTACGGCGCGGGCGGCGCGTACGGTGCGCGCTACCCTGCGCCCGGTGCCGCGCCCCCTCCCACCGGCACGCCGCCGCCCGCGCAGCCCTACCCCGATTACTACAGGCCTCAGCAACCACCGCCGCCGGCACCACCGCCCACGGCCGGCCAGCCTCCCGCACCCGCCGCTGGACAGCACGAGATCGCGCACCCGCCCCCGTCGCCCCCCGCTAGTATAATGAACTCTCAGCTGGCGCGCCAGCTCGTGGCGCCACTGTCGCCGGCCAACAAGCCCTACCACCACTACGGAGGCGGCAAGAATCAGATGCCGCCGCCCGGGGGCGCGGCGGGGCAGCCCCGGCGGCACCCCGACTTCGCAAAGGAGGCGGCGGCGGGAGGGGTCGCGGGCGCGGCGGGCGCGGGGCCGGGCGCGACAGGCGCGTCGGCGGGCGCGGCGGTGGCGGGCGGGCATGCGCCGCCGCGCGCGCAGTACGCGCCGTGGGCAGGCGCGACGGGCGCGGCGGGCCCCTTTCCGCGCGCGCCCGCCGCGCCCGGCGCGCCGCAGCCGTGGCGGCCGCCGCCCGGCGCGCAACCGCAGCAGTGGCCCAACTCGCCCTACCAACCACCGGTGGCGGCGGGAGCGTGGGGTGGGGGTGGGGGTGCGGCTGGTGCGGGGGGAGCACCACGACCACCGCCCGGCTCGCCGCGTGCGCCCTCCGCCGCGCCGCCCGCGCCCTACCTGCGGCCCGACGGCAAGCCCTACCCCAGCCAGCCCGCGCCACCAGGCGTCTGCGGCACTGGTACTGGTGGCGTCGGCAGTGGAGCAGCCACCAAGCGCGAGCTGGTGTTCCCCGCCGACAGCGTGGAGGCGAGCGCGCCCACGCCGGACAAGCGGCGGCGGCTCACGCGCGCCGACGTCGCGCCCGTCGACGCCTGGCGTATCGTCATGGCGCTCAAGTCGGGCCTCCTCGCCGAGACCTGCTGGGCGCTCGATATACTCAATATACTCCTCTTTGACGATTCGAGCGTCGCTTACTTCGGTCTCCAGCACATGCCCGGTCTCCTGGACCTGCTGCTCGAACACTTCCAGAAGTCCCTCAGCGACGTATTCGAGAGCGCGCCCGCCGAGCCGGAGGAGTGGTTCGCGCCGCCGCCGGCGTCGCCCGCGTCCCCCGCGCCCCCCGCGCCGCCACCGCCGCCGCCTGACCCCTCCGCGCGCCTCGCGCTCCTTGCCGGCGACAACTACACGCTCGAGTCGCGCCGCGGCCGCGCCGTCACCTACCGCGCCGCCGACGAGTCGCCGCCGCCGCTCGACGACGCCGAGGAGCGCGTCGAGGACGCGCCGCCCGAGCCGTGGCAGTTCGGCGGCGACGCTTCCTTCGGGGGCCACGTCGTGCCCACCTTCCAGGCCGAGTTCGTCCACATTCCGTTCGCAAGGGTCATCGGGCGGCGGCGGCCGCGCGTCCCCTCCGCCGCCCCTCCGCCCACCCCCGCCTGCGCCGCCTCCCCCGCTCCCGCCGCCGCCGCCGCGCCCACGGACCCGCTCGACGAGCGGACGGAGGCGCCGCCCGAGCCGGAAGCACCCCCCGAGACGGAGCCGCCCGGCGACGATCGGCCCGAGGACCGCGACAACCTCGAGGCGGAACCGATGGAGCTTGAGCGGGAGAGTCGGCCCGAGCTGCAGGTGCGTGACCCGGCCGGCACGCTGCGGCGGCGGCGCCTCTCCGACTACGAGGACGAGTGCTTCGCGCGCGATGAGCCGAGCCTGAACCTGCTGACGGAATCGCGCGACGCGCTCGCCCGCCGCTGCGTCGCCCTCTCCAACATCCTCCGCGGGCTCACCTTCGTGCCAGGCAACGAGACCGAGTTCTCGCGGAGCGGCGCGTTCCTCGCGCTAGCCGGCAAGCTGCTACTGCTGCACCACGAGCACGCGCCGCGAGCGGCGCGCGCGCGAGCGTACGAGCGGGCGGCGCGCGACGACGCCGACTCGGACGCGTGCTGCTCGAGCCTGCACGGTGCCGCCTCGTGGTGGTGGGAGACGCTCGAGCAGCTGCGCTCGGACGCGCTCGTCTGCTGCGCGAACATCGCAGGGTGCGTCGAGCTCGCGACGCAGCCGGAGGCGGTCGCGCGGCCCCTGCTCGACGGGCTGCTGCACTGGTGCGTGTGCCCGGCGGCGGCGGCGGAGGACGCGCCCGCGTCGGCGCCACCGAGCTCGCCGCTCTCGCCGCGGCGGCTCGCGCTCGAGGCGCTCTGCAAGCTGTGCGTGACGGACGCGAACGTGGACCTCGTGCTGGCGACGCCGCCGCGCTCGCGACTGCGCGCGCTATGCGCAGTGCTCGCGCGCAACCTGTGCCGCGCCGACGAGCCCGTGCTGCGCGAGTTCTCGGTGAACCTGCTGCACTACCTGGCGGGCGCCGAGTCGGGTGCGGCGCGCGAGGTGGCGCTGCAGGCGCCGGCCGTCTCGCAGCTGGTGGCGTTCATCGAGCGCGCCGAGCAGGCGGCGCTCGGCGTCGCCAACCAGCACGGCGTGGGCGCGCTGCGCGACAACCCCGACGCGATGGGCACCAGCCTGGACATGCTGCGGCGGGCAGCCGCCGCGCTACTGCGCCTAGCCGAGCACCCGCACAACCGGCCGCTGTTCCTGCGCCACGAGCGCCGCCTGCTCTCGCTCGTCATGAGCCAGATCCTGGACCAGAAGGTGGCGCAGGAGCTCGCCAAGGTGCTGTACCAGTGCAGCCGGCCCCCGCCGCCGCCGCCGCAGCCCCGCAGGCACGAACCCGCGTAG
Protein Sequence: MPPRPSSSQSDGSGPTSRAAPAAAAAPPAAPAMAAQGYPPPPPPPHHGYKPPPLPPPGAHYPQYPQYPPHPSHPPHPSHPPHPSHPPHPPRNHHPYPPAGYPQPPYRHPPPHHQPPHPSQPHQPPHHQHYLKQHLGHKHMGPPASQHGGAEVGAGAGAMPPPTAPDAPPHAADNGPGAPSVTALVTTGPDGASLDEASQQSTLSNASAASGEEAACTTPKSRKEFAGAAASPAPPHDDYDASPSAWPRPPSSPVFNTHVPQETYRSKKSDSLGKLYEMDESPERRGWVERLLAFMEERRTPIAACPTISKQPLDLYRLYLLVRERGGFVERPLAFMEERRTPIAACPTISKQPLDLYRLYLLVRERGGFVERPLAFMEERRTPIAACPTISKQPLDLYRLYLLVRERGGFVERPLAFMEERRTPIAACPTISKQPLDLYRLYLLVRERGGFVERPLAFMEERRTPIAACPTISKQPLDLYRLYLLVRERGGFVEVTKNKTWKDIAGLLGIGASSSAAYTLRKHYTKNLLAYECHFDRGGIDPQPIINQVEATTKKKNNKANSSPSPGTSNTTESFPGGGAGGGAGGVAAPGAPMDGYGGQYGAYPPQPNQPQGGGGGPAAENNLAASNPFDELPPGPRRAPGYQQGYGYEGYNSPYSPARSVYPPYGPEGDRGYGGSGEYRYGAGGAYGARYPAPGAAPPPTGTPPPAQPYPDYYRPQQPPPPAPPPTAGQPPAPAAGQHEIAHPPPSPPASIMNSQLARQLVAPLSPANKPYHHYGGGKNQMPPPGGAAGQPRRHPDFAKEAAAGGVAGAAGAGPGATGASAGAAVAGGHAPPRAQYAPWAGATGAAGPFPRAPAAPGAPQPWRPPPGAQPQQWPNSPYQPPVAAGAWGGGGGAAGAGGAPRPPPGSPRAPSAAPPAPYLRPDGKPYPSQPAPPGVCGTGTGGVGSGAATKRELVFPADSVEASAPTPDKRRRLTRADVAPVDAWRIVMALKSGLLAETCWALDILNILLFDDSSVAYFGLQHMPGLLDLLLEHFQKSLSDVFESAPAEPEEWFAPPPASPASPAPPAPPPPPPDPSARLALLAGDNYTLESRRGRAVTYRAADESPPPLDDAEERVEDAPPEPWQFGGDASFGGHVVPTFQAEFVHIPFARVIGRRRPRVPSAAPPPTPACAASPAPAAAAAPTDPLDERTEAPPEPEAPPETEPPGDDRPEDRDNLEAEPMELERESRPELQVRDPAGTLRRRRLSDYEDECFARDEPSLNLLTESRDALARRCVALSNILRGLTFVPGNETEFSRSGAFLALAGKLLLLHHEHAPRAARARAYERAARDDADSDACCSSLHGAASWWWETLEQLRSDALVCCANIAGCVELATQPEAVARPLLDGLLHWCVCPAAAAEDAPASAPPSSPLSPRRLALEALCKLCVTDANVDLVLATPPRSRLRALCAVLARNLCRADEPVLREFSVNLLHYLAGAESGAAREVALQAPAVSQLVAFIERAEQAALGVANQHGVGALRDNPDAMGTSLDMLRRAAAALLRLAEHPHNRPLFLRHERRLLSLVMSQILDQKVAQELAKVLYQCSRPPPPPPQPRRHEPA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -