Basic Information

Insect: Udea olivalis
Gene Symbol: -
Assembly: GCA_947369235.1
Location: OX376347.1:1-32220[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.00047 0.52 11.1 1.1 31 63 212 244 207 246 0.87

2 5 0.00043 0.48 11.2 0.5 31 63 590 622 585 624 0.87

3 5 0.11 1.2e+02 3.5 1.4 22 56 1129 1163 1122 1168 0.82

4 5 0.00047 0.52 11.1 1.1 31 63 1533 1565 1528 1567 0.87

5 5 0.061 68 4.3 0.3 31 52 2056 2077 2051 2082 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.00047	0.52	11.1	1.1	31	63	212	244	207	246	0.87
2	5	0.00043	0.48	11.2	0.5	31	63	590	622	585	624	0.87
3	5	0.11	1.2e+02	3.5	1.4	22	56	1129	1163	1122	1168	0.82
4	5	0.00047	0.52	11.1	1.1	31	63	1533	1565	1528	1567	0.87
5	5	0.061	68	4.3	0.3	31	52	2056	2077	2051	2082	0.78

Sequence Information

Coding Sequence: ATGTCTACCGAACGTAACTCGGTTAATTCCGTTGAGGGTCTCGCAGTCGAGGTAAACTCGGCGGACGAGCTGGACCAGAGGGTCACACGTGCGTTGCGTAGCCTACGCCCTAAGAGGCCGGCGGGTTCGCCCATTTTTGCGTCTGAGGCTTCGGTCTCAGACAGTGAGGAGGTGGCCACGACGATACGGTCGACGGCACCAAAAAAGGCTTCGACCAAAAAGGTCGTAGCCAAAAAGGCCAAAAAGGCGGCGACTGGCACTGCGGCTAAAAAGGCGGCGGCCAAAAAGGCGGCAGTTGCCACTGCGGCCGAATTCCTCAGGGCCAAGGCAGCGCAAGTCGCCTTGAACCGCCTGGAGTCAAACTCCAACGCATCTCGGGAGGATGCACAAGAGGTGGAAGCCGACGAGCCTGTCGACTTCACGCGAAACCCACTCCCCGAGGAATGCTCACTCGCGGAGCTGGACGCCGCCGTTGACACCGAGACGCTGCGTGCCCGGGCGGGTCATCTGAGGTCCCAGATTTTCCACATTGCCCGAAAGTCCGGCAATCTCAAGGGGGAGTACGTGCGTGACCTAAAAAACCACGCCACGGAATACCACGAGATTGTCGAGACGATTGCGGAGCGGACGATCTCGGATGAGACACGGCGGCTCAGTCTCGAAAACCGGAGACTTCGCCGCCAAGTGGAGGACCTAGAGAAGGAGGTGAAAGCCATGCGCCGCGACTTCTCACAAAGGGATAAATCCCCGGCGCGGCCGGTCATCCCCTCCCAAGACCCTGCGGGCAGCTCGCCAAATGACTTGATGGCCGAGATGTCCAAAATGGTTAAAGACATGgcggaggagttgaaggcctccatgtgccgaaccttcggtgaaatggtcaacgcccgcttggcggtggttgaggagcgccttcctcccgcaagaatcgtgcggcctccacttgccgccgacaagaggcgagatgaggcagccaaggctgcagctgctttatctgcACCTGCATTAGCTCAGCCTGAGCCTACTGCGGCTCCCAAGCCGAAACGAACTCGGAAGGGTAAAGCGAGGGTGGTGCCGCAACAGGCACCCCCCGCTATTCCCGGCCCGTCCGCAGTGACTCTGGCTgcccctaccactcgcgaggaatcgtggagtgtggtagTCGAGGGTCTCGCAGTCGAGGAAAACTCGGCCGATGAGCTGGACCAGATGGTTACCCGGGCGTTGCGTAGCCAACGGCCTAAGAGGCCGGCGGGTTCGCCCATTTTTGCGTCTGAGGCTTCGGTCTCAGACAGTGAGGAGGTGGCCACGACAACACGGTCGTCGGCACCGAAAAAGGCTACGGCCAAAAAGGTCGTAGCTAAAAAGGCCAAAAAGGCGGCGTCTGGCCCTGCGGCCAAAAAGGCGGCGGCCAAAAAGGCGGCAGTTGCCACTGCGGCCGAATTTCTGAGGGCCAAGGCGGCGCAAGTCGCCCTGACCCGCCTGGAGTCGAACTCGAACGCATCTCGCGAAGATGCGCAAGAGGTGGAAGCCGACGAGCCTGTCGACTTCACGCGGAACCCACTCCCCGAGGAATGCTCACTCGCGGAGTTGGACGCAGCCGTCGACACGGAGACGTTGCGTGCCCGGGCGGGTAATCTGAGGTCCCTGATTTTCAACATTGCCCGCAAGTCCGGCAATCTCAAGGGGGAGTACGTGCGCGACCTGAAGAACTTCGCCACGGAATACCATGAGATTGTCGAGACGATTGCGGAACGGACAATCTCGGATGAGACACGGCGGCTCAGCTTCGAAAATCGAAGACTTCGCCGCCAAGTGGAGGACCTCGAAAAAGAGGTGAAGGCTATGCGCCGGGATTTCTCTCAGAGAGACAAATCCCCAGCGCGGCCGGCCCTTCGCTCCCATGACCCTGTGGGCATCTCGACCAATGACCTGATGGGCGAGATGTCCAAGATGGTGAAGGAGATGgcggaggaactcaaagcctccatgtgccgcacagtgggggaaatgattagcgcccgtatagcggtggttgaggagcgccttcctcccgcaaaaatcgtgcggcctccacttgccgccgacaagaggagagaggAGGCAGCCAAGGCTGCAGTTGCCTCATCTTTACCTGCACCGGCTCAGCCTCAACCCACTGCAGCTCCCAAGCCGAAGCGGACTCGGAAGGGCAAAGCGAGGGTGGTTCCGCAACAGGCACCCCTCGCTGTCGCCGGCCCGTCGTCCGCGGTGACTCCGGCTGCCCTGACCACCCACGAGGGAGAATGGAATGTGGTGGTTGGGAATAAGGGGAAAGGCAAAGGCAAGGGGAAGACCTCCACGCCCGCCGCAGCCCGAACCCCTGCCCAACCCTCCGTGAGACAGGCGCAGTCGACACCAGCGCCAAAACGGACAAAAAATAAAAATGCGGTcaagttgacgccccctcgctcatcggctgtagtggtgacactgcagcccgacgccatcgagcggggcgtctcgtacaagtcggccctgcttaaggcacgggaagtggtctcgttgcccgatttgggtatacctgGTAGGTTGGTAGGAGCGCGTAAGGATGCTAGTCCCTCGGAGGTGGAGCCGGCACAGGCTGCGGCGATGTCATCTGCGTCGCAGTGTGCTACTGGCAAAGAGGTGGTGCGGGAGCCTATCGTAAGGCTCACCCGCTTAAGTTCTGCGGAACTTTTAGTTGCGACGCCGGAGCCTTCAATTTCGGCGACGGTCGAGCGCATTTTGCGCAGCGGCCGTTCAAGCGCAGCTGGGGAACGGTCGCGTTCTCCGTCTGCCCAGGAGTCGGACTCAGGCACCAGCCTGATGACCGTCGATCCTTCCTCCGGGGAGGAACTCGGCCGACTCTGGGGTACACGGAAGCGGCCGTACTCTAAAAACGGAGGGTCGGGTTCCGACAGGAGCGCCAAAAGTGGACGGGGTTCTGCTTCTGGAAAGCCTGCGGCCCGACGAGGGAGAGGCGGTACGCCCGCTCCCGGTGCTAACGCCTGTATGGCGGAGGCCCGGGAAAAATTCATGCGCCTAGGGCGCGATGACGAGAGGTTGGAGGCAAAGCTGCGGTCCGAGCAAGAGGTCGCTGGAATGGATCGAGCTTTGCTCCAACTTCAAGAGAAGTCAACCCGCTTGTCAGACTCGTCCCAGGGCGAGGCCGATGAGCGGGAATTGACAGCCTCCGCGCTCAAGGAGCGAATGGAGATGTCGGCggcgatagtccggaaggtcattgcgacttccggacatctgaagggtaccttccaaaaggccctgaagacggcagTCGGAGACTGGGAGCTTCTAGCTCCAGTGCTATACAAGCGCACAGTCTCCGAAGAGACCGAGAAGCTGCGGGTGGTGAACCACCGCCTGCTCTCCGCGGTCTCTCGACAGGGGGAGGAGCTGGCCCAACTCCGTAAGGAAATGGACAGCCTCCGCGAAAGCCTCGCCGGGCAAACGTCCCGAGCGGCTGGCGTAGGTGACGACAGTAATGTCATTGCCTACGTCAACGCGCGTTTTGAGGCCATCGAGGCTCGACTGCCACTGGAGCGGCTTCGGCCCCCCCTGGCTGCTGACAAGCGCCAGACTAACGCGCCGCCGCCGGCCACTGCGCCAGCGGCCGCGCCACTACCGGCTACGACAAAAACCCCGGACAAGACGTCCGCGAGCAAGAGGGCGACTCAGCCGCCACCTGCTCGCAGCACACCAACTGCAGCTGCGCCGAAGCCCATGGCTCCAGCGCCGCCCAACCCCGAATCCCGAGGGAATCCTCCCGCGGGGAAGAAGGGAAGGACGTCGGCCAAGAAGGGCAAGGCGGCTAACGCTGCCCCGCccccaagggagccccgccctttgccgccggcccccgagaccatggagttaccgtggaacctcgtgaccagccgcaagggcaagagcaaggTTATGTCTACCCGACGTAATTCTGCCAACTTAGTCGAGGGTCTCGCAGTCGAGGAAAACTCGGCGGACGAGCTGGACCAGATGGTCACACGGGCGTTGCGCAGCCAACGGCCTAAGAGGCCGGCGGGTTCGCCCATTTTTGCGTCTGAGGCTTCGGTCTCAGACAGTGAGGAGGTGGCCACGACAACACGGTCGTCGGCACCTAAAAAGGCTACGGCCAAAAAGGTCGTAGCCAAAAAGGCTAAAAAAGCGGCGTCTGGCCCTGCGGCCAAGAAGGCGGCGGCCAAAAAGGCGGCAGTTGCCACTGCGGCCGAATTTCTCAGGGCCAAGGCGGCGCAAGTCGCCTTGACCCGCCTCGAGTCTAACTCCAACGCATCTCGCGAGGATGCACAAGAGGTGGAAGCCGACGAGCCTGTCGACTTTTCGCGGAACCCACTCCCCGAGGAATGCTCACTCGCGGAGTTGGACGCAGCCGTCGACACCGAGACGTTGCGTGCCCGGGCAGGTAATTTGAGGTCCCTGATCTTTCAAATTGCCCGAAAGTCCGGCAATCTCAAGGGGGAGTACGTGCGTGACCTAAAAAACCACGCAACGGAATACCATGAGATTGTCGAGACGATTGCGGAGCGGACGATCTCGGATGAGACACGGCGGCTCAGTCTCGAAAACCGGAGACTTCGCCGCCAAGTGGAGGACCTCGAGAAAGAGGTGAAGGCTATGCGCCGGGATTTCTCCCAGAGGGACAAATCCCCGGCGCGGCCAGCTCTTCCCTCCCAAGACCCTGTGGGCATCTCGGAAAATCACCTGATGGGCGAGATGTCCAAGATGGTGAAGgaaatggcggaggaacttaaagcctccatgtgccgcactgtcggcgaaatgattagcgcccgtatagcggtggttgaggagcgcctcccaccagcaccaatcatgcggccaccacttgccgccgataaaagacgggaggAGGCAGCCAAAGTTGTGGTTTCCCCAACTGCTCCGGCTCAGCCTCAGCCCGCAGCGGCCCCAAAGCCAAAGCGGACCAGGAAGGGCAGAGCGAAGGCGGTTCCGCAACAGGCACCTCCCGCTGTTGCCGGCCTGTCATCAGCATTGCCTTCGTCGATCCCTGTCCCTCGTGATGAGTGGAGTGTTGTGGGTAAGAAGCAAGGGAAAGGGAAAGGCAAGGGGAAAACCTCCAAGCCCGCCCCAGCCCAAACCCCTGCTCAACCCCCAACCCGCGTGGATGACAACCACTATAAAAATCACGAAGCCGGAGGTCTAACCGTGCCGAAGAGTGCAGTGACGGAGAACCAGGGCTCAGCATCGGCCCGTGTCACACGCGCGAAATTTGCAAAAAGGCGAGATGCACCCGACTTCCTCCAACTTGGACAGCCCAACATTGAGCTGGTTCGTTTGGAGATGAGCCCGCTCAGCGGAGCTTTAGTAGACAAAATCGTCAGTGAGGACGATTCCGACCGTGAAAAGCCGGATGATGTGCTTCTCGATGAGAATGGAAAAGGCGGAGTGGCCTACTGGATGAAATCCAAGGGCGGAGCAACAAAACCTCGGGAGACAAAGAGGGAGGCAAGAGCTCGGAAGAAGCGAGAGAAGGAGACCTCTAACGAGGTGACAATGACAGACTGTGTTTTAGAGACTGGCGTATCGTCAGACTCAGATAATGCATCTTTTGTCTCAGTACCCGAGCTGGAGTCGGATGGCACCAGCGATGCCCGGAGCCCGGACAATCGGCGGAAGCGGTATGGGGAAAACCTCAATGATACGACCAATGATGCAATGCCACTGTCAAAGGTATTCTcagccaggaggggaagggggcgacccccaaccactggccagtacataggactggcgcaagccaaagagcgggcagcggctgctgaagtattagagcttgagctccaagccgaAAGGGAGATGGCCGAACAGATGAGAGAAGTCAGGGAGACAAGAGCCAAGAAGTTGGTCTCGCGGCTCTCAGAGTCTTCCGAGGGCCAAAATGAAGAAGAGCAAGGGGAAAAGACTTTGCTGGATCTGCTCAAGCAGATAGTCGACGGGGCGAAAATTGTGGGTGGAGTAAACGAACGCTCTAAAAACCTGAAGGGAACGTTTAAAGGTGCCTTAAATTTAGCCCAGTCCACCATCGCTAGCGGTGTGGACGAGATTAAAAAGCTGCCACTGGTAGAGAAGGCCATGGCCCTAGAGGCAGAAAACAGCCGCCTCAGAGCGGAATTGGAAAAGGCAAGGGCGAGTCCATATAGGAATGAAGAAAAGAGGGCTCTTTCGCCCTATAAAATGGAAGAAGATGTGCTCCCAGCATATGCCCCCGGGGCCGCCTGTACCTTGCGGGAGACAGCGACCAACGAAGTGGAACGGCAATTGGTGTCGGAGGAGTTTTTAAAAGGACTTATTGATGTGGTTGTCGAGAAGGTTTCTAGTGCCGTGGTCCAGCAGGTCATAGTGATGATCGACCTCAAAATGGACGCGAAACTCGACGCCTATGAAAGGAAACCAGAGGTGCGCTTACGACCGCCACTGGCCCATGAGAAGAAAAAGGAAGCTGCATCTACTGCTGCAAAGCCTCCTCTTGCTAAGCCCGGCCCAGTCCGGGCCGAACCAGCAGGGGATAGTATTCCCAGTGGCTCAGTTCCACCTCCTGCAAAGGGAAAGAAGAACAAAAGTCCCAAAAATAACGTCTTGAAAGCTGCTACAATTCAAAAACCTCAGAAAGTTCAGTCGAATCCTGAATCACGGGAGCCACGCATGCTGCGTCCACCACCTGCTCCTGCGAGTGAGCAATGGAGTGTTGTAGCTGGGAAGGGCAACAAAAAGCTCAAGACTGCAGGC
Protein Sequence: MSTERNSVNSVEGLAVEVNSADELDQRVTRALRSLRPKRPAGSPIFASEASVSDSEEVATTIRSTAPKKASTKKVVAKKAKKAATGTAAKKAAAKKAAVATAAEFLRAKAAQVALNRLESNSNASREDAQEVEADEPVDFTRNPLPEECSLAELDAAVDTETLRARAGHLRSQIFHIARKSGNLKGEYVRDLKNHATEYHEIVETIAERTISDETRRLSLENRRLRRQVEDLEKEVKAMRRDFSQRDKSPARPVIPSQDPAGSSPNDLMAEMSKMVKDMAEELKASMCRTFGEMVNARLAVVEERLPPARIVRPPLAADKRRDEAAKAAAALSAPALAQPEPTAAPKPKRTRKGKARVVPQQAPPAIPGPSAVTLAAPTTREESWSVVVEGLAVEENSADELDQMVTRALRSQRPKRPAGSPIFASEASVSDSEEVATTTRSSAPKKATAKKVVAKKAKKAASGPAAKKAAAKKAAVATAAEFLRAKAAQVALTRLESNSNASREDAQEVEADEPVDFTRNPLPEECSLAELDAAVDTETLRARAGNLRSLIFNIARKSGNLKGEYVRDLKNFATEYHEIVETIAERTISDETRRLSFENRRLRRQVEDLEKEVKAMRRDFSQRDKSPARPALRSHDPVGISTNDLMGEMSKMVKEMAEELKASMCRTVGEMISARIAVVEERLPPAKIVRPPLAADKRREEAAKAAVASSLPAPAQPQPTAAPKPKRTRKGKARVVPQQAPLAVAGPSSAVTPAALTTHEGEWNVVVGNKGKGKGKGKTSTPAAARTPAQPSVRQAQSTPAPKRTKNKNAVKLTPPRSSAVVVTLQPDAIERGVSYKSALLKAREVVSLPDLGIPGRLVGARKDASPSEVEPAQAAAMSSASQCATGKEVVREPIVRLTRLSSAELLVATPEPSISATVERILRSGRSSAAGERSRSPSAQESDSGTSLMTVDPSSGEELGRLWGTRKRPYSKNGGSGSDRSAKSGRGSASGKPAARRGRGGTPAPGANACMAEAREKFMRLGRDDERLEAKLRSEQEVAGMDRALLQLQEKSTRLSDSSQGEADERELTASALKERMEMSAAIVRKVIATSGHLKGTFQKALKTAVGDWELLAPVLYKRTVSEETEKLRVVNHRLLSAVSRQGEELAQLRKEMDSLRESLAGQTSRAAGVGDDSNVIAYVNARFEAIEARLPLERLRPPLAADKRQTNAPPPATAPAAAPLPATTKTPDKTSASKRATQPPPARSTPTAAAPKPMAPAPPNPESRGNPPAGKKGRTSAKKGKAANAAPPPREPRPLPPAPETMELPWNLVTSRKGKSKVMSTRRNSANLVEGLAVEENSADELDQMVTRALRSQRPKRPAGSPIFASEASVSDSEEVATTTRSSAPKKATAKKVVAKKAKKAASGPAAKKAAAKKAAVATAAEFLRAKAAQVALTRLESNSNASREDAQEVEADEPVDFSRNPLPEECSLAELDAAVDTETLRARAGNLRSLIFQIARKSGNLKGEYVRDLKNHATEYHEIVETIAERTISDETRRLSLENRRLRRQVEDLEKEVKAMRRDFSQRDKSPARPALPSQDPVGISENHLMGEMSKMVKEMAEELKASMCRTVGEMISARIAVVEERLPPAPIMRPPLAADKRREEAAKVVVSPTAPAQPQPAAAPKPKRTRKGRAKAVPQQAPPAVAGLSSALPSSIPVPRDEWSVVGKKQGKGKGKGKTSKPAPAQTPAQPPTRVDDNHYKNHEAGGLTVPKSAVTENQGSASARVTRAKFAKRRDAPDFLQLGQPNIELVRLEMSPLSGALVDKIVSEDDSDREKPDDVLLDENGKGGVAYWMKSKGGATKPRETKREARARKKREKETSNEVTMTDCVLETGVSSDSDNASFVSVPELESDGTSDARSPDNRRKRYGENLNDTTNDAMPLSKVFSARRGRGRPPTTGQYIGLAQAKERAAAAEVLELELQAEREMAEQMREVRETRAKKLVSRLSESSEGQNEEEQGEKTLLDLLKQIVDGAKIVGGVNERSKNLKGTFKGALNLAQSTIASGVDEIKKLPLVEKAMALEAENSRLRAELEKARASPYRNEEKRALSPYKMEEDVLPAYAPGAACTLRETATNEVERQLVSEEFLKGLIDVVVEKVSSAVVQQVIVMIDLKMDAKLDAYERKPEVRLRPPLAHEKKKEAASTAAKPPLAKPGPVRAEPAGDSIPSGSVPPPAKGKKNKSPKNNVLKAATIQKPQKVQSNPESREPRMLRPPPAPASEQWSVVAGKGNKKLKTAG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -