Basic Information

Insect: Diaphora mendica
Gene Symbol: -
Assembly: GCA_949125395.1
Location: OX421310.1:59400110-59421353[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.013 23 6.5 0.0 28 63 159 194 148 196 0.78

2 4 0.032 58 5.2 0.0 28 61 767 800 766 804 0.86

3 4 0.0048 8.6 7.9 0.0 28 61 1342 1375 1341 1379 0.88

4 4 0.0065 12 7.5 1.9 33 56 1997 2020 1983 2025 0.64

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.013	23	6.5	0.0	28	63	159	194	148	196	0.78
2	4	0.032	58	5.2	0.0	28	61	767	800	766	804	0.86
3	4	0.0048	8.6	7.9	0.0	28	61	1342	1375	1341	1379	0.88
4	4	0.0065	12	7.5	1.9	33	56	1997	2020	1983	2025	0.64

Sequence Information

Coding Sequence: ATGGAGCGCATGCGTTCCAGATCCGCCGTGAGCGTCACGGGCGGTGGTTCCAGTGCGAGGACGGACGCACTggagccgatggacgtggaggaataccggaagcgcggacgccccactggctgcgagagtgacatcgctcaggcgatgttgcctcctAAGGTGGCGAGCAgtcagagggagcgatcgctgaccccggtgccggccccgtcagGTTCCCCCTTTTGTAGGGCGGAGTCCTACAGGCGGACTCGAGCGGACGGCGAATTCCAAGCGGAGGAGGAGATAGCAgatctcctgctgaagatcaaGGAGCCGACGGTGGGGGATTCTGTGCCCCAAACACCGTCCTccatgcaggagagagcggacgcggcggtggctattatccacaaggtggccaccaagtccgtcaaccttaagggcccgtttgtgagggcccttaaggactcctcctctgccttagcgggagtcgtcgaatctctcgcaggggacgtggctcgcctcgaggcggccaacggccgcttgacggagcaggtggccgggctcagcgctcaatttgccGTCTTTCGGGCGGAGTGCTCTGAGCGTgaggcccctgtcccgtctgcgtcccagccggccctgGCCCCGTCTACAtgccggccggccccgtctgcgtcccggccggccccgtctgagCCGCCGCCTCCGCCTGCGTTGCGGCGGGCCCCGTCTGTGTCCCAGCCTGCCCCGTGTACGTCGCAGTcagcccctgctgtccccggggtatccgacgacgtcctgcagcagatgctgcagcaGATCCTCGTctcggtggggaatctggtggacggtcgtCTGGCTGGCCTGGAAGAAAGGCTGCTTCCCGCCCCTATtcttcggccgccgctcgcggCGCCGAAGACGAGGGTCACCTCGGCGCCGGCCTCgcttcccgtggtggggggtcgcgtgtcgtacgcggcggcgacgtctGTGCCGGGCACTGCCTTCACGCGcaagacgcagcagcgggcgaaggctgcggccaagacggctgcgccgcagccgacgcccaagacggtggcaacgtctggagcggagttccctccgctccccactccaacacctctgcctggcccttcCACATCCGCCCCCTCTGATGAGGGTTGGCAAGTAGTTGGAGGGGCCAAGCTGtcaaagaaggccaagaagcgggccaagaaggctgcccaaaaggcggcctctggcccgcagtcgtcatcggTGGCAAGGACCACTccaaagaagccgcggaagttgcagccgcctaagaccgcggctgtagtggtcacggtgtcaccggaggcggcaagtgggggactgtcctacgcggccgtctttaagacggcccgggactgtctcgccccagattttggagcggcaggggtccgcttgcgccttgcccagacgggagctcggatccttgagttccctggggccgatggcgcaaagacggcggacaccttcgcCGAGAGGCTACGGGAAGTATTTTCcaacacggatggtgtcaaggtcgccaggcccacgaagtgcgcggagctgcgcatttcgggcctagACGACTCCGTCACTGTGGATGACGTCCGCGTTGCTATAAGAGAGAAGACGAAGTGCAACGCGGACAACATCAGGGtaggcaccatccgccccggtccgggaggacttggcgcTGTCTGGgtcagttgtcccgtggcgtcagCCAAAGTTTTGgacgacgccggcaggctgctCATCGGTTTCGTGAGCGccaggatcacagtcctggctgcgagaccgatgaggtgtttcAAATGCCTGGCCGCGGGACACACCCGAGTGAAGTCCAGCCACTCGTCGGATGGCGCGGGTGGTAGCTCTAATGCGTCAGCATTGGAGTCTATGGATCTGGACGCAAGCGACAGCCGCAAACGCGTGCGCTCCAACGATGGCGGCAGCGACACACGCGAAATGTTGCCGCCTAAAATCCCGAGTAGCCAGAGGGGGCGCTCACGTACCCCGGTGTCGGCCCCATCAGGTTCCGCCTTTAGTAAGGCGGAATCATATAGGCGAGCCAGGACGGACGGCGAGACTCAGGCTGAGGAGGAGATTTCCggtctcctgctgaagatcggGGAGCCGGTGGATGGGGATTCAGTGCCCCAAACACCGGCCTCcttgcaggagagggcgcaggcTGCGGTGGCCATAattaacaaggtggccaccaagtcggtgaaccttaagggctcctttgtaagggcccttaaggactcctcctccacaCTGGGTGGAGTCGTCCAGTCCTTgataggggacgtggctcgcctacGGGCAgccaacgaccgcttgacggggcaggtggctgagcttagcgctcagttcgcccaatttcgggcggagcgtcctgagcgcgaggcctcggccccggctccgtctgcgtcgcggctgGCCCCATCGGCGTCGCGGCCGGACCGGTCTGCGTCTCGgccagccccgtctgcgtcgcggccagCCCAGTCTGCGTCGCAGCCGGCCCCCACTGTCCCTGGGGTTTCGGAGGACCTCGTCCAACAGATCCTCATCGcagtggggaatctggtggacgggcgtctggccggcctcgaggcgaggctgcctccggcccctgtcgttcggccgccgcttggagCCCAGCGAAAGACGGTCGCTTCGGCGCCGACCCCGCTTCCTGTGGTGGGGGGTCGAGTGACCTATGCCGCCGCGGCGACGTCAAAGCCTGCTCCTGCGGCTGCCCACAAGCAACGACAGGACGCTAAGGCCGGGACGGCTGCCCCGAAGCCTGGGCCTAAGTCAAAGAATacggcaagagctggagcggagttccctccgctccccactccaacgccGGTACCTGGCCCCTCAAcagctgccccctccaatgaggcttGGCAGGAAGTTGGGGGGTCCAAGAAGTCCCGAAGGAGGGCTAGGAAGGCTGCTGAGAAGGCAGCCCCTACCCCGCAGTCGCCGCCGGTGGCAAGTGCCGCCGctaagaagccgcggaaactgcagccgccaaaaaccgcggctgtagtggtgaccgtgtcgccggaggcggctgagGGCGGGCTGTCCTATGCGGCCCTCTTCAAGAGGGCCCGGGCCAGTCTCGCCTCTTTCGGGACGACCGGAGTTaggttgcgcctcgcccagacgggagctcgggttctcgagttccccggggctgaaggcgcaaagtcggcGGACGAGTTTGCCGAGAAGCTCAGAGGAATGTTTGCGGAAACGGATGGTGTacggatcgccaggcctacgaagtgcgcggaattgcgcatctcgggcctggacgattccgtcacggccgaggatgtccgcgttgcagtgCAGGAGAAGACGAACTGCAGCGCGGAAAACattaaggtcggcaccatccgccccggtccagggggccttggtgcggtgtggctcagctgcccaatagcggcagccaaagtgctgggcgatgctggcaggctcctcgtcggcttcgtgagcgccaggacaacagtcctggcggcgaggccgatgagGTCCAGCCACTCGTCGGATGGCGCGGGTGGTAGATCCAATGCTGATGCATTGGAGTCTATGGACCTGGACCTGAGCGACAGCCGCAAACGCGTGCGCTCCAATGATGGCGGCAGCGACACCACGGAAATGTTGCCGCCCAAAATCGCGAGCAGCCATAGAGGGCGCTCGCGAACTCCGGTGTCGGCCCCGTCTGGTTCCGCCTTTTGTAAGGCGGAATCATACAGGCGAGTCAGGGCGGACGGCGAGactcaggcggaggaggagatctccGGTCTCCTGCTGCAGATTGGGGAGCCGGTGGATGGGGACTCAGTGCCCCAAACACCGGCCTCtctgcaggagagggcgcaggcggcggtggccatcattaacaaggtggccaccaagtcggtaaaccttaagggctcctttgtaagggcccttaaggactcctcctccacgctggggggagtcgtccagtccctgataggggacgtggctcgactccaggcggccaacgaccgcttgacggggcaggtggctgagctgagcgctcagtttgcccaatttcgggcggagcgtcctGAGCGCGAGGCCTCGGCCCCAGCCCCGCCTGCGTCGCGGGCGGCCCCGTCAACGTCGCGGGCGGCCCCGTCAGcgccgcggccggccccgtcagcGTCGCGGGCGGCCCCGTCAGCGTCGCGGCCGGTCCCGTCGGCGtcgcagccggccccgtctccgTCACAGCTGGCCCCCACCGTCCCTGGGGTATCGGAGGACCTCGTCCAACAGATCCTCATCGcagtggggaatctggtggacgggcgtctggccggcctcgaggcgcggctgcctccggcccctatcgttcggccgccgcttggggCACAGCGTAAAACGGTCACGTCGGCCCCGACTCCACTTCCCGTGGTAGGGGGTCGAGTGACCTACGCCGCGGCGACGTCGGCCCCGGCTCCTGTGGCGGCTCAAAAGCCACGACAGGGGCCTAAGGCCAGGACGCCTGCCCCGAAGCCAGGGCAGCCGTCTAAGACGACgacaagagctggagcggagttccctccgctccccactccaacgccGGTACCTGGCCCCTCAACAGCTGCCCCCTCAAATGAGGCTTGGCAGGAAGTTGGGGGGTCTAAGAAGTCCCGAAGGCGGGCTAGGAAGGCTGCTGAAAAGGCAGCCCCTACCCCGCAGTCGTCATCGGTGGCCacaaagaagccgcggaagctgcagacGCCAAAAACCGCGGCCGTAGTGGtcaccgtgtcgccggaggcggctgaaGGCGGGCTGTCGTACGCGGCCCTCTTCAAAAGGGCGCGGGCTAGTCTCGCCTCCTTCGGGACGACCGGCGTTagattgcgcctcgcccagacgggagctcgagttctcgagttccccggggctgaaggcgcaaagtcggcagaCGAGTTTGCCGAGAAGCTCAGAGGGATGTTTGCGGAAACGGATGGTGTtaggatcgccaggcctacgaagtgcgccgaattgcgcatctcgggcctggacgattccgtGACGGCTGAGGATGTCCGCGATGCAGTTCAGGAGAAGACGAACTGCAGCGCGGAAAACattaagGGACCTGCGGACCCCTCGGTTGGGCAGAAATTTACGCTTGCCCGGGTATTAGGGGATCTCTGCCCGGGTGGACCTTTTAGTTCTCCCCTACTCGTGGGTCTAGTTATGGATATTGAAATTTGTAAAaccttaaataaaaatgatgatgGGCCAATTTTGGCGGAGTCGAAGATGGAGACGGGAGAGCCGTCTGCCGGAAGTGGCAGCGAGAGCCGTGGAAGCTCGCGCGCCTCCTCCAAATTTTGGAGGAAGCGCTCGCGTGGGAAGAACGCAAATCCCTCTTCAAGCGAAGAGGAGATGTCGGCAGCGAAGATACCGACAGTAGGAAGAGGTGGTCGCGCAGTGGTGGGTGAAGCATCCGCTAGTCTGCCACAGCGCGATCAAAGGGGTCGTTTTTTGCGGCCTTCTACGCCGATTCCGGCGGTCCGCCTGGTCCGCCTAGATCGGTCCGAGGTGGAAAGCGACGACTCGTCGATCGCTGACCTAAACGCAGATTCCGCTGCGTCCCCGCTATTGCTAGGCAGCAATAAAGCGGAGGTAAACGCTGCAAAGCGGGCGCAGCGGAAGGCGGTTGCGTCGGACGAGGTGGGCGAGATGGCTCGTCAGGCTCGAGAGCTGCGGGCTGCTCGGTCAGCTGCTGGGGAGGAGGTGTCAGCGGTGGCACTCAGCCGCCAGGTCTTGGACGGCGTGGACGTGGTCCTGAAAGTTGCCACTAAATCGGGCAGCTTGAAGGGCACGTTCACGCGTGCTCTGAAGGAGGCGGCTGAGGGTATAAAGGAGGCAGTTGAGGTCCTCCTTAAGAGAACGAGCTCTGAGGAGACGGCCAAGCTATGGGAGGAGAACGGCCGTCTCCGAGCTGAGCTGGAGGACCTCAAAAGGGAGGTTGCTGCACAGAAGTGTGCGGCACCTGCAGTTGCTGGCTCCCCGGCGGTTGCTGTGGCGCCGCCGTCGGCCCCTGCCCCTGCACCTGCGGATGCGGAGATTGAGAAAATCGTCCGCATCTGCATGCAGCAGTGTGGGGGCATGATGAATGCCCGCCTGGAGGCCTTAGAAACGAGGCTCCTCCCGGCCCCAAGCCTCCGGCCTCCGTTAGCGGCCGACAGAAGGAGAAAGGAGGAGGAGGCTGCAAAATCGGGGCCGTCAACCGTGGCGGCCAAAAAGCCCGCGAAGGGTGTGTCAGTCCCACCTGCCAGTTCATCTGCAGCCCAGGCAACCGCGCCTCCGGCGACCGCTCCTACGACGACTGCTCCTCCGGCAACTGCGCCCGGCTTCACCGCAGAGGCTTGGACGACGGTCGTCAAAAGGGGCGGAAAAAAGAAGAAGGTGGCGCCGCCGACACCTACGCCCGAGAAGAAGACGAAGAAGCGGAGGACCCGGAAGAGTAGGGCCTCTCGTTCCGCGGCTGTAGTAATCACACTGCAGCCCGGAGCCATCGAGAGGGGCCTTACTTATAAGGAGGTCCTCTCGCAGGCAAAGGCCAAAGTCGCGTTCCCCGATCTTGGCACACCAACCGGCTTCAGGATGAAGTCGGCGATGACGGGGGCGCGGCTGTTTGAGGTGGCGGGTCCGGACGGCAGGGAGAAGGCGGACATCCTGGCCGCCAAATTGAGGGAGGTCCTCAAAGAGGAGGACGTTCGGGTGTCCAGGCCCGTCAAGACCGCAGAATTGTGTGTCGATGGGCTGGATGACTCGACGACTCCGGAGGAggtcgtggcggccatcgctcGAAGCGGTGGATGCCTGCCGGGTGACGTGCGGGCTGGCGAGATTCGCGCCAACGCCGCCGGGCTGGGCACCATTTGGCTCAAGTGCCCGGCTGCGGTGGCAAATAAGATAGCCGACAGCGGGCGGCTTTTGGTGGGGTGGGTTGCAGCACGGGTGAAGCTGCTGCAGCCCAGGGCTATGCGGTGCTACCGATGCCTTGAGGTTGGGCACGTCGGGGCGCGGTGCACCGCAACAACTGACCGTAGCGGCCAATGTTACCGCTGCGGTAAGCCCGGCCACAGAGCGGCCCAGTGCTCCGCGAAGCCAAACTGCAGCCTCTGTACAGCTGCAGGGAGACCCGCGGAGCACAGCATGGGCGGAAAGGCCTGTGGCGCCCCCGcccagaagaagaagaaaaataatgaGAGGAGGGAGCCAACCAGAGCTGCCCCTCAGCCTGGTGGTTCTTCGGCCGACTCCCGGCCCAAGGTTGTGGAGGAAATGGATTGTGTTTAA
Protein Sequence: MERMRSRSAVSVTGGGSSARTDALEPMDVEEYRKRGRPTGCESDIAQAMLPPKVASSQRERSLTPVPAPSGSPFCRAESYRRTRADGEFQAEEEIADLLLKIKEPTVGDSVPQTPSSMQERADAAVAIIHKVATKSVNLKGPFVRALKDSSSALAGVVESLAGDVARLEAANGRLTEQVAGLSAQFAVFRAECSEREAPVPSASQPALAPSTCRPAPSASRPAPSEPPPPPALRRAPSVSQPAPCTSQSAPAVPGVSDDVLQQMLQQILVSVGNLVDGRLAGLEERLLPAPILRPPLAAPKTRVTSAPASLPVVGGRVSYAAATSVPGTAFTRKTQQRAKAAAKTAAPQPTPKTVATSGAEFPPLPTPTPLPGPSTSAPSDEGWQVVGGAKLSKKAKKRAKKAAQKAASGPQSSSVARTTPKKPRKLQPPKTAAVVVTVSPEAASGGLSYAAVFKTARDCLAPDFGAAGVRLRLAQTGARILEFPGADGAKTADTFAERLREVFSNTDGVKVARPTKCAELRISGLDDSVTVDDVRVAIREKTKCNADNIRVGTIRPGPGGLGAVWVSCPVASAKVLDDAGRLLIGFVSARITVLAARPMRCFKCLAAGHTRVKSSHSSDGAGGSSNASALESMDLDASDSRKRVRSNDGGSDTREMLPPKIPSSQRGRSRTPVSAPSGSAFSKAESYRRARTDGETQAEEEISGLLLKIGEPVDGDSVPQTPASLQERAQAAVAIINKVATKSVNLKGSFVRALKDSSSTLGGVVQSLIGDVARLRAANDRLTGQVAELSAQFAQFRAERPEREASAPAPSASRLAPSASRPDRSASRPAPSASRPAQSASQPAPTVPGVSEDLVQQILIAVGNLVDGRLAGLEARLPPAPVVRPPLGAQRKTVASAPTPLPVVGGRVTYAAAATSKPAPAAAHKQRQDAKAGTAAPKPGPKSKNTARAGAEFPPLPTPTPVPGPSTAAPSNEAWQEVGGSKKSRRRARKAAEKAAPTPQSPPVASAAAKKPRKLQPPKTAAVVVTVSPEAAEGGLSYAALFKRARASLASFGTTGVRLRLAQTGARVLEFPGAEGAKSADEFAEKLRGMFAETDGVRIARPTKCAELRISGLDDSVTAEDVRVAVQEKTNCSAENIKVGTIRPGPGGLGAVWLSCPIAAAKVLGDAGRLLVGFVSARTTVLAARPMRSSHSSDGAGGRSNADALESMDLDLSDSRKRVRSNDGGSDTTEMLPPKIASSHRGRSRTPVSAPSGSAFCKAESYRRVRADGETQAEEEISGLLLQIGEPVDGDSVPQTPASLQERAQAAVAIINKVATKSVNLKGSFVRALKDSSSTLGGVVQSLIGDVARLQAANDRLTGQVAELSAQFAQFRAERPEREASAPAPPASRAAPSTSRAAPSAPRPAPSASRAAPSASRPVPSASQPAPSPSQLAPTVPGVSEDLVQQILIAVGNLVDGRLAGLEARLPPAPIVRPPLGAQRKTVTSAPTPLPVVGGRVTYAAATSAPAPVAAQKPRQGPKARTPAPKPGQPSKTTTRAGAEFPPLPTPTPVPGPSTAAPSNEAWQEVGGSKKSRRRARKAAEKAAPTPQSSSVATKKPRKLQTPKTAAVVVTVSPEAAEGGLSYAALFKRARASLASFGTTGVRLRLAQTGARVLEFPGAEGAKSADEFAEKLRGMFAETDGVRIARPTKCAELRISGLDDSVTAEDVRDAVQEKTNCSAENIKGPADPSVGQKFTLARVLGDLCPGGPFSSPLLVGLVMDIEICKTLNKNDDGPILAESKMETGEPSAGSGSESRGSSRASSKFWRKRSRGKNANPSSSEEEMSAAKIPTVGRGGRAVVGEASASLPQRDQRGRFLRPSTPIPAVRLVRLDRSEVESDDSSIADLNADSAASPLLLGSNKAEVNAAKRAQRKAVASDEVGEMARQARELRAARSAAGEEVSAVALSRQVLDGVDVVLKVATKSGSLKGTFTRALKEAAEGIKEAVEVLLKRTSSEETAKLWEENGRLRAELEDLKREVAAQKCAAPAVAGSPAVAVAPPSAPAPAPADAEIEKIVRICMQQCGGMMNARLEALETRLLPAPSLRPPLAADRRRKEEEAAKSGPSTVAAKKPAKGVSVPPASSSAAQATAPPATAPTTTAPPATAPGFTAEAWTTVVKRGGKKKKVAPPTPTPEKKTKKRRTRKSRASRSAAVVITLQPGAIERGLTYKEVLSQAKAKVAFPDLGTPTGFRMKSAMTGARLFEVAGPDGREKADILAAKLREVLKEEDVRVSRPVKTAELCVDGLDDSTTPEEVVAAIARSGGCLPGDVRAGEIRANAAGLGTIWLKCPAAVANKIADSGRLLVGWVAARVKLLQPRAMRCYRCLEVGHVGARCTATTDRSGQCYRCGKPGHRAAQCSAKPNCSLCTAAGRPAEHSMGGKACGAPAQKKKKNNERREPTRAAPQPGGSSADSRPKVVEEMDCV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -