Basic Information

Insect: Locusta migratoria
Gene Symbol: DNAH3_1
Assembly: GCA_026315105.1
Location: scaffold27612:771360-781461[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 8.2e-05 0.1 12.9 8.9 2 45 145 188 144 196 0.91

2 9 1.1e-06 0.0014 18.8 11.0 2 55 287 340 286 345 0.91

3 9 4.5 5.6e+03 -2.3 0.1 11 34 477 500 474 502 0.88

4 9 1.8 2.3e+03 -1.1 1.4 2 27 750 775 740 786 0.61

5 9 0.42 5.3e+02 1.0 3.2 17 35 1153 1171 1149 1175 0.88

6 9 2.8 3.5e+03 -1.6 1.3 3 30 1238 1265 1236 1276 0.83

7 9 0.91 1.1e+03 -0.1 1.7 39 54 1396 1411 1383 1424 0.65

8 9 0.88 1.1e+03 -0.1 0.3 5 39 1423 1457 1418 1460 0.84

9 9 7.5e-08 9.4e-05 22.6 6.8 2 59 1830 1887 1829 1892 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	8.2e-05	0.1	12.9	8.9	2	45	145	188	144	196	0.91
2	9	1.1e-06	0.0014	18.8	11.0	2	55	287	340	286	345	0.91
3	9	4.5	5.6e+03	-2.3	0.1	11	34	477	500	474	502	0.88
4	9	1.8	2.3e+03	-1.1	1.4	2	27	750	775	740	786	0.61
5	9	0.42	5.3e+02	1.0	3.2	17	35	1153	1171	1149	1175	0.88
6	9	2.8	3.5e+03	-1.6	1.3	3	30	1238	1265	1236	1276	0.83
7	9	0.91	1.1e+03	-0.1	1.7	39	54	1396	1411	1383	1424	0.65
8	9	0.88	1.1e+03	-0.1	0.3	5	39	1423	1457	1418	1460	0.84
9	9	7.5e-08	9.4e-05	22.6	6.8	2	59	1830	1887	1829	1892	0.93

Sequence Information

Coding Sequence: ATGAATGTCCCGGGTCGGTGCCTGCCGCGGCAGTACTGGCCCGTTTCGGAGAAGCCTTTGGGGAAGGCGGACGCACCCGTCGACGTCCCGGTCGGACACTACCGGGCACCGGAGCTGACACGTCTGCGGCGCGACCGCACGCCGAATGCGACGGAGCCGCGGGGTACGTTCGTGCCCCCACCTGTCGATTGGGTGTCGGGGACCGCATCTGTCGCTACGGGCGGTTGCCGTGAGCTGCCAGCAGATTACCTACCGCACCACTGTAGTGACGACATCTGGGTGCCGGACACTGGTAACGTTTCGGCTGCGGCTCCAAGACAGCTGCCCGAGGCCATCTCCGCCGCGGACATTATCGACGACGAACTCCTCGTGTCACTGTCGCCGAACCAGCTGTACGAGAAGCTGGAGGGCTATCCCAAAGAGGAGGTATTGCGCCTGAGACAGAAGAGGCGTGCTCTGAAAAACCGTTTCTATACGCAGAACTCCCGTACCAGACGGATACGACTCCGCCACGAACTGGAAGCTACCAACCGCACACTCGTCGCCGAGCTACTGCGCCTCAAGTGCCATCTGGCACGTGTCGCGAATCCCGACCTGGACCTCCTACCCGACTGCACGGCAGATAACGCGATATCTCCACGGGACGTAAGTGATCTGTGTGCCGCCAGCTGCGTATCGGGAACCACGGCCGACACGGACGAATCCTGCGAGGAGCCGTGCGAGCTCGTGCCGCAGTCGGAGTACGCCGCGTCGGGTGCCTCCTCCGGCGAAGTAGTCCTCAGTGACGAAACTATCGTGTTACTTTCGGCGAGTGAGTTCAGGCAGAAATTACTCTGCTATTCCAGTGAAGAGAGGGTTCAGCTCAGGCGCAGGCGGCGCATGCTGAAAAACCGTCTCTACGCAAAGACGTCTCGTGTCAAACGTCGGCGGCAGTGTCAGGTACTGGACGACACCAACCGCATGCTGGTCGCAAAGTTGCAGCACCTCAAGCTGCAGCTGGCACGCATCACGCAGGAGTGTGACTTGGCCCTGCGTCACGACTGCAATACTGACGGTGTGACGAAGGTGGGAGGCACGTCTGTTACGACTGACACCGGCCCGATGCCGGGTGCGAAGGTGGTAGTCGAGTGCCCGAAGTTGCAGGCCGAGTACGTGTCGCACCGCCACCTCGGTGAGCGGCGAGCACCGCTACGGCCGATACGCACCGACTCTGTGTCACCCGCTACCTGTGACGGCGTCTGCACTCTGCGAGACCACCGTGACCCGGCCCCCTCGCACCTGCAGAAAACTGTGCCCGAAGTCTCCACCGATGACAGTACACTTGTCGACAGCGCTCTCGAGTTGCTGTCGGCAGACGAGGGTGACGGAGTGCCCGAGAACTGTCTGAGTGATGAGGTGGTGCGTCTCGACCTGCGGCAGCATGACTCGAAAAACTGTACCTATACAAGAAACGCACGCAATAAGCCCCGACCACGTGCCGGAGAGGTCGAGATGCGGGTGTCTTCAAAGTCTGTCGACACCGGTAACGTCTCGGCTGAGACGGGCCTTATTAGATGGCAGCAGCTGCCGCCTCACCTAGAGGTGACGTTATCGAAGGCACAGAAAGCCACATCTTCAGTCACCGACAAAAATGGCCTCGATTTGCTGTCTGTTTGTGAGGGCAGCCGGAAGACGAACAGTGACCGACGTGGGAAGGTGGTTCACCTCAAACGGAGACAGTCGGTGTTCAATAATTGTGGCTGCACGCAGCTCGAGGTGGACAGTGAGAAACGGGAGCCCGGGCGGCCACTCGGCACCGGTCCCGTCTCGCCCGCTCTCCTGCTCGCGCCCTCTCTGCCTCGGTACACCGCACATGGTGTCACTACCGACAGGGTAACCGTCGACACCGGTGTCCTCGTGCCGCTTTCAGTGTCTGGACTCGATAAGAAGCCACAAAGCTTTTCACTTGTGGAGGCGGCACATCTCGAGCAGAAAATGCGGTCGTTCGAGGACTGCAGTATCGTCGGCAGCGAGAGCTGTCGGGGACCGGAGATCGACAGGGAGGAGGTGACAGCTGTGCGTTCCTTGGACTCTGGTTGTCGTGCACCTGTGGAGAACTGCCACCCGCCACACGACATGCAGCTGCCGGCCCCACAGAACGACACCGAGGAAGTCCTCAGTGACCGCAGTCTCGTGTCGCTGCCGATGTCCGAGCTCTGTGAGAAGCTCGCGGGCTACTCTCCGGAGGAGGTGGCACGTCTGAAGAGGAGGCGTAAGGCCCTCCAGCACCGCAGGCACTGGAAATCCTCCGGAGAGAGATGTACGCAACAGCAGCGGGAGCTCGAGGTGCAGCTCGGCCAGGTGCAGAATCTGGTGCATTTGTTGGGTCACCTGACGAGTAAGGAACGGGTGCCGCCGCCTCGTGCCGAGAAGAGTGACGGCTCCGCGTGCGACAAGACGGTGCGCCTCGATCTGCGGTCCCGCACGCCGAAGAACTGCGACGACCCGATATGCCGCCGCAGACCGGGGCGACTGAGCGGGCGGCTCGAGGTCGACACTGGGGGTCTGCCTCCCTTACGGCTGACGTACGCGGGCTCCGTCTCGCTGCGTCGGTTCGGACCTCGGCAGCTCCGTAACGGTCTGTCTCCTCCGCTGCCACGTAACGCCACATCCGCATCTTCCACTGCGTTGGCTTTGTCCTCTGCATCCGCCACTTATACTTCCTCTTCCACAGACGACTTTGTCGCAGATGACACGCCGTCTTTACAATTGAAATGTGAGATTGTCAAAGAGGAGAACATCTTTCCACCAGAGGAAATTGAGTCACCCCAGAACTGCTACGACACACAGAACAGTGTCGACGAGCGGCTGCGACAGCACGAGGAGGACGACGTAGAGAGAGAGAACGGGATTCCGCAGCAAAAGCTGTGTGCCCCACCTGTCTCGTCTGCAGTGCGCCATTCCCAGCAGTCCGCACAGGACTGCAATCTGTCACCACAGGTGCCGTACGACACGTCCACTGCCGCCTGCACCAAAGAAGTCTCCAGTGAGGAGGTTCTCGTGTCCCTGTCTGTGTGTGAGGGAGACGAGACTCCGAATAGTTACCCATGCGACAAAATCGATCGCCCGGAGCAGAAGCCGATTAAACCCGAGGGATCTGTCCACGTGAAAACGACCCACAGCAGTAAGCTGCGACGACACCGGGAGCTCGAGATCGACAGTGGAGCACTGACGTCACTGCAGCCAGTCGACACTGTTACTGTCTCACCCCCACCGTGCCACTCCCGTCGACCTCAGCGGCACCACCTCAGGAGGACGACGTCACGGCGACAGAAGGCTGCATCCGCAGTCTCCACCGCCGAGAATCCATTCGCTCGTCATATGTCGGCGTCTGAGGTCGACGAGAAGCTGGAGAGTTACTGTGAGAAGGTGGGGCACCTCAATCTGAAGCAGCGCAAGTTGGACTGTGCCTACCGGCAAAATGCCCGCAATAGACGGAAGCGGCGGAGGCGGGAGCTCGAAGTTGACAGTGAGGAGCGGGTGTCATTAAAGCCTGTTGGTGTCGGTTCTGTCCCACCTACAACGGGCCATCCCAACCGTCCACATCGGCGGCAGCAGCACAAGGAAGTGTCATCGGGGCTACAGAAGGGCGCCTCTGAAGACGTCATCGAAGACGATCCCCTCGTTTCACTGTCCGAATACGAGAGTAACCAGAAGTGCAAGGTGGAGCACCTTAAAGAGAGGCGGCACAAGGTGAACAATCGTAGATATACGCGAAACACCCGTAGCAAACAGCTGCGGCAGCACTGGGAGCTCGGGGTCGACAGTGAGAAATGTGTGCCGGAGCAGCCACTTGCCACTGATTCTCTCTCACCTGCCGTCGACGATAATGTCCTAGCAAAGTCTGAGCCCGATAAGGAGCTGCAAACCTATCCACCTGAGGAGGTGATACACATTCGGCAGGAAAGGTGTACAGTCGAGGACCGCAACATTGTCGACGAGAGATCCGAGGTCAACCCAGACAACAACTCCGGTGCACCTTTGGAAAACCACCACCAGCCGAAACGACAGCATCGGGAGCTGCAGCTGCCGGGGCCACAGAAATCCACTTCTGCCTCTTCCTCCAATGAGGACATCATCAATGACGACACACTCGTGTCGATGCCGATGTCTGAGCTCGTACAGAAACTCGAGGGTTACCCTCCGGAGGAGGTGGCTCGTCTAAAGAAGAAGCGGGAAGCGCTCAAGAAACGCATCTACCGGAGGTCTCTCCGGCAGAAACGGATGCAACAGTACAGAGACATCCAGAACCGCAGCTACTCAAACTTCTCATTCAAAAATAGGGTGCAACAGCCAAAAGAGCTAGAGGCGGAGCTCAGTCAGATGCAGGAAATGACACATTTACCTCGTGACCCGAACAGGGAAGCATCAGCAGTGAAGGGTGTACAGTCACGTTCTACCTCTCCTGCAGTGCATCGGGACGACGTGGTACGGCAACAACACGAACACTGCGAGCTGCCACCGTCGCGACTGCCAAATTTGACACAGACTGCCGACATTCCCGAGTCACTGTCGACGTGTGAGTTCGACGACAAGCTACGCGGCAACCCCCGCGTCGAAATTGTACGCCTCGAACGACAGTCGAAGATTTCTGACTACACTAACTGCCGCAGCAAATGGATTCGACGACACAGGCGACCTGAGGTCGACAGTGAGGAGCCGGTTCCGGCACGGACACCGGATGTCGGCTCCCTCTCATCCGTACCGCAACACCGTTGTCGGCCTCGGAACGTATGTCATGAGCTGGCACCTCCGTTACTGCAGCACGCTACATCCGCGGCATCTGCCGACCACAGTTCGTCTGTTACGGACCTCGTCATCGAAGAGAGATCTCAGTCGTCGCAGTCAAAGTGTCAGCTCATAACGGAGGCGTGCAGCTACCCACCTGAGGAGGGTGTGCAGAATGTGCCCCCAAACCGCAACTGCACGCAGGACTTCCCCGGCAGACGGCTGCGACACGACGACGAAGTCGAGGCCGACGCGCGGGACGAGACTTTGCGGCAGCTGCTACGTACCCCACCCGTCTTTTCTACGGTCCACCACCGTCACTCGGCGCCGAGGCGGCAGTGCGAGACGGTGTCTCGGCCGTTGTACTCGGCATCCGTCGCCGCCTCCACCGGGAAAGTCCTCGGCGCTGACGACCGCGCCTCGCCGGCGCGACGCGAACTCGACGAGAAGCTGAGGGGCCGCCCGCCTGAGGAGGCGGTGCGCCTAAAACTCAAGTTGCACGTGCTACGCAATAGCGGCCACATTCCGGAGAGCGGCGGCGACGGTCCGAGTCCGACGGGGCCGCCGCGCGTCCTGCCGGGTCGTGCTTCGGGACGGCCGTCGTCGGCCTCGTCTGCCGCCCCTTCTGTAGAGGACCTTCCGGATGACCGCGATCTCGTGTCGCTGCCGATACGTGAACTCAACAGCAAACTCAGAGCCCTCCCCGTCGAGGAGGCGGCACGTCTGAGGCACAAGCGTCGCACTCTCAAGAACCGCAGTTACGCCAGAGTTTGCCGCAACAAGCGGTTGGGGCTGCTACAGTCTATCGAGGCCGCCAACGTCTCGCTCGGCGCCAGACTGCAGCACCTCAGAGCGGACTTGGCGCGCGTAACGCGAGAGCGCGACGTGTTCAGGGAGTGCCTCGCGCGTCAGCTGTTGCTCCCTGTTCCTGAAGCGCAGCCGCCAGAGGACGGCACTTCGGTCGCCTCGCCGCCCCCTGCCGATACCGACACCGGTCTGTGA
Protein Sequence: FGNDYGEEYQDGIFWKMALISVEVEPVLGTSELRFSPTLEHLRTIIHSIFSKIIDVNSHIPRLETVVFREMSNKEMYLKPVYEEEDRVQQILLKALSSYDKNTVGPQKYLVTYEPYMHLLNGEANQDLKTFFKSDPFPTLKDFTKKIESYEKVRQSSIYLRRNVLLNMILLDCNKINDTLYKQVDDLRTFIVDYHANKNRTHNKGICAVFDEMSDRVREMPKTTAELVELNNYIVECRDVTMFNLKEQIRISAENVLFLMDHAILSVDDIDLNGRVFLWPDDMESVLELSMTRLAHRREEVETALRAKTAELEAKLLLHAKDLEVFKKKDPPILTMEEMAESVEQVEALVALLKEDKEEADAINAEEELLEIVLSPFTVLQQMLSVTDPLDKLWHTALEFHELYEKWYYGPFLPLDADAITEQVDEMWRLLYKLAKTLYDLRGAKRVAEMVRAKVEKFKQFLPVLSTICNKGIRERHWKQMSEIVGIPLRPTEENSLSDMIDVGLLKHVEKLEEIGVAATKEFALENNLQKMKEEWDDIEFECIPYRETGVTILSAVDDIQVMLDDHILKAQTMRGSPYVKPFEEDMQKWEAKLISMQDILDAWLQCQATWLYLEPIFSSEDIMRQMPEEARKFKKVDKTWRAIMANTLLDKHVLIATDFPDMLSLLRENNQLLDEIQKGLNDYLEQKRLYFARFFFLSNDELLEILSETKDPLRVQPHLKKCFEGISSLQFTPEEEVVGMISAEKEVVPLSGVIIPSEAKGMVEKWLIQVQILMIQSLKDITMQAVLAYTSTPRSSWVLNWPGQIVICGSCIHWTTEVSAAIQNGKLRDYKLKSDRQIEEMVGVVRGKLKPGARVTICALIVIDVHARDTVSQLEKSKVSSLQDFNWISQLRYYWREGTVYVSMITTEVEYGFEYLGNTPRLVITPLTDRCYRTLMGALKLNLGGAPEGPAGTGKTETTKDLAKAVAKQCVVFNCSDGLDYKAMGKFFKGLAQAGAWACFDEFNRIELEVLSVVAQQIHSIQMAITQKVERFMFEGSELSLDPTCSIFITMNPGYAGRQELPDNLKVLFRTVAMMVPDYAMIGEISLYSTGFVDARSLAEKIVHTYKLCSEQLSSQHHYDYGMRAVKTVLTAAGNLKLKYTTQDEAVLVLRAIVDVNLPKFLAQDVPLFQGIVSDLFPGVDLPKPDRDELIEVLKTNLAKRNLQSTDWYMEKIIQIYEMILVRHGLMIVGEPMGGKTCAYQTLAESLTDIANNRKSVMEEYRAHYRIINPKAITMGQLYGCFDPVSHEWSDGVLANTFREFASGTTPDRKWIMFDGPVDAVWIENMNTVLDDNKKLCLMSGEIIQMTNKMNLIFEPADLEQASPATVSRCGMIYLEPHQLGWRALLASYKNILREKLLDVQLELLDELIEWLVPPILSFLHESCQLFIETSELHLFHSFSRLFSSLLEGEQKVSTQWLQCIFLFSLVWGFASTLKGSSRAAFDSFYRNLLYGSNQENPKPKSFKLTRQQLFPEREMVFEWVYDKKNNGSWVLWIETVEKVQLSPTAKPGDMIIETSEMACQLFFLKLYLSKKLPMMVVGPTGTGKSAVILNHLVALPKDKFLANVVNFSARTTAGQTQDIVMSKLDRRRKGVYGPSMGKKCVLFVDDLGMPQKEIYGAQPPIELLRQWIDHRHWYDLKDTTKLELVDILFVGAMGPPGGGSNEITGRFVRHLMLISIDSFPDNTLTKIFGAIIDWHFSKGFDSNVTRFGKSLVEATIEVYHQATTNFLPTPTKSHYTFNLRDFSRVIRGVLLVPSSHMSESDKLMRLWIHETYRVFYDRLVDTDDRKKLFVIVRNSLYNNFRQHMHQVCASLIPEEENDLTDEHLRNLFFGNYMEPDADPKIYDEVKDLQLLTKKMVYYLEQYNLMSQTPMPLVLFKFAIEHISRVSRVLQQDSGHLLLVGVGGSGRRSVARLAASMADFVLFQIEISRLYGISEWKDDLRELMRKAGALRKPTVFLLCDSQIKDESFLEDVSMLLNTGDVPNLYSAEDKAEILEIMQNVCRQIGRKGEMTPLALYNLFIESVRANLHVALAMSPIGDAFRNRLRMFPSLINCCTIDWFTAWPEDALEKVAKMFLKQMNLEKEIQSACVIMCKHFHTSVTDTSVRYFESLRRRNYVTPTSYLELILTFKSLYQVKMDQITLQRNRYEVGLEQLDFAAGQISVMQEELHALQPQLIETSEKTEKLMVKIEQDTVIVEAKKETVGADEALANEAAAVAQSIKDDCESELSQAIPALEAALNALDTLKPADITIVKSMKNPPAGVKLVMEAVCIMKGAKPERKPDPSGSGRLIEDYWGPSLKLLADLKFLDSLKAYDKDDISPAIMKRIREKFIPNKDFNPNIIKKISTACEGLCKWVRAMEVYDRVIKIVAPKKAKLAEAEAELAVQMDKLNEKRAQLKEVTDKLQALNDEFTAMAKKKKELEDSIELCSQKLDRAENLIGGLGGEKTRWSDTAKYLNSLLSNVVGDVLLSAGTVAYLGPFTVDFRQELTAEWNKACTELGIPCSQNFTLIATLGEPVVIRAWNIAGLPVDNFSVDNGIIISKARRWPLMIDPQSQANKWVKNMERANGLRVIKFSDSNYMRVLESAIQLGSPVILENIGEDLDPSIEPILLKQVYREGGLDWLKLGENVVEYNWDFRFYITTRLRNPHYLPEVAVKVTLLNFMITPQGLQDQLLGIVVAKEKPVLEEKKNELIIESANNKKQLKETEDKILEVLSSEGNILEDETARQILSSSKALSEEIQAKEKVAAATEAEIDTARNQYVPVSKHSSVLFFSISELANIDPMYQYSLVWFLNLYVQSIVNSVPSDNLEIRIENLNSYFTNSIYKNVCRSLFEKDKLIFSLVLCIGILRAK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -