Basic Information

Insect: Thyatira batis
Gene Symbol: -
Assembly: GCA_905147785.1
Location: LR990486.1:98372-140894[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.00046 0.5 10.9 2.3 30 61 205 236 200 238 0.87

2 5 0.00027 0.29 11.6 0.9 27 61 764 798 760 800 0.91

3 5 0.041 45 4.6 1.4 32 60 1190 1218 1169 1222 0.82

4 5 0.0047 5.1 7.6 0.4 33 57 1560 1584 1537 1592 0.63

5 5 0.0025 2.8 8.5 1.7 30 61 2001 2032 1994 2035 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.00046	0.5	10.9	2.3	30	61	205	236	200	238	0.87
2	5	0.00027	0.29	11.6	0.9	27	61	764	798	760	800	0.91
3	5	0.041	45	4.6	1.4	32	60	1190	1218	1169	1222	0.82
4	5	0.0047	5.1	7.6	0.4	33	57	1560	1584	1537	1592	0.63
5	5	0.0025	2.8	8.5	1.7	30	61	2001	2032	1994	2035	0.87

Sequence Information

Coding Sequence: ATGGAAGAGGTACCGGACGTAGAAACAGTAGGAGCTAACCAGGACAGGAGAGAGACGAGGAGTTGGCGCAATATTGCGGCTTCTCCTTTTATGAAGGAGTTGCGTGTGTCCGTGTCACGGCTATCTGACACGGACTCGGAGTGTAGCTCCGTGTCAATTGGCACGGCAGTAAGCCGACACTGGAGAAAAAGGAGTTTCTCGGATGATGACCCGGAGATGTCAGAGCCGCCAAAAGGGGCGGCTCACAAATCTAAACGAGGCAGAGGCCGACCGCCCACCACGGGCGAGTTCGTCGGTCTGGCGGAGGCAAAGGCGCAATTGAATGCTGCCAAGGCAGAGGAGCTGCGCCTCGAGGCGGAGGCGAGTGTCGCCGAAATGTCCAAGTCCCTCCGGGACAGCAGACACTCGTGCCGGAGTGCGCTCAACCCGCCGACCGACAACGAAGACACAGCGCAATCATTGGCTGCGCTGTACCAACTGATGGTTGACGCGGCTGCCACGGTAGAGGGGGTGGCAGTCCGCTCCAAAAATTTGAAGGGGACGTCTGTGAAGGCCCTCAAAGACGCAGCGGGCCTGGTTAAGGAGGCCGCTGCGGGAATGAGGGCCCGAACAATTAATGAGGAAGTGGCAAAGCTGGAGCAGGCGAACCGTCAGCTGACAGCTAAGCTGGCGGAGCTCAGCCGAGAGGTGGCAGAGCTGCGGCGCCAACCAGCCGTACCAGCCGCACCAGCTGCGCCAACCATGCCAGACACGAGCTCCATTAAAGAGCTTTTAGAAGAGGCGACCAGGGCAAGCATCGCACAATTTAGTGCGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGCCGCGGCTGAGGCACCACCACCGCCACAAGCATGGGGGCCACGACCACCAGCGGCCCCTCCCGCTCCGCCTGCCCCCCCTGTAGCCTCAAAGGGCAAAGGGAAGGGCAAGATGTCCATGGCGGCAAAAGAAGCGCGCGCAAATCTCCGGGATAGTGAGTTCCCGGAGCTTCCTGCCCCGGCACCGCCACCACCGCCGACGGCCAATAGGCCAAATAAGAAGAAGGCTGGGCAGCAACCCAAGCCGCAGGCCGCCAAAGACAACTGGCAGAGAGCCTGCTCGCATCCCGTCGCAGGCGCGCCGGCTACCGTCGCCGGCGCGACAATATGCGACCGCCCTAGAAGTGGCCTGCGGGTGATGGGTAGGGCAACCCATCACCCGCGCAGACACAGGCCCAAGAAGGAGACGGACGCGCCTTGTCCGACGCGTCCGTCCAGACGGAGCTCGCATCCCGTCGCAGGCGCGCCGGTTACCGTCGCCGGCGCGACAATATGCGACCGCCCTAGAAGTGGCCTGCGGGTGATGGGTAGGGCAACCCACCACCCGCGCAGACACAGGCCCAAGAAGGAGACGGACGCGCCTTGTCCGACGCGCGTGCCACGTCCGACGGTGGAGGAAGGTGCGCGCAGCGCACAGGAGTCTGGCACAGGCGTGCCACTCCGTAGGTCGTCGCGTGTGGGCACAGGCGTGCCACACGCGACAGTGGAAGAGGGAGCAGGGGTCGGCGCAGTCGCGCCACTCCTCCAAAGGAGGTTGTCGAACGTGGGCACAGGCGTGCCACGTTCTTCGTCGGGTGAGGAGGCGTCGGGCGTGGGCACAGGCGTGCCATGCCTGATGCGGGAGGTGCGGGTGATGGTCACCCGCCTGTCGGAGTCTGACTCCGACTGCAGCAGCCTGGTGTCGGTGACACCACCCGCAACTCCAATGGAGGAAGATGTTCTCGGTCGGTCGTGGCGAAAGCGATCGGCCGAGGACGGAGAGGAGGAAGTGCTTTGTGGGCTAGCCAAAGGGGTAGCCCACAAAACTAAGCGCGGGCGAAGCCGCCCGACCACAAACGCAGAGTGTGCGGGTCTGACGGAGGCCAGGGCGCAGCTGTCCGCCGCTAAGGCGGAGCAGCTGCTCCTCGATGCCGAGGAGAGCGTGGCGGCGAGGTCGAGAGCCTTGAAGGAGTCTCGACACAATTGCCGCCGCGCTCTGAATCCGCCGACGAGGGGGGAGGACACAGCGCAGTCTTTGGCTGCGCTGTTCGGCCTCATGGTGGACGCCGCGGCCACGGTGGAGCACGTGGCCGCGACGTCCAAGAACCTGAAGGGCACCTCGGTGCGGACCCTTAGGGATGCGGCCGGCCTCGTCAAGGAGGCCGCAGCCAGCATGAGGGTCCGTACCATCACGGAGGAGGTCGCCCACTTGGAGGCCGCCAACCGGCAGTTGTCCGCCAAATTGGCGGACCTGAGCCGGGAAGTGGCTGAGCTCCGGCAGCAGCAGCCGGCACCGGCTGCCACCCCTGATGCCTCCATCAAGGCTCTCTTGGAGGAGACCTCGCGGGCAAGCGTCGCGCAGTTCAGCGCGATGCTGAACGCGAGGTTCGACGGCATCAGGGATCGCCTGCTGCCGGAGCCGATCCTTCGGCCGCCACTAGCGGCCGATAAAAGGAGGGCGGAGGCTGCGGCAACGTCATCGCCGCAGCCGTCGGGTTCGGGGACCCAAAAGGTCCCCCCAAAGCCCACCGTGGTTGCCGGGCCAGCGCCGAAGTCCAAGCCAGCCCCAGCCCCCCCCACTGCCCAGCCCCAACCCACCTCGGGTAAGGGCAAAGGCAAGGGGAAAGGCAAGGGCAAGAGCAAGGCGGTGGCCTCGGAGCCGGCACCCCTGCGGGAGCCGAGCCCGATCCGGCCCGCCCCTCCACCACCTCCGCTTACGGAGGGGCTCGCGGGGCGAGCGGAGGAGAGAGTCAGAGATGTTGGAGGTGGAGACGTGGGAGTCGGAGAGGGAGAGCAGGTCGCTCTCGAGAAGTTGCGAAGGAGCGCAAGGCAGGGACGGAAGAACTTGTCCCCATTCCTGGAGCCGCGGGTCGTGTTGACCCGTACGGATCTGACAAGCTCCAGAGCTGAGTCACCGATGGAGGCGGAATCAGGAGGTGCAGCGGGAGTAGCTGCTGACGTTGTGGTGGTTGACGACGGCGACATGGTCGTGGAGGAACCTGTAGAGATATGTTCCAGGTTCTTCGGTGGCAGGAAGCGGTCTCGCTCCAGGAGCCATTCCGACTCCGAGAGTGGGTCAGCATCCGAGGCGGGTGGCCTGAAGAGGTTCGCCAGGGAAAGGCGACCCAGGCTACAGAAGGCGGGAGGGCTGTTGACGCCGAGGTCAGAGGTCGCGGCGTTCAGGCGATCGGAGGCCGAAAAGGTGGCCGAAGAGGAGGTGGCAGCGATGGCGGACCAGCTGCGTCCCGTCGCCGCCAGAGAGGGAGATACCGTGGGTAAGTCCATTTATGAACTACCCGCGGTTGAGATCGTCCAGAGGGCGTTGGACTCCGTGGCAATCGTGCAGAAGGTTGCCGCGAAGTCCAACAACCTCAAAGGGACGTTTAAGAGGGGGCTGCAGGAGTCGGCCTCGGCACTGGCGGAGTTGGTGCAGGAGTTGCAGACCCGCACCTCCGACAGCGAAACCAGGAGGCTGGCCGCGTTGAATGCCAGCCTTATGGCAGAACTGTCGGCGATGCGGAAGGAGGTAGCGCAGCTCCGCACCGACATGCGCACTGCGCTGGAGACGCCGAAGCCGGCGCCTGCGAGGCCGGCCCAGCCGCCACAGGTGAGCGAGACGGTGGGTCTAGGGACACGCCGGGGGGGCAAGAAGAGGCGAACCGGGAAGAGGAAAACCCAACCCGCCTCCAACCCGACTGCCGAAACCGGCGGCCCCCCGAGCAAACCAGGGCCCAAGAAGCCCGAGAAGAAGTCGGCTCCCGCAACAACAACCGCGTGGAGCGTGGTGGCGGCGCGCAAGAAGCTCGGGGAGCGAGCGGAGGCGTCGAGGACGGACGCGGTGGGAGTAGAGAAGGCGTCCAAGATGGACGTGGCGGAGATGGCGGTGGTGCGAAGAAGCACCAGGCTGGGGCTGAGAAATCAGTCCCCAGTCCCGGAACCGCGAGTGGTACTAACGCGTACCACCCTGGCGGGCCCTTCCCAGGGCAAACCAAAAGGTCCTCTTCAGGGCCAACTAAAAGGCCCTTCCCAGTGCCAATCGGAAACTAGTCGCACGGCGTCTGCGTCCAGTTTCTTCTGCGGGGCGGATGACTCAGGAGACTCTGTCAGATTTGAGTCGGACGCGGACTCCGTTGCGACTAGTCGCAAGACAAAGAAGAAGGCCTTCCTAAAATCTGGGTCCGAGGGCTCCTCGGACTCGGCCAGGAGGCCTAAAAAGATCGCCAAGGCCCAAGCCGACACCCACGACGTGGGTCTGGCAGATGCCCAACGCCGGCTTCAGCTGGCTCAGCGGGTGCAGGTCCAGCAGGACCTGGAAGAGCAGGTCGCCGCGAGGGAGCAGCGGGCGCGCACCGCCCGGGCTAAGTCCGGGTACGGCGCGTCCGCCGTCCTCTACGCGGACCACTCCCTGGCCGAGCTGGAGCGGATGGCCCGGGAGGACGAGGAGGAGATTGTGGTAGTCGCCTCCAAGTCCTCCAACCTTAAGGGGACTTTCCAAAAGTCCCTTAAGTCCCGGGCCGCAAGTCTGCGCGGTATCGTCGGTGAGCTGGTGCAGCGCACAGCCACCGACGAGACCCGGCAACTGCAGGCGAGGGTGGATCGCCTGCAGTTGGAAGTGAGCCAGCTTCACGCGAAGCTGGCCGAGATCACGGCCCAGCCGGCCCAAGCTGCGCCGAGACCTGCGGCGGAGGGCCCCTCCTCCCCCAATTTTGAGGACACGCTCCGCAAAATTATCTTGGAGGAGAGGGCCTTCACCAGAGCCTGCATAGCAGGAATAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGGCGCAGCGAGCCGGGGCCGTCCTCCCAGGGGGAGGACACCCTTCTCCCTTCTGCCACCCCGTGCAACGAAAGTTGGGCAACGGTGGTCGGCAAGAAGGGGAAGGCCAAGGCCAAGAAGAAGAGTGCCGTCGCTGCCGACCCAAGCCCTGTCCAACCCGGCCCGTCCAAGACGACGGGTAAAGGGAAGGGCAAGGGGAAGGGAAAGAAGACGGCACCCAAGCCCGCAGCCGCTGCTCCCGCAGCCAAACGGGCCCCCGCCGGCAAGAGGCGTACCCTCACTGTCCCGAGGACCGCGGCCGTTGTGGTGACGCTCACCACGGAGGCCGCGGAAAGGGGGGAGACGTACGCCTCCATTATGAAGCGGGCACGTCCCAACGCCGATCCCGCACAGTTGGGGATCGGCAAGGTGTCGTGCCGGCATACATATGCGGGGGCTCGAATTTTCGAGTTCCCGGGGGCCCAAGGCGGCGCCAACGCGGACCTCTTCGCAGCCAAGCTGAAAGAGGTCATCGCAGACGCCGCCAGGGTGGTGAGACCCGTCAAGTCCGCCTCCTTGGAGGTGACCGACCTCGACGATTCGGTCACCAAAGAGGAGGTGGTGGCGGCGGTCGCAGCGGCGGGAGGCTGCGACGCCGCAGCGGTAACAGGCCGGGACATCAGACCCGGCCGCGGCGGCATGGGCACGATCCGCCTGGAGTGCCCAGTCGCCGCCGCAAAAGCCGTCCTCGCAAAAGGACGGCTCCGCGTGGGCTACAGCTCGGCAGCGCTAAATGCCGCTAAGGCGGAGGAGCTGCGCCTCGAAGCGGAGGCGAGTGTCGCCGACATGTCCAAGACACTCCGGGACAGCAGGCACTCATGCCGGAGTGCGCTCAACCCGCCGACCGACGGAGAGGATACAGCGCAGTCGCTGGCTGCGCTGTATCAGTTGATGGTGGACGCCGCTGCCACGGTAGAGGGAGTGGCAGGGCGTTCAAAAAATCTCAAGGGGACATCGGTTAAGGCCCTAAAGGATGCAGCTGGCCTAGTGAAAGAAGCCGCTGCGAGTATGAGGGCCCGAACTATCAACGAGGAAGTCGCCAAGCTGGAGCTGGCCAATCGCCAGCTGACAGCAAAACTCGCAGAGCTCAGTCGCGAGGTGGCTGAGCTGCGGAAACAACCCTCCGCACCACCCCCGCCGGCCACACCCGACACAAGCTCCATCAAGGAGTTGTTGGAGCAGACGACACGGGCGAGCATCGCACAATTTAGTGCGATGCTGAACGCCCGCTTTGACGGCATCGAGAGCCGGCTCCTTCCGGAACCTCGATTACGGCCGCCCCTAGCGGCCGACAGACGAAGAGCGGAAGCCGAAGCCGCAGCTGCGGTACCACCACCGCCACAAGCATGGGGGCCGCGACCACCAGCGGCCCCTTCAGCTCCGCCTGCCCCCCCTGTAGCCTCAAAGGGCAAAGGGAAGGGCAAGATGAGTATGGCGGCTAGAGAGGCGCGCGCCAAGTCCCTTGACCGCGAATTCCCGGAGCTTCCTGCCCCGGCACCGCCACCAACGTCGACGGCCAACAGGCCAATTAAGAAGAAGGCCGGGCAGCCACCCAAGCCGCAGGCCGCCAAAGATAACTGGCAAGTGGTCGGCGGAGCCAAAAAGGGCAAGAAGCGCCGCAAAAAGAGGAGCGCTCTTAAAAGGAGGGAAGCAGCAAGGCTACGACCGCCTACCACCACAGCGGTCGTAATTACCTTGCAGAGCGGTGCCGAGGCGCGAGGGGTGTCCTACAATGAGGTCATGAAGAAGGCCAAGACCTTCGACCTCACTGAAGTGGACATCCCGGAGGGCAACCCACCACCCGCGCAGAAACAGGCCCAAGAAGGAGACGGACGCGCCTTGTCCGACGCGTCCGTCCAGACGGAGGTAGGGGGGCAGAGGCCCCCCGAAGAAGTGGTCTCTAAGACCGATGCCGGCCGGAGTTGCGTGTAG
Protein Sequence: MEEVPDVETVGANQDRRETRSWRNIAASPFMKELRVSVSRLSDTDSECSSVSIGTAVSRHWRKRSFSDDDPEMSEPPKGAAHKSKRGRGRPPTTGEFVGLAEAKAQLNAAKAEELRLEAEASVAEMSKSLRDSRHSCRSALNPPTDNEDTAQSLAALYQLMVDAAATVEGVAVRSKNLKGTSVKALKDAAGLVKEAAAGMRARTINEEVAKLEQANRQLTAKLAELSREVAELRRQPAVPAAPAAPTMPDTSSIKELLEEATRASIAQFSAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAAAEAPPPPQAWGPRPPAAPPAPPAPPVASKGKGKGKMSMAAKEARANLRDSEFPELPAPAPPPPPTANRPNKKKAGQQPKPQAAKDNWQRACSHPVAGAPATVAGATICDRPRSGLRVMGRATHHPRRHRPKKETDAPCPTRPSRRSSHPVAGAPVTVAGATICDRPRSGLRVMGRATHHPRRHRPKKETDAPCPTRVPRPTVEEGARSAQESGTGVPLRRSSRVGTGVPHATVEEGAGVGAVAPLLQRRLSNVGTGVPRSSSGEEASGVGTGVPCLMREVRVMVTRLSESDSDCSSLVSVTPPATPMEEDVLGRSWRKRSAEDGEEEVLCGLAKGVAHKTKRGRSRPTTNAECAGLTEARAQLSAAKAEQLLLDAEESVAARSRALKESRHNCRRALNPPTRGEDTAQSLAALFGLMVDAAATVEHVAATSKNLKGTSVRTLRDAAGLVKEAAASMRVRTITEEVAHLEAANRQLSAKLADLSREVAELRQQQPAPAATPDASIKALLEETSRASVAQFSAMLNARFDGIRDRLLPEPILRPPLAADKRRAEAAATSSPQPSGSGTQKVPPKPTVVAGPAPKSKPAPAPPTAQPQPTSGKGKGKGKGKGKSKAVASEPAPLREPSPIRPAPPPPPLTEGLAGRAEERVRDVGGGDVGVGEGEQVALEKLRRSARQGRKNLSPFLEPRVVLTRTDLTSSRAESPMEAESGGAAGVAADVVVVDDGDMVVEEPVEICSRFFGGRKRSRSRSHSDSESGSASEAGGLKRFARERRPRLQKAGGLLTPRSEVAAFRRSEAEKVAEEEVAAMADQLRPVAAREGDTVGKSIYELPAVEIVQRALDSVAIVQKVAAKSNNLKGTFKRGLQESASALAELVQELQTRTSDSETRRLAALNASLMAELSAMRKEVAQLRTDMRTALETPKPAPARPAQPPQVSETVGLGTRRGGKKRRTGKRKTQPASNPTAETGGPPSKPGPKKPEKKSAPATTTAWSVVAARKKLGERAEASRTDAVGVEKASKMDVAEMAVVRRSTRLGLRNQSPVPEPRVVLTRTTLAGPSQGKPKGPLQGQLKGPSQCQSETSRTASASSFFCGADDSGDSVRFESDADSVATSRKTKKKAFLKSGSEGSSDSARRPKKIAKAQADTHDVGLADAQRRLQLAQRVQVQQDLEEQVAAREQRARTARAKSGYGASAVLYADHSLAELERMAREDEEEIVVVASKSSNLKGTFQKSLKSRAASLRGIVGELVQRTATDETRQLQARVDRLQLEVSQLHAKLAEITAQPAQAAPRPAAEGPSSPNFEDTLRKIILEERAFTRACIAGIXXXXXXXXXXXXXXXXXXRRSEPGPSSQGEDTLLPSATPCNESWATVVGKKGKAKAKKKSAVAADPSPVQPGPSKTTGKGKGKGKGKKTAPKPAAAAPAAKRAPAGKRRTLTVPRTAAVVVTLTTEAAERGETYASIMKRARPNADPAQLGIGKVSCRHTYAGARIFEFPGAQGGANADLFAAKLKEVIADAARVVRPVKSASLEVTDLDDSVTKEEVVAAVAAAGGCDAAAVTGRDIRPGRGGMGTIRLECPVAAAKAVLAKGRLRVGYSSAALNAAKAEELRLEAEASVADMSKTLRDSRHSCRSALNPPTDGEDTAQSLAALYQLMVDAAATVEGVAGRSKNLKGTSVKALKDAAGLVKEAAASMRARTINEEVAKLELANRQLTAKLAELSREVAELRKQPSAPPPPATPDTSSIKELLEQTTRASIAQFSAMLNARFDGIESRLLPEPRLRPPLAADRRRAEAEAAAAVPPPPQAWGPRPPAAPSAPPAPPVASKGKGKGKMSMAAREARAKSLDREFPELPAPAPPPTSTANRPIKKKAGQPPKPQAAKDNWQVVGGAKKGKKRRKKRSALKRREAARLRPPTTTAVVITLQSGAEARGVSYNEVMKKAKTFDLTEVDIPEGNPPPAQKQAQEGDGRALSDASVQTEVGGQRPPEEVVSKTDAGRSCV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -