Basic Information

Insect: Phengaris arion
Gene Symbol: -
Assembly: GCA_963565745.1
Location: OY751445.1:82183-89147[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.00078 1.2 10.5 4.8 32 61 307 336 301 341 0.75

2 3 1.5e-05 0.023 15.9 3.6 31 60 669 698 664 702 0.90

3 3 2.1e-05 0.032 15.5 1.6 30 60 1445 1475 1441 1478 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.00078	1.2	10.5	4.8	32	61	307	336	301	341	0.75
2	3	1.5e-05	0.023	15.9	3.6	31	60	669	698	664	702	0.90
3	3	2.1e-05	0.032	15.5	1.6	30	60	1445	1475	1441	1478	0.91

Sequence Information

Coding Sequence: ATGGCAGATCGCAAGTTgaaaaatattccccgggtgggtcctctctctGAGAGGGAATCCCACCCTTCCGCTCCGGCGGAAGgctgccccacgtatacggggggggcacaaacTGCGATGAGGGTAGAGGCGGTCGTGCAAACGACGGAGAGGGAGAAAGACCCGAGAATGCGAACAGGTCCGGgtctggcgcacattaccgcgccggaaACGGACCCTTTAACCGACGAGGATGTCGACTTTTCCAAGCCACAGCCGGACGGCAAACGTCGGCTGTTCGTGCTTCTGGAGAAGATGGAACTGAGAGGGAATATGAAGGGCGTACCGCGCGCGTATGTAGATCGCGTGCTGTACAATAAAAGCCCCAATACCGAacgagacagcgaggactatacCACGGACTCCAGCTGCGTGTCTagcatgtcgctggactccgtggGATTGCCCGCATCACCGGACAGGACTGCGCGAAAACGGCGCAATACAAACGAAGACGTGGCGCCTTCCACCAGTAAGGAGGTGGCGCCCAAGTCAAAGAGGGGGCGTggccggccgcctacgaccggccaatatgtcggcctggccaaggccAAAGCCGACCTAAATAAAGAAAAGGCGGAGGCCCTTCGGCTCCAGGCCGAGGAGGAAGTCGCCGCAGTGGCTCGTGGGGCGAGGAAAGCTGGGGCCGTTCGTTCTAGCCCCTCCCCCATCAGACTCCCCGCTACTTCTCTTACGCGAGAAGAAGCGTCGGAGCGGACGGGCGCTGCGCTGGTCGGAGCAGTGCAGGCCTCGTTGGAGACCGTCGTCATGGTCGccacaaagtcctccaatctcaAAGGTACCTATCAAAGGTACCTAAAGGAGGCAGTGGTGACTATCGCGTCGGCCTTCAACGAGGTACGATGTCGCACCGCGACAGAGGAGGTGTCAAAGCTGGAGGCCCATAACAAGCGCCTCGAAGAGCAAATGGCCGAATTGCGCCAGGAGCTCGACGAGCTGCGCAAACAGGCCTCCCGCCCCAAGGACAAAGACATGCGTGAGCTAttggcggaggtctctagagcaaacatggagaccttcggcaatatgctcaACGCTAGGCTGGCCGGTTTGGAGGATAGACTCCTTCCGGAGCCTCGGAGGagacccccgctggcggcggatagtgccattGTAGGCACCACGCCGGTGGAGAAAGCACTGAAGCCTAAGAAGGCGACGGCGCCAACGTATGCGGCAGTGACGGCGCAGAGCGCGgcggccccaaaagaggcaccgccgACGCCTGCCCCGTCAAAGGCCCGTAAGAAGAAGAccaagaagcggccatcaatggccgcccaGGAAGTGGCGCAAGGGGGGGCGAACACCAGCCCCTCCCctgccgaggccccgtggaccaccgttGGGTCACGTAAGGCCaggaagaagggggcggctaaaacacccaaggccgccccaaagaagaagagaaaggcaaggcttcgcccccccacaTCCGCGGCcgtcaccctcacccttgaggcggGGGCTGCGGAGAGGGGGGTGTCATACGAAAAGCTGCTCCGTGAGGCCCGGGCGAAGATCGACCTCGGGGAGATCggtatccccaggctcggcttccgcctggcccaaACGGGTGCGCGCGTCCTGACCGTTGAAGGAGAGGACGCAAATAAGAAGGCAGACGCGCTTGCTGCTAGAATGCGAGCGGTCCTCAACCCGGAGAGCGTAAAaatcgcccgcccggtgaaacgTGTAGaaatgcgcatcaccgggctggatgACGCAACAACAGCCGCCGATATAATCGAGGCGGCTGCAAAAGGGATCACCGCCCACAccatgggtcccgagcgcaaagctccccaatgcccggggagctctcggagaggcaggcggcggcacaacaccaggccgccgcaaagaagagagccgAGGCACCTGAAGGAGGCGGTAGTGGCCATAAGAGCGGCGGTGGCCGAAATAAAGGGCCGCTCAACTACCGATGAGATGGCACAGCTCGAGGCCCAAAACAAGCGTCTCGAGAAGCAAGTGGCCGAGATGCGTCGGGAGCTCGACGAGCTGCGCAAGCGGACAGCGCAGCCCGCGGAAAAGGACatgcgccagctgttgtcggaggtctctcgttccaacatggagaccttcggcaacatgctgaacgcaaGGTTGGCAGGTCTTGAGGACCGTCTTCTGCCGGCCCCGAGGAtgagaccaccgctggcggcggacagtgccactgtaggcaccacgccagcggcagtaaagacgaaggcgccgaagcccaaaaaggcgacggcgcccacataCGCGGAGGTGACGGCACCGAGTGCAgcggccccaaaagaggcaccgcctgcaccggcCCCGCCAGCAAAGAAGAAGACAAAAATgaaaaagcggccatcaatggccgcacaGGAAGCagcgcaagggggggataacaccgacccctcccccgccgaggccccgtggaccgccgtaggtccacgcaaggcaaagaaaaagaagaagggggcggctatcCCAGCTAAAGCCGcccccaagaagaagaagaaggcgaggctGCGCACCCCAGCCAccgcggccgttaccctcacccttgaggaaaaggctgcggagaagggggtgaCATACGCCCAGCTTCTCAAAGAAGCCAGGGCGAAAGTCGATCTTGGGGAGTTTgacatccccaggctcggcttccgcctggcggaaACAGGTGCGCGCGTGCTCACAATCGCAGGCGAGGGCGCGCAGGCGAAGGCAGACGCTTTTGCTGCGAAATTGAGGGCCGTACTAAGCCCAGAAAcggtgagagtcggccgcccggtcaaaTGTGCAGAGTTGCGCgtgaccgggctggacgactcagtgacggccgcccaagtcatcaTGGCGGCGtcacaagaaggaggatgcccgaccagctcaatcaggtcgggcaaaatagtgGTGGGACCCAGAGGGGACGGGTCCTtgtggatgagcgtccccgtcgaGGCGACAAAGAAGTTGCTCagttctgggcggcttcgcgtgggctgggtcgcggcaaaggtggcgctgctggccgcgaggccaaagcggtgcttccgatgccaagacaccggccacgtcgcggcgaaatgccagtcctcggtggaccgcagccggagctgtttccgctgcgggaagccggggcacaaggcgacAGAGTGCGGAGCGGATCCACTCTGCTCGCTGTGCCAGGCCACTGGTAAGGAGGAGGTGGCacatgtgctggggagcagcggttgCGTTTTCGCAAAGCCGCCCTCCGGCGCGAAAGcccatatccgagcaactATGGAGGTACGCAATGTAAAAAATAgtccccgggcgggtcccgactatgtcggggaatcccgcacctcTCCGAAGGGAGAGGTCTGGCCCAAGTATACGGGGGGTGCCACCATTGCGAGTGGGAATGTGGAGGCCGTGGCGACGGCGAGTGAAGGGagtggcgcgatggcgcatgcgagtccgaagccggtgtccctaaccgcaccggcggcggatcTCTTAACCGACGAGGACACGGACTTTTCTCAGCCCGTGGAGAATGGCAGGGAGCGACTCCTGCGGCTTCTTCATCGTAAGAAGttgcgaggagacacggaggggctcgcaCGCGTTCAGCGCGAGCGCGAGCTtatcctccctccctctatGACAGAGACAATGGCGGCGGGAAATGCCAGTGGAGCCACACCGCGCATACCGCGCgttatgctcacgcgcgcgctgattcccgcacgcccaaacaccggacttgacagcgacgactacctctcggactccagtgatattTCTGGCatgtcactggactccgaggggctgcccgtcatacccGATAGAGACGCACCTCGTAAGAGAAAAACTAGCGACGACGATGTATCGTCCTTaagtaaaggggcggtaccaaaaATCAAACGTGGACGCGGCaggccgcctacgaccggccagtatgctggcctggccaaggcgcaggccgaCTTAAATAGGGAGAGagaggaggctcttcggcttcaAGCTGAAGCCGAAGTTGCAGAAACGGCGAAGACAGTGAGGGAGACACGCGCGTCATTCTGCTCGAGTCCCGCCAAGATCGGAGAGGCTGAGTCGGAGCGGTCAAGTGCTGCCCTGGCCAAGGCGATAGAGACGTCATTGGAGGCCATTACAATGGTCGCCACTAAATCGTCGAACCTTAAGGGCACCTTCCAAAGGTGCCTCAAGGATTCAGTGGCGGCCATTAAATCGGCTGTTACCGAGATCAGGGGCCGCACCATGAACGAGGAGATAGCGAGATTGGAGGCCCAAAACGCGCGGCTCCAGGAGCGAGTGGCCGAAATGGGCCGGGAGCTGGAAGAGCTGCGTAAACGGGCCTACAATTCCCGCCCCGTAGAGCAGGACatgcgccagctgttgtcggaggtctctcgatccaacatagagaccttcggcaacatgctgaacgctagGTTGGCAGGCCTTGAAGACCGTCTTCTGCCGGCCCCTAGAGTaagaccaccgctggcggcggacagtgccaccGTAGGCACCCCGCCAGCGGCAGTAAAGACGAAGGCGCCGAAAGCAAAAAAGGCGCCCACGTATGCGGAGGTGGCGACACCGAGCGCGACGGTCCCCCCAAAAGAGGCTCCGCCTGCACCGGCTCCGCCCAAAAAGGCGaaaaagaaaaagcggccatcaatggccgcaaGAGAAGCGACGCAAGGGGAGGAGATCATCAACCCCTCtaccgccgaggccccgtggaccaccgtcGGTCCACGCAAGGCTGGAAAGAAAAAAGGGGCGGCCAAAACACCCAAAGCCGCcccaaagaagaaaaagaaggcaAAGCTTCGTCCCCCCGCAACGGCGGCaatcaccctcacccttgaggctgGAGCCGCCGAGGAGGGGGCAACATACGAGAAGATCTTGCGTGAGGCCAGGTCGAAAATCGATCTAGGGGAACTGAACATCCCCagactcggcttccgcctggccaaGACGGGTGCGCGCATCCTATCGGTTGACGGAGAGGGGGCAAATGAGAAGGCTGACGCTCTGGCCACGAGGCTTCGGGCGGCCCTTAGCCCCAACGTTGTGAAGatagcccgcccggtgaaatgcgcgGAAATacgcatcaccgggctggacgacgcgacgacggccgccgatgtcACCGAGGCGGCCGCAAAAGAAGGAGaatgcccggccaccaacatccggtcgggcagaGTTGTCGTGGGCCCAAGGGGAGCTAGAAGCCTCTGGCTCAGTGTCCCGAtggcagccgccaaaaagcttaCCAGCTTTGGGCGGCTGCAAATAGGCTGGGTCGTTGCAGGGGTgacactgctggccgcgaggcccaagcggtgttacCGCTGCCTCGACACCGGCCACCTGGCGGTGCAGTgcaagtcctcggtggacctcagtcggaattgtttccgctgcgggaagccggggcacaaggcaccAGAGTGCGAAGCGGCTCCAAATTGCCCGGCCTGCGAGGCCGTAAGCAAGCcaaaggagcacgtgctggggagcagcggctgtatcacagcacccaagccgccccccggcacgaataAGAAGAGGAAGGCTCCTTCCAAGGCCCGGCTTCAAacgcccaaggccggcgcaagggcggtgcCACCCGTCCCCGCAACTATGGAAGTggaagcctag
Protein Sequence: MADRKLKNIPRVGPLSERESHPSAPAEGCPTYTGGAQTAMRVEAVVQTTEREKDPRMRTGPGLAHITAPETDPLTDEDVDFSKPQPDGKRRLFVLLEKMELRGNMKGVPRAYVDRVLYNKSPNTERDSEDYTTDSSCVSSMSLDSVGLPASPDRTARKRRNTNEDVAPSTSKEVAPKSKRGRGRPPTTGQYVGLAKAKADLNKEKAEALRLQAEEEVAAVARGARKAGAVRSSPSPIRLPATSLTREEASERTGAALVGAVQASLETVVMVATKSSNLKGTYQRYLKEAVVTIASAFNEVRCRTATEEVSKLEAHNKRLEEQMAELRQELDELRKQASRPKDKDMRELLAEVSRANMETFGNMLNARLAGLEDRLLPEPRRRPPLAADSAIVGTTPVEKALKPKKATAPTYAAVTAQSAAAPKEAPPTPAPSKARKKKTKKRPSMAAQEVAQGGANTSPSPAEAPWTTVGSRKARKKGAAKTPKAAPKKKRKARLRPPTSAAVTLTLEAGAAERGVSYEKLLREARAKIDLGEIGIPRLGFRLAQTGARVLTVEGEDANKKADALAARMRAVLNPESVKIARPVKRVEMRITGLDDATTAADIIEAAAKGITAHTMGPERKAPQCPGSSRRGRRRHNTRPPQRREPRHLKEAVVAIRAAVAEIKGRSTTDEMAQLEAQNKRLEKQVAEMRRELDELRKRTAQPAEKDMRQLLSEVSRSNMETFGNMLNARLAGLEDRLLPAPRMRPPLAADSATVGTTPAAVKTKAPKPKKATAPTYAEVTAPSAAAPKEAPPAPAPPAKKKTKMKKRPSMAAQEAAQGGDNTDPSPAEAPWTAVGPRKAKKKKKGAAIPAKAAPKKKKKARLRTPATAAVTLTLEEKAAEKGVTYAQLLKEARAKVDLGEFDIPRLGFRLAETGARVLTIAGEGAQAKADAFAAKLRAVLSPETVRVGRPVKCAELRVTGLDDSVTAAQVIMAASQEGGCPTSSIRSGKIVVGPRGDGSLWMSVPVEATKKLLSSGRLRVGWVAAKVALLAARPKRCFRCQDTGHVAAKCQSSVDRSRSCFRCGKPGHKATECGADPLCSLCQATGKEEVAHVLGSSGCVFAKPPSGAKAHIRATMEVRNVKNSPRAGPDYVGESRTSPKGEVWPKYTGGATIASGNVEAVATASEGSGAMAHASPKPVSLTAPAADLLTDEDTDFSQPVENGRERLLRLLHRKKLRGDTEGLARVQRERELILPPSMTETMAAGNASGATPRIPRVMLTRALIPARPNTGLDSDDYLSDSSDISGMSLDSEGLPVIPDRDAPRKRKTSDDDVSSLSKGAVPKIKRGRGRPPTTGQYAGLAKAQADLNREREEALRLQAEAEVAETAKTVRETRASFCSSPAKIGEAESERSSAALAKAIETSLEAITMVATKSSNLKGTFQRCLKDSVAAIKSAVTEIRGRTMNEEIARLEAQNARLQERVAEMGRELEELRKRAYNSRPVEQDMRQLLSEVSRSNIETFGNMLNARLAGLEDRLLPAPRVRPPLAADSATVGTPPAAVKTKAPKAKKAPTYAEVATPSATVPPKEAPPAPAPPKKAKKKKRPSMAAREATQGEEIINPSTAEAPWTTVGPRKAGKKKGAAKTPKAAPKKKKKAKLRPPATAAITLTLEAGAAEEGATYEKILREARSKIDLGELNIPRLGFRLAKTGARILSVDGEGANEKADALATRLRAALSPNVVKIARPVKCAEIRITGLDDATTAADVTEAAAKEGECPATNIRSGRVVVGPRGARSLWLSVPMAAAKKLTSFGRLQIGWVVAGVTLLAARPKRCYRCLDTGHLAVQCKSSVDLSRNCFRCGKPGHKAPECEAAPNCPACEAVSKPKEHVLGSSGCITAPKPPPGTNKKRKAPSKARLQTPKAGARAVPPVPATMEVEA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -