Basic Information

Insect: Eucera pruinosa
Gene Symbol: SNAPC4_1
Assembly: GCA_028830335.1
Location: JAMYCR010000005.1:21439952-21442528[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.072 1.1e+02 3.8 0.0 3 18 138 153 137 158 0.92

2 5 5.1e-08 8e-05 23.5 0.2 1 44 247 292 247 294 0.95

3 5 5.8e-09 9.2e-06 26.5 0.3 3 42 303 346 301 348 0.96

4 5 2.8e-11 4.5e-08 33.9 0.0 1 45 356 401 356 402 0.95

5 5 3.9e-09 6.1e-06 27.0 0.0 3 41 411 449 410 450 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.072	1.1e+02	3.8	0.0	3	18	138	153	137	158	0.92
2	5	5.1e-08	8e-05	23.5	0.2	1	44	247	292	247	294	0.95
3	5	5.8e-09	9.2e-06	26.5	0.3	3	42	303	346	301	348	0.96
4	5	2.8e-11	4.5e-08	33.9	0.0	1	45	356	401	356	402	0.95
5	5	3.9e-09	6.1e-06	27.0	0.0	3	41	411	449	410	450	0.96

Sequence Information

Coding Sequence: ATGATGAGGAACGGGGAAAAAGAGCAAGAGGGAAAGGAACAGGTAACTTGGAAACGGGAGAACGAGAAGAGTAAGAAGGAAGTGGCGGCGGCAGTGGCGGAAAGAAAAGCAGGTGCAACGGAAAAGGTGGAAATTTGTAGAAGCGCGATAGACACGAATAAACGAATAGCCTGTCATCTGTTGGATTTGAGAAAGCACGTAACGACGGCTCTGCAAAAGTGCGAGCAAAAATTGGCAGCAGTGGAGAAAAGTTTGTCAAAGCATACAGCTGGGAACGGAAAGATGCCAATCTGTAGCGCTGGTATACCTTATTTTAAAGATAGACATTTTTTTTCTGCTTTCAGCAACAGGGATGAGCGAGAGAAAAAAGATCGAAAAGAATTGGAACTGAGAAACGTGTATAAGGTTTGTTCGTGGACCAAAAAAGAGAGGGCTACACTGCTAAAAGCAATAGAAAGGGAAGCGAGTAGAttcgtaaacgtaaacgtagaCGTAGACGTAAACGTAGACATAGACGTAGGGACGGGAAAGGTAGAAGGCGCGAGGTGCGAGCAGAAAGTTGggagaggaaaaaaaggaagaaggagaaTATCGCCAGCGCGGTTCGTGCAAACAATTCGTTCGATGGAGAGCGAGAAATTCGATTGGCTTCAAATATCGTTCGCTCATTTCGAAGACGTGCATTCGGCGCTGGATTGTTCGGTCATATGGAACGTTTTCCTTCATCCGGACATCAACAGAAGCTGCTGGATAAAGTCGGAAGATACGAAGCTGATGAGAGTAACGGAAAGGTATCGATTCCAAGACTGGGACGGGATCGCGAAACAGCTGGATACAAATCGTACCGCGTATCAGTGTTTCGTCAGATACAACACGAAACGGAAGCTGGACAAGGCGAAGATGCGTAGCTGGCAAAGGGAAGAGGACCAGAGGCTGTTGAAGTTGGTAGAGGTATTTCGAATTGGCGACTTTGTTCCTTGGGGCGAGGTTGCTAGCTGGATGCAAGGTAGAACGAAACAGCAAATATACTTTCGCTGGGTGTACAGCATAACTCCGCACTTAACCAAAGGCAGATTCACCAAAGCCGAAGACAGCCTTCTCAAGGACGGCGTTAGCAAGTTTGGTAgaaattttcgtaaaatatcAGCGGTATCGATCCCCAACAGATCCAGTGCTCAGCTTCACGACCGCTATCGAACCTTGACCATCAACCAACACGACAACTGGAATCAATGGACCCTCGAGGAAGACGTAAACTTGCTCCACCTTTTTTCCACCCTCGGCCCAACGTGGTCCGCCATAGCCAAAGATTTTTCCTTTAAAACCAGAACTCAGTTGAGACACAGACACGCGGCCCTGCGACGATACATCAATAGGGGTGTTTCCTTGTCTCAACTACATCAAGCTCGCTCTTCCGATAAGAATAAAAACAACCGAAGAGAAGAGGGAGAAGAAGATCtcgaagtagaagaagaagaagaatcttcCGACGATTCCTCGTCCGCTTGCATAGACGAACAACTAATCGATCGCTTTCGTTTGAGATACAAGGTAGAGAGATTTATGTCCAAGTGGCAGTTGAATAGCGCGGAGACGTTGAATCGCGACACGAGAACGCTGGAGAACGCTTTGCTGGCATTGAACGCGAATCTTCGTATACCGAACGACCTCTGCCAATTCCACCTTACCGACAGGGACTGCCAATTGTCCTGCTCCTTGCGGCAATACAAGAACTCGAAAAGCCACGGATACTCTCGGCTTATAGACAAGTACAAATCCCGCATGTTTCCCGATGCTTTTAACTCCGATTCCGATACCAATTCCAATAGTTGTAGCGCAACTAGCGAACAAGCATCGCGATTCGTGCCTCCGCCTCCTTTTAATTCCCAAATCAAATTCAAGAAGTCGCAAGCAAGCCAATCCATAGATTACCGTTTAAACGATAAGATGCAGTTCTTGCTGGAGAAACCTACGAACCTTTATACTCCGGATTTTGTAGTTTCGTACATCGGAGGCCACGAACAGCAGCTGCAGTTTCAGAAGCTCGCAGATATATTTGCTATTGGCGATGGTATTGCCTGCGGCACGAATGCCGATAATAGCGATAACAGCGATAGTAATAGCGATACGAGGACCGGTACAAATAGGAATACTAGAAACGATTCGAGTAGCAAGATGCAAGTCGGAGAGGAAGAGCAGGATATAGGCAGGATGTATGCTAGCCACGCAACCCTGTGCAGCTTCAAGAACTTGACGTACTTGAAGCGGGTGCGGGAAATGGAATGGCATCGCGATAGCAAGCCCGATGTTTGGTGCGATCGACGCAGACCATTGGTGCGATCAAATGGCTGCGAACAACCGGTGAATTTACTGGAAGCACGTTTGCAAATGCTATTCAGATATCCGATAGGTCTATCAAAAAGTGTATTGCCGGAAATTGGCCCGATCAATACGTTCTCCAACAACGATATCCGGCTTCGGCCAAAAAGGAAGACTCGCGAAACTTCCGATACGTTGGAAAAGCCTGCGAGGAAAAGGTTGCAAATGTTTAACGAGAACATCGGCAGCTTTAGGTGA
Protein Sequence: MMRNGEKEQEGKEQVTWKRENEKSKKEVAAAVAERKAGATEKVEICRSAIDTNKRIACHLLDLRKHVTTALQKCEQKLAAVEKSLSKHTAGNGKMPICSAGIPYFKDRHFFSAFSNRDEREKKDRKELELRNVYKVCSWTKKERATLLKAIEREASRFVNVNVDVDVNVDIDVGTGKVEGARCEQKVGRGKKGRRRISPARFVQTIRSMESEKFDWLQISFAHFEDVHSALDCSVIWNVFLHPDINRSCWIKSEDTKLMRVTERYRFQDWDGIAKQLDTNRTAYQCFVRYNTKRKLDKAKMRSWQREEDQRLLKLVEVFRIGDFVPWGEVASWMQGRTKQQIYFRWVYSITPHLTKGRFTKAEDSLLKDGVSKFGRNFRKISAVSIPNRSSAQLHDRYRTLTINQHDNWNQWTLEEDVNLLHLFSTLGPTWSAIAKDFSFKTRTQLRHRHAALRRYINRGVSLSQLHQARSSDKNKNNRREEGEEDLEVEEEEESSDDSSSACIDEQLIDRFRLRYKVERFMSKWQLNSAETLNRDTRTLENALLALNANLRIPNDLCQFHLTDRDCQLSCSLRQYKNSKSHGYSRLIDKYKSRMFPDAFNSDSDTNSNSCSATSEQASRFVPPPPFNSQIKFKKSQASQSIDYRLNDKMQFLLEKPTNLYTPDFVVSYIGGHEQQLQFQKLADIFAIGDGIACGTNADNSDNSDSNSDTRTGTNRNTRNDSSSKMQVGEEEQDIGRMYASHATLCSFKNLTYLKRVREMEWHRDSKPDVWCDRRRPLVRSNGCEQPVNLLEARLQMLFRYPIGLSKSVLPEIGPINTFSNNDIRLRPKRKTRETSDTLEKPARKRLQMFNENIGSFR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -