Basic Information

Insect: Udea olivalis
Gene Symbol: -
Assembly: GCA_947369235.1
Location: OX376340.1:19081786-19092196[+]

Transcription Factor Domain

TF Family: bHLH
Domain: HLH domain
PFAM: PF00010
TF Group: Basic Domians group
Description: A basic helix-loop-helix (bHLH) is a protein structural motif that characterizes one of the largest families of dimerizing transcription factors.It should not be confused with the helix-turn-helix domain.The motif is characterized by two α-helices connected by a loop. In general, transcription factors including this domain are dimeric, each with one helix containing basic amino acid residues that facilitate DNA binding. In general, one helix is smaller, and, due to the flexibility of the loop, allows dimerization by folding and packing against another helix. The larger helix typically contains the DNA-binding regions. bHLH proteins typically bind to a consensus sequence called an E-box, CANNTG. The canonical E-box is CACGTG (palindromic), however some bHLH transcription factors, notably those of the bHLH-PAS family, bind to related non-palindromic sequences, which are similar to the E-box. bHLH TFs may homodimerize or heterodimerize with other bHLH TFs and form a large variety of dimers, each one with specific functions.https://en.wikipedia.org/wiki/Basic_helix-loop-helix
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.4 1.8e+02 2.8 0.1 38 53 10 25 3 25 0.89

2 14 0.0073 3.2 8.4 0.2 22 53 92 124 90 124 0.90

3 14 0.023 10 6.8 0.2 22 53 191 223 189 223 0.90

4 14 0.0073 3.2 8.4 0.2 22 53 290 322 288 322 0.90

5 14 0.023 10 6.8 0.2 22 53 389 421 387 421 0.90

6 14 0.019 8.3 7.1 0.2 22 53 488 520 486 520 0.90

7 14 0.023 10 6.8 0.2 22 53 587 619 585 619 0.90

8 14 0.0073 3.2 8.4 0.2 22 53 686 718 684 718 0.90

9 14 0.023 10 6.8 0.2 22 53 785 817 783 817 0.90

10 14 0.0073 3.2 8.4 0.2 22 53 884 916 882 916 0.90

11 14 0.0073 3.2 8.4 0.2 22 53 983 1015 981 1015 0.90

12 14 0.12 53 4.5 0.2 23 53 1083 1114 1081 1114 0.79

13 14 0.019 8.3 7.1 0.2 22 53 1181 1213 1179 1213 0.90

14 14 0.019 8.3 7.1 0.2 22 53 1280 1312 1278 1312 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.4	1.8e+02	2.8	0.1	38	53	10	25	3	25	0.89
2	14	0.0073	3.2	8.4	0.2	22	53	92	124	90	124	0.90
3	14	0.023	10	6.8	0.2	22	53	191	223	189	223	0.90
4	14	0.0073	3.2	8.4	0.2	22	53	290	322	288	322	0.90
5	14	0.023	10	6.8	0.2	22	53	389	421	387	421	0.90
6	14	0.019	8.3	7.1	0.2	22	53	488	520	486	520	0.90
7	14	0.023	10	6.8	0.2	22	53	587	619	585	619	0.90
8	14	0.0073	3.2	8.4	0.2	22	53	686	718	684	718	0.90
9	14	0.023	10	6.8	0.2	22	53	785	817	783	817	0.90
10	14	0.0073	3.2	8.4	0.2	22	53	884	916	882	916	0.90
11	14	0.0073	3.2	8.4	0.2	22	53	983	1015	981	1015	0.90
12	14	0.12	53	4.5	0.2	23	53	1083	1114	1081	1114	0.79
13	14	0.019	8.3	7.1	0.2	22	53	1181	1213	1179	1213	0.90
14	14	0.019	8.3	7.1	0.2	22	53	1280	1312	1278	1312	0.90

Sequence Information

Coding Sequence: ATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCCCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGGCCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGGCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCCCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGGCCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATAGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGGCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCCCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGGCCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGGCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGGACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCCCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGGCCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGGCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCCCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGGCCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCTAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGCAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAAGCAGTGTATTGCTCTGCCCCGAGGTGCCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGAGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAGGAAACGCGTTCGGGGGGCCGAAGAAAACGACTGACCTGCGCAGAGCCATTCCTCACATGAAAAAATACAATCGAGGCTTATTGAAAATCCAAACACTGACGCTGACCAGGAACTACGTTAAGTCACTGACGAATGCCATTGATGACTTGAATTGGAAGGCGCCACGATACAATGTATTGCTCTGCCCCGAGGTGGCGGTGAAGGAGGAGATCGAGAACGAGGAGATAGTGAACGGGGAGTACAAGCGCAGCGCCGAGTCGCCGCTGGAAGAGCGCATGCAGCACACTCAATAG
Protein Sequence: MKKYNRGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLARNYVKSLTNAIDDLNWKAPRYKQCIALPRGGGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLARNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGGGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTRNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLARNYVKSLTNAIDDLNWKAPRYKQCIALPRGGGEGGDRERGDSERGVQAQRRVAAGRAHAGHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLARNYVKSLTNAIDDLNWKAPRYKQCIALPRGGGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLARNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNLGLLKIQTLTLTSNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTRNYVKSLTNAIDDLNWKAPRYKQCIALPRGAGEGGDRERGDSERGVQAQRRVAAGRAHAAHSIGNAFGGPKKTTDLRRAIPHMKKYNRGLLKIQTLTLTRNYVKSLTNAIDDLNWKAPRYNVLLCPEVAVKEEIENEEIVNGEYKRSAESPLEERMQHTQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -