Basic Information

Insect: Leptopterna dolabrata
Gene Symbol: -
Assembly: GCA_954871275.1
Location: OX940974.1:155788654-155813158[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.00042 3.1 10.3 0.0 29 84 26 81 14 84 0.81

2 10 4.4 3.3e+04 -2.5 0.1 72 88 161 177 153 178 0.78

3 10 0.00041 3 10.4 0.0 29 84 238 293 225 296 0.81

4 10 0.00041 3 10.4 0.0 29 84 336 391 323 394 0.81

5 10 0.00041 3 10.4 0.0 29 84 434 489 421 492 0.81

6 10 0.00041 3 10.4 0.0 29 84 532 587 519 590 0.81

7 10 0.00041 3 10.4 0.0 29 84 630 685 617 688 0.81

8 10 0.00041 3 10.4 0.0 29 84 728 783 715 786 0.81

9 10 0.00041 3 10.4 0.0 29 84 826 881 813 884 0.81

10 10 4.4 3.3e+04 -2.5 0.1 72 88 961 977 953 978 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.00042	3.1	10.3	0.0	29	84	26	81	14	84	0.81
2	10	4.4	3.3e+04	-2.5	0.1	72	88	161	177	153	178	0.78
3	10	0.00041	3	10.4	0.0	29	84	238	293	225	296	0.81
4	10	0.00041	3	10.4	0.0	29	84	336	391	323	394	0.81
5	10	0.00041	3	10.4	0.0	29	84	434	489	421	492	0.81
6	10	0.00041	3	10.4	0.0	29	84	532	587	519	590	0.81
7	10	0.00041	3	10.4	0.0	29	84	630	685	617	688	0.81
8	10	0.00041	3	10.4	0.0	29	84	728	783	715	786	0.81
9	10	0.00041	3	10.4	0.0	29	84	826	881	813	884	0.81
10	10	4.4	3.3e+04	-2.5	0.1	72	88	961	977	953	978	0.78

Sequence Information

Coding Sequence: ATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGGGAGAGGTCGGAGGACTTACGAGTATTTCGAGGAAATGGAagaggtgttaaaaaaaaagcggAATGTCCACCCGGTTATACTCCTCAGTGGAGAACAACAAGTGGCAGTTGTTGACAACACCGCTGAAGCCCCTGAGATGCCTTCCCCTGAGATGCCTTCTGCCACCACTCCCAAGACTCGGCGACCACGCAAGGCGAGGCAGACCTCTTTGGGGGAACttgttgaaattttaaaaaaatactacgCTGAAATGCTCTCCATTTACAGAGAGAGGTTAGAGTTAGATAAGTTGAGGACGGACAACTCAACCAAACGTCTCCGTATGATGGAGGAAAACTCCCTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGTAGCTCTGAGCGAATTCGTTGTAATTGACATGGACGAGATTGGAGAAGGTGATGGAGACACCGCTGCCGGCCAACCAGGCCAGTCGACGGGATGGACGAGGCCCCATATGTTGGAACTGATCGGTTTGTATAAAGAACTGAGAGACAAGGTTGGCACATTTGCTGTCAAAAACCTTAAGGCGCTGTGGGGAATAATTGCACGCAAAATGGACGTCAGCCCAGCTCAGATCGAAAATAGGTGGCGGGTCCTTGTAAGAAATTACAAGAAGATCGTCGACAATAAAAACCAAACAGGGAGAGGTCGGAGGACTTACGAGTATTTCGAGGAAATGGAagaggtgttaaaaaaaaagcggAATGTCCACCCGGTTATACTCCTCAGTGGAGAACAACAAGTGGCAGTTGTTGACAACACCGCTGAAGCCCCTGAGATGCCTTCCCCTGAGATGCCTTCTGCCACCACTCCCAAGACTCGGCGACCACGCAAGGCGAGGCAGACCTCTTTGGGGGAACttgttgaaattttaaaaaaatactacgCTGAAATGCTCTCCATTTACAGAGAGAGGTTAGAGTTAGATAAGTTGAGGACGGACAACTCAACCAAACGTCTCCGTATGATGGAGGAAAACTCCCGTAAGGAAAAGAGTTGA
Protein Sequence: MDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTGRGRRTYEYFEEMEEVLKKKRNVHPVILLSGEQQVAVVDNTAEAPEMPSPEMPSATTPKTRRPRKARQTSLGELVEILKKYYAEMLSIYRERLELDKLRTDNSTKRLRMMEENSLALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTVALSEFVVIDMDEIGEGDGDTAAGQPGQSTGWTRPHMLELIGLYKELRDKVGTFAVKNLKALWGIIARKMDVSPAQIENRWRVLVRNYKKIVDNKNQTGRGRRTYEYFEEMEEVLKKKRNVHPVILLSGEQQVAVVDNTAEAPEMPSPEMPSATTPKTRRPRKARQTSLGELVEILKKYYAEMLSIYRERLELDKLRTDNSTKRLRMMEENSRKEKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -