Basic Information

Insect: Dorcus hopei
Gene Symbol: nfxl1_1
Assembly: GCA_033060865.1
Location: CM065420.1:16492081-16540232[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.26 6.8e+03 -1.3 0.8 4 10 360 366 359 366 0.94

2 15 3.1e-07 0.0081 17.7 17.2 1 19 374 391 374 391 0.99

3 15 1.9e-06 0.049 15.2 14.8 3 19 429 445 427 445 0.92

4 15 2.5e-07 0.0067 17.9 11.9 1 18 480 497 480 498 0.96

5 15 2.4e-05 0.65 11.6 11.3 1 18 533 550 533 551 0.98

6 15 0.43 1.1e+04 -2.0 0.6 1 5 560 564 560 569 0.89

7 15 6.7e-05 1.8 10.2 17.1 1 18 585 602 585 603 0.94

8 15 6.4e-10 1.7e-05 26.2 13.4 1 18 612 629 612 630 0.97

9 15 0.071 1.9e+03 0.5 5.6 10 19 679 688 677 688 0.91

10 15 0.033 8.8e+02 1.6 4.7 2 11 699 707 698 708 0.85

11 15 0.64 1.7e+04 -2.5 4.4 14 18 736 740 736 741 0.95

12 15 0.24 6.4e+03 -1.2 0.6 6 10 767 771 766 773 0.86

13 15 0.001 27 6.4 8.2 1 11 777 787 771 788 0.80

14 15 0.0013 35 6.1 17.5 3 19 818 834 817 834 0.92

15 15 2.4e-06 0.063 14.8 13.9 1 18 877 896 877 897 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.26	6.8e+03	-1.3	0.8	4	10	360	366	359	366	0.94
2	15	3.1e-07	0.0081	17.7	17.2	1	19	374	391	374	391	0.99
3	15	1.9e-06	0.049	15.2	14.8	3	19	429	445	427	445	0.92
4	15	2.5e-07	0.0067	17.9	11.9	1	18	480	497	480	498	0.96
5	15	2.4e-05	0.65	11.6	11.3	1	18	533	550	533	551	0.98
6	15	0.43	1.1e+04	-2.0	0.6	1	5	560	564	560	569	0.89
7	15	6.7e-05	1.8	10.2	17.1	1	18	585	602	585	603	0.94
8	15	6.4e-10	1.7e-05	26.2	13.4	1	18	612	629	612	630	0.97
9	15	0.071	1.9e+03	0.5	5.6	10	19	679	688	677	688	0.91
10	15	0.033	8.8e+02	1.6	4.7	2	11	699	707	698	708	0.85
11	15	0.64	1.7e+04	-2.5	4.4	14	18	736	740	736	741	0.95
12	15	0.24	6.4e+03	-1.2	0.6	6	10	767	771	766	773	0.86
13	15	0.001	27	6.4	8.2	1	11	777	787	771	788	0.80
14	15	0.0013	35	6.1	17.5	3	19	818	834	817	834	0.92
15	15	2.4e-06	0.063	14.8	13.9	1	18	877	896	877	897	0.89

Sequence Information

Coding Sequence: ATGAAGTGGCTGGTGCTGTTCGTTTTGGCCGTCATTCTCGTGAGCCTGGCGGTGGCCGAAGGTGAAATTTGGGAGGAAGATGATCACGAGGTCCTCATCCGAAACGAGAGGGGTGCCAAGAACACTGGTAAGAAACAATGCAGATATGCGAAGGGAGAGTGGTCAGAATGCGATTCGAAGACCAACATGCGCTCCAGAACATTGACTTTGAAGAAGGGTGACCAGAAGACTTGCGAGGCCACTAAAACGATGCAGAAGAAGTGCAGAAAAGCTTTGCACATAACGTCTTTGGTAACTAGATCCTTGCTTTTCCTAGCATGTCGATACGAGAGAGGAGCTTGGGGCGAATGCAATCAAAATCAGATGACGCGGAAGGACAAGCTTAAGCCAAACAGCGACCCATCCTGCGAGCAGAACAGACAGAtcacgaaaaaatgcaacggaTCCAAGCCCACGAAAGGTAAAGAAGCAAAAATGAGTGAGTACTTTAAGCCACCTAAACAAAAAAACCCATGGGCTAAAGGCAAGCAACAACAACAGCAAAATAGATCTACGAAGGTAACCTCAAATAACCTCAAAAACtctgaaaataaattcaaagaGGCAACTAGCAAGCATCAAGCAGCTGCCCAAAAGTATGCCAAAGATTATGAATCTTCATCCGAGGAAGAAGAACTTGAGTCGCAACATATAATAGATAAGATATTAGAGGGTTATGCACTCGGTGAGGCAGACAAGGAAAATTTAAGCCGCACTAAGAATTACTTAGAAGACGCTTTTGTATCAGGTGCTGCCACCTGTCTCATTTGCATATCAAGCATCAAGAGGAACGATTCTATATGGAGTTGTTCCGAGTGTTACTGCTTTTTTCACTTAATGTGCATTCAACGATGGTCGAAGGATACGATCACTCAAAAGAAACTGGCTTTGGAGGGGCAGGTGCAAGTAAAGAAGATAAAAGTCGCCTGGGGTTGCCCTAAATGTAGACACGACTATGAACCTGCTGATATTCCAACTCAGTATTTGTGCTTCTGTGGTAAAACTACCAATCCTGTATTTCAGTCACTGCTTGTACCACACTCATGTGGAGAAAAATGTGGTAGAAGTTTGAAGCCAGAGTGTGGTCATGAATGCGTTTTACTTTGTCATCCAGGGCCTTGTCCTCCTTGTCCTAAAACTGTTACTGTTAAATGTTATTGTGGTGTTCAACCACCAAAAGTCCAGCGATGCAGCAATAAAGAATGGTCATGTGGAAATCCATGCAATAAATTACTAGCTTGTAAAAAACATAAATGTGTGCAGCCATGTCATTCTGGTGAATGTGAACCATGCTCGAAAAAAAGCATTCAGAAATGTTTGTGCGGATCTAGTCAGAAATTACGTGACTGTGCCTCGCCCATCTGGCAATGTGATAAGATTTGCAATAAACCATTGGAATGCGGCTTTCATAATTGCTCTGAAGTATGTCATGTCGGTGAATGTGGAGGTTGTGAATTGTCGAAGCTAAGGACTTGCCCCTGTGGAAAGTCCTCGTTTTTGCTTCCATGCACAGAAGAAACACCAGCATGTGATGACACTTGCCTTAAAGTTTTAGAATGCGGACAGCACGTATGCTATCAAAAGTGTCACAAAGACAAATGCGGAAgtTGTGTGGAAGTAGTAACAAAGACTTGTCAATGTGGATTACATACAAAGGAAGTTCAGTGCAAGAAACCTTTTCTCTGTGAAACCAAATGCAAACAGCTCAAAGATTGTAACAAACATCCTTGTAATCGTAAGTGTTGTGATGGTAATTGTCCTCCATGCGAGAAACCTTGTGGGAGGACCCTCTCCTGTGGCACTCACAAATGCAAGTCAGTATGCCACAGAGGCCCGTGCTACCCTTGTAATTTAACGGAGAAGGTTTTCTGTCGGTGCGGGGGTACTTTTGTGACAGTTCCATGTGGTAAAAAGAATAGGACACGTCCTCCAAAATGCTACAAGCCTTGTTTGTTACCACCAGATTGTCACCATCCAAAAAGGGAGCATCACAACTGTCATTTCAACGATTGTCCACCTTGCAagcaaatttgtaataaatcaCGTGAAAGCTGTGCCCATAATTGCCCTGCACGCTGTCACGCTGCAATCACAGTAAAAATTGAAGGGAAGAAAGGATCCATGCCTTGGGAACAAACGGGGCCGCAATTTGAAGTCAAAGAATTTCCTTGTCCGCCTTGTATTGTTCCTGTATTAGTTACATGCTTAGGTGGACATGAGACTCGTTACTGGCCTTGTCATGCAGCTGTGGCTTCCAGTTGTCAAAGACCATGTGGTCGAGTTCTACTATGTGAAAATCACACTTGCAAGAAACTTTGCCACAATATTATAGCTGCTCCTGATAACATTAAAGCAGGTGAAAATTGTGATGTGTGTGAAAGTGAATGCCTAAAAGTTAGACCAGAAGGTTGTACGCATGCATGTCCGAAACCATGTCATCCAAATGAATGCCCGCCGTGCAAACAAATGTTGCGCATCAAATGCCATTGTGGCCTCAACCAGCCTTACGTACCTTGCAGTGAATGGAACAACATTGAAAGCAGAGAACAGTTGCAATGCTGTGGAAATCAATGCCCGAACAACTACGAGTGCGGGCATCGATGTCGATCCAGCTGTCATTCAGGGCCGTGCCCCAACCCCGAATCATGCAAGAAAAAAGTCAAAGTCTTCTGCAAATGCAAGAGAATTAAAAAGGAGTTTCCTTGTGAAACACTCAGAAAGGGTGAGGCCGTCGTAAACTGCGATGAGATCTGCGAGCAAAAGAAAGAAGAGGAGAGAAAGCAAAAAGAACTGGAGAGGGAGCAGaggaagaaagaagaagatttaaaaaatcagagagAGCTTGAAAAGTACGAGAAAATGTTCCATGGTAAGAAAAAGAATCGAGAGCGTAAGATACAAGAAGAAACCGAGGATAAATCAGTTTTACGTAAATATTGGTTGCTATGTGCGTGTTTCGTTGTTGCTATCTTAGCagttactttttattattatattaatgtGTAG
Protein Sequence: MKWLVLFVLAVILVSLAVAEGEIWEEDDHEVLIRNERGAKNTGKKQCRYAKGEWSECDSKTNMRSRTLTLKKGDQKTCEATKTMQKKCRKALHITSLVTRSLLFLACRYERGAWGECNQNQMTRKDKLKPNSDPSCEQNRQITKKCNGSKPTKGKEAKMSEYFKPPKQKNPWAKGKQQQQQNRSTKVTSNNLKNSENKFKEATSKHQAAAQKYAKDYESSSEEEELESQHIIDKILEGYALGEADKENLSRTKNYLEDAFVSGAATCLICISSIKRNDSIWSCSECYCFFHLMCIQRWSKDTITQKKLALEGQVQVKKIKVAWGCPKCRHDYEPADIPTQYLCFCGKTTNPVFQSLLVPHSCGEKCGRSLKPECGHECVLLCHPGPCPPCPKTVTVKCYCGVQPPKVQRCSNKEWSCGNPCNKLLACKKHKCVQPCHSGECEPCSKKSIQKCLCGSSQKLRDCASPIWQCDKICNKPLECGFHNCSEVCHVGECGGCELSKLRTCPCGKSSFLLPCTEETPACDDTCLKVLECGQHVCYQKCHKDKCGSCVEVVTKTCQCGLHTKEVQCKKPFLCETKCKQLKDCNKHPCNRKCCDGNCPPCEKPCGRTLSCGTHKCKSVCHRGPCYPCNLTEKVFCRCGGTFVTVPCGKKNRTRPPKCYKPCLLPPDCHHPKREHHNCHFNDCPPCKQICNKSRESCAHNCPARCHAAITVKIEGKKGSMPWEQTGPQFEVKEFPCPPCIVPVLVTCLGGHETRYWPCHAAVASSCQRPCGRVLLCENHTCKKLCHNIIAAPDNIKAGENCDVCESECLKVRPEGCTHACPKPCHPNECPPCKQMLRIKCHCGLNQPYVPCSEWNNIESREQLQCCGNQCPNNYECGHRCRSSCHSGPCPNPESCKKKVKVFCKCKRIKKEFPCETLRKGEAVVNCDEICEQKKEEERKQKELEREQRKKEEDLKNQRELEKYEKMFHGKKKNRERKIQEETEDKSVLRKYWLLCACFVVAILAVTFYYYINV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01258905;
90% Identity: iTF_01258905;
80% Identity: -