Basic Information

Insect: Proctacanthus coquilletti
Gene Symbol: nfxl1_1
Assembly: GCA_001932985.1
Location: MNCL01000065.1:393464-396911[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 2 2.7e+04 -5.1 1.9 15 19 171 175 171 175 0.85

2 19 0.09 1.2e+03 0.2 0.4 4 10 206 212 205 212 0.96

3 19 2.9e-08 0.00039 20.9 16.6 1 19 220 237 220 237 0.99

4 19 1.4 1.9e+04 -3.7 0.9 5 10 262 267 262 267 0.91

5 19 3.1e-05 0.41 11.3 15.5 1 19 273 292 273 292 0.96

6 19 1.4 1.8e+04 -3.6 1.8 6 10 317 321 316 321 0.89

7 19 2e-08 0.00027 21.4 11.3 1 19 327 345 327 345 0.99

8 19 0.92 1.2e+04 -3.0 0.5 1 7 370 375 369 377 0.49

9 19 1.5e-07 0.002 18.7 10.8 1 18 380 397 380 398 0.96

10 19 1.7e-06 0.022 15.3 18.8 1 18 432 449 432 450 0.98

11 19 2.1e-08 0.00028 21.4 12.1 3 18 461 476 459 477 0.91

12 19 1.5 2e+04 -3.7 1.9 5 10 505 510 505 510 0.73

13 19 1.6 2.1e+04 -3.8 0.5 9 12 515 518 514 520 0.72

14 19 0.12 1.6e+03 -0.2 6.9 10 19 524 533 521 533 0.91

15 19 0.027 3.6e+02 1.9 5.7 4 12 547 555 545 555 0.89

16 19 0.72 9.6e+03 -2.7 0.9 6 10 616 620 615 620 0.89

17 19 6.1e-07 0.0081 16.7 7.2 1 12 626 637 626 637 0.97

18 19 0.019 2.5e+02 2.4 15.1 3 19 666 682 665 682 0.91

19 19 3.1e-06 0.041 14.5 11.9 1 16 733 747 733 753 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	2	2.7e+04	-5.1	1.9	15	19	171	175	171	175	0.85
2	19	0.09	1.2e+03	0.2	0.4	4	10	206	212	205	212	0.96
3	19	2.9e-08	0.00039	20.9	16.6	1	19	220	237	220	237	0.99
4	19	1.4	1.9e+04	-3.7	0.9	5	10	262	267	262	267	0.91
5	19	3.1e-05	0.41	11.3	15.5	1	19	273	292	273	292	0.96
6	19	1.4	1.8e+04	-3.6	1.8	6	10	317	321	316	321	0.89
7	19	2e-08	0.00027	21.4	11.3	1	19	327	345	327	345	0.99
8	19	0.92	1.2e+04	-3.0	0.5	1	7	370	375	369	377	0.49
9	19	1.5e-07	0.002	18.7	10.8	1	18	380	397	380	398	0.96
10	19	1.7e-06	0.022	15.3	18.8	1	18	432	449	432	450	0.98
11	19	2.1e-08	0.00028	21.4	12.1	3	18	461	476	459	477	0.91
12	19	1.5	2e+04	-3.7	1.9	5	10	505	510	505	510	0.73
13	19	1.6	2.1e+04	-3.8	0.5	9	12	515	518	514	520	0.72
14	19	0.12	1.6e+03	-0.2	6.9	10	19	524	533	521	533	0.91
15	19	0.027	3.6e+02	1.9	5.7	4	12	547	555	545	555	0.89
16	19	0.72	9.6e+03	-2.7	0.9	6	10	616	620	615	620	0.89
17	19	6.1e-07	0.0081	16.7	7.2	1	12	626	637	626	637	0.97
18	19	0.019	2.5e+02	2.4	15.1	3	19	666	682	665	682	0.91
19	19	3.1e-06	0.041	14.5	11.9	1	16	733	747	733	753	0.87

Sequence Information

Coding Sequence: ATGTCTGCAAATCCTtggaaaattacttcaaaaccGGAACCAAGGAAGGCAAACATtatgaaaaatcataaaaagcaCGAGTGTACCAACGAGGTGGCACAgaagaaatttgaagaagtccaagcgaaaaatattgagaaagcGAAAACCTATACTGAGAATTACAATTCCAGTTCTGATGAAGAGGAAGAATTAAACACCGGTGATATTCTAAtgaaattgtttaaatattatgcCGGAGAACGGAATCAGCTTTCGAAAACAGAAGCTTTCTTAGAGAACTTTTTGCAGTCGGGATCCGCTATATGCTTGATTTGCATAGGAACTGTTAAGCGAAATGATTCGATTTGGTCGTGCAAGAACTGCTATTGCTTTTTCCATCTTCAATGCATTAAACGTTGGGGAAACGATAGCATTTCTCAACAAAAGATTACTGTAAACGAGGAGCAAGgctattataataatttaggaCAATATGTGCCTAAGAAGATAAAGCAGATTAAGTGGTATTGTCCCAAATGCAGAAAGGAATACCATCCAGAAGACATTCCGAAAGTGTATGTTTGCTTCTGCGAGAAGGAGATCAATCCTAACCCACATCCTTGGACAATCCCACATTCGTGCGGTGAGCTTTGTGAGAAATACCTTGTACCCGATTGCGGCCACAGATGCCTACTTCTTTGCCATCCAGGACCATGCCCTCCTTGTCCGCAAAGCATTTTGACTTCATGCAAGTGCAAGAAATCTAAACCTAAGTCGATCAGGTGCTTTCAGAAATCGTGGACTTGTGATTCTAAATGCCAATGTCTATTGGCTTGTGGCATTCATAAATGCGAACAGGGATGTCACAGTCCACGTGAGTGCCCTCCTTGCACAAAGAAAAGTAAGCAAAGGTGCCAGTGTGGGGCAGAGATGTCTGAACGAAACTGCTCTGAACTCATTTGGCAATGTAAGAAGGTCTGCAACAAGCCCTACAGTTGTGGCATTCATAAGTGCAAAAAAGTATGCCACGCCGACGACTGTGGCACTTGTCCATTAGGACTTCCAAGATCTTGCCCCTGTGGGAAAactAAAACCGTTGCGCCTTGCAGTGAGGTCATAGACACCTGTGGAGATACTTGCCAAAAACTCCTCGCTTGTGGGCTTCATAACTGTACACAAAGGTGCCATAAAGGCGAATGCAGTCTTTGTCTAACTATTGTCGAAAAAAAATGCCGATGTGGTCTTCGAACGAAGGAGCAACCATGCTCTCGTCCATTTATTTGTGAAACCAAATGCAAGCAGATTAGGGACTGTGGAAAGCATCCGTGTAACAAAAAGTGCTGCGACGGCCAATGTCCTCCATGCGATAAAATATGCTCAAAAACCCTTTCgtgtaaaaaacataaatgtaAGTCTGTTTGCCACGATGGTCCTTGTTATCCATGCGATTTAAAATCGCAAGTTAAGTGCCGATGTGGTTTTACATCAATAACAGTGCCTTGcggaagagaaaaaaagactCGGTCCCCAAAATGTCACCAACCGTGCAGAATTGCATCGAAATGCCACCACCAAAACCCTCACAACTGCCACATGAACGAGTGTCCACCGTGCACACAAAGATGTAACCTCAAGAACGACGTAACCAACTGCGACCACCCCTGTGAGGCCAAGTGCCACGATGCTGTAAAAGTAGCAGTAGATCCCAGAAATCAAAAGCCAGTCAGCATTTGGGAATGGAATGTAGAGAAGtttgaaattaaaaaactgccGCATCCACGTTGCGAAGTCAAAGTTATGGTAACCTGCCTGGGAGGTCACGAGACAGCGCTTTGGCCCTGCTGGAATTCGAAGCCTAGCTCGTGTGAGAAGATTTGCGGACGAGTTTTGAAATGTGGTAATCACACTTGCCAAAGGATATGCCACTCCGTTGCTAACATCGAGAACAAAAACGAGCAAGAGGGCTGCATTTCTTGCGAGGAGGAATGCAAGATACCGAGAACCAATGGGTGTACACATCCCTGTCGAAAACCTTGCCACTTGGCCCCTTGTACACCCTGTACAGTTACTGTGAAGTCAAATTGCCATTGTGGTCTGGGCCAGGTGTACTACAAGTGTTCCGAATTTAATAGAACCGACATTAATCTTGAGTCCTTGCAAAAACTCCGAGATCAACTTAAAAGTTGTGGCAATCGATGTATTAAGAATTACACTTGTGGTCATCGGTGTGTATCTGTTTGCCACGCAGGTGAATGTCCCGACCcggaaaagtgtaaaaaaaaggtaaagatTTATTGCAAATGTAAGAACTTGAAGGCGGAAATTACGTGCGAGAAATATCGCAATGGATTCACCATTATTTCTTGCGACGATGTCTGTGCTCAGAAAATGGAAGCTGAAGAACGAGCTAAACACGAAATGGAAGAAAAGCGACGAAAACTGGAAGAAGAGAAAAACCGTCTAGAACTGGAGCAATTCGagaaaaagtttggaaaaaagaaacaccGCGAACGAAAAGTTTACGAGCAAACTCCAGAAGGGAAAAACCTTGAAATTCTGTGGATCATTTCCAGCGTTCTATCAGTAACATTCGCAGTACTTTTGGctatttatttcctaaattgA
Protein Sequence: MSANPWKITSKPEPRKANIMKNHKKHECTNEVAQKKFEEVQAKNIEKAKTYTENYNSSSDEEEELNTGDILMKLFKYYAGERNQLSKTEAFLENFLQSGSAICLICIGTVKRNDSIWSCKNCYCFFHLQCIKRWGNDSISQQKITVNEEQGYYNNLGQYVPKKIKQIKWYCPKCRKEYHPEDIPKVYVCFCEKEINPNPHPWTIPHSCGELCEKYLVPDCGHRCLLLCHPGPCPPCPQSILTSCKCKKSKPKSIRCFQKSWTCDSKCQCLLACGIHKCEQGCHSPRECPPCTKKSKQRCQCGAEMSERNCSELIWQCKKVCNKPYSCGIHKCKKVCHADDCGTCPLGLPRSCPCGKTKTVAPCSEVIDTCGDTCQKLLACGLHNCTQRCHKGECSLCLTIVEKKCRCGLRTKEQPCSRPFICETKCKQIRDCGKHPCNKKCCDGQCPPCDKICSKTLSCKKHKCKSVCHDGPCYPCDLKSQVKCRCGFTSITVPCGREKKTRSPKCHQPCRIASKCHHQNPHNCHMNECPPCTQRCNLKNDVTNCDHPCEAKCHDAVKVAVDPRNQKPVSIWEWNVEKFEIKKLPHPRCEVKVMVTCLGGHETALWPCWNSKPSSCEKICGRVLKCGNHTCQRICHSVANIENKNEQEGCISCEEECKIPRTNGCTHPCRKPCHLAPCTPCTVTVKSNCHCGLGQVYYKCSEFNRTDINLESLQKLRDQLKSCGNRCIKNYTCGHRCVSVCHAGECPDPEKCKKKVKIYCKCKNLKAEITCEKYRNGFTIISCDDVCAQKMEAEERAKHEMEEKRRKLEEEKNRLELEQFEKKFGKKKHRERKVYEQTPEGKNLEILWIISSVLSVTFAVLLAIYFLN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00937704;
90% Identity: -
80% Identity: -