Basic Information

Insect: Bactrocera dorsalis
Gene Symbol: nfxl1_1
Assembly: GCA_000789215.2
Location: NW:217970-221918[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 1.6 1e+04 -3.8 2.1 15 19 217 221 216 221 0.82

2 18 0.14 8.7e+02 -0.4 0.4 4 10 252 258 251 258 0.95

3 18 5.8e-09 3.6e-05 23.2 15.1 1 19 266 283 266 283 0.98

4 18 1.6 1e+04 -3.8 1.1 5 10 308 313 308 313 0.91

5 18 3.3e-06 0.02 14.4 14.8 1 19 319 338 319 338 0.96

6 18 1.1e-07 0.00066 19.1 12.5 1 19 373 391 373 391 0.99

7 18 1.4 8.5e+03 -3.6 0.4 1 8 416 422 416 423 0.59

8 18 8e-08 0.00049 19.5 10.6 1 18 426 443 426 444 0.96

9 18 0.23 1.4e+03 -1.1 0.5 1 5 453 457 453 462 0.75

10 18 2 1.2e+04 -5.1 2.3 5 10 467 472 467 472 0.91

11 18 0.00014 0.89 9.1 15.1 1 18 478 496 478 497 0.92

12 18 4.1e-08 0.00025 20.5 15.5 1 18 506 523 500 524 0.86

13 18 0.0063 39 3.9 6.1 9 18 569 578 567 579 0.89

14 18 0.039 2.4e+02 1.3 4.7 3 11 592 600 582 601 0.86

15 18 0.94 5.8e+03 -3.1 1.4 6 10 661 665 660 665 0.88

16 18 3.4e-06 0.021 14.3 5.4 1 11 671 681 671 682 0.96

17 18 0.0062 38 3.9 15.7 3 18 711 726 710 727 0.93

18 18 0.00011 0.68 9.5 16.4 1 16 778 792 778 798 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	1.6	1e+04	-3.8	2.1	15	19	217	221	216	221	0.82
2	18	0.14	8.7e+02	-0.4	0.4	4	10	252	258	251	258	0.95
3	18	5.8e-09	3.6e-05	23.2	15.1	1	19	266	283	266	283	0.98
4	18	1.6	1e+04	-3.8	1.1	5	10	308	313	308	313	0.91
5	18	3.3e-06	0.02	14.4	14.8	1	19	319	338	319	338	0.96
6	18	1.1e-07	0.00066	19.1	12.5	1	19	373	391	373	391	0.99
7	18	1.4	8.5e+03	-3.6	0.4	1	8	416	422	416	423	0.59
8	18	8e-08	0.00049	19.5	10.6	1	18	426	443	426	444	0.96
9	18	0.23	1.4e+03	-1.1	0.5	1	5	453	457	453	462	0.75
10	18	2	1.2e+04	-5.1	2.3	5	10	467	472	467	472	0.91
11	18	0.00014	0.89	9.1	15.1	1	18	478	496	478	497	0.92
12	18	4.1e-08	0.00025	20.5	15.5	1	18	506	523	500	524	0.86
13	18	0.0063	39	3.9	6.1	9	18	569	578	567	579	0.89
14	18	0.039	2.4e+02	1.3	4.7	3	11	592	600	582	601	0.86
15	18	0.94	5.8e+03	-3.1	1.4	6	10	661	665	660	665	0.88
16	18	3.4e-06	0.021	14.3	5.4	1	11	671	681	671	682	0.96
17	18	0.0062	38	3.9	15.7	3	18	711	726	710	727	0.93
18	18	0.00011	0.68	9.5	16.4	1	16	778	792	778	798	0.92

Sequence Information

Coding Sequence: ATGAAAAAtcctccaaaaataaataaattacaaatttctggTAACCTTGAAGTGGATCTGAAACAGCCGGttcagaaaattgttttaattccCACGTCAGAAACAgaaatcttaacaatttctaaaaaaatgtctGTGTTTTCTGCCAAGAACGAAAAAATGAAAGGAGGCTCCAAGTCAAATCAACAAAAACCGAATGGAGCAACTCGTTTTGAAGAAGTACATGCACGGCATATAGCTGCCGCAAAgaaaatagtggaaaaataTTCCTCTAGTTCCGATGAAGAGGAAGAGGAGCTTAACGAATCTAAAATATTAgaTTCTCTATTTAAGCATTACAAGTCTGACGGCAGCCGCTTAGGTATCCAACAAgcactacaacaaaaaactgcTACCTTCTTTGAAAACGCTTTGCATTCAGGATCAGCAACTTGTCTAATTTGTATTGGTAGTGTGCGCCGAGCTGACTCGATTTGGACCTGTAAACATTGCTATTGTTTCTTCCATTTAAACTGTATACGACGCTGGGCCAATGATAGCATCGCGCAGCAGAAAGCATCCACTGAACAAACAAGCAATGAACAGGGTTACTACAATAATCTTGGACAGTTCGTACCGCCGAAGCGGAAGCGGCCATTGCACTGGAGTTGTCCACAGTGTCGCAAAGATTACTGTTTGGAGGAAAAGCCGGCAACTTATAAGTGCTTTTGtggaaaagaagaaaatccACGCCCCGCAGCATTTTTATTACCGCATTCTTGTGGAGAAATATGCGGAAAAAACTTGCAACCAACCTGTGGTCATACATGTATGTTGCTTTGCCATCCGGGTCCATGCCCGCCCTGTTCTCAGTATGCTACAACCAGTTGCCTATGTGGTCAATCACAGAAAAAATCCGTACGTTGTATAGATAAAGAGTGGAAATGTGATAGAAAGTGTAAAGAATTACTTCCATGTGGCGAACATCGATGTAAAGAGTTATGTCATAAGCCCAATCAGTGTCCACCATGTACGAGTACCAGTTTGCAGCCGTGCGAATGTGGTGCTGAGACGAAGAAACGTAATTGTTCCGAACTTAAATGGCATTGCAAAAAGaTTTGCGGCTCAAAATATTCTTGTGGAGCACACGTGTGTAAGCGCGTATGCCACTCGGGGTCTTGCGGTGATTGTCCTTTAAGTTTACCGCGTTCATGTCCATGTGGTAAAACCCAAAAAATCGTACCGTGTATCGAAAACATTGATCCTTGTGGTGATACTTGTCAAAAACTATTATCGTGTGGGCTGCATACTTGCACGCAACGATGTCATCGTGGCGAATGTAATTTGtgtttaataataacaaaaaagaaatgccGCTGTGGCATACATGAAAAGGAATTGCCGtgctggaaaatatttacatgtgaAACCAAATGCAAGCAAATGAGAGATTGTGGCAAACATACTTGTAACAAAAAGTGTTGTGATGGTCGCAGCTGTCAACAATGTgataaaatatgtggaaaacCGCTCACTTGTCAAAAACACAAGTGCCAGTCGGTTTGTCATGAAGGACCTTGTTATCCTTGTAATCAGCAATCACAAGTAAATTGTCGATGTGGAAAAACATCAAAACGTGTCCCTTGTGGACGTGAACGTACAGCCCGCGTTATGTGCATGGAATTATGCCGTATTCCTTCAAAATGTCACCATCCAATCAAACATCGCTGTCACAAAAACGAATGTCCACCTTGTAATCAAAAATGTGGACAGGTAAATGACACCACTGGATGTCTGCATATTTGCGAAGCTAAGTGTCATGCCGCAGTTAAAGTTATCAAACAAAATCCGATTAATGGCGGTGCAAATGTGTGGCATCAAAGCAAACagTTTGAATTCAAAAAGCAGCCGCATCCGCCATGTGAACAATTGGTGAAAGTCACGTGTATTGGTGGTCATGAAATAGCTGAATGGCCTTGTTGGAATTCTAAACCAACATCCTGTCAACGCAAATGTAATCGAGCATTGCGTTGTGGTAACCACAAATGTGAGCTTATATGCCACGCCGTGCCCGACTTGAAAGATATGAAGgAGCAACTTGGCTGCGCCCGATGCCAAGAGGGTTGCAATGTATCCCGTCCAGCGGGTTGTGAGCATGCTTGCCCTCGACCTTGTCACGCTCCGCCATGTAATCCATGTGACAAAATGATCAAAAACAAATGTTATTGTGGTTTAACACAATTAATCTACAAATGTTCAGAATATTTTCGAGTCGAAGGTACCAAAGAGGAAATCGCTTTAACACAGGAACGCCTGAAGAGCTGCGGAAACCGTTGCCTCAAAACTTTTTCATGCGGTCATCGCTGTCATACACCTTGTCATCCGGGGAAGTGTCCAAACCCGGAATTGTGTCGCAAAAAAGTGCGCATATTTTGCGAATGCAAACGTTTGAAAGCAGAAATCGCCTGTGATAAACATCGTGCTGGTCAAACATCTATACCTTGTGATGAATTTTGCGTTGAGACACGGATAAAGTTGGCAGAACAGTTGAAAcgggaacaagaaaaattacgCCAACAAGAAGAGGCGAAAAATCGTGCAGAAGTTGAacaatttgaaaagaaattcaGCAAACGTAAATACAAAGAACGTAAGGTCGTCGTAGAGAAACCAAATAGGCAGATAAATTGGAAGTTATTAAGCATTTATGGTGGTATTATACTAGCAATCGTTTTAGCTATTGCTGTAGCTTTCTATGCCGATAGTTAA
Protein Sequence: MKNPPKINKLQISGNLEVDLKQPVQKIVLIPTSETEILTISKKMSVFSAKNEKMKGGSKSNQQKPNGATRFEEVHARHIAAAKKIVEKYSSSSDEEEEELNESKILDSLFKHYKSDGSRLGIQQALQQKTATFFENALHSGSATCLICIGSVRRADSIWTCKHCYCFFHLNCIRRWANDSIAQQKASTEQTSNEQGYYNNLGQFVPPKRKRPLHWSCPQCRKDYCLEEKPATYKCFCGKEENPRPAAFLLPHSCGEICGKNLQPTCGHTCMLLCHPGPCPPCSQYATTSCLCGQSQKKSVRCIDKEWKCDRKCKELLPCGEHRCKELCHKPNQCPPCTSTSLQPCECGAETKKRNCSELKWHCKKICGSKYSCGAHVCKRVCHSGSCGDCPLSLPRSCPCGKTQKIVPCIENIDPCGDTCQKLLSCGLHTCTQRCHRGECNLCLIITKKKCRCGIHEKELPCWKIFTCETKCKQMRDCGKHTCNKKCCDGRSCQQCDKICGKPLTCQKHKCQSVCHEGPCYPCNQQSQVNCRCGKTSKRVPCGRERTARVMCMELCRIPSKCHHPIKHRCHKNECPPCNQKCGQVNDTTGCLHICEAKCHAAVKVIKQNPINGGANVWHQSKQFEFKKQPHPPCEQLVKVTCIGGHEIAEWPCWNSKPTSCQRKCNRALRCGNHKCELICHAVPDLKDMKEQLGCARCQEGCNVSRPAGCEHACPRPCHAPPCNPCDKMIKNKCYCGLTQLIYKCSEYFRVEGTKEEIALTQERLKSCGNRCLKTFSCGHRCHTPCHPGKCPNPELCRKKVRIFCECKRLKAEIACDKHRAGQTSIPCDEFCVETRIKLAEQLKREQEKLRQQEEAKNRAEVEQFEKKFSKRKYKERKVVVEKPNRQINWKLLSIYGGIILAIVLAIAVAFYADS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00191751; iTF_00192487; iTF_01563367; iTF_00193992; iTF_00190378; iTF_00193233; iTF_00304215; iTF_01564223; iTF_01045918; iTF_00083584; iTF_00082597; iTF_00081817;
90% Identity: iTF_01564223;
80% Identity: -