Basic Information

Insect: Drosophila paulistorum
Gene Symbol: nfxl1_1
Assembly: GCA_018152135.1
Location: JAECXG010000018.1:2214377-2235409[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 2 1.9e+04 -8.1 6.4 15 19 149 153 148 153 0.82

2 18 0.15 1.4e+03 -0.5 0.2 4 10 184 190 183 190 0.95

3 18 6.5e-08 0.00062 19.8 15.5 1 18 198 214 198 215 0.98

4 18 1.6 1.5e+04 -3.8 2.6 6 10 241 245 240 245 0.89

5 18 2.7e-06 0.026 14.6 15.0 1 19 251 270 251 270 0.96

6 18 0.46 4.3e+03 -2.1 1.0 5 10 294 299 294 299 0.93

7 18 2.7e-08 0.00026 21.0 10.2 1 19 305 325 305 325 0.93

8 18 1.6 1.6e+04 -3.8 0.8 6 10 349 353 348 355 0.54

9 18 1e-08 9.9e-05 22.4 14.4 1 18 359 376 359 377 0.97

10 18 0.7 6.7e+03 -2.7 0.4 1 5 386 390 386 395 0.73

11 18 0.0011 11 6.3 14.9 1 18 411 428 411 429 0.97

12 18 2.4e-08 0.00023 21.2 14.8 1 19 438 456 432 456 0.90

13 18 1.8e-05 0.17 12.0 7.4 9 19 501 511 499 511 0.88

14 18 0.00075 7.1 6.8 5.0 1 12 523 533 523 533 0.96

15 18 5.4e-05 0.51 10.5 6.5 1 11 600 610 600 611 0.96

16 18 0.035 3.3e+02 1.5 14.5 1 18 639 655 639 656 0.95

17 18 1.7 1.6e+04 -3.9 1.6 8 13 661 666 660 666 0.74

18 18 7.4e-06 0.07 13.3 10.3 1 16 707 721 707 727 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	2	1.9e+04	-8.1	6.4	15	19	149	153	148	153	0.82
2	18	0.15	1.4e+03	-0.5	0.2	4	10	184	190	183	190	0.95
3	18	6.5e-08	0.00062	19.8	15.5	1	18	198	214	198	215	0.98
4	18	1.6	1.5e+04	-3.8	2.6	6	10	241	245	240	245	0.89
5	18	2.7e-06	0.026	14.6	15.0	1	19	251	270	251	270	0.96
6	18	0.46	4.3e+03	-2.1	1.0	5	10	294	299	294	299	0.93
7	18	2.7e-08	0.00026	21.0	10.2	1	19	305	325	305	325	0.93
8	18	1.6	1.6e+04	-3.8	0.8	6	10	349	353	348	355	0.54
9	18	1e-08	9.9e-05	22.4	14.4	1	18	359	376	359	377	0.97
10	18	0.7	6.7e+03	-2.7	0.4	1	5	386	390	386	395	0.73
11	18	0.0011	11	6.3	14.9	1	18	411	428	411	429	0.97
12	18	2.4e-08	0.00023	21.2	14.8	1	19	438	456	432	456	0.90
13	18	1.8e-05	0.17	12.0	7.4	9	19	501	511	499	511	0.88
14	18	0.00075	7.1	6.8	5.0	1	12	523	533	523	533	0.96
15	18	5.4e-05	0.51	10.5	6.5	1	11	600	610	600	611	0.96
16	18	0.035	3.3e+02	1.5	14.5	1	18	639	655	639	656	0.95
17	18	1.7	1.6e+04	-3.9	1.6	8	13	661	666	660	666	0.74
18	18	7.4e-06	0.07	13.3	10.3	1	16	707	721	707	727	0.92

Sequence Information

Coding Sequence: ATGGAAGATCATAAACATGTGCAATCAAAAAACTTGGCATCTGGAAAGAGACTTGAGAATACCTTTACCTATATCTCTAGTTCAGATGATGAAGAAGAATTGGATGAAAAGCATATCTTGGAACTATTGTACAAGAACTACCAACCCAGCTCGGATACATCTCGAACCCAAATTAACCGTACATCCGTGTTTCTTGAAAATATACTGCATTCAGGAGCTGCAACATGCCTAATATGTATTGGTGGCATCAAACGCGTAGAGTCAATTTGGTCGTGTCAAGCTTGTTATTGTTTTTTTCACCTAAATTGCATTCAACGCTGGGCTAATGACAGTGTCATGCAAATGAAGGTAAAAGGAGAGCAGCAGCGAAATGACAATCAGGGCTACTATAATCATCTGGGGGAGTTTGTTCCACCAAAGCGTGAAAAGTCTCTTCACTGGTGCTGCCCGCAGTGTCGTATGGAATATCAGCCTGAGGAGAGGCCGACAACTTACAACTGTTTTTGTAGTAAGGAAATCAATCCTACTGCACAGCCCTTCCTAGTTCCACATTCATGTGGCGATGTCTGCGGAAAGTTCCTAGAACCAAAGTGTGGCCATGACTGCAAACTTCTATGTCATCCGGGGCCTTGTCCACCGTGTGCGCAGCAGTCTCAAAATACTTGCCGTTGCGGCAAATCTGCGCCACGGCCTCTGCGCTGCATTGACCGCGATTGGCAATGCCAAGAAAAATGCGAAAAGCTTCTATCATGTGGCAAACACAAATGCAATCAGAGATGTCACCGTGCAGGAAACTGCCCAGGCTGCACTAGCCAGAGTACACAACCATGTGAGTGTGGACGAGATATGAAGGTTGTCAACTGCGCCAATAGAAAATGGAAATGCCAGAATATTTGTGGTGTCCGGTTTGTCTGTGGACTGCATTCTTGTGATAAAATATGTCATAAAGGACCATGCGAAATGATCGAGTGTCCCTTTAACGTCCGAAGCTGTCCCTGCGGTAAAAATAGCCAATCATTGCCATGCAGTGAAGTGGTGGATACCTGTGGCGACACTTGTCAAAAGATTTTGTCATGCGGCCAACACAAATGCACGCAACGTTGTCATCGTGGACCTTGCAATTCGTGCCTAGTGACAACAAGGAAGAAGTGCCGCTGTGGTCTACACGAAAAAGAGCTGCCATGCTCTAAAGAGTTTACGTGTGATACTAAATGCAAGCAAGTACGGGACTGCGGAAAACATGCTTGCAACAGAAAGTGCTGCGGAGATCAGTGTTTGCCCTGTGAGAAGATATGTGGCAAGCCTTTGAGTTGCAACAAGCACAAATGCCAATCAGTTTGTCACCGTGGGCCTTGTTATCCATGCAGGCTGGAGTCAGTAGTTAATTGCCGATGTGGCAAGACACGACGAAGTGTTCCTTGTGGAAGAGAGAGAAATACACGGAACCTATGCCTTGAGCTGTGTCGAGTTTCATCCAAGTGTCATCATATTGTAGAACATCGTTGCCATAAGGGTGATTGTCCCCCATGCCGCCAGAAATGTGGCCTTCCAAATGATGTCAGCGGTTGTGGCCACATTTGCAAAGCTGTATGCCACGATGCCATAAAAGTCAAAAATCAGAAATCATTAAATACCAAAACGCAGATCAAAAAAAAATATGAATATAAATCCTTGCCACATCCGCGTTGTGAGGAGAGCGTAAATGTTAAATGTATTGGTGGTCACGAAGTGGTAACCACACCTTGCTGGAACTCTAAGCCAACATCGTGTTATCGCAAATGTAACAGAGTATTAAAATGTGGTAATCATCAATGTAATCTTACGTGTCACGCGGTACCGAATTTGGAGAGCATGCAGCAACAGGTAGGCTGTATCAACTGTGAGGAGGGCTGCGTTAGACCCAGATCCAGTGGTTGTAGTCATCCCTGTCCCAAACGATGTCACTTACCTCCCTGCTCTCCATGCATTGTTTTGCTTAAAAGTAAGTGCCATTGCGGACTCATACAAGTAATGTACAAATGCAGCGAATTGTTTAATGAGACGGGCTCAATCCAGGAGCAACTCGAGCAAAAGGAAAGATTGGGAAGCTGCGGGAATCGTTGTATTAAAAATTTTCCTTGCGGTCATCGATGTCTAGCCATTTGTCACTCTGGGATATGCCCAGGTCCTGAGTTATGTCGCAAAAAAGTACGCATTTACTGCCCATGCAAAACGTTAAAGCAAGAAATTTCATGTGATATTCATCGAGCTGGCAAATTGTTACTACAGTGCAACTCCCAATGTGAAGCTGATAACTCACGTGCTTTTAAAGAACTTGCACAAAAACAACACTTGGAAGAAGAAAAAAATCGTCTGGAGTTGGAGAAATTTCAACAAAAGTTTGGAAAGCGCAAGCACAAGGAGCGCAGAATTGCAGAAATAGGGCCAAGCCAAAAGAATTTTAATTGGCAACGCGGAGCCATCTATGCTGTGTCTTTAACTGCAACATTAGGGGCGCTGGCAGTAGCTTACTATGCAGATAGGTAA
Protein Sequence: MEDHKHVQSKNLASGKRLENTFTYISSSDDEEELDEKHILELLYKNYQPSSDTSRTQINRTSVFLENILHSGAATCLICIGGIKRVESIWSCQACYCFFHLNCIQRWANDSVMQMKVKGEQQRNDNQGYYNHLGEFVPPKREKSLHWCCPQCRMEYQPEERPTTYNCFCSKEINPTAQPFLVPHSCGDVCGKFLEPKCGHDCKLLCHPGPCPPCAQQSQNTCRCGKSAPRPLRCIDRDWQCQEKCEKLLSCGKHKCNQRCHRAGNCPGCTSQSTQPCECGRDMKVVNCANRKWKCQNICGVRFVCGLHSCDKICHKGPCEMIECPFNVRSCPCGKNSQSLPCSEVVDTCGDTCQKILSCGQHKCTQRCHRGPCNSCLVTTRKKCRCGLHEKELPCSKEFTCDTKCKQVRDCGKHACNRKCCGDQCLPCEKICGKPLSCNKHKCQSVCHRGPCYPCRLESVVNCRCGKTRRSVPCGRERNTRNLCLELCRVSSKCHHIVEHRCHKGDCPPCRQKCGLPNDVSGCGHICKAVCHDAIKVKNQKSLNTKTQIKKKYEYKSLPHPRCEESVNVKCIGGHEVVTTPCWNSKPTSCYRKCNRVLKCGNHQCNLTCHAVPNLESMQQQVGCINCEEGCVRPRSSGCSHPCPKRCHLPPCSPCIVLLKSKCHCGLIQVMYKCSELFNETGSIQEQLEQKERLGSCGNRCIKNFPCGHRCLAICHSGICPGPELCRKKVRIYCPCKTLKQEISCDIHRAGKLLLQCNSQCEADNSRAFKELAQKQHLEEEKNRLELEKFQQKFGKRKHKERRIAEIGPSQKNFNWQRGAIYAVSLTATLGALAVAYYADR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00524104; iTF_00612497; iTF_00618838; iTF_00503679;
90% Identity: iTF_00612497;
80% Identity: -