Basic Information

Insect: Anopheles cruzii
Gene Symbol: nfxl1_1
Assembly: GCA_943734635.1
Location: OX030879.1:60731337-60734348[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 0.92 7.1e+03 -3.0 1.4 14 19 212 217 212 217 0.86

2 16 0.074 5.7e+02 0.5 0.3 4 10 248 254 247 256 0.94

3 16 2.2e-06 0.017 14.9 20.6 1 19 262 279 262 279 0.98

4 16 2.8e-06 0.022 14.6 15.2 1 19 315 334 315 334 0.93

5 16 0.00013 1 9.3 16.5 3 19 371 387 359 387 0.88

6 16 0.89 6.9e+03 -3.0 0.5 1 8 412 418 411 419 0.50

7 16 8.5e-09 6.6e-05 22.6 10.8 1 18 422 439 422 440 0.97

8 16 2 1.6e+04 -5.1 2.3 5 10 463 468 463 468 0.91

9 16 3.5e-06 0.028 14.3 16.9 1 18 474 491 474 492 0.97

10 16 2.8e-06 0.022 14.6 21.5 1 18 501 518 501 519 0.97

11 16 0.0012 9.1 6.2 13.9 8 19 564 575 558 575 0.87

12 16 0.16 1.3e+03 -0.6 5.5 3 12 588 597 578 597 0.85

13 16 5.8e-05 0.45 10.4 4.4 1 12 668 679 668 679 0.97

14 16 1 8e+03 -3.2 1.1 15 18 692 695 691 696 0.85

15 16 0.0022 17 5.3 16.1 4 19 709 724 707 724 0.93

16 16 1.4e-06 0.011 15.6 12.3 1 16 782 796 782 802 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	0.92	7.1e+03	-3.0	1.4	14	19	212	217	212	217	0.86
2	16	0.074	5.7e+02	0.5	0.3	4	10	248	254	247	256	0.94
3	16	2.2e-06	0.017	14.9	20.6	1	19	262	279	262	279	0.98
4	16	2.8e-06	0.022	14.6	15.2	1	19	315	334	315	334	0.93
5	16	0.00013	1	9.3	16.5	3	19	371	387	359	387	0.88
6	16	0.89	6.9e+03	-3.0	0.5	1	8	412	418	411	419	0.50
7	16	8.5e-09	6.6e-05	22.6	10.8	1	18	422	439	422	440	0.97
8	16	2	1.6e+04	-5.1	2.3	5	10	463	468	463	468	0.91
9	16	3.5e-06	0.028	14.3	16.9	1	18	474	491	474	492	0.97
10	16	2.8e-06	0.022	14.6	21.5	1	18	501	518	501	519	0.97
11	16	0.0012	9.1	6.2	13.9	8	19	564	575	558	575	0.87
12	16	0.16	1.3e+03	-0.6	5.5	3	12	588	597	578	597	0.85
13	16	5.8e-05	0.45	10.4	4.4	1	12	668	679	668	679	0.97
14	16	1	8e+03	-3.2	1.1	15	18	692	695	691	696	0.85
15	16	0.0022	17	5.3	16.1	4	19	709	724	707	724	0.93
16	16	1.4e-06	0.011	15.6	12.3	1	16	782	796	782	802	0.93

Sequence Information

Coding Sequence: ATGGCCCATCGGGATCGTAAGTTACAAGCGCCGAAAGTCCCAAACGCTTGGAGACTTCCGGCGCCGCCGCCGCCCATGCAACCCGGCCAAAAGAAAACACCGGCCCCAAGTAACCGATTGTCGGAGGAACGCCTGGGTGGTTCCAAGATTCCGCAACCCTCGAAACTTTCCCCGTCGGCGGGTGGTAAGCAAAAGACCGCCCAGGAGAAGTTTAATCAAGTTCAGCGCGAGCACATGGAAAAGGCGCGGCTCTACACGAAGGAGTATATCTCGAGCGAGGAAGAGAGCGACGATGACGGTGGTACGGTCGGTACCGATGCGGCCACGCAAAACATTCTCGGCGAGGTGTTGAAAAACTATCACGGAGCAGACTCGGACATGGGCCGAACGCAGGAATATCTCCAGAGCCTACTCGAATCACGCAACGCCGTTTGCTTGATCTGCATCGAGAGCGTCAAGCGAGCGGATAAGATTTGGTCGTGCCACGCGTGCTACACGTTTTTCCACCTCATGTGCATCCAACGGTGGGCCAACGATAGCATCTCGATGAAGCGCATCAACCACGAGCAGCAGGAAGGCTACTACAACAACCGGGGCGAGTACGTGCCGAAGCCGGTCCTCTCGGTGCACTGGGATTGCCCAAAGTGTCGCAAAGAGTACGAACCGGTCGCCATTCCGCGTCACTACGAGTGTTTCTGCGGCAAGGAACGGGATCCGAGTCAGCATCCGTGGCTCATACCACATTCGTGTGGGGAACCGTGCGGCAAGCAGCTGAAACCCGCCTGTGGTCACCACTGCCGGTTGCTGTGCCACCCGGGGCCATGCCCCCCGTGTCCGCAGACCATCAATGTATCGTGCCGATGCGCGAAATCGGCTCCGAAAACTATCCGATGTTCACAGCAATCTTGGACCTGCACACTGAAGTGCCCCCGGAAGCTTGGCTGTGGAATTCACGGGTGCGGGCAACTTTGCCACCCAATCGGCGACTGTCCTCCGTGTAAAAATCGCAGCCAACAGCCGTGTCTGTGTGGGGCCGCGACAAAGGAGGTCAATTGCTACGAATCCCGCTGGCAGTGCGGCAAGATTTGTGGCCGACCATTCGCCTGCCAGTTGCACCGTTGTGAGCGAAGCTGTCACGAGGGCGGCTGTGGTGATTGTCCGCTGGGTTTGCCACGTTCCTGTCCGTGCGGCCGGATGCAAACGCAAGCCGCGTGCTCGGAACGGATTGGAACTTGTGGCGATACCTGCCAGAAGGTACTGGTGTGCGGTGTCCATCGCTGTGCCGACCGGTGCCACGAAGGTGACTGCGGAACGTGCCTCGAGTTGGTGCAGAAAACGTGCCGCTGCGGGCTGCTGACCAAGGAGATGCCCTGCGCCAAGGAAGCGACATGCGAAACGAAGTGCAAGAAGCTGCGCAGCTGCGGGAAGCACCCGTGCAATCGGAAATGCTGCGATGGGAACTGCCCCGAGTGTGACAAAGTTTGCGGCAAGACGCTGGCCTGCGGAAAACACAAATGTTCCTCCTGCTGCCATCACGGCCCGTGCTATCCGTGTAACCAACGGTCGGCCATCAAGTGCCGGTGCGGCGGAACGGCCACCGAAGTGCCGTGTGGCCGCGAGAAACGAACCAGCGCACCGAAATGCAGACTGCCGTGTCGTATTCCGTCCAAGTGCCACCATCAAAATCCGCACCCATGCCACACCGGTGACTGTCCTCCGTGTAGCAAACCGTGCGGTGAGCCAAACGATACCACCAAGTGTGAGCATCCGTGCGGCGCAAAGTGTCACGACGCGGTCACGGTGGTGACTAAGGACCGAAACTTCAAACCCATCGGCCCGTGGGATGTGGCGCAGGAGATTGTGGAGATCAAGGCGCTGCCTCACCCGGCGTGCGACGTCAAGGTTCCGGTGATGTGTCTCGGTGGCCACGAGACAGCGGACTGGCCATGCTCGAACTCGAAACCGGCTTCCTGCGGGAGACCTTGCGCACGGCTGCTCAAGTGCGGCATGCACCGGTGCGTGTTGCCGTGCCACAAGGTCACGCATCGCGCCAGCACCACGCAAGACTCCCGCTGTGAACCGTGCGCCGCAGGTTGTGAAATTCCGCGCCCGGTCGGGTGTTTGCATCCGTGCAAAAGGCGATGCCACGAGCCGCCCTGCCAGCCGTGTTCCGTTTCCATCAAAGACAAGTGCTACTGCGGCCTTACGCAAGTGTTCTACACTTGCACCGAGTTTTATCCGCCCGATCTGGACGATGAAAAGGAGGAGAATATGGCGGAGGAACTGAAGCGGCGTCGGATCTCCGTACTAAGTTGCGGCCAGAAGTGCATCAAGAACCTTCCTTGTGGCCATCGCTGTTCGGCCACCTGCCATCCGGGACGCTGTCCGAATCCGGAGCTTTGCACGAAGAAGGTAAAAGTCACCTGCAAATGCTCCCTGCGGAAGTCGGAAGTGGCGTGTAATGTCGCCAAAGACACTGGTCCTCTGGAATGTGACGCCGCTTGCGAAGCCGCACGGGCAAAGAAGCAGCAAGAGGAGGAACTGAAGGAAAACGAACGCCGGACACGGGAGGAGCTGGAGAACCAAAAGGAGCTGGAAGAATACGAACGCAAGTTTGCCCGCCGGAAGCACCGGGAGCGGAAACGCCACGAGGTGAAGGAGGAAGAGGGGCGCAATCCGTGGCTGTTGTACGTGTTGCCGGCGGCCATCGTCGTGGTGGGAATCGTCATGTACTTTGTGTTGATTCAATAA
Protein Sequence: MAHRDRKLQAPKVPNAWRLPAPPPPMQPGQKKTPAPSNRLSEERLGGSKIPQPSKLSPSAGGKQKTAQEKFNQVQREHMEKARLYTKEYISSEEESDDDGGTVGTDAATQNILGEVLKNYHGADSDMGRTQEYLQSLLESRNAVCLICIESVKRADKIWSCHACYTFFHLMCIQRWANDSISMKRINHEQQEGYYNNRGEYVPKPVLSVHWDCPKCRKEYEPVAIPRHYECFCGKERDPSQHPWLIPHSCGEPCGKQLKPACGHHCRLLCHPGPCPPCPQTINVSCRCAKSAPKTIRCSQQSWTCTLKCPRKLGCGIHGCGQLCHPIGDCPPCKNRSQQPCLCGAATKEVNCYESRWQCGKICGRPFACQLHRCERSCHEGGCGDCPLGLPRSCPCGRMQTQAACSERIGTCGDTCQKVLVCGVHRCADRCHEGDCGTCLELVQKTCRCGLLTKEMPCAKEATCETKCKKLRSCGKHPCNRKCCDGNCPECDKVCGKTLACGKHKCSSCCHHGPCYPCNQRSAIKCRCGGTATEVPCGREKRTSAPKCRLPCRIPSKCHHQNPHPCHTGDCPPCSKPCGEPNDTTKCEHPCGAKCHDAVTVVTKDRNFKPIGPWDVAQEIVEIKALPHPACDVKVPVMCLGGHETADWPCSNSKPASCGRPCARLLKCGMHRCVLPCHKVTHRASTTQDSRCEPCAAGCEIPRPVGCLHPCKRRCHEPPCQPCSVSIKDKCYCGLTQVFYTCTEFYPPDLDDEKEENMAEELKRRRISVLSCGQKCIKNLPCGHRCSATCHPGRCPNPELCTKKVKVTCKCSLRKSEVACNVAKDTGPLECDAACEAARAKKQQEEELKENERRTREELENQKELEEYERKFARRKHRERKRHEVKEEEGRNPWLLYVLPAAIVVVGIVMYFVLIQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00094857;
90% Identity: iTF_00094857;
80% Identity: -