Basic Information

Insect: Urophora cardui
Gene Symbol: nfxl1_1
Assembly: GCA_960531455.1
Location: OY482673.1:44420546-44423963[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 20 1.6 3.7e+04 -3.8 2.1 15 19 186 190 185 190 0.82

2 20 0.14 3.2e+03 -0.4 0.4 4 10 221 227 220 227 0.95

3 20 5.6e-09 0.00013 23.2 15.1 1 19 235 252 235 252 0.98

4 20 1.6 3.7e+04 -3.8 1.1 5 10 277 282 277 282 0.91

5 20 4.6e-06 0.11 13.9 15.1 1 19 288 307 288 307 0.96

6 20 0.66 1.5e+04 -2.6 0.7 5 10 331 336 331 336 0.90

7 20 1.7e-08 0.00039 21.7 13.6 1 19 342 360 342 360 0.99

8 20 1.3 3.1e+04 -3.5 0.4 1 8 385 391 385 392 0.59

9 20 2.2e-08 0.00051 21.3 11.7 1 18 395 412 395 413 0.96

10 20 0.32 7.5e+03 -1.6 0.4 1 5 422 426 422 431 0.75

11 20 2 4.7e+04 -5.0 2.3 5 10 436 441 436 441 0.91

12 20 0.00014 3.4 9.1 16.2 1 18 447 465 447 466 0.94

13 20 4.7e-08 0.0011 20.3 14.9 1 19 475 493 469 493 0.86

14 20 0.013 3e+02 2.9 6.4 9 18 538 547 536 548 0.89

15 20 0.068 1.6e+03 0.6 4.6 3 11 561 569 551 570 0.85

16 20 0.91 2.1e+04 -3.0 1.4 6 10 632 636 631 636 0.88

17 20 1.9e-06 0.043 15.2 6.1 1 12 642 653 642 653 0.97

18 20 1.8 4.3e+04 -4.0 1.5 15 19 666 670 666 670 0.87

19 20 0.28 6.5e+03 -1.4 21.2 4 18 683 697 681 698 0.93

20 20 0.00011 2.5 9.6 16.4 1 16 749 763 749 769 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	20	1.6	3.7e+04	-3.8	2.1	15	19	186	190	185	190	0.82
2	20	0.14	3.2e+03	-0.4	0.4	4	10	221	227	220	227	0.95
3	20	5.6e-09	0.00013	23.2	15.1	1	19	235	252	235	252	0.98
4	20	1.6	3.7e+04	-3.8	1.1	5	10	277	282	277	282	0.91
5	20	4.6e-06	0.11	13.9	15.1	1	19	288	307	288	307	0.96
6	20	0.66	1.5e+04	-2.6	0.7	5	10	331	336	331	336	0.90
7	20	1.7e-08	0.00039	21.7	13.6	1	19	342	360	342	360	0.99
8	20	1.3	3.1e+04	-3.5	0.4	1	8	385	391	385	392	0.59
9	20	2.2e-08	0.00051	21.3	11.7	1	18	395	412	395	413	0.96
10	20	0.32	7.5e+03	-1.6	0.4	1	5	422	426	422	431	0.75
11	20	2	4.7e+04	-5.0	2.3	5	10	436	441	436	441	0.91
12	20	0.00014	3.4	9.1	16.2	1	18	447	465	447	466	0.94
13	20	4.7e-08	0.0011	20.3	14.9	1	19	475	493	469	493	0.86
14	20	0.013	3e+02	2.9	6.4	9	18	538	547	536	548	0.89
15	20	0.068	1.6e+03	0.6	4.6	3	11	561	569	551	570	0.85
16	20	0.91	2.1e+04	-3.0	1.4	6	10	632	636	631	636	0.88
17	20	1.9e-06	0.043	15.2	6.1	1	12	642	653	642	653	0.97
18	20	1.8	4.3e+04	-4.0	1.5	15	19	666	670	666	670	0.87
19	20	0.28	6.5e+03	-1.4	21.2	4	18	683	697	681	698	0.93
20	20	0.00011	2.5	9.6	16.4	1	16	749	763	749	769	0.92

Sequence Information

Coding Sequence: ATGTCTGAAAAACGTACGCAATTACAGAAGGAGGATACAAATTCCAAAGCTTTGCAGCAAAAATCAAATGGAATGAAACGTTTTGAGCAAACGCACGCAAAGCATATTGCAGCTGCACAAAAAGCGCTCGAACACTTTACACCCAGTTCCGATGAAGAAGATGATGAAGAGGTGGAGCTGGACGAACGTCAAATTTTTGACTCCCTGTATAAACATTACAAACCTACAAACAGCACTGCCACCGATGCCGTTGCCGGCGTAGTCGACTCTAGTCTCGTCCCTCAAAAGTCGGCAACTTTCTTTGAAAACGCTTTGCACTCGGGCGCAGCAACCTGTTTAATCTGTATCGGTAGCATACGACGAGCCCAAGCCATATGGTCATGTAAATATTGTTATTGTTTCTTTCATTTGACTTGCATACAGCGTTGGGCCAAAGATAGCGTTGCTCAATTGAAAGCTAAAGCGAGACAACAACAAAATGATCAACAAGGCTACTACAATCACTTGGGAGAGTTTGTGCCACCAACGAAACGTACACGTGCACTACAATGGAGTTGTCCACAGTGTCGCAAGGGTTATTCCCCCGAAGAACGACCAACAGAGTATACATGCTTTTGCGGTAAAGAGGTTAATCCCAAGCCGGGACCATTTATGCTGCCGCATTCGTGTGGTGAAATATGTGGTAAGCTGTTACAGCCAAAGTGTGGTCACACATGCATGTTACTCTGTCATCCAGGCCCATGTCCGCCGTGCTCGCAGTATGCACAAACGAGTTGTTTGTGTGGTAAATCGGCAAAAAAGTCGGTACGCTGCATAGATAAGGAGTGGAAATGTGATCGAAAGTGTGATAAATTACTACGCTGTGGCGAACATAAATGCAAAGAGATTTGTCATAAGCCCAATCAATGTCCACCATGTACTAGCAGCAGCATGCAGCCGTGCGATTGTGGCAGAGAGGTAAAAAAACGTAATTGCTCCGAACTCCAGTGGAATTGCAATAAAGTGTGCGGTACCAAATATTCATGCGGTGCACACACTTGTAAGCGAGTATGTCACTCTGGGACTTGTGGCGATTGCCCTTTGAGCTTACCACGTTCATGTCCTTGTGGAAAAACTCAAAAAATTGTACCCTGCACTGAAGCTATTGAGCCTTGCGGTGATACATGCCAGAAGCTTTTGTCCTGTGGACAACATACTTGCACGCAGCGCTGTCATCGCGGCGATTGCAATTTGTGTTTAATCATAACGAAAAAGAAATGTCGCTGTGGTATGCATGAAAAGGAGCTACCTTGTTGGAAAAGCTTTACATGTGAaacaaaatgcaaacaaatGCGCGATTGCGGAAAACATGCATGTAATAAAAAGTGCTGCGATGGTCAAACATGCCCACCATGTGACAAAGTCTGTGGCAAGCCACTCGCATGTCAAAAACATAAATGTCAATCGATTTGTCATGAGGGTCCATGTTATCCATGCACGCAGCAATCTCAAGTGAATTGCCGATGCGGCAAGACTTCGAAACGTGTGCCATGTGGTCGTGAACGTACAGCACGTGTTATGTGCATGGAACTATGCCGAATTCCTTCTAAGTGTCACCATCCCAACAAGCATCGTTGCCACAAAAAGGAATGTCCCCCGTGTAATCAAAAATGCGGACTACCAAATACTGATACCGGTTGCGAACATATTTGTGAAGCTAGATGCCATGCAGCTGTTAAGGTTCCTAAAAAAACGCCAGCAAGTGATGGCTGTGCCGCAAACATGTGGGATGTAGGAAAAAAGtttGAATTCAAATCAATGCCACATCCACCTTGCGAGAAACCCGTGAGCGTTAGATGTATAGGTGGTCATGAGGTTGCGGATTGGCCGTGTTGGAATTCAAAACCAACATCTTGCCAACGCAAGTGTAACCGTTTACTACGTTGCGGCAATCACAAGTGTGAACTTGTATGTCATTCTGTACCCGATATGCAAGATATGAAGGAACAAGATGGTTGCGCCCCATGCCGAGAGGGATGTATTGTACGACGTCCTGAAGGCTGTGTACACCCTTGCCCGCGGCCATGTCATCCGCCACCATGTCATCCATGCGACAAAATGataaaaacaaaatgtttctgtGGCTTAACGCAACTCATCTACAAATGTTCTGAATATTTCGCTGTAGAAGGAACAGCAGAAGAAATTGTTGCGCGACAGGAGCGCTTGAAGAGCTGTGGCAACCGTTGCATCAAAAATCTCCCTTGTGGCCATCGCTGTCACACACCCTGTCATCCAGGCAAGTGCCCGAATCCTGAATTGTGTCGTAAGAAAGTACGCATTTTTTGTGACTGCAAACGTTTAAAAATCGAAGTAGCTTGCGATCGATATCGCGCCGGCCAAATATCATTGCCATGCGATGCATTCTGTGTGGAGACACTAGCAAAATTGGTTGAGGAGCAAAAGCGCCAGGCCGAGAAGCAACGTCAATTGGAAGAGGCTAAAAATCGTGCTGAAGTTGAACAATTTGAGAAGAGATTCGCTAAGCGTAAATATAAGGAACGCAAAACGGTTGTGGAAACGACGAAAAGCCAAATAAATTGGAAATTAATTAGCATTTATGGGGGTATTTTTATGGCCATAATTCTAGCCGTTTTGGTGGCATTTTATGCAGAAAGTTAA
Protein Sequence: MSEKRTQLQKEDTNSKALQQKSNGMKRFEQTHAKHIAAAQKALEHFTPSSDEEDDEEVELDERQIFDSLYKHYKPTNSTATDAVAGVVDSSLVPQKSATFFENALHSGAATCLICIGSIRRAQAIWSCKYCYCFFHLTCIQRWAKDSVAQLKAKARQQQNDQQGYYNHLGEFVPPTKRTRALQWSCPQCRKGYSPEERPTEYTCFCGKEVNPKPGPFMLPHSCGEICGKLLQPKCGHTCMLLCHPGPCPPCSQYAQTSCLCGKSAKKSVRCIDKEWKCDRKCDKLLRCGEHKCKEICHKPNQCPPCTSSSMQPCDCGREVKKRNCSELQWNCNKVCGTKYSCGAHTCKRVCHSGTCGDCPLSLPRSCPCGKTQKIVPCTEAIEPCGDTCQKLLSCGQHTCTQRCHRGDCNLCLIITKKKCRCGMHEKELPCWKSFTCETKCKQMRDCGKHACNKKCCDGQTCPPCDKVCGKPLACQKHKCQSICHEGPCYPCTQQSQVNCRCGKTSKRVPCGRERTARVMCMELCRIPSKCHHPNKHRCHKKECPPCNQKCGLPNTDTGCEHICEARCHAAVKVPKKTPASDGCAANMWDVGKKFEFKSMPHPPCEKPVSVRCIGGHEVADWPCWNSKPTSCQRKCNRLLRCGNHKCELVCHSVPDMQDMKEQDGCAPCREGCIVRRPEGCVHPCPRPCHPPPCHPCDKMIKTKCFCGLTQLIYKCSEYFAVEGTAEEIVARQERLKSCGNRCIKNLPCGHRCHTPCHPGKCPNPELCRKKVRIFCDCKRLKIEVACDRYRAGQISLPCDAFCVETLAKLVEEQKRQAEKQRQLEEAKNRAEVEQFEKRFAKRKYKERKTVVETTKSQINWKLISIYGGIFMAIILAVLVAFYAES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -