Basic Information

Insect: Chrysolina haemoptera
Gene Symbol: nfxl1_1
Assembly: GCA_958298965.1
Location: OY282587.1:5021619-5028982[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 2 6.2e+04 -7.8 5.6 15 19 169 173 168 173 0.81

2 18 0.13 4.1e+03 -0.3 0.4 4 10 204 210 203 210 0.95

3 18 1.2e-08 0.00038 22.1 16.7 1 19 218 235 218 235 0.99

4 18 5.1e-07 0.016 17.0 17.9 1 19 271 289 265 289 0.87

5 18 4.8e-10 1.5e-05 26.6 11.0 1 19 324 342 324 342 0.99

6 18 0.85 2.6e+04 -2.9 0.9 6 10 367 371 366 371 0.86

7 18 7.9e-06 0.25 13.2 13.0 1 18 377 394 377 395 0.97

8 18 1.3 4.2e+04 -3.6 3.4 1 10 404 413 404 415 0.73

9 18 5.6e-05 1.7 10.4 17.1 1 18 429 446 429 447 0.94

10 18 1.6e-08 0.0005 21.7 12.6 1 19 456 474 450 474 0.85

11 18 0.63 2e+04 -2.5 1.2 5 10 502 507 502 507 0.92

12 18 7.8e-05 2.4 10.0 5.7 9 19 522 532 520 532 0.90

13 18 1.4 4.3e+04 -3.6 9.4 4 12 544 552 542 552 0.87

14 18 2 6.2e+04 -6.9 4.5 14 18 580 584 580 584 0.86

15 18 2 6.2e+04 -4.4 1.4 6 10 611 615 610 615 0.58

16 18 8.1e-06 0.25 13.1 3.8 1 11 621 631 621 635 0.96

17 18 2.3e-06 0.071 14.9 20.3 3 19 662 678 661 678 0.94

18 18 1.3e-06 0.039 15.7 11.7 1 16 721 735 721 741 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	2	6.2e+04	-7.8	5.6	15	19	169	173	168	173	0.81
2	18	0.13	4.1e+03	-0.3	0.4	4	10	204	210	203	210	0.95
3	18	1.2e-08	0.00038	22.1	16.7	1	19	218	235	218	235	0.99
4	18	5.1e-07	0.016	17.0	17.9	1	19	271	289	265	289	0.87
5	18	4.8e-10	1.5e-05	26.6	11.0	1	19	324	342	324	342	0.99
6	18	0.85	2.6e+04	-2.9	0.9	6	10	367	371	366	371	0.86
7	18	7.9e-06	0.25	13.2	13.0	1	18	377	394	377	395	0.97
8	18	1.3	4.2e+04	-3.6	3.4	1	10	404	413	404	415	0.73
9	18	5.6e-05	1.7	10.4	17.1	1	18	429	446	429	447	0.94
10	18	1.6e-08	0.0005	21.7	12.6	1	19	456	474	450	474	0.85
11	18	0.63	2e+04	-2.5	1.2	5	10	502	507	502	507	0.92
12	18	7.8e-05	2.4	10.0	5.7	9	19	522	532	520	532	0.90
13	18	1.4	4.3e+04	-3.6	9.4	4	12	544	552	542	552	0.87
14	18	2	6.2e+04	-6.9	4.5	14	18	580	584	580	584	0.86
15	18	2	6.2e+04	-4.4	1.4	6	10	611	615	610	615	0.58
16	18	8.1e-06	0.25	13.1	3.8	1	11	621	631	621	635	0.96
17	18	2.3e-06	0.071	14.9	20.3	3	19	662	678	661	678	0.94
18	18	1.3e-06	0.039	15.7	11.7	1	16	721	735	721	741	0.87

Sequence Information

Coding Sequence: ATGCATAGCCAACCTAAACCTCGCAATCCATGGACAAAAAACGTTCAACAGAAGAAAAACGAGCAGAgccctaaaaataaaaaaaaccctAGCGTGAAGCCTGCTTTAACTACATCCGAGCTAAAATTCAAAGAAGCCCAATCCAAGCAACAAGCTGCAGTCAAAAAACATGTAAAAGAATACGAGTCTTCCTCGGAAGAAGAGGAATTAGACTCCAGCAATTTGATTGatgCCATTCTCAAGAATTACAGGAATACTGGTGGTGAGAATGAACATGCTGGACGGACACAAACGTTTATCGAAGAAACTTTACTGTCTGGCGCTGCAACTTGTCTCATTTGTATATCTAAAGTCAAACGAGACGATGAGATCTGGAGTTGCAGCAATTGTTACGGGTCCTTTCATCTTATGTGCATTCAAAGGTGGTCTAAAGATACCATAACGCAGCAAAAACATGCTTTGCAAGAACAAATTGTTGTCCGGCAGACAAAACTCTTTTGGTGCTGCCCAAAATGCAGATTTGAATATACCTCTGAAGATGTTCCTACTAAATATATGTGTTTTTGCAAGAAAAGTGAAAGTCCTAAGTACCATCCATTCCTGGTACCTCATTCCTGTGgagaaatttgcaaaaaaaatttgataccGAGCTGTGGACACAAGTGTATGCTATTGTGTCATCCAGgtccATGTCCTCCATGTCCCGTTACTGTGAATGTATCGTGTTATTGTGGGTCAGAACCTCCAAGAACTCAGAGGTGTAGCAACAAGGAATGGTCTTGCAACGGAAAATGCGGAAGATCTTTGGAGTGCCAGAAACACACTTGCACCAACCCATGCCATCCAGGTGAATGTGGTCCGTGTCCTAAGAAAAGCATCCAAAAGTGTGTGTGCAAATCTCAGCAGAAGCTCCGTGATTGTGCCAAGCCTGTTTGGCATTGTGACAAGATTTGTAACAGAGCTTTAGAGTGTGGAAACCACAGATGTCAGGAAGTATGTCATGATGGTGTATGTGACATGTGTCCCCTAAGCAAACCGAGAACATGTCCTTGTGGAAAAACTCCCTACCAGCTGCCCTGCACTGAAGATGCACCTAGCTGTCAAGACACCTGTGACAAAATTCTTGATTGTGGAGTCCATACTTGTAATCAAAGGTGTCACAAGGAAAAATGTGGACAGTGCCTTGAAACTGTTGAGAAGTCTTGTAGATGTGGGTTGCATACCAAAGAAGTTCAGTGCTGCAAGCCTTACTTCTGCGAGGTGAAATGCAAACAGATGAAGGATTGCAATAAACATCCCTGTAACAGAAAATGTTGTGACGGCAACTGCCCCCCTTGTGAGAAGCCCTGTGGAAGGACTCTCAGCTGCAGAAATCACAAATGCGCTTCCGTATGTCATAGAGGGCCATGTTACCCTTGCAGTCAAACAGAAATTGTGTCTTGTAGATGCGGGGCGACAAGACTAGAGGTGCCTTGTGGACGCAAAAATAAAACCAGACCACCAAAATGCAACAAGCCGTGTTTGTTACCTCCGGATTGTCATCACGAGAAAAGAGACAACCACAAATGCCATTTCGGCGACTGTCCTCCATGCAGGCAAAGGTGCAACAAAAGCAGGTCAAAGTGCTGCCATCTATGTCCGGCGCCTTGTCATTCTGCCGTTCTCGTGAAGGTTGAGGGGCAAAAAGCTACTACTCCTTGGGAGCAGACTAAGCCTCTAATCGAGAAGAGGGACTTACCATGTCCGGATTGTGTTGTTCCTATGTCTGTCACATGTTTAGGGAAGCATGAGACATCTGACTGGCCTTGTTATTTGGCAAAGCCTTCCAGTTGTCACCGTCCGTGTGGGAGAGATTTGTCTTGTGGGAACCACAGCTGTTCCTTGCCGTGTCATTTGGTCGAAGGAGCTACAGACGAAATTATGTCGGGGAAAAACTGTGAGAGATGTGAAGGCAGCTGTACCAAGGACAGACCAGAAGGCTGTCAGCACTCATGTCCGAAACCATGCCACCCAGGACCCTGTCCACCCTGTAAAAGTATGGTGAGGATCAAGTGTTATTGCGGTCTTAATCAACCCTACGTCACGTGCAGTGACTGGCTTGACGAAGACAAGAAGTTGGAGTTGCAGAGCTGTGGAAATCAGTGCCCAAAGAATtatgaatgTGGACATAGATGCAAAGCCAACTGCCACGCAGGTCCCTGTCCAAACTCTGAAGCATGCAAGAAAAAGGTTAAAGTCACCTGCAAGTGCAAACGACTCAAGAAGGAGTTCTCCTGTGAAACTGTTCGCAAGAAAATGGCCTCTTTTGACTGCGATGATGTATGTTCGTCCAAAAAAGAGGAAGAAAGGAAAATCAGGGAAGCCGCTGACGAACAGAGGAAGCGAGAGGAGGAAATCAAACAAAAGAAGGAGATGGAGCAGTATCAAAAGATTTTCGAAGGGAAAAAGAAGAACAGGGAGAGGAGGGTTTTTGATGAGAAGAAGGAGGTTGGGGTTTTTAAGAAATATTGGTTTGTGATTTTGTCAGTTGTGTTGCTTTTTTTAGCATTAGCAGTGTATTACTGCttgtaa
Protein Sequence: MHSQPKPRNPWTKNVQQKKNEQSPKNKKNPSVKPALTTSELKFKEAQSKQQAAVKKHVKEYESSSEEEELDSSNLIDAILKNYRNTGGENEHAGRTQTFIEETLLSGAATCLICISKVKRDDEIWSCSNCYGSFHLMCIQRWSKDTITQQKHALQEQIVVRQTKLFWCCPKCRFEYTSEDVPTKYMCFCKKSESPKYHPFLVPHSCGEICKKNLIPSCGHKCMLLCHPGPCPPCPVTVNVSCYCGSEPPRTQRCSNKEWSCNGKCGRSLECQKHTCTNPCHPGECGPCPKKSIQKCVCKSQQKLRDCAKPVWHCDKICNRALECGNHRCQEVCHDGVCDMCPLSKPRTCPCGKTPYQLPCTEDAPSCQDTCDKILDCGVHTCNQRCHKEKCGQCLETVEKSCRCGLHTKEVQCCKPYFCEVKCKQMKDCNKHPCNRKCCDGNCPPCEKPCGRTLSCRNHKCASVCHRGPCYPCSQTEIVSCRCGATRLEVPCGRKNKTRPPKCNKPCLLPPDCHHEKRDNHKCHFGDCPPCRQRCNKSRSKCCHLCPAPCHSAVLVKVEGQKATTPWEQTKPLIEKRDLPCPDCVVPMSVTCLGKHETSDWPCYLAKPSSCHRPCGRDLSCGNHSCSLPCHLVEGATDEIMSGKNCERCEGSCTKDRPEGCQHSCPKPCHPGPCPPCKSMVRIKCYCGLNQPYVTCSDWLDEDKKLELQSCGNQCPKNYECGHRCKANCHAGPCPNSEACKKKVKVTCKCKRLKKEFSCETVRKKMASFDCDDVCSSKKEEERKIREAADEQRKREEEIKQKKEMEQYQKIFEGKKKNRERRVFDEKKEVGVFKKYWFVILSVVLLFLALAVYYCL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00328840; iTF_00756314;
90% Identity: iTF_00328840;
80% Identity: -