Basic Information

Insect: Osmia bicornis
Gene Symbol: nfxl1_1
Assembly: GCA_907164935.1
Location: NC:7336241-7339851[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 2.1 1.3e+04 -3.2 1.1 15 19 126 130 125 130 0.81

2 18 0.29 1.8e+03 -0.5 0.8 4 10 161 167 160 167 0.95

3 18 4.9e-07 0.003 18.0 17.1 1 18 175 191 175 192 0.98

4 18 6.7e-07 0.0041 17.5 15.7 1 18 229 245 229 246 0.95

5 18 0.00012 0.7 10.4 11.7 1 19 281 300 281 300 0.92

6 18 9.7e-05 0.59 10.6 9.5 1 18 336 353 336 354 0.97

7 18 0.014 83 3.8 7.6 1 12 388 399 388 399 0.94

8 18 3.7 2.2e+04 -4.0 1.3 6 10 409 413 409 413 0.96

9 18 2.2e-07 0.0014 19.1 13.4 1 18 419 436 419 437 0.91

10 18 2.2 1.3e+04 -3.3 0.7 6 10 466 470 465 470 0.85

11 18 0.00021 1.3 9.6 9.8 9 19 485 495 483 495 0.90

12 18 0.005 31 5.2 6.2 1 12 505 515 505 515 0.95

13 18 3.5 2.1e+04 -3.9 3.1 14 18 547 551 547 552 0.87

14 18 0.033 2e+02 2.5 8.1 1 12 588 599 578 599 0.91

15 18 4 2.4e+04 -4.4 3.8 6 10 615 619 611 619 0.71

16 18 0.01 61 4.2 16.4 4 19 629 644 627 644 0.91

17 18 1.5e-05 0.091 13.2 11.0 1 16 689 703 689 709 0.90

18 18 1.4 8.3e+03 -2.6 0.7 5 10 738 743 738 743 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	2.1	1.3e+04	-3.2	1.1	15	19	126	130	125	130	0.81
2	18	0.29	1.8e+03	-0.5	0.8	4	10	161	167	160	167	0.95
3	18	4.9e-07	0.003	18.0	17.1	1	18	175	191	175	192	0.98
4	18	6.7e-07	0.0041	17.5	15.7	1	18	229	245	229	246	0.95
5	18	0.00012	0.7	10.4	11.7	1	19	281	300	281	300	0.92
6	18	9.7e-05	0.59	10.6	9.5	1	18	336	353	336	354	0.97
7	18	0.014	83	3.8	7.6	1	12	388	399	388	399	0.94
8	18	3.7	2.2e+04	-4.0	1.3	6	10	409	413	409	413	0.96
9	18	2.2e-07	0.0014	19.1	13.4	1	18	419	436	419	437	0.91
10	18	2.2	1.3e+04	-3.3	0.7	6	10	466	470	465	470	0.85
11	18	0.00021	1.3	9.6	9.8	9	19	485	495	483	495	0.90
12	18	0.005	31	5.2	6.2	1	12	505	515	505	515	0.95
13	18	3.5	2.1e+04	-3.9	3.1	14	18	547	551	547	552	0.87
14	18	0.033	2e+02	2.5	8.1	1	12	588	599	578	599	0.91
15	18	4	2.4e+04	-4.4	3.8	6	10	615	619	611	619	0.71
16	18	0.01	61	4.2	16.4	4	19	629	644	627	644	0.91
17	18	1.5e-05	0.091	13.2	11.0	1	16	689	703	689	709	0.90
18	18	1.4	8.3e+03	-2.6	0.7	5	10	738	743	738	743	0.93

Sequence Information

Coding Sequence: atgcaaaaatTTAGACGAGCTCaagcagaaaataaaatagcaaTTAATAAGCATTTAGAAGCTAATGCCTATTTAGAATCATCCAGCGAGGATGAGGATGATAGAAATGAAGAAGATATGCAAAATGTGGTTGAAAAGGTGCTATCTGCTTATCAAGGAAGAGAGGCAGattcagaaaaatttttatcatatttaattaatatttttcaatctgGTAGTGCTGTTTGCTTGATATGTATTTCAACTATAAAGAAAGCAGATGCGATTTGGAACTGTAATAAATGTTATGCATTTTTACATTTATCATGCATTTTGCATTGGATACGGGATAGTTTAAATGTTAAACATGAAAAAGGTATCGCACCAGTATGGGCATGTCCAAAATGTCGCACAGAATACGAACAAGACGAAGTTCCTCGTAATTATAAGTGTTTCTGTAAAAAAGTCGTGGATCCTTCTTATTATCCATGGAATATTCCACATTCTTGTGGAGAAACTTGTGGAAAAGCTCTGCAACCAGAATGCGGTCACAAATGTGTATTACTTTGTCATCCAGGACCATGTCCTCCTTGTGGAAAAACAATATCGATAAGCTGTTATTGCGGCAAACAAGTGCCACAGCCACGACGATGCAATGCAAAAGAATGGAGCTGTGATACCGTATgcgataaaaaatataaactaTGCTCGCATAGTTGCAAGCAATTGTGTCACACAGGTGAATGCCCTCCTTGTGGAGAAGCGTTATTGATAGAGTGTCATTGCAagagtaaaaaagaaatgaagcAATGCTTTGAAGGCTCGTGGATTTGCGACATACCCTGTCGTAGAGCACTTTCATGTAACGTTCATATTTGCCAAAGCACGTGCCATTTACCTGGTGATTGTGGAAATTGTCCATTAGAGAAGAACAGAACGTGTCCTTGTGGAAAGAAACGATATGCGGTATCTTGCGAACAAGAACAGGTACCAACGTGTGGAGACACGTGTGGAAAATTATTAGAGTGTGGCTCACATTATTGTAATATGAGATGTCATACAGATAAATGCGGTCAATGTTTAGAGGTAGTGAGGAAATCATGCCGTTGCGGTAGTTATCAAAAAGAAATTGCATGCGGTAAAGAATTCCATTGCAACAAGAAATGCACGCAAATGCGTCTATGTGGAAGACATTTATGCAATAAAAAATGCTGTGACTGTTTAATGAAAAACATATATAACGTATGCGAAAAGATATGCGACAACGCTTTAAACTGCCGTAAGCACAAGTGTTCTGCACCTTGTCACAGCGGTCCTTGTTATCCGTGCGAGAGAACCGATATTATTCAATGTAGATGTGGttacaataaaataagaataccGTGTGGTAcgatgaagaaaattaaaccaCCAGCATGTAATAAACCGTGCAAGATACCGCCGATTTGTCATCACCTTAAAAGGGAAACTCACAAATGCCACCAAGGCCCTTGTCCACcttgcaaaaaaatttgtGGTTTGATATATAAAAGATGCGGCCATTCTTGCGTTGCTGTTTGTCATACAAAAGTTTGGGTaaaagtgaataaaaatgacGTGAAAACGCAACCCGCAGGTCCATGGGATATACAGAAAGAAACTATGCAGCTTAAAACACTACCTTGTCCGGCATGTGAAGTATCTGTACCGGTGACTTGTTTAGGAGGCCATGAAACACGTCCATGGCCTTGTCATGCAGCTAAACCTACTTCTTGTGGAAGACTTTGCGGAAGAATATTACCTTGTACCAATCATAGATGCGAATTAGATTGCCATAAAGTAGCATCTTCTGAAGATGCAAAGAATAGCATTCCATGCATGGAATGTGAAAAGCCATGCTTGTTTTCACGACCACAAGGCTGCACGCATTTATGTCCAAAACCATGTCATCCAGCGCCTTGTAGTCCTTGCAAGCAATTAGTCAAAATTTCATGCCATTGTGGTATAGGCACATTATATCGAAGGTGTTCTGAATTAACATCAGCTACGATCGAGCAACGTAATGAACTACTTAAATGTGGAAATCAGTGTccaaaaaatTATTCTTGTGGGCATAGATGCATGAATAATTGTCATCCTGGTCCATGCACAAATGAAAAcgaatgtaataaaaaaataaaattattctgcTCGTGCAAACGTATCAAGAAAGACTATATATGTTCGATGGTACAAAAGCaagaaatttctataaaatgcGATGAAATTTGTATTAAGTTGAAGAATGAGAAGCATCAAGCTGAAGCCGCATTATTAGAACAGAAACGACAAGTAGAGGAAATGCGTAATCaagaagaaatcaagaaattcGAACGAAAATTCAAATCTCGGCGTAAAGGAAAAGATAAATTTGATAGGAAACAATTCCATGAAGAGACGtgtaataattatagaaaatgCTGGATTTTAactattttaataactttaataagtgttttaatatattatgtaGGTATGGAGAAACTGTAA
Protein Sequence: MQKFRRAQAENKIAINKHLEANAYLESSSEDEDDRNEEDMQNVVEKVLSAYQGREADSEKFLSYLINIFQSGSAVCLICISTIKKADAIWNCNKCYAFLHLSCILHWIRDSLNVKHEKGIAPVWACPKCRTEYEQDEVPRNYKCFCKKVVDPSYYPWNIPHSCGETCGKALQPECGHKCVLLCHPGPCPPCGKTISISCYCGKQVPQPRRCNAKEWSCDTVCDKKYKLCSHSCKQLCHTGECPPCGEALLIECHCKSKKEMKQCFEGSWICDIPCRRALSCNVHICQSTCHLPGDCGNCPLEKNRTCPCGKKRYAVSCEQEQVPTCGDTCGKLLECGSHYCNMRCHTDKCGQCLEVVRKSCRCGSYQKEIACGKEFHCNKKCTQMRLCGRHLCNKKCCDCLMKNIYNVCEKICDNALNCRKHKCSAPCHSGPCYPCERTDIIQCRCGYNKIRIPCGTMKKIKPPACNKPCKIPPICHHLKRETHKCHQGPCPPCKKICGLIYKRCGHSCVAVCHTKVWVKVNKNDVKTQPAGPWDIQKETMQLKTLPCPACEVSVPVTCLGGHETRPWPCHAAKPTSCGRLCGRILPCTNHRCELDCHKVASSEDAKNSIPCMECEKPCLFSRPQGCTHLCPKPCHPAPCSPCKQLVKISCHCGIGTLYRRCSELTSATIEQRNELLKCGNQCPKNYSCGHRCMNNCHPGPCTNENECNKKIKLFCSCKRIKKDYICSMVQKQEISIKCDEICIKLKNEKHQAEAALLEQKRQVEEMRNQEEIKKFERKFKSRRKGKDKFDRKQFHEETCNNYRKCWILTILITLISVLIYYVGMEKL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00217442;
90% Identity: iTF_01123370;
80% Identity: -