Basic Information

Insect: Cosmopolites sordidus
Gene Symbol: nfxl1_1
Assembly: GCA_031761425.1
Location: JARFXV010001710.1:388905-393806[-]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 2 5.2e+04 -7.8 5.6 15 19 166 170 165 170 0.81

2 19 0.13 3.4e+03 -0.3 0.4 4 10 201 207 200 207 0.95

3 19 1.4e-07 0.0036 18.8 17.3 1 19 215 232 215 232 0.99

4 19 1.5e-08 0.0004 21.8 14.8 1 19 268 286 262 286 0.85

5 19 1.4 3.5e+04 -3.6 1.0 6 10 311 315 310 315 0.88

6 19 3.7e-09 9.7e-05 23.8 10.2 1 18 321 338 321 339 0.97

7 19 1.3 3.3e+04 -3.5 1.0 5 10 363 368 363 368 0.86

8 19 2e-05 0.51 11.9 8.2 1 18 374 391 374 392 0.96

9 19 1 2.6e+04 -3.1 1.3 1 4 401 404 401 404 0.97

10 19 0.0083 2.2e+02 3.5 16.1 1 18 426 443 426 444 0.94

11 19 1.4e-10 3.7e-06 28.3 13.3 1 19 453 471 453 471 0.98

12 19 0.74 1.9e+04 -2.7 1.3 5 10 499 504 499 504 0.91

13 19 0.00018 4.6 8.8 6.2 9 19 519 529 517 529 0.90

14 19 0.15 3.9e+03 -0.5 4.0 1 12 539 549 539 549 0.89

15 19 2 5.2e+04 -4.8 4.6 16 19 576 579 574 582 0.55

16 19 0.0012 30 6.2 5.2 1 11 618 628 612 632 0.90

17 19 0.35 9.2e+03 -1.7 1.2 5 10 645 650 645 650 0.93

18 19 2.5e-06 0.065 14.7 16.4 3 19 659 675 658 675 0.94

19 19 6.2e-06 0.16 13.5 13.0 1 18 718 737 718 738 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	2	5.2e+04	-7.8	5.6	15	19	166	170	165	170	0.81
2	19	0.13	3.4e+03	-0.3	0.4	4	10	201	207	200	207	0.95
3	19	1.4e-07	0.0036	18.8	17.3	1	19	215	232	215	232	0.99
4	19	1.5e-08	0.0004	21.8	14.8	1	19	268	286	262	286	0.85
5	19	1.4	3.5e+04	-3.6	1.0	6	10	311	315	310	315	0.88
6	19	3.7e-09	9.7e-05	23.8	10.2	1	18	321	338	321	339	0.97
7	19	1.3	3.3e+04	-3.5	1.0	5	10	363	368	363	368	0.86
8	19	2e-05	0.51	11.9	8.2	1	18	374	391	374	392	0.96
9	19	1	2.6e+04	-3.1	1.3	1	4	401	404	401	404	0.97
10	19	0.0083	2.2e+02	3.5	16.1	1	18	426	443	426	444	0.94
11	19	1.4e-10	3.7e-06	28.3	13.3	1	19	453	471	453	471	0.98
12	19	0.74	1.9e+04	-2.7	1.3	5	10	499	504	499	504	0.91
13	19	0.00018	4.6	8.8	6.2	9	19	519	529	517	529	0.90
14	19	0.15	3.9e+03	-0.5	4.0	1	12	539	549	539	549	0.89
15	19	2	5.2e+04	-4.8	4.6	16	19	576	579	574	582	0.55
16	19	0.0012	30	6.2	5.2	1	11	618	628	612	632	0.90
17	19	0.35	9.2e+03	-1.7	1.2	5	10	645	650	645	650	0.93
18	19	2.5e-06	0.065	14.7	16.4	3	19	659	675	658	675	0.94
19	19	6.2e-06	0.16	13.5	13.0	1	18	718	737	718	738	0.90

Sequence Information

Coding Sequence: ATGAGCAATAATCGGCCTAAATCAAACccttggaataaaaataattctactcaaaagcaaaaaaaaacttctgtTTCTTCCTTGGGGCCTAACATAAATTCATCTGGCGAAGTGAAATTTAAAGAAGCAcaaacaaaattacaaaatgcTGTTAAAAAGCATATTAAAGACTATGAATCTTCATCAGAAGAAGAAGACATAGATTCTACCAATGTTATAGACGAAATTCTCAAGCAGTATGCCAAAACTGGTGGAACAAATGATCAACTTTCTCGAACTCAAATCTTTATTGAAGAATCATTTTTATCTGGTGCAACAACTTGTCTTATTTGCATTTCTAGAGTAAAGAGAGATGATCAGatatggAGTTGCCTTAATTGCCATGGAGGCTTTCACTTAAACTGTATCCAAAGATGGTCTAAAGACACTGTAATCCAACTAAAACAAAGAATAGAAGAACAAACCATATCAAAAGAAAAGAAGTTACATTGGTGTTGTCCAAAATGCAGATATGAATATAATCCAGAGCAGATTCCTActaaatatgtttgtttttgtgGAAAAGCTGAAAACCCAAAATATCAACCATTTTTGGTGCCTCATAGTTGTGGAGAGATATGTAGAAAAGATTTACTGCCACAGTGTGGACATCAATGTCTTTTACTTTGTCATCCAGGACCATGTCCACCTTGTCCAGTGACTGTTAGTGTTACCTGTTTCTGTGGTTCTCAACTGCCAGTAACAAAAAGATGTAGCTTTAAAGGTTGGTCATGCGGTAGTAGATGTGGCAAGGAATTATCATGCCGAAGACACACTTGTAGTGAACCATGTCATGATGGAAACTGCCAACCATGTTCAAAGAAAAGtatacaaaaatgtatgtgtgGCTCCAGTCAAAAGCTAAGGGATTGTAATTCTCCCATTTGGCAATGtgataagGTGTGTGGGAAATCTCTTGATTGTGGTAAACATAAATGTGAAAATGTCTGTCATGCCGGAGTCTGTAACTCATGCTTGTTAGCACAACCTAGAACCTGTCCTTGTggtaaaacaaaatatcaacTGCCTTGTACAGAAGAAGTTCCAACTTGTCCAGATACATGTGGAAAGTTGTTGGAATGTGGAATCCATTCTTGCAACTACAGATGCCATAAAGATAAATGTGGTTTGtgtcTGGAAATTGTAACTAAAGCCTGCAGATGTGGACAGcatataaaagaaatacaatGCTGTAAACAGTATTTATGTGACACTAAATGTAAGAGGTTAAGAGACTGCAACAAGCATCCTTGCAACAGAAAATGTTGTGACAACAATTGTCCACCTTGTGAAAAACCCTGTGGGCAGACATTACAATGTGGAAATCACAAATGTCAGTCAGTTTGTCATCGAGGCCCCTGTTTTCCATGCCAGCAGACAAATACTGTTTCATGTAGATGTGGAAGTACTAAAATCACCGTGCCTTGTGGTAAAAAGCATCGAGTGAAACCACCAAAATGCTCGAAGCCATGCCTGTTACCCCCAGAATGTCACCATGAAAAACGCGAGAAACACAAGTGCCACTTTGGTGAATGTCCTCCTTGTCGCCAAATTTGCAATAAATCAAGATCAAACTGTTCTCATCTGTGCATAGCAAATTGTCACTCTTCtgttaacattaaaattgaagCACAAAAAGCTTCAATGCCTTGGGAGCAAACCCTGcctcaatttgaaaaaaaatgcctACCATGTCCTGACTGCAAAGAACCTGTTATGGTAACATGTCTAGGAGATCATGAGACGTCAGCTTGGCCTTGTTATATGGCTAAACCTTCCAATTGTGGAAGACCATGTGGAAGAATTTTAAGTTGTACTAATCATACATGCTCTTTATCATGTCATGTGGTAGAAGGCTCTAATGACAATGCTTTGgcAGGATATAATTGTGAGAAATGCGAAAGTCCTTGTTTGAAACCTCAACCAGAAGGATGTATTCATTCGTGTCCAAAACCTTGTCACCCAGGGTTATGTCCCCCTTGCAAACAAATGTTAAGGATAAAATGTCACTGTGTCTTAACTCAACCATATGTTTTATGCTCTGATTGGTTGATTATTGAAAAAAGAGAAGAATTACAAAGTTGTGGCAATCAATGTCCCAAAAATTATCCTTGTGGTCATCGTTGTAAAACCAACTGCCATTCGGGTGATTGTCCCGATCCCGAATCGTGCAagagaaaaatcaaaatcactTGTAAATGTAAAAGACTAAAGAAAGAGTTCCAGTGCGAAACAATTCGCAAAGGTTTGGCAATTCTAGAATGTGACGAAATCTGTAAACAAAAGCAGGAAGAAGAACGAAAGAAACGGGAAGCAGAGGAAGCTATCAAATTAAAACAGCAAGAACTGAAAGATCAGAAAGAACTCGAGGAGTATCAAAAGAAATATTCGGGAAAGAAGAAACCCAGGAAGAGGAACGTCAATGATGAAGTCGAGAATAAAAGTTTCTTTGTGAAATATTGGATTGTTATTTTATCAGTTTTCTTGTTTGTGACGTCTCTAGTGGTATATCAAGCAttgagttaa
Protein Sequence: MSNNRPKSNPWNKNNSTQKQKKTSVSSLGPNINSSGEVKFKEAQTKLQNAVKKHIKDYESSSEEEDIDSTNVIDEILKQYAKTGGTNDQLSRTQIFIEESFLSGATTCLICISRVKRDDQIWSCLNCHGGFHLNCIQRWSKDTVIQLKQRIEEQTISKEKKLHWCCPKCRYEYNPEQIPTKYVCFCGKAENPKYQPFLVPHSCGEICRKDLLPQCGHQCLLLCHPGPCPPCPVTVSVTCFCGSQLPVTKRCSFKGWSCGSRCGKELSCRRHTCSEPCHDGNCQPCSKKSIQKCMCGSSQKLRDCNSPIWQCDKVCGKSLDCGKHKCENVCHAGVCNSCLLAQPRTCPCGKTKYQLPCTEEVPTCPDTCGKLLECGIHSCNYRCHKDKCGLCLEIVTKACRCGQHIKEIQCCKQYLCDTKCKRLRDCNKHPCNRKCCDNNCPPCEKPCGQTLQCGNHKCQSVCHRGPCFPCQQTNTVSCRCGSTKITVPCGKKHRVKPPKCSKPCLLPPECHHEKREKHKCHFGECPPCRQICNKSRSNCSHLCIANCHSSVNIKIEAQKASMPWEQTLPQFEKKCLPCPDCKEPVMVTCLGDHETSAWPCYMAKPSNCGRPCGRILSCTNHTCSLSCHVVEGSNDNALAGYNCEKCESPCLKPQPEGCIHSCPKPCHPGLCPPCKQMLRIKCHCVLTQPYVLCSDWLIIEKREELQSCGNQCPKNYPCGHRCKTNCHSGDCPDPESCKRKIKITCKCKRLKKEFQCETIRKGLAILECDEICKQKQEEERKKREAEEAIKLKQQELKDQKELEEYQKKYSGKKKPRKRNVNDEVENKSFFVKYWIVILSVFLFVTSLVVYQALS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01307710;
90% Identity: -
80% Identity: -