Basic Information

Insect: Agrotis ipsilon
Gene Symbol: nfxl1_1
Assembly: GCA_028554685.1
Location: CM052976.1:11988015-11990495[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 20 2 3.6e+04 -7.8 5.6 15 19 134 138 133 138 0.81

2 20 0.011 1.9e+02 3.2 0.3 4 10 169 175 168 176 0.97

3 20 3.1e-07 0.0056 17.6 15.9 3 19 186 202 185 202 0.95

4 20 1.6 2.8e+04 -3.8 0.6 6 10 227 231 226 231 0.78

5 20 1.4e-07 0.0024 18.8 10.6 3 19 239 255 237 255 0.91

6 20 1.7 3e+04 -3.9 1.9 6 10 280 284 279 284 0.83

7 20 2e-08 0.00035 21.5 11.9 1 19 290 308 290 308 0.99

8 20 4.4e-06 0.078 14.0 19.0 3 19 345 361 337 361 0.86

9 20 1.2 2.2e+04 -3.4 0.4 7 11 365 369 365 369 0.84

10 20 2 3.6e+04 -5.3 2.2 5 10 384 389 384 389 0.88

11 20 6.7e-05 1.2 10.2 20.3 1 18 395 412 395 413 0.97

12 20 4.5e-10 8e-06 26.7 14.0 1 19 422 440 422 440 0.99

13 20 0.00035 6.3 7.9 4.9 9 19 488 498 486 498 0.89

14 20 0.00022 4 8.5 7.4 1 12 508 518 508 518 0.96

15 20 0.35 6.2e+03 -1.7 3.6 14 18 547 551 547 552 0.87

16 20 0.28 5e+03 -1.4 0.4 8 12 568 572 567 579 0.79

17 20 5.3e-06 0.095 13.7 4.8 1 11 588 598 588 599 0.97

18 20 0.00013 2.2 9.3 13.2 4 18 630 645 628 646 0.86

19 20 2.1e-06 0.037 15.0 10.8 1 18 687 705 687 706 0.89

20 20 2 3.6e+04 -4.5 1.1 6 10 736 740 736 741 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	20	2	3.6e+04	-7.8	5.6	15	19	134	138	133	138	0.81
2	20	0.011	1.9e+02	3.2	0.3	4	10	169	175	168	176	0.97
3	20	3.1e-07	0.0056	17.6	15.9	3	19	186	202	185	202	0.95
4	20	1.6	2.8e+04	-3.8	0.6	6	10	227	231	226	231	0.78
5	20	1.4e-07	0.0024	18.8	10.6	3	19	239	255	237	255	0.91
6	20	1.7	3e+04	-3.9	1.9	6	10	280	284	279	284	0.83
7	20	2e-08	0.00035	21.5	11.9	1	19	290	308	290	308	0.99
8	20	4.4e-06	0.078	14.0	19.0	3	19	345	361	337	361	0.86
9	20	1.2	2.2e+04	-3.4	0.4	7	11	365	369	365	369	0.84
10	20	2	3.6e+04	-5.3	2.2	5	10	384	389	384	389	0.88
11	20	6.7e-05	1.2	10.2	20.3	1	18	395	412	395	413	0.97
12	20	4.5e-10	8e-06	26.7	14.0	1	19	422	440	422	440	0.99
13	20	0.00035	6.3	7.9	4.9	9	19	488	498	486	498	0.89
14	20	0.00022	4	8.5	7.4	1	12	508	518	508	518	0.96
15	20	0.35	6.2e+03	-1.7	3.6	14	18	547	551	547	552	0.87
16	20	0.28	5e+03	-1.4	0.4	8	12	568	572	567	579	0.79
17	20	5.3e-06	0.095	13.7	4.8	1	11	588	598	588	599	0.97
18	20	0.00013	2.2	9.3	13.2	4	18	630	645	628	646	0.86
19	20	2.1e-06	0.037	15.0	10.8	1	18	687	705	687	706	0.89
20	20	2	3.6e+04	-4.5	1.1	6	10	736	740	736	741	0.83

Sequence Information

Coding Sequence: ATGGCACGCAGATACAGAGATGCAGCTGCAAAATTGCAGCAAAACGTCCAGAAACATCTAAAAGACATGAAGGAAATGTCGTCTTCCGAAGATGAGGAACCTTGCGAGTCCAGCGTCTTGGAGACCATGTTCCAGAGCTACTGGCGTGGCGGAGGTGACACTCAAATGCTTAACAGGACCAAAAACCTCCTTGAAGAAGCCATCAGTGGCCGCTCAGTTACGTGTCTTATATGCATAGGGTCGATCAAAAAATCTCACGCAATTTGGACTTGTGACCATTGTTTTTCATACTTCCATCTATCTTGCATTCAAAAATGGGCAAACGACAGCATTAGCTTACGTAGCGAAGAAAGTACGGGTCCGATAGCTGTAATAAAGCATCAGAAAATTGAATGGTGCTGCCCCAAGTGCCGAAATTCATATTCCAAAGAAGAAATACCTCGGAAATATCGCTGCTTTTGCGGCCAAACTGATGACCCGCCACAACATCCGTGGCTCATTCCTCATACTTGTGGTGAAGTCTGTGGGAAGAGGCTATCTACTGGTGATAATTGTAAACACAAGTGCTTGCTGTTATGCCACCCTGGTCCTTGTCCCCCGTGTCCTCAAACTGTTAACGGGATTTGTTATTGTGAGAAAGAACGCAAGAGAGTGAGATGCAGCGCTGCTAAATGGTCTTGTGGCCAAGTTTGTAAGAAAACTCTTCTATGTAAGACTCATTATTGTGAAAATGTTTGCCATGCTGGTGACTGCCCTGAATGCACCTACACAAGTATTCAACCATGTCAATGTGGCTCTGAGAAAGCTAAAAGACCATGTAATGATCCATTCTGGCAGTGTAAGAAGCCatgtaacaaattattttcatgtgGCTATCATAAATGTGACAGAATCTGTCATTCTGGCACCTGTGGTGACTGTCCTAACTCTGGCATGTTATCATGTCCCTGCGGTGCCAACCAGCGCTTTGTTCAGTGTCCAGATGTTATGGAAACCTGTTTGGGTACATGTGGGAAGAGGCATGAAGATTGTGAACACAAGTGTCCAGAGAAGTGCCACAATGGCAACTGCCCACCATGCCAAGTACTAATTGAGAAGAAATGCCACTGCTCAACACATACTAGGTCTCTACCGTGTAGCAAGGACTTCAAATGTGAGACTAAATGTAGAGGCATCAGACCGTGCGGCAAACATGGATGTGGAAGAAAATGCTGCAATGGGAACTGCCCTCCTTGTGAGAAAACATGTGACAAAAATCTCCATTGTGGTAGACATAAGTGCACAAATATCTGTCATCGTGGACCATGCTACCCGTGCCCTCTAGAATCGAAAGTAACTTGCAGATGTAAAGAAACTTTTGTCCGAGTCCCCTGTGGACGTGAACGTCAGACAAAACcaccaaaatgtaatttacCTTGCAAAATAAGGTACAAATGTGGTCATagtgaagaaaataaacattccTGTCATTTTGGTGATTGTCCATCCTGCAAGGCAATTTGTGACAAGCAGAATCCTAAGTGTGGTCATAATTGCAAATCAGTGTGTCATGAATATGTGCCAGTGCTGTTCAAACAAGTGGAAAAACCTGCCACCCCATGGGAAGTGCAGCCTCCAAAGACTAAGATCATGACCTTGGACTGTCCACCATGTGACACACCAGTATCAATGATTTGTTTTGGAGAACATGAAACGGATCTACAACCTTGCCACTCAGCTTCTCGGAGGCCTTGTGGAAGAGAATGTGGAAAACCGTTGGCTTGTGGCAACCACAAGTGCTCCTTACTCTGTCATCTTTATAGCCCTCTTCCTGAGTATCCAAATGTGCCTTCCAGTTGTAGGCAATGTAACAGAGAATGTTCTGTTCCACGTCCTGAAAAATGTGCTCACAAATGTTCCATAAAGGCTTGTCATCCTGGACCATGTCGGCCATGTGAGATACTTGAACGTTTAGCATGTCATTGTGGAGTAACTGAGATTTATTTACGCTGTCGAGAACTGTCCACAGCTACTGAAGAGATGTTATCGTGTAAGCAACAATGTCCTAAGAACTTGGAGTGTGGTCACCGCTGCCGGAACATTTGTCACTCAGGAGCTTGCGGCAACCAAGTATGCACTAAGAAGACTAAAGTGCATTGTCCATGTGGTAATATAAGGAAGGAGGCTCCATGCAATTTAGTTAGAAACGGAGAAGCAAAGATAATGTGTGACCAAACTTGTGAAGCCAAGAAAGCTGCAGCTAAAATAGAACAAGAGAAAGAGAAGCAGAGGTTGAAAGAgttagaagaagaaaagaatCGTAAAGAGTTAGCAGAGTATGAGTGGAAATTAAGTGGTAAGAAGAAGAAATATAAGGAGAAGAAGATGGTAGTAGATAAAGATGACCGTGGATTCCTAAAGAGATATTGGGTACCAATGTCATCATTCCTAGTTATGATGCTAGCttctatttattatatattttatgtagaatTAGAATAG
Protein Sequence: MARRYRDAAAKLQQNVQKHLKDMKEMSSSEDEEPCESSVLETMFQSYWRGGGDTQMLNRTKNLLEEAISGRSVTCLICIGSIKKSHAIWTCDHCFSYFHLSCIQKWANDSISLRSEESTGPIAVIKHQKIEWCCPKCRNSYSKEEIPRKYRCFCGQTDDPPQHPWLIPHTCGEVCGKRLSTGDNCKHKCLLLCHPGPCPPCPQTVNGICYCEKERKRVRCSAAKWSCGQVCKKTLLCKTHYCENVCHAGDCPECTYTSIQPCQCGSEKAKRPCNDPFWQCKKPCNKLFSCGYHKCDRICHSGTCGDCPNSGMLSCPCGANQRFVQCPDVMETCLGTCGKRHEDCEHKCPEKCHNGNCPPCQVLIEKKCHCSTHTRSLPCSKDFKCETKCRGIRPCGKHGCGRKCCNGNCPPCEKTCDKNLHCGRHKCTNICHRGPCYPCPLESKVTCRCKETFVRVPCGRERQTKPPKCNLPCKIRYKCGHSEENKHSCHFGDCPSCKAICDKQNPKCGHNCKSVCHEYVPVLFKQVEKPATPWEVQPPKTKIMTLDCPPCDTPVSMICFGEHETDLQPCHSASRRPCGRECGKPLACGNHKCSLLCHLYSPLPEYPNVPSSCRQCNRECSVPRPEKCAHKCSIKACHPGPCRPCEILERLACHCGVTEIYLRCRELSTATEEMLSCKQQCPKNLECGHRCRNICHSGACGNQVCTKKTKVHCPCGNIRKEAPCNLVRNGEAKIMCDQTCEAKKAAAKIEQEKEKQRLKELEEEKNRKELAEYEWKLSGKKKKYKEKKMVVDKDDRGFLKRYWVPMSSFLVMMLASIYYIFYVELE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00932106;
90% Identity: iTF_01440670;
80% Identity: -