Basic Information

Insect: Thyatira batis
Gene Symbol: nfxl1_1
Assembly: GCA_905147785.1
Location: LR990509.1:234421-237458[+]

Transcription Factor Domain

TF Family: zf-NF-X1
Domain: zf-NF-X1 domain
PFAM: PF01422
TF Group: Zinc-Coordinating Group
Description: This domain is presumed to be a zinc binding domain. The following pattern describes the zinc finger. C-X(1-6)-H-X-C-X3-C(H/C)-X(3-4)-(H/C)-X(1-10)-C Where X can be any amino acid, and numbers in brackets indicate the number of residues. Two position can be either his or cys. This family includes Swiss:P40798, Swiss:Q12986 and Swiss:P53971. The zinc fingers in Swiss:Q12986 bind to DNA [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 2 2.5e+04 -7.8 5.6 15 19 134 138 133 138 0.81

2 19 0.025 3.1e+02 2.0 0.2 4 10 169 175 168 176 0.96

3 19 3.1e-07 0.0039 17.7 15.9 3 19 186 202 185 202 0.95

4 19 1.8e-08 0.00022 21.6 13.7 3 19 239 255 237 255 0.92

5 19 0.45 5.6e+03 -2.0 1.7 6 10 280 284 279 285 0.76

6 19 5.8e-10 7.3e-06 26.4 12.3 1 19 290 308 290 308 0.99

7 19 5.1e-06 0.065 13.8 18.6 3 19 345 361 337 361 0.86

8 19 2 2.5e+04 -5.3 2.2 5 10 384 389 384 389 0.88

9 19 4.8e-07 0.006 17.1 16.3 1 18 395 412 395 413 0.97

10 19 1.7e-10 2.1e-06 28.1 11.7 1 19 422 440 422 440 0.98

11 19 0.0002 2.6 8.6 6.4 9 19 488 498 486 498 0.89

12 19 0.0021 26 5.4 8.6 1 12 507 517 507 517 0.96

13 19 0.4 5.1e+03 -1.9 3.4 14 18 546 550 546 551 0.85

14 19 0.35 4.3e+03 -1.7 0.2 8 11 567 570 566 571 0.78

15 19 1.6e-06 0.02 15.4 6.2 1 11 587 597 587 598 0.98

16 19 0.43 5.4e+03 -2.0 1.4 14 18 611 615 611 616 0.85

17 19 0.0054 67 4.1 11.7 3 18 628 644 627 645 0.87

18 19 2 2.5e+04 -6.5 3.4 9 13 651 655 651 655 0.71

19 19 1.5e-05 0.19 12.3 11.3 1 18 686 704 686 705 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	2	2.5e+04	-7.8	5.6	15	19	134	138	133	138	0.81
2	19	0.025	3.1e+02	2.0	0.2	4	10	169	175	168	176	0.96
3	19	3.1e-07	0.0039	17.7	15.9	3	19	186	202	185	202	0.95
4	19	1.8e-08	0.00022	21.6	13.7	3	19	239	255	237	255	0.92
5	19	0.45	5.6e+03	-2.0	1.7	6	10	280	284	279	285	0.76
6	19	5.8e-10	7.3e-06	26.4	12.3	1	19	290	308	290	308	0.99
7	19	5.1e-06	0.065	13.8	18.6	3	19	345	361	337	361	0.86
8	19	2	2.5e+04	-5.3	2.2	5	10	384	389	384	389	0.88
9	19	4.8e-07	0.006	17.1	16.3	1	18	395	412	395	413	0.97
10	19	1.7e-10	2.1e-06	28.1	11.7	1	19	422	440	422	440	0.98
11	19	0.0002	2.6	8.6	6.4	9	19	488	498	486	498	0.89
12	19	0.0021	26	5.4	8.6	1	12	507	517	507	517	0.96
13	19	0.4	5.1e+03	-1.9	3.4	14	18	546	550	546	551	0.85
14	19	0.35	4.3e+03	-1.7	0.2	8	11	567	570	566	571	0.78
15	19	1.6e-06	0.02	15.4	6.2	1	11	587	597	587	598	0.98
16	19	0.43	5.4e+03	-2.0	1.4	14	18	611	615	611	616	0.85
17	19	0.0054	67	4.1	11.7	3	18	628	644	627	645	0.87
18	19	2	2.5e+04	-6.5	3.4	9	13	651	655	651	655	0.71
19	19	1.5e-05	0.19	12.3	11.3	1	18	686	704	686	705	0.86

Sequence Information

Coding Sequence: ATGTCGCGTCGATATCGAGACGCTGCTGCGAAACTGCAGCAAAATGTGCAAAAACATTTGAAAGAGATGAAAGAACTCTCTTCTTCAGAAGATGAGGAGCCCTACGAGTCCAGCGTATTAGAAGGCGTATTCCAGAGCTACTGGAACGGTGGTGGAGACACTCGCATGATAAATAGGACTAAGAACCTTCTAGAAGAAGCGATCAGCGGCCGACCGGTAACCTGCCTTATTTGCATAGCTTCTATCAAAAGAACCGACGCAATATGGACCTGTGACCACTGCTACTCTTACTTCCACTTATCGTGCATACAAAAGTGGGCAAACGATAGCATTAGCTTAAGAAATGAAGAGAATCATGGACCAATTAGTGTTGTAGTCCCTAAAAAAATCGAATGGTGCTGCCCTAAGTGCCGGCAATCTTATAGCAAGGAAGAAATACCTCGGAAATATCGGTGTTACTGTGGTAAGGCTGATGACCCACCCTTTCACCCTTGGCTGATACCACACACTTGTGGGGATGTGTGCGGGAAAAGACTGTCTGCTGGAGATAACTGTAAACATAAGTGTCTTCTACTTTGCCACCCTGGCCCCTGCCCGCCGTGCCCACAAACAGTCAACGGAGTATGTTATTGCCAAAAAGAACGTAAGAAAGTCAGATGTAGTTCAGCTAAATGGTCATGTGGACAAATATGTAAAAACACTCTTCTATGCAAGACACATAAATGTGAAAACGTGTGTCATGATGGTGAATGCCCTCCCTGCAGCTACACAAGCTTACAAGCCTGCCAATGTGGTGCCCAAACATCAAAGCGACCTTGCAATGACCCTCACTGGCAATGCCAAAAACCATGCTCTAAACCTTACTCCTGTGGCTTCCATAAGTGTGAGAGAGTGTGCCACTCCGGGAATTGTGGGACATGCCCAAATTCTGGTGTCAGATCCTGCCCTTGCGGTGCCAATGAACGTGTTGTCCAATGTCCTGATGTTATGGAAACCTGTCTTGGGACTTGTGGAAAAGAACATGCTGACTGTGAACACAATTGTCCAGAAAAATGCCACAAAGGTTCCTGCCCGCCATGCCAGGTATTAATCCAAAAGAAATGTCTATGTTCCACCCATGTAAGATCCCTGCCTTGCAGCAAAGAATTCAAATGTGAAACAAAATGTAGAGGTGTCAGACGATGCGGTAAACATGCTTGTGCCCGCAAATGTTGCAATGGCAATTGCCCTCCATGTGAAAAAATCTGTGACAAACCACTCCAATGTGGACGTCATAAATGTGCCAGCATTTGTCACCGTGGTCCATGCTACCCATGTTCCAGGGAATCCAAAATAACATGCAGATGCAAGGAAACCTACATAACTGTTCCATGTGGCCGAGAAAAAAATGTAAAACCACCAAAGTGTACTTTACTGTGCAAGATTAAATATAAATGTGGACATGCTGATGAGAATAAACATTCCTGCCACTTTGGTGACTGCCCTCCTTGCAAAGCAATCTGTTATAAAACATATCCATGTGGTCATGAATGCAAGGCGACATGCCATGAGTTTGTTGCGGTAGTTTTCAAACAAGTAGAAAAACCAGCTACTCCATGGGAAATGCAACCTCCAAAAACTAAAATTATGACGTTGGAGTGCCCGCCGTGTGATACTCCTGTGCCTGTCGTTTGTTTTGGTGAACATGAAACAGATGATCAACCCTGCCACGCGGCAACACGTCGTCCGTGCGGGCGGGAATGTGGACGCCCATTGGCTTGTGGCAACCACAAGTGCTCACAACTCTGCCACCTGTACAAACCTGATCCAGAATATCCTAATACTCCCTACAACTGTAAACCATGTAACAGAGAATGTTTAGTTACCCGTCCAGAGAAATGCATACATAAGTGTGCACTAAAAGCTTGTCATCCAGCCCAATGTCCACCTTGTAATGTGTTTGAGCGCATACCTTGCCACTGTGGTGTAACTGAACTGTACCTACGTTGCCGGGAGTACACTTCAGCTACTGAAGACATGCTGTCTTGCAAGCAGCAATGTCCTAAGAACCTAGAGTGTGGGCATCGTTGCCGTAACACATGCCATTCCGGAACTTGCTCAAACCAAGTATGTACTAAGAAAACTAAAGTATATTGCCCATGCGGCAATGTAAAGAAAGAAGCCGCATGTAATGCATTAAAAAGTGGAGAAGTGAGAATAAAGTGTGATGAAAGTTGTGAAGAAAAGAAAATTGCTGTCAAACTTGAGAAAGAAAAAGAGGAAAAGAGGCTTAAAGCATTAGAGGAAGAGAAGAATAAAAAAGAATTAGCTGAATATGAATGGAAATTGAGTGGAAAGAAAAAGAAATATAAGGAGAAGAAGTTGGTTATGACAAGAGATGATAGAAATTTGGTGCAGAAATATTGGCTGCCAGTATTTTCATCTCTCGTTGTGGTGTCTGCTGCTCTCTATTATATATTTTATGTATAA
Protein Sequence: MSRRYRDAAAKLQQNVQKHLKEMKELSSSEDEEPYESSVLEGVFQSYWNGGGDTRMINRTKNLLEEAISGRPVTCLICIASIKRTDAIWTCDHCYSYFHLSCIQKWANDSISLRNEENHGPISVVVPKKIEWCCPKCRQSYSKEEIPRKYRCYCGKADDPPFHPWLIPHTCGDVCGKRLSAGDNCKHKCLLLCHPGPCPPCPQTVNGVCYCQKERKKVRCSSAKWSCGQICKNTLLCKTHKCENVCHDGECPPCSYTSLQACQCGAQTSKRPCNDPHWQCQKPCSKPYSCGFHKCERVCHSGNCGTCPNSGVRSCPCGANERVVQCPDVMETCLGTCGKEHADCEHNCPEKCHKGSCPPCQVLIQKKCLCSTHVRSLPCSKEFKCETKCRGVRRCGKHACARKCCNGNCPPCEKICDKPLQCGRHKCASICHRGPCYPCSRESKITCRCKETYITVPCGREKNVKPPKCTLLCKIKYKCGHADENKHSCHFGDCPPCKAICYKTYPCGHECKATCHEFVAVVFKQVEKPATPWEMQPPKTKIMTLECPPCDTPVPVVCFGEHETDDQPCHAATRRPCGRECGRPLACGNHKCSQLCHLYKPDPEYPNTPYNCKPCNRECLVTRPEKCIHKCALKACHPAQCPPCNVFERIPCHCGVTELYLRCREYTSATEDMLSCKQQCPKNLECGHRCRNTCHSGTCSNQVCTKKTKVYCPCGNVKKEAACNALKSGEVRIKCDESCEEKKIAVKLEKEKEEKRLKALEEEKNKKELAEYEWKLSGKKKKYKEKKLVMTRDDRNLVQKYWLPVFSSLVVVSAALYYIFYV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00762242;
90% Identity: iTF_01252423;
80% Identity: -