Basic Information

Insect: Udea olivalis
Gene Symbol: XPO7_1
Assembly: GCA_947369235.1
Location: OX376368.1:7392030-7411178[+]

Transcription Factor Domain

TF Family: zf-GATA
Domain: zf-GATA domain
PFAM: PF00320
TF Group: Zinc-Coordinating Group
Description: This domain uses four cysteine residues to coordinate a zinc ion. This domain binds to DNA. Two GATA zinc fingers are found in the GATA transcription factors. However there are several proteins which only contain a single copy of the domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.011 39 4.7 0.1 17 30 462 475 457 475 0.81

2 10 0.011 39 4.7 0.1 17 30 508 521 503 521 0.81

3 10 0.011 39 4.7 0.1 17 30 554 567 549 567 0.81

4 10 0.011 39 4.7 0.1 17 30 600 613 595 613 0.81

5 10 0.011 39 4.7 0.1 17 30 646 659 641 659 0.81

6 10 0.011 39 4.7 0.1 17 30 692 705 687 705 0.81

7 10 0.011 39 4.7 0.1 17 30 738 751 733 751 0.81

8 10 0.011 39 4.7 0.1 17 30 784 797 779 797 0.81

9 10 0.011 39 4.7 0.1 17 30 830 843 825 843 0.81

10 10 0.13 4.6e+02 1.3 0.3 17 27 876 886 871 894 0.79

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.011	39	4.7	0.1	17	30	462	475	457	475	0.81
2	10	0.011	39	4.7	0.1	17	30	508	521	503	521	0.81
3	10	0.011	39	4.7	0.1	17	30	554	567	549	567	0.81
4	10	0.011	39	4.7	0.1	17	30	600	613	595	613	0.81
5	10	0.011	39	4.7	0.1	17	30	646	659	641	659	0.81
6	10	0.011	39	4.7	0.1	17	30	692	705	687	705	0.81
7	10	0.011	39	4.7	0.1	17	30	738	751	733	751	0.81
8	10	0.011	39	4.7	0.1	17	30	784	797	779	797	0.81
9	10	0.011	39	4.7	0.1	17	30	830	843	825	843	0.81
10	10	0.13	4.6e+02	1.3	0.3	17	27	876	886	871	894	0.79

Sequence Information

Coding Sequence: ATGGCTGAAGAACAGGAGGTGATTCAGATAGAACTGCTGTGTAAACAGCTGTACGAGTCTCAGGATCCAGTGCTGAGGGAGCAGGCAGAGAAAGCTGCTGTGGCCTTCCAGGAGTCCCTAGACACGCTGAGCAAATGCCAAGCCTTGCTGGAGCGAGCTGACTCCAGCTACTCGCAGCTCCTCGCGGCCACCACACTTGCCAAATTGATAAACAGGTCAACGAGCAGCCTGTCGGTGCAGCAGCGCCTCGACATCAGGAATTATGTGCTTAACTACCTCGCGACGCGCCCCAAACTTGCCACCTTTGTCGTGCAGGCCTTGGTCTCGCTATTTGCCCGCATCACCAAGCTGAGCTGGTTCGACACGGTGAAGGAGGAACTGGTCTTCCACAATGTGATGAACGATATCACCAGCTTTCTGCAGGGTCCAGCAGAGATGTGCACGATTGGAGTGCAACTTATTTCGCAACTTGTTGTCGAAATGAACCAGGTGACCGAAGCAGATGCCAACAGATCGCTCGCGAAGCACAGGAAGATCGCTTCTTCCTTCCGAGACTCCCAACTGTTCGAGATGTTCCGCCTCTCCTGTTCCCTCCTCGGGGCGGCTCGTTCGAAACCCTTAGACCTGAACGACGAGCGCCAACACACGCTCATAGCGGCGCTGCTGCGGCTCGCGCACAACTGCCTGACCTTCGACTTCATAGGCACCACCAGCGACGAGGACTTGTGCACGGTTCAGATCCCCACCTCATGGCGGCCAACGTTCCTAGAGTCCAGCACGCTAGACCTCTTCTTCGAGCTGTACCACTTGCTGGGCGGGGGTCTCGCGTCTCTGGCGCTCGCGTGCCTCGCGCAGCTGGCTTCGGTGCGCCGGTCGCTGTTCAGCAACAATGAGAGGGCCAAGTTCCTGAACAGGCTGGCTGCTGGGGTCCTGAGGATATTGGAGAATACACAAGGCCTCTCGGACGCGGCCAACTACCACGAGTTCTGCCGCCTCCTCGCGCGGCTCAAGTCCAACTACCAGCTGGGTGAGCTGGTGATGGTCGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTTCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGGTTAGTGTACCTTGATGATGTGTTTGTTGCTTGTCACATACAAACACTAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGTTGTGCCGCCTCCTCGCGCGGTACCAGCTGGGACAACTACCCGCGGCTCATCGAGCTCATCGCCAAGTTCACTGTGCAGAGCCTGCAGATGTGGCAATTCGCCCCAAACTCGGTCCACTACCTGCTATCGCTCTGGCAGCGGATGGTCGCGTCAGTTCCGTACGTGAAGGCGACGGAACCGCATCTGCTGGAGACGTACGCGCCGGGTGTCACCGCCGCGTACATCGGCTCGCGACTGGACTCCGTGGCTTGTGTGCTCAGGTAA
Protein Sequence: MAEEQEVIQIELLCKQLYESQDPVLREQAEKAAVAFQESLDTLSKCQALLERADSSYSQLLAATTLAKLINRSTSSLSVQQRLDIRNYVLNYLATRPKLATFVVQALVSLFARITKLSWFDTVKEELVFHNVMNDITSFLQGPAEMCTIGVQLISQLVVEMNQVTEADANRSLAKHRKIASSFRDSQLFEMFRLSCSLLGAARSKPLDLNDERQHTLIAALLRLAHNCLTFDFIGTTSDEDLCTVQIPTSWRPTFLESSTLDLFFELYHLLGGGLASLALACLAQLASVRRSLFSNNERAKFLNRLAAGVLRILENTQGLSDAANYHEFCRLLARLKSNYQLGELVMVDNYPRLIELIAKFTVQSLQLCRLLARYQLGQLPAAHRAHRQVHCAEPAVVPPPRAVPAGTTTRGSSSSSPSSLCRAFRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACRLVYLDDVFVACHIQTLVVPPPRAVPAGTTTRGSSSSSPSSLCRACSCAASSRGTSWDNYPRLIELIAKFTVQSLQMWQFAPNSVHYLLSLWQRMVASVPYVKATEPHLLETYAPGVTAAYIGSRLDSVACVLR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -