Basic Information

Insect: Iselma pallidipennis
Gene Symbol: gba-4_1
Assembly: GCA_037464855.1
Location: JAZBHA010001040.1:16440-32623[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 25 2.9e-05 0.0013 18.8 0.5 1 23 129 151 129 151 0.98

2 25 4.1e-05 0.0018 18.3 2.3 1 23 157 179 157 179 0.96

3 25 0.00041 0.018 15.2 7.1 1 23 186 208 186 208 0.99

4 25 0.0003 0.013 15.6 0.6 3 23 374 394 373 394 0.97

5 25 4.4e-07 1.9e-05 24.5 0.9 1 23 400 422 400 422 0.98

6 25 0.00022 0.0095 16.0 5.6 1 23 429 451 429 451 0.99

7 25 6.1e-05 0.0026 17.8 1.5 3 23 459 479 458 479 0.98

8 25 3.3e-07 1.4e-05 24.9 1.6 1 23 485 507 485 507 0.98

9 25 1.3e-06 5.7e-05 23.0 0.4 1 23 639 661 639 661 0.99

10 25 3.6e-05 0.0016 18.5 3.3 1 23 667 689 667 689 0.98

11 25 1e-06 4.3e-05 23.4 2.4 1 23 695 717 695 717 0.99

12 25 0.014 0.6 10.4 2.9 1 23 723 745 723 745 0.97

13 25 2.7e-07 1.2e-05 25.2 1.6 1 23 751 773 751 773 0.98

14 25 6.1e-05 0.0026 17.8 2.8 1 23 779 801 779 801 0.97

15 25 0.024 1 9.6 5.6 1 23 807 829 807 829 0.98

16 25 0.0016 0.069 13.3 3.3 2 23 1001 1022 993 1022 0.94

17 25 8e-06 0.00035 20.5 0.1 1 23 1028 1050 1028 1050 0.97

18 25 1.3e-06 5.8e-05 23.0 3.8 1 23 1058 1080 1058 1080 0.99

19 25 0.0046 0.2 11.9 2.4 3 23 1088 1108 1087 1108 0.98

20 25 3.4e-06 0.00015 21.7 3.7 1 23 1114 1136 1114 1136 0.98

21 25 0.00039 0.017 15.2 2.6 2 23 1268 1289 1260 1289 0.95

22 25 0.19 8.1 6.8 0.2 1 11 1295 1305 1295 1308 0.89

23 25 0.014 0.61 10.3 0.6 1 23 1422 1444 1422 1444 0.96

24 25 8.4e-06 0.00036 20.5 0.5 1 23 1482 1504 1482 1504 0.99

25 25 3.2 1.4e+02 2.9 0.5 1 8 1510 1517 1510 1518 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	25	2.9e-05	0.0013	18.8	0.5	1	23	129	151	129	151	0.98
2	25	4.1e-05	0.0018	18.3	2.3	1	23	157	179	157	179	0.96
3	25	0.00041	0.018	15.2	7.1	1	23	186	208	186	208	0.99
4	25	0.0003	0.013	15.6	0.6	3	23	374	394	373	394	0.97
5	25	4.4e-07	1.9e-05	24.5	0.9	1	23	400	422	400	422	0.98
6	25	0.00022	0.0095	16.0	5.6	1	23	429	451	429	451	0.99
7	25	6.1e-05	0.0026	17.8	1.5	3	23	459	479	458	479	0.98
8	25	3.3e-07	1.4e-05	24.9	1.6	1	23	485	507	485	507	0.98
9	25	1.3e-06	5.7e-05	23.0	0.4	1	23	639	661	639	661	0.99
10	25	3.6e-05	0.0016	18.5	3.3	1	23	667	689	667	689	0.98
11	25	1e-06	4.3e-05	23.4	2.4	1	23	695	717	695	717	0.99
12	25	0.014	0.6	10.4	2.9	1	23	723	745	723	745	0.97
13	25	2.7e-07	1.2e-05	25.2	1.6	1	23	751	773	751	773	0.98
14	25	6.1e-05	0.0026	17.8	2.8	1	23	779	801	779	801	0.97
15	25	0.024	1	9.6	5.6	1	23	807	829	807	829	0.98
16	25	0.0016	0.069	13.3	3.3	2	23	1001	1022	993	1022	0.94
17	25	8e-06	0.00035	20.5	0.1	1	23	1028	1050	1028	1050	0.97
18	25	1.3e-06	5.8e-05	23.0	3.8	1	23	1058	1080	1058	1080	0.99
19	25	0.0046	0.2	11.9	2.4	3	23	1088	1108	1087	1108	0.98
20	25	3.4e-06	0.00015	21.7	3.7	1	23	1114	1136	1114	1136	0.98
21	25	0.00039	0.017	15.2	2.6	2	23	1268	1289	1260	1289	0.95
22	25	0.19	8.1	6.8	0.2	1	11	1295	1305	1295	1308	0.89
23	25	0.014	0.61	10.3	0.6	1	23	1422	1444	1422	1444	0.96
24	25	8.4e-06	0.00036	20.5	0.5	1	23	1482	1504	1482	1504	0.99
25	25	3.2	1.4e+02	2.9	0.5	1	8	1510	1517	1510	1518	0.93

Sequence Information

Coding Sequence: AATGAttcgaaaattgaaattaaagaacTGTTAAAGATTGAACCTGTGGAGGTTGATGAAGATCAGAAACCTTCTCTTGATCAACAAGGCAACTTGGATGGGGAATTGGGTACAGAAAGTCTAGAATGTACACTTGATATTGatgataatgatgatgattccgAAGAAGGGACTGGTGAAATCAAtagttttgatgataaaattgataaagagaTCACTGCTAATCCGAAAAACGTTAGTAAGGAAGTTGTAAATCCCCATTCAAGTACACATTTTAATCAAAGAGAATCATACTTTTGTGCACAATGTGGAAAACAATTAACGCCCAATGCAAATGGAACTTTGAAAAAGATACGTGATGAATATTTGTGTGAAGATTGCAAATatatatgtaaaatatgtGGCAAACGTTTTCCTCGTACAAATActgttattttacatttacgaACGCATAGTGATGCAAAACCATACATGTGTTATGTATGTGGTAAAATGTGTAGAACTTCTTATCAATTAACTCGTCATTTAGTAATCCACAAAGAACCcaaaaaactatacaaatGTCATATTTGCAGTAAAGATTTTTCCCGAGAAGATTGTTTTAAAACTCATCAAAAAATCCATCGTGGTCATAAACCGAATATTTGCCATGTTTGTGGTAGagTTCTGGAAGCTGATTTactgttccatcaagaattATATGATGGTGAAGATTCAGTTGATCAggttgaaataaaaatcaaagaaacatTCCTAATTGaaaatgttgaGAAACCTATTGACGATCAATCTAATATGCAGAAAACTCCTGATAGTGATATGAAAAATGAAGAGTTGGATGTAGAAAGTCAAGAATACCCATTTGGAATcgatgataataatactgatgatgatgatgatagctCCGAAGAAGGCAATTCTGAAATGGACAATTTTGATgcagaaattaataaacagaTCCGTAGAAATCGGAAACTAgataacaaaacaagaaagaaacaTTGTAACCAAAGTGAATCATTATCGTGTGCACAATGtggaaaacaattaatacCTAATGCCCGAgggaattttataaaaacacgTGGTGAATATTTGTGTGACGATTGCAAAAACATATGTAAGATTTGTGGAAAACGTTTCCATAGTCCATGGACTGTTACAGcacatttaaaaatacataacgGTGAGAAACCTTATATGTGTCATATTTGTGGAAAAGTCTATACAAATGCCAGTCAATTAAGCACTCATTTAATAACacataataatacagaaaaattatataaatgtagtttttgtgttaaaaGTTTTTCCAGAGAAGATTGTTTTAAAGCTCATCAGAAAACACATAGTGGTGAAAAACCAAATATTTGTCATATTTGTGGTAAAGGTTTTCTAACAAAACGTGATTTAAGAGAACACATTCGAACACATACTGGCGAAAAACCATAtagttgtaatatttgtaatcgACCGTTTTCGAGTAAATCAAGTTTAAATCGACATCGAAAAGTACATACTGAAACTATTGAAGAACCTGTTGAGGACCAATCTAATATTGAGGTTAATGACAATGAACAAAattctgataatgataagagaaaattgaataagGAACCGAATACAGAAGGCCCATTAGAAATTGgagataatgatgatgatgatgatgatgatgatgattccgAAGAAGGCAGTGGTCaagttgattttaatgatgaaattgataaagaaatgaCTAAAACTGAGAAGGTaaagaacaaaacaacaaaaaacagtaAGGAAGCTTTAAGTCCACATGCAAGTAGAGATTGTAAACAAAAAGGATCATATTCATGTGCACTATGTGGTCAACATTTATCGCCGcgaaatttaagaaaaatacgTGGCGAATATTTATGTACAGgctgtaaatataaatgtaaaatttgtggaAAACGTTTTCCCCGCTCATATGCTGTTACTGCTCATTTGGAAACACACAGTGATGTAAAACAGTACGTATGTTATGTTTGTGGCAAAATGTGTAAAACCGATAGTCATTTAAGGGTTCATTTAAGAGTACATAATACTGAAAAATCatacaaatgtaatatttgtaataaaagttttaatgtTAAAGCATATTTAACAACACATCAAAAAACACATATTGGTGAAAAATTGCACATTTGTCATGTTTGTGGTAAAGATTTTCTAGTAAAAGCCACTTTACGGGAACATTTTcgaacacatactggtgaaaaaccatatacTTGTAATATCTGTAATCGGCCGTTTTCAAGTAAATCAAGTTTAAATCGACATACTAAAGTACATACTGGCGAGAAGCCGCATActtgtaatatttgcaatagAAGTTTCACTGTAACAGCTCAGTTAAATCGGCACAAGAAAATACACAGTGATGTGAAACTATATtgttgtgatatttgtaaGAAACAATTTCATGAGGAATATGCTTATAAAAGACATTTAAAGatacatacaggtgaaaaaccgtatGCTTGTTCGATTTGTGTTCTGGATGctgatttgttgtttcatcaAGAATTATATGATGGCGAAGACGATGATAAGAAAGATTCAATCGATCAGATTGAAATAAAAGTCgaacaaacatttcaaattgaaaatgttgaGAAACCTATTGAAGATCAGTCTGGTATTGGGACAAATAAAACACAGAAAATCCCTGATAATGATGCGAAAAACGAAGAGTTGGTTGTAGAAAGTCCAGAACGCTCATTTGAAATcgatgataatattgttgatgacGATGAAGGGAATTGTGAAATGGACAATTTTAAGccagaaattaataaacaaattagtaGAAATCAGAAATTGGGcaacaaaacaagaaagaaacgTTCAAATATGGATTCTAGccaaaaacaatcattatcaTGTGCACAGTGTGGAACACACTTGACACTTAATGCAAGAGGCTATTTAACAAAAGTACGTGGTGAATATTTGTGTGAAGATTGTAAATGCACATGTGGGATTTGTGGGAAACGTTTTTCTAAATCACCTGCTGTTATTGTACATTTAAAAATGCATAATGGTGTGAAACCATATATGTgtgatatttgtggtaaagTGTTTGCAAACGCTACTCAATTAAGCAATCATTCAAtaacacataataataattctgaaAAATTATACCAATGCGATGTTTGTGATAAATCTTTTTCCCGAAAAGATTGTTTCAAAGCTCATCAAAAAATACATACTGGTGTAAAACCGAATATTTGTCATTTTTGTGGCAAAGGTTTCTTAAAAAAACGTACTTTAAGAGATCATATACGAatacatactggtgaaaaaccatatagTTGTAATATCTGCAATAAAGCTTTTTCGAATAGATCAGATTTCAACCATCATCGAAAAGTACATACAGaaaatgttgaGAAACCTATTGAGGATCAGTTTGGTATTGAGACAAATAAAACACAGAAAATCCCTGATAATAATGCGAAAAAGGAGGAATTGGTTGTAGAAAGGCCAGAACGCTCATTTGATATTTTagatgataatattgttgatgacgatgatgatgatagttcCGAAGAAGGGAATTCTGAAATCGACAATTTTGAGGcagaaattgataatcaaatcagtagaaatcgaaaattggataacaaaacaagaaagaaacgTTCAAGGATGGATTCTAGCCAAAAAGAATCATTATCGTGTGCACAGTGTGGAACACATTTGACGCTTAATGCAAGAGgctatttaaaaaaagcacGTGGTGAATATTTGTGTGAAGATTGTAAATGTACATGTGAGATTTGTGGGAAACGTTTCGTTAATTCAGGTGCTGTTATTgcacatttaaaattacatagtGGTGAGAAACCATATATGTGTCATATTTGTGGTAAAGTCTATCCATTTGCTGTTCTGGATGCTGATTTATTGTATCATCAAGAATTACGTGACGATGAAGATGACGATAGAAAAGTTCCAGTCgatcaatttcaaatagacattaaagaattattgaaaatagAAACTATTGAAGAACCTGATGAAGGCCAGTCTACTATTGTGGTCAAtgaaaatgatcaaatttctgataatgataagagaaacttacaattagataaagaGTCGGATACAGAAAGTCCATCAAAAAACGGaggtaatgatgatgatgatgatgactccCAAGGAATAACTCGGAAAGAGATCATCGAAAATACAGAATTAAAGAACAAAGCCAACAAGAataaaaaaccatataaatgcACGATTTGTAAACGAAATTATGGCAGTAAGGAAGGCTTAGATCAACATTCAAGTATACATTGTAATCAAGAAGATTCCTATTCATGTGCACGATGTGGCAAACATTTACCACCTAGTCTAAATGGATATTTAAGAAAAGTATGTGGTGAATATTTATGTGCCGATTGTAAATATACATGTAAATTTTGTGGTAAACGTTTTGCACGAGCCGGTGctattataaaacatttaaaaacacataGTGATGATAAACCGTACCAGTGTAATGTTTGTGGAAAAATtcAAGATGAATATCAAACGATTTTTGGCTGGGGTGGTGCTTTTACTGATTCTTTCGGCTATAATTATCAATCGTTAGATGGAACAGCCaggaaatatttattagattcATATTTCTCTGATAATGGTCTAGAATACAGTTTATGCCGTGTACCAATTGGTGGTACAGATTTCTCATTACGTGGTTATTCGTATAATGATGGTCCCGTAGATGTTAATTTAACTCGCTTCAATTTAACACAAGaagattataattataaaATTCCTTTAATAAAAACAGCATTAAATTTGACTGATAAtagattaaaattgtttgCAAGTGCATGGACAGCACCGAAATGGATGAAAACCAATCAACAATACAATGGGTTCGGCTTTTTAAAAACTGAAATGTATAACAGTTGGGCAaaatatcatttgaaatttttggaaaattatttcaatgaagGTATAAATTTTTGGGGTTTAACAACGGGTAATGAACCAAGTTTAGGTTTAATACCATGGGAACGGATTAATTCCGTAGCTTGGTTGCCACAACAAatgATTAAATATATCTCCGAACATTTAGGTCCGGTTGTACGAAATTCCAAATTCAAAGACATAAAAATCATGATATTGGATGACCAACGTTTCTTCTTACCCTGGTACGTTAATGAGgtCTTAGGTAATGAATTGGCACGGGGATACGTTGATGGTACTGCTGTCCATTGGTACCATGATGTTGTATTTCCAGTtagtttattaacaaaaacccATAATAAATGGCctgataaatttatattagCTACTGAAGCTTGTAATggTGATAAACCGTATGATAAAAAAGTGGTTTTAGGTTCTTGGGAACGTGGTGAATCTTATGCTATCGATATTATTGaaGACATGCAAAATTGGGTTACTGGCTGGGTTGATTGGAATATGGCCTTAGATTTATCAGGTGGTCCCACATATATTAAGAATTTTGTTGATTCCCCtataattgttaattcaacagctaatgaattttataaacaaccaacattttatatattgggacatttttctaaatttataccACCAAACTCGAAACGTATCTATTCAAcaagttttgataataaacaagtTCAAGTGGTTGCATTTAAAACACCCGCGAATAATATAGTTGTAAAGATTTTGAATAGgaaacCAGAAAATACTTCAGCCACTCTTGTAGATGATTTAGTTGGGAtaacaaatttagaattaacACCAAAAtcgataacaacaataatttattaa
Protein Sequence: NDSKIEIKELLKIEPVEVDEDQKPSLDQQGNLDGELGTESLECTLDIDDNDDDSEEGTGEINSFDDKIDKEITANPKNVSKEVVNPHSSTHFNQRESYFCAQCGKQLTPNANGTLKKIRDEYLCEDCKYICKICGKRFPRTNTVILHLRTHSDAKPYMCYVCGKMCRTSYQLTRHLVIHKEPKKLYKCHICSKDFSREDCFKTHQKIHRGHKPNICHVCGRVLEADLLFHQELYDGEDSVDQVEIKIKETFLIENVEKPIDDQSNMQKTPDSDMKNEELDVESQEYPFGIDDNNTDDDDDSSEEGNSEMDNFDAEINKQIRRNRKLDNKTRKKHCNQSESLSCAQCGKQLIPNARGNFIKTRGEYLCDDCKNICKICGKRFHSPWTVTAHLKIHNGEKPYMCHICGKVYTNASQLSTHLITHNNTEKLYKCSFCVKSFSREDCFKAHQKTHSGEKPNICHICGKGFLTKRDLREHIRTHTGEKPYSCNICNRPFSSKSSLNRHRKVHTETIEEPVEDQSNIEVNDNEQNSDNDKRKLNKEPNTEGPLEIGDNDDDDDDDDDSEEGSGQVDFNDEIDKEMTKTEKVKNKTTKNSKEALSPHASRDCKQKGSYSCALCGQHLSPRNLRKIRGEYLCTGCKYKCKICGKRFPRSYAVTAHLETHSDVKQYVCYVCGKMCKTDSHLRVHLRVHNTEKSYKCNICNKSFNVKAYLTTHQKTHIGEKLHICHVCGKDFLVKATLREHFRTHTGEKPYTCNICNRPFSSKSSLNRHTKVHTGEKPHTCNICNRSFTVTAQLNRHKKIHSDVKLYCCDICKKQFHEEYAYKRHLKIHTGEKPYACSICVLDADLLFHQELYDGEDDDKKDSIDQIEIKVEQTFQIENVEKPIEDQSGIGTNKTQKIPDNDAKNEELVVESPERSFEIDDNIVDDDEGNCEMDNFKPEINKQISRNQKLGNKTRKKRSNMDSSQKQSLSCAQCGTHLTLNARGYLTKVRGEYLCEDCKCTCGICGKRFSKSPAVIVHLKMHNGVKPYMCDICGKVFANATQLSNHSITHNNNSEKLYQCDVCDKSFSRKDCFKAHQKIHTGVKPNICHFCGKGFLKKRTLRDHIRIHTGEKPYSCNICNKAFSNRSDFNHHRKVHTENVEKPIEDQFGIETNKTQKIPDNNAKKEELVVERPERSFDILDDNIVDDDDDDSSEEGNSEIDNFEAEIDNQISRNRKLDNKTRKKRSRMDSSQKESLSCAQCGTHLTLNARGYLKKARGEYLCEDCKCTCEICGKRFVNSGAVIAHLKLHSGEKPYMCHICGKVYPFAVLDADLLYHQELRDDEDDDRKVPVDQFQIDIKELLKIETIEEPDEGQSTIVVNENDQISDNDKRNLQLDKESDTESPSKNGGNDDDDDDSQGITRKEIIENTELKNKANKNKKPYKCTICKRNYGSKEGLDQHSSIHCNQEDSYSCARCGKHLPPSLNGYLRKVCGEYLCADCKYTCKFCGKRFARAGAIIKHLKTHSDDKPYQCNVCGKIQDEYQTIFGWGGAFTDSFGYNYQSLDGTARKYLLDSYFSDNGLEYSLCRVPIGGTDFSLRGYSYNDGPVDVNLTRFNLTQEDYNYKIPLIKTALNLTDNRLKLFASAWTAPKWMKTNQQYNGFGFLKTEMYNSWAKYHLKFLENYFNEGINFWGLTTGNEPSLGLIPWERINSVAWLPQQMIKYISEHLGPVVRNSKFKDIKIMILDDQRFFLPWYVNEVLGNELARGYVDGTAVHWYHDVVFPVSLLTKTHNKWPDKFILATEACNGDKPYDKKVVLGSWERGESYAIDIIEDMQNWVTGWVDWNMALDLSGGPTYIKNFVDSPIIVNSTANEFYKQPTFYILGHFSKFIPPNSKRIYSTSFDNKQVQVVAFKTPANNIVVKILNRKPENTSATLVDDLVGITNLELTPKSITTIIY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -