Basic Information

Insect: Columbicola columbae
Gene Symbol: -
Assembly: GCA_016920875.1
Location: JADMLL010000005.1:723689-744631[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 5.6 4.3e+02 1.6 1.0 1 23 68 91 68 91 0.92

2 23 0.17 13 6.4 4.2 1 23 98 121 98 121 0.95

3 23 0.28 21 5.7 2.3 1 23 183 206 183 206 0.97

4 23 0.013 1 9.9 0.8 2 23 240 261 239 261 0.97

5 23 1 79 3.9 2.1 1 23 267 289 267 290 0.95

6 23 6.5 5e+02 1.4 2.0 2 23 402 424 401 424 0.95

7 23 0.18 14 6.3 5.7 2 21 635 654 634 655 0.94

8 23 7.6 5.8e+02 1.2 1.4 1 23 783 805 783 805 0.78

9 23 0.015 1.2 9.7 0.1 1 23 1099 1121 1099 1121 0.94

10 23 0.15 11 6.6 0.2 1 23 1129 1151 1129 1151 0.97

11 23 0.16 12 6.5 2.1 1 23 1189 1211 1189 1211 0.97

12 23 0.00045 0.035 14.5 2.9 1 23 1218 1240 1218 1240 0.99

13 23 3.9 3e+02 2.1 4.4 1 23 1299 1321 1299 1321 0.98

14 23 0.026 2 9.0 0.2 2 23 1340 1361 1339 1361 0.96

15 23 1 79 3.9 1.1 3 23 1453 1473 1452 1473 0.96

16 23 0.0052 0.39 11.2 1.6 1 23 1479 1501 1479 1501 0.98

17 23 2.6e-06 0.0002 21.6 2.0 1 23 1595 1617 1595 1617 0.98

18 23 0.0093 0.71 10.4 2.1 1 23 1703 1725 1703 1725 0.97

19 23 0.00066 0.051 14.0 3.1 1 23 1731 1753 1731 1753 0.99

20 23 0.12 9.6 6.8 0.7 1 23 1829 1851 1829 1851 0.98

21 23 0.042 3.2 8.3 0.9 1 23 1861 1883 1861 1883 0.95

22 23 0.0013 0.096 13.1 1.3 2 23 2022 2043 2021 2043 0.96

23 23 0.0017 0.13 12.7 2.4 1 23 2049 2071 2049 2071 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	5.6	4.3e+02	1.6	1.0	1	23	68	91	68	91	0.92
2	23	0.17	13	6.4	4.2	1	23	98	121	98	121	0.95
3	23	0.28	21	5.7	2.3	1	23	183	206	183	206	0.97
4	23	0.013	1	9.9	0.8	2	23	240	261	239	261	0.97
5	23	1	79	3.9	2.1	1	23	267	289	267	290	0.95
6	23	6.5	5e+02	1.4	2.0	2	23	402	424	401	424	0.95
7	23	0.18	14	6.3	5.7	2	21	635	654	634	655	0.94
8	23	7.6	5.8e+02	1.2	1.4	1	23	783	805	783	805	0.78
9	23	0.015	1.2	9.7	0.1	1	23	1099	1121	1099	1121	0.94
10	23	0.15	11	6.6	0.2	1	23	1129	1151	1129	1151	0.97
11	23	0.16	12	6.5	2.1	1	23	1189	1211	1189	1211	0.97
12	23	0.00045	0.035	14.5	2.9	1	23	1218	1240	1218	1240	0.99
13	23	3.9	3e+02	2.1	4.4	1	23	1299	1321	1299	1321	0.98
14	23	0.026	2	9.0	0.2	2	23	1340	1361	1339	1361	0.96
15	23	1	79	3.9	1.1	3	23	1453	1473	1452	1473	0.96
16	23	0.0052	0.39	11.2	1.6	1	23	1479	1501	1479	1501	0.98
17	23	2.6e-06	0.0002	21.6	2.0	1	23	1595	1617	1595	1617	0.98
18	23	0.0093	0.71	10.4	2.1	1	23	1703	1725	1703	1725	0.97
19	23	0.00066	0.051	14.0	3.1	1	23	1731	1753	1731	1753	0.99
20	23	0.12	9.6	6.8	0.7	1	23	1829	1851	1829	1851	0.98
21	23	0.042	3.2	8.3	0.9	1	23	1861	1883	1861	1883	0.95
22	23	0.0013	0.096	13.1	1.3	2	23	2022	2043	2021	2043	0.96
23	23	0.0017	0.13	12.7	2.4	1	23	2049	2071	2049	2071	0.97

Sequence Information

Coding Sequence: ATGGCTCATCGATCCGACGACGACGTTGAACTGGTGCGCAGCGGCAGCAGTCCTTTGGTTGACGAGGACACTCTAGAGAAAAACGCTTCTCCAGTTTACAATGAAAATGAAACTGGAGGTGAAGATGTCGGTAATGAAGTCTTTGCAGCCGACAATGGTGACGAGGATGCCAACTTACCTCAGTGCAAAATAAAAAGGAATTATTCCTGCAGTCTTTGTCCATTTTTCTCACAGAATCCGAGGTCCTTTTTGTACCACTCTAGAGACGTTCATTTTGATCCAATTAAGATCTTTGAATGCTCTTACTGTCTTTATGCATCGAAGCACTGTCAGAAACTCAAACGACACATTGTTATGGTTCACGTGGCAGGAAAAAATAGGTTAAAGAGAGGAGTAAGACTTACCACAAAAGACTTGAGACCCATCAGGCCGAAACCATTGCCGCCACAAACCTACATTTTGACCGAGGGGAGTCTTGTGTCAGAAGAGCAGGAACCTTCTCAAATCGATGATGAATCCGAAATCGAAGAAATTGTCGACGGTGAATACAAGTGTTCCCTTTGTAATTTTAAAAATAAAAGTCAAAAGTTGATGCGAAGGCACGAAAGAATAGTTCATCTTAAAAAGATGTTTTTGCGGTGTAGCAAATGTTCTTATATGACTCACGTCAAAGCTAGGTACACAAAACATGTGAAATACCATTCCATGCCTATGATCAAATGCGACTTATGTGATTTCCGAACGCCTTACAAATGGAATTTAGATCGCCATTACAAAAACCATTGCGGCTCCGGAGCCTTCCAGTGTTCAAAATGTAACTTTCGGGCGGACATAAAACAGAGTTTGACGGTTCACGAAATGAACCATCACGTGCCTCCTGTTGGCCAAGGAGCTGTTATGGCGCGAAAGAAAAATAAAGTGGGATCCTCCGAAATACCGTCTGTTGCGTCTGATACAACTGAAAGAGAAAAATCGGAAATTGCGATGGAAAGCAACGAGGAGTCCGAAACTCGTGACAACCAAAAGGCGGACACGAAAGAAGAACAAAAACGGGAGAAAAGAACAGGTGTTCAAAGCAATCACAACCTAAAATCGACGTATGGTAACAAACGAGAAACGACTGGTAACAGCCACTTGCAAACAGATTTCATTCATCCCGACGATATAGTGCCCAGGTATGGTCAGATCTTCGTGAAGAACTTGAAATGTAAATTTTGCAGCTATAAAGCCGTCTTTAGTCACGAGATATGGAGACACGAGAAGAGGATCCACGGCTACGTCCGTCCTGAAAACAAGAAGGAAAATGCTCCTAAAAGGCCGCCCCCTAAATTGATTCCTATCCAAAACAAAGCAGGGCCTCCCGGCTCCGTTTCGTCTCCAATACTTAAAATTCCAGAGGTGAAGAGCAAATCCGTCGTTTTGTTTCCGGACTCATCTCCTAGCCCCGATAAATCCGTAAATGACAATGAATTCAATGAGATGTGCAAAAAATCTAGTTTGACGAGTTCGTTGAAAGATTTTGTGTCTTTAATCGGAGATGAAGAAGGTTTGAAAACCATTCCTGATTCCTCACGTGAGGAAGACTTGCCGGAAGAGTGCTCGGTAATCAAGACAGAAGCTGTCGAGGATGTCGATACCAAAGGCGACGATTTAGCCAAACAGAAACAGACGGATTTAATGAAGAAGAAAAACGCGTCTTTTTTCGATAAGTTGAAGGAAAAATTGTTGACCAGTAGTAGCGAGGAGCAAAGTCTATTTTGTGAAGAATGTGCGCACGAGTCAAAATGTTTGTCAGAAGCTGTCGCTCATCAAAAACGACATTCTAATGCTAATAATAAGAGCGAGGTTGACGGTCATTCGGAAAACGATGTCGTTGTTTTGGGAGTCAAACTGTCTTCCACCAGATGTCAGCATTGTAGACAGCGCTGCAAAACAAGCACTGACTTATTTAATCACCTCAAGTCTTGCAAAGCCTTTGGTGCTGCTCAAGAGCTCCAGACATCTCTGGACGGGTATGTAGATCGTGAGATAAAATGCGAGCCTGATCTGAGCGACAAAGAAGAGAAGCACGACGAGAATGAAAATTCTATGGAAAATCGGGTTTTTGTCTGGAACGATTTGGGGCGAACGCCGGTTGAAGGCGAGGAAGAAGTTGATGAGGATGACGAAGACGGAGAAGAAGGTATGGTTGTAGACATTCCGTCGAATGAAGATGCTCGAACTGATTCTGATTCAATGTCTGGTGCCGTAATAAGTAAAGACGACCAAAAAGGCGAGAAAGACGTAACATCCACCCCGGAAACCGGCGGGTCGGGACGCCGATTCAAACTGCCGGTCAAAAACGTATTTAAATGCCCTCATTGTTCGTTTTGGGCATCGACCGCTTCTCGGTTTCACGTCCACATTGTGGGTCACCTTAACAAAAAACCATTCGAGTGTTCTCTTTGCATGTATCGCTCCAACTGGAGATGGGACATTACAAAGCACATCAGACTAAAGTCTGCTCGTGATCCAAGCCATTTAGAAGCTCGAGTGAATATGACCGACGAAACCGGTCGTAGAAATTATTCCAAGTACAGCAAATATTTGACTCTGATGAAGGTTCATGCACCTTCGGCTGAAAGCAGTGGAACGGGAAAAAGATCGGGAAGACCCAATGAAATAACTCAAGGCAATGTTACCGAAAAAGGCGTGATCACGCTTCCAGCACTTCCCAGGCTCACGAGAGCTCCCACGCCAGGTACATCCAATCAGGTTCCAGAAGGGCTGCCTTTGAGGCCTCCCCCACCTTTGAAAGCTGCCCACTCAATTTCATCAAATTTGCCAACCGAAGATCAGTCTGAGGTGTCACAAGATTCTAAAAAATCCTCCAAAAAGACTTTATGGAAATGTAAAAGGTGTGATTTCAGGGATTCAGACAAACACAGTGTCCTTTCGCACGTTAAAAATCATTATGGGAAGAAGAAGAAAAATATTTCACGGGCAAAATTTACTTTTTCGGAACATTTTAGCGATGAATCGAATCAGTCTCAAGATGCATCAGCTTTTATCGAAGAGGATGAAACTTCAAGAGGAAAATCAGCTTCAAGAATTTCTTTCAAAGAAGTTTCTTACAAATGCGGTCATTGTCATCAGGCATCCCCTTGGAAACATGTGATACAGCGTCACTGCAGGCTTAAGCATAATGGCAACGCCCTGATCGAAGTGGGATGGCGACATGAAGAAGTTGCGACTTCGCATGATAAAGAAAAAATTCCTGGCGACACAGTACCCGGAGACGGTGGTGTCAAACTCTTTTTGTGTGACATCTGTCCTTTTACCACTGATTCAGAAGGAAATCTCACAGCTCACAAACTGAATCATATTGATCGCCCGGGTTCCATCTTTAAATGTACATACTGTCCATTTTACGTACCGAGCAAAATAGCCGTTCTCGAGCACATGCAACTTCACGGAGTCTTTGGGTCTAGATTCAAAATACCTACTTCGAATTCCGATGATTTGGACGAGGAGGATAGTGACGACAATTTATCTGGTGAAAGTCCTGATACTTCCTCGCAAAAGTTCAGTTGCAAACAGTGCCCCTACGTTTCCTCCGTAAAAACGCAGTTCCTCTACCACAAAAAACTCCACATACCTCGCGATACGCCGTTCAAATGCAAGTACTGTTCGTATAATGTGACTCGACCTCATCTTCTTCGTGAGCACCTTAAAGTTCACTCGATTGTAGTTACAACAGAAAGTTCAGATGAAATCACGGAAGAAAGTATCGAAGAAACAACGACACCGACTACGACAGATTTCAAGCTGAAGGCTCTTCGCGAAATCGACCAAGTAGCTTTGCAAGATATACCTCTAGTTTGGGTTCTCAGAGCTGGAAACTGGAAAAAAATGTTCAAATGCCGACATTGTCCGCACATGAATGCGAGGAAGACTAACATTCAAGAACACGAAAAGATGCATCAAGGAAACGAGAGAAAAAATGATGGAGATTCTGGGCAGGGGAGTTCGGAACTCCGCTGTGCGGATTGCAGCTACTCCTGCAACAACCCCGGCGTGTTGGCATCTCACGTTAAAGTTCATCAAGAGGAATATGGACTGGTTGCATGTTTGGTTGATCGTGAAAGACCTGACACCGAACAAATTGAAGAATTACAAAAGAGAGTGAATATAGAAAAGCGGTGTGTGATCGTGAAGAAGGCGGAGATCGAGAGCGAGACAAAAGAGCCCCAGCACAAGGATAGAAGGATGCAGGACGATTTTTTGTCCTCTCAACCAGAAAACGCGTACAGGCGGACCACGAATAACGAAGAAGACAATGCGGATGACGAAAAAGAGAAAAAAGTCCTCAGTTTCTGTGATAAGTGTCCGGCCCGATTCTTCTTTGACAAAGAACTGACAATACATTCGAGGTTTCATGGCATTCACCTACCGTTCCAATGCGTGTATTGCTCGTACACTGCCAGGCAAAGACCACACCTCCTCGCTCACTACAAGGTCCATAGCCAGGAATACAAAGAAAAAACCGAGCAACTCGTCACCACTTACGATGTGTCGGAAGATTGGCCTCGTCCTCAAACCAGCATTATCTCGAATGAATCTGACCTGATCGAAGGACCCGTTTGGATGGTGACACCTGTCGACGACACCAAAGAGAAATCAAAATCGGAGGGAAACCCAAATAAGCCTACTGCGAAATTTGCTTGCCACCTTTGTCCTGCCAAATTGTTCAAACTCCTGGCACTCAAATATCACTTGACTCTTCACGGAGGTTCCCATCGGTACAAATGCAAATACTGCAACTACTCCGTAAAGACCCAGGGAAATTTGACGAAACACCAGTTGATTCACGAAAACGAATCTGAAGGGAAAGGCTCTGAAGACTCGATACGTTCCAACTCGGTTCAACGTTCTGCTAGGGAGTCCCTTTACCGTCGGACAGAAACCCGAAGCAAAAGCTTACCTGAAGTGCATAAGAAGTGCGATTCAGAGAAAGTCACGAAAACGAAAACGAAAACGGATCCCCAATTTGGTTCTTTGATGCACGGTTCCCCCGAGTTTATCTACCCGACGTACTTGAAAAATGGGAAAATCAAAGAGAAGAAGTACAAGTGTCACAAATGTCCATCGGCCTTCGAAAAACGCGAGCAGTACAGGATACATGTTTCACTTCACGGGTCCAAACAAAAATACGAATGTAAGAAATGCGACTACTCCGTTAAATACTTCGCGAATTTCAGTCAGCACATGAAAAAGCACAAAATTCACGAGCAGGCCATGAGAAGTCAAAAATTGAAAGACAAAAGCTGTCCTCTTGAGAAAGTTAAGACCTCAGATAAGTCGTCAATCGTTGAGGCTTCATTCGTAAATATTAGGAACGAATTGAAAGGTTCCAACGACGAACTCACCCTCATCGAACAGCAGACTCTCATGTTTCAGGGGTATAAAATGACACTCGAAGGGAAGGAAGAGGCGAGAAAGATGTTCAGCTGCCAGTACTGTCCGTACATAAACAATCGAAACGACAACGTAAGCAATCATGCCCGACGACACTTCAGCGTATCTGGTGTTACAGCGGGATATCGGTGCCCTCACTGTGATTACTCGGCAAACCAGGCCAACTTCATTCGGGACCACGTAAAGCTTCACTTCCGTCAGTTGGCTTGTCCGAAAGCCGAAGCTTACTTAAAATGCGACAAAATGGAACTGTGGTGCTTATTGGATAAGAATAAAGAGGATGTGCGAGTCTCACAATTGGAATCGAAAATGCTCGTGTTCCAGGACAGGGGGGAGGAAGCGGAGGATCGGTTTTTCCCACCTCTTTCGCGTGTAAACCCTGAAGAAGACGAGAACGACAATTGGCGGATATACATCAATCCAGAAAATGGTCAACCCAACGGAGATTTTCCGTTTCTGACAGCAGAGAGTGATTTTCCGATGCCCGAAAACTTTTGTGAATTCATGGAAATGTTCCAGGTTCATATGAAAGAAATGTTCAAGGACTCTTCGACAAAAGAGCCCAAGGCAAAGATTAAGACGAAAAGGTCGAGGGGGAAGAATTGGAAGTGCAAGAAGTGTCCTCATGCTTTCGGAAAAAAGGATCAGTACATGAGACACATCGCTCTCCACGGATCCAACCAAAAGCACAACTGCGACATTTGCGACTATTCCGTGAAATTTTACTCGACTTACGTTCAGCATATGCGAATGCATCAAAATCACGAACCAAACAGGCTCATCAGGGTGAAGGAAAACTTCCAAAGTTTGGATGAGAGTTCTTCGAAACACAAGAACCCCATCAGTCCTGACTGCTTGACAGAAACAGAGAACACGAAAAAAACACAGGAGGTCGAAGACGTTGAATCAGACTCTTTCCTCGAGGCAGAAGAAAAGTCGTTAGCTGCGTGTAAATATGAAACCGATCAGGAGTATTCAAGTTGGACGGATGGAACGGAAATATCCGTCTATTCTGGAGACGATGGTCCTTCCGGCGAAGACAACGAATTCCTGAAGAAGAAGATGGAACTGGATGAAGGAGTTTCAGTGAGTCGTAACTGA
Protein Sequence: MAHRSDDDVELVRSGSSPLVDEDTLEKNASPVYNENETGGEDVGNEVFAADNGDEDANLPQCKIKRNYSCSLCPFFSQNPRSFLYHSRDVHFDPIKIFECSYCLYASKHCQKLKRHIVMVHVAGKNRLKRGVRLTTKDLRPIRPKPLPPQTYILTEGSLVSEEQEPSQIDDESEIEEIVDGEYKCSLCNFKNKSQKLMRRHERIVHLKKMFLRCSKCSYMTHVKARYTKHVKYHSMPMIKCDLCDFRTPYKWNLDRHYKNHCGSGAFQCSKCNFRADIKQSLTVHEMNHHVPPVGQGAVMARKKNKVGSSEIPSVASDTTEREKSEIAMESNEESETRDNQKADTKEEQKREKRTGVQSNHNLKSTYGNKRETTGNSHLQTDFIHPDDIVPRYGQIFVKNLKCKFCSYKAVFSHEIWRHEKRIHGYVRPENKKENAPKRPPPKLIPIQNKAGPPGSVSSPILKIPEVKSKSVVLFPDSSPSPDKSVNDNEFNEMCKKSSLTSSLKDFVSLIGDEEGLKTIPDSSREEDLPEECSVIKTEAVEDVDTKGDDLAKQKQTDLMKKKNASFFDKLKEKLLTSSSEEQSLFCEECAHESKCLSEAVAHQKRHSNANNKSEVDGHSENDVVVLGVKLSSTRCQHCRQRCKTSTDLFNHLKSCKAFGAAQELQTSLDGYVDREIKCEPDLSDKEEKHDENENSMENRVFVWNDLGRTPVEGEEEVDEDDEDGEEGMVVDIPSNEDARTDSDSMSGAVISKDDQKGEKDVTSTPETGGSGRRFKLPVKNVFKCPHCSFWASTASRFHVHIVGHLNKKPFECSLCMYRSNWRWDITKHIRLKSARDPSHLEARVNMTDETGRRNYSKYSKYLTLMKVHAPSAESSGTGKRSGRPNEITQGNVTEKGVITLPALPRLTRAPTPGTSNQVPEGLPLRPPPPLKAAHSISSNLPTEDQSEVSQDSKKSSKKTLWKCKRCDFRDSDKHSVLSHVKNHYGKKKKNISRAKFTFSEHFSDESNQSQDASAFIEEDETSRGKSASRISFKEVSYKCGHCHQASPWKHVIQRHCRLKHNGNALIEVGWRHEEVATSHDKEKIPGDTVPGDGGVKLFLCDICPFTTDSEGNLTAHKLNHIDRPGSIFKCTYCPFYVPSKIAVLEHMQLHGVFGSRFKIPTSNSDDLDEEDSDDNLSGESPDTSSQKFSCKQCPYVSSVKTQFLYHKKLHIPRDTPFKCKYCSYNVTRPHLLREHLKVHSIVVTTESSDEITEESIEETTTPTTTDFKLKALREIDQVALQDIPLVWVLRAGNWKKMFKCRHCPHMNARKTNIQEHEKMHQGNERKNDGDSGQGSSELRCADCSYSCNNPGVLASHVKVHQEEYGLVACLVDRERPDTEQIEELQKRVNIEKRCVIVKKAEIESETKEPQHKDRRMQDDFLSSQPENAYRRTTNNEEDNADDEKEKKVLSFCDKCPARFFFDKELTIHSRFHGIHLPFQCVYCSYTARQRPHLLAHYKVHSQEYKEKTEQLVTTYDVSEDWPRPQTSIISNESDLIEGPVWMVTPVDDTKEKSKSEGNPNKPTAKFACHLCPAKLFKLLALKYHLTLHGGSHRYKCKYCNYSVKTQGNLTKHQLIHENESEGKGSEDSIRSNSVQRSARESLYRRTETRSKSLPEVHKKCDSEKVTKTKTKTDPQFGSLMHGSPEFIYPTYLKNGKIKEKKYKCHKCPSAFEKREQYRIHVSLHGSKQKYECKKCDYSVKYFANFSQHMKKHKIHEQAMRSQKLKDKSCPLEKVKTSDKSSIVEASFVNIRNELKGSNDELTLIEQQTLMFQGYKMTLEGKEEARKMFSCQYCPYINNRNDNVSNHARRHFSVSGVTAGYRCPHCDYSANQANFIRDHVKLHFRQLACPKAEAYLKCDKMELWCLLDKNKEDVRVSQLESKMLVFQDRGEEAEDRFFPPLSRVNPEEDENDNWRIYINPENGQPNGDFPFLTAESDFPMPENFCEFMEMFQVHMKEMFKDSSTKEPKAKIKTKRSRGKNWKCKKCPHAFGKKDQYMRHIALHGSNQKHNCDICDYSVKFYSTYVQHMRMHQNHEPNRLIRVKENFQSLDESSSKHKNPISPDCLTETENTKKTQEVEDVESDSFLEAEEKSLAACKYETDQEYSSWTDGTEISVYSGDDGPSGEDNEFLKKKMELDEGVSVSRN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -