Basic Information

Insect: Tanypteryx hageni
Gene Symbol: -
Assembly: GCA_028673005.1
Location: CM054112.1:16357668-16363923[-]

Transcription Factor Domain

TF Family: GTF2I
Domain: GTF2I domain
PFAM: PF02946
TF Group: Other Alpha-Helix Group
Description: This region of sequence similarity is found up to six times in a variety of proteins including GTF2I. It has been suggested that this may be a DNA binding domain [2, 1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.015 2.7e+02 4.7 0.0 37 56 14 34 8 45 0.79

2 4 0.014 2.5e+02 4.8 0.0 37 56 489 509 479 520 0.80

3 4 0.014 2.5e+02 4.8 0.0 37 56 715 735 705 746 0.80

4 4 0.014 2.5e+02 4.8 0.0 37 56 1361 1381 1351 1392 0.80

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.015	2.7e+02	4.7	37	56	14	34	8	45	0.79
2	4	0.014	2.5e+02	4.8	37	56	489	509	479	520	0.80
3	4	0.014	2.5e+02	4.8	37	56	715	735	705	746	0.80
4	4	0.014	2.5e+02	4.8	37	56	1361	1381	1351	1392	0.80

Sequence Information

Coding Sequence: atgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgccccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgttttcttcgggggggataacgtcgcggcttagggacacggtttccgaacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtaaaatccacgccccgtaaaacgtgccaccagcgaacacgggtgggttgcctttggcctcttagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgccccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctcccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtgtcaccctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaaccgacttgcgaatgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtggggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgttttcttcgggggtggataacgtcgcggcttagggacacggtttccgaacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtaaaatccacgccccgtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacggtccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgttttcttcgggggggataacgtcgcggcttagggacacggtttccgaacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtaaaatccacgccccgtaaaacgtgccaccagcgaacacgggtgggttgcctttggcctcttaggtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcacggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccaccccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccagggggacacggtttccgagtaggtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtaaaatccacgccccgtaa
Protein Sequence: MLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSSVTLRISIVPPRIRLFGRPAAPRPPPRRNRPTCFRRIPEFGRRLPSHPRDDCPLSAPPNEPLAAPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQAFSSGGITSRLRDTVSEHITPYRRSVDISIPAPPQPRPKPTCEVKSTPRKTCHQRTRVGCLWPLSVTLRISIVPPRIRLFGRPAAPRPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSRHLAKIRLPRAYTAPINRQEVFPLSLSRGVTLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKNRLANVTLRISIVPPRIRLFGRPAAPRPPPRRNRPTCFRRIPEFGRRLPSHPRDDCPLSAPPNEPLAAPDKSAPALDHADAPRHLAKIRLPRAYTAPINRVCFLFFNGENFIYGGNLYLPGSFGPNYVWGGVNALLTPRDRGEFPPYLRRFLRGWITSRLRDTVSEHITPYRRSVDISIPAPPQPRPKPTCEVKSTPRPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQAFSSGGITSRLRDTVSEHITPYRRSVDISIPAPPQPRPKPTCEVKSTPRKTCHQRTRVGCLWPLRSVAEFKICRHPHDLSRRSEARHLAPLPGEIAPRVFEGSPNSAADYHPTPRDDCPLSAPPNEPLAAPDKSAPALDHADAPRHLAKIRLPRAYTAPINRQEVFPLSLSRGTRFPSRCHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSKIHAP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -