Basic Information

Insect: Tanypteryx hageni
Gene Symbol: -
Assembly: GCA_028673005.1
Location: CM054112.1:16477838-16485725[+]

Transcription Factor Domain

TF Family: GTF2I
Domain: GTF2I domain
PFAM: PF02946
TF Group: Other Alpha-Helix Group
Description: This region of sequence similarity is found up to six times in a variety of proteins including GTF2I. It has been suggested that this may be a DNA binding domain [2, 1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 0.023 4.2e+02 4.1 0.0 37 56 14 34 8 45 0.79

2 8 0.022 3.9e+02 4.2 0.0 37 56 289 309 279 320 0.80

3 8 0.022 3.9e+02 4.2 0.0 37 56 564 584 554 595 0.80

4 8 0.022 3.9e+02 4.2 0.0 37 56 839 859 829 870 0.80

5 8 0.022 3.9e+02 4.2 0.0 37 56 1114 1134 1104 1145 0.80

6 8 0.022 3.9e+02 4.2 0.0 37 56 1389 1409 1379 1420 0.80

7 8 0.022 3.9e+02 4.2 0.0 37 56 1645 1665 1635 1676 0.80

8 8 0.022 3.9e+02 4.2 0.0 37 56 1920 1940 1910 1951 0.80

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	0.023	4.2e+02	4.1	37	56	14	34	8	45	0.79
2	8	0.022	3.9e+02	4.2	37	56	289	309	279	320	0.80
3	8	0.022	3.9e+02	4.2	37	56	564	584	554	595	0.80
4	8	0.022	3.9e+02	4.2	37	56	839	859	829	870	0.80
5	8	0.022	3.9e+02	4.2	37	56	1114	1134	1104	1145	0.80
6	8	0.022	3.9e+02	4.2	37	56	1389	1409	1379	1420	0.80
7	8	0.022	3.9e+02	4.2	37	56	1645	1665	1635	1676	0.80
8	8	0.022	3.9e+02	4.2	37	56	1920	1940	1910	1951	0.80

Sequence Information

Coding Sequence: atgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtctctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttaggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgtcccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttaggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgacaacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctaaggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacgtccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttctttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgccacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaagaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagtccgtggccgaatttaaaatatgccgccatccgcatgacctctcccgtcgctccgaggcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttaggacggccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgacaacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttcttttttttaacggtgaaaatttcatctaaggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgtgtcacctaaggtcgggctcttggtggcaccgaccaaatatttggcgcatccgtggccgagctaaaaaggcagtcgcgccgaaggaggtgcggaagggcggtcacccatccaagtactatccgggccctacgatgcttaacttcggtgatcggacgagaaccggtgttttcatcgtggtatggtcgttgccgagagatttaagccttcgacgccctaagacacattacaccttatcggcgatccgtcgatatttccatacccgcgccgcctcaaccgagaccaaaaccgacttgcgaagcagtgtgactctccgaatttcaattgtccccccacggatccgcctcttcggacgtccagcggcacctcgcccccctccccggcgaaatcgccccacgtgttttcgaaggatccccgaattcggccgccgactaccatcccacccccgcgacgactgcccgctctctgccccgccgaacgagcccctcgccgcccccgacaagtcggccccggcgctcgaccacgcggacgctccccggcacttggcgaaaattcgcctccctcgggcctatacggctccaataaaccgtcaggaggtcttccccttatcgctgtccaggggtttgctttctttttttttaacggtgaaaatttcatctatggcgggaacctttatttgcccgggtcgttcggccccaactacgtgtgggtggcgtaaatgccctcctcacccctcgcgacaggggagaattccccccatacctcaggcgttttcttcgggggggataacgtcgcggcttagggacacggtttccgagtag
Protein Sequence: MLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVSPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARPRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARQRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSKAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSSVTLRISIVPPRIRLFGRPAAPRPPPRRNRPTCFRRIPEFGRRLPSHPRDDCPLSAPPNEPLAAPDKSAPALDHADAPRHLAKIRLPRAYTAPINRQEVFPLSLSRGLLSFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSPWPNLKYAAIRMTSPVAPRQCDSPNFNCPPTDPPLRTASGTSPPSPAKSPHVFSKDPRIRPPTTIPPPRRLPALCPAERAPRRPRQVGPGARQRGRSPALGENSPPSGLYGSNKPSGGLPLIAVQGFAFFFLTVKISSKAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQACHLRSGSWWHRPNIWRIRGRAKKAVAPKEVRKGGHPSKYYPGPTMLNFGDRTRTGVFIVVWSLPRDLSLRRPKTHYTLSAIRRYFHTRAASTETKTDLRSSVTLRISIVPPRIRLFGRPAAPRPPPRRNRPTCFRRIPEFGRRLPSHPRDDCPLSAPPNEPLAAPDKSAPALDHADAPRHLAKIRLPRAYTAPINRQEVFPLSLSRGLLSFFLTVKISSMAGTFICPGRSAPTTCGWRKCPPHPSRQGRIPPIPQAFSSGGITSRLRDTVSE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01402113;
90% Identity: -
80% Identity: -