Basic Information

Insect: Empis stercorea
Gene Symbol: -
Assembly: GCA_949752835.1
Location: OX457085.1:9309482-9315040[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.0024 3 8.4 0.0 2 28 1042 1068 1041 1080 0.86

2 7 0.00012 0.16 12.5 0.1 2 38 1154 1190 1153 1194 0.92

3 7 1.6e-06 0.0021 18.5 0.0 3 39 1332 1368 1332 1371 0.93

4 7 0.003 3.9 8.1 0.0 3 27 1407 1431 1405 1441 0.89

5 7 2.9e-06 0.0037 17.7 0.1 5 37 1530 1562 1527 1565 0.92

6 7 1.1e-06 0.0014 19.1 0.0 3 38 1705 1740 1703 1745 0.94

7 7 6.1e-05 0.077 13.5 0.0 2 35 1780 1814 1779 1820 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.0024	3	8.4	0.0	2	28	1042	1068	1041	1080	0.86
2	7	0.00012	0.16	12.5	0.1	2	38	1154	1190	1153	1194	0.92
3	7	1.6e-06	0.0021	18.5	0.0	3	39	1332	1368	1332	1371	0.93
4	7	0.003	3.9	8.1	0.0	3	27	1407	1431	1405	1441	0.89
5	7	2.9e-06	0.0037	17.7	0.1	5	37	1530	1562	1527	1565	0.92
6	7	1.1e-06	0.0014	19.1	0.0	3	38	1705	1740	1703	1745	0.94
7	7	6.1e-05	0.077	13.5	0.0	2	35	1780	1814	1779	1820	0.90

Sequence Information

Coding Sequence: ATGGAAGAGAACAATTCTAATGAAATATTAACcacaataaatacaaataattctaattctaatgataatagtaatagtaattttccattaattataaataatgttaaacgtGAAATTGATATTGATTTTGAAGATGAAAGACTTGATACaaaagatgaaaattatcaTTCAAAATGTGGTGAAATATTTGTATCAAAAGATAAAGAATTTACATTTCATTGCAGTATTTGTAAtgagaattattttaattttaattatttctctgAACATGTTCTATATGATCAAAATCATGCAAAtcaattagtatttttaaataattgtacaaataataatagtaataattttattataccatcATTACCATTACTACTGCCATCATCATCAGTTACACTTGCAAATAATCCATTTCGTGACTATCCAGATTgtgaaaatattgttaaaactGAATTAACAGaagatgaaaaatatattgattatTGTGAtgaaaaatcatcatcatcaaatgtTTTTGTTGAGGATGAAATGCTAGAAGTTATATCAGCGCCACCAGCTGGATTCTATCAAAGTAATGAATTTAATGAACAGCAATCTGATTACTCCGAATTAAATGATGAAGAACCAATAATATTGGCAAATTTACGTGAAGAAATTATGCAAGaagaaatttctaataattcaacaggtaataataattatgctGGTTTtcataaatgtaatttttgtgaTAAAGAATTTTCACGTGCAtggaatttaaatattcatttgaaacgttgtaaattaaatatcgGAAAAATTGATTATCAACAAACTCAATCAAATAATAAACCAGATTCAACAGCATTTAAAATTATGTGTCCAATTTGTAAAATGTCCTTTCAACgtgaagtaaatttaaattttcatttaaaaaaatatcataaaaatactGTATGGTCACATACAGAAGAAAGTCTTTTACGATGTGATTTATGTAATACATCATTTAAACGTCGTGAATATTTACGAAAACATATTAAAAGACATATGGCTAAATATCGAAAACAATCATTTTTACCAAATCCAATAGCATCTGATAATAAATTGGAATGTAAagaatgtaatttaaaatttgatgaaGAATATCAATTGTTTGCCCATCAAAGTACACATTTATATACAGATTCAATAGAAACAAATGAATGGgatacaaaattttcatctaATGTAGATTCTAGTATACCAACAACAAGTTATCGTGACAATGAAAATATTCCATTTGAATTTGTTGATAATTCAacatttgataaaataaataatccaCAATATACATGTGAACAATGTGATCGTACATATAATAGCGAAGaatcatttaaattacataattgtaTTAATATATTTGATAGACCACATCAATGTTTAACTTGTAATAGAAGTTTTATGTATCAATCATATTTAAAAAGGCATATGAAAAGATGTTcaaatagaaattcatttaatgaaacaacagataataaaaataatttagatatatTTGATAATTATGATAATGATTCAGAAATAAGATATGaggaaaattcaattaaaaataatttttcatcaattcCATCAACTGATAATGAACAATTACCAACTACACCAATTAAATCAACAACAAGTTCACCATCGAAACGTAGAGGTAGtggtaatttattattaaaattatttaaatgtaaattttgtaaaaaagtctttagatcaaaaattaatttacaaaatcatTTAAGTATTCATTTAAAGAGTCAAAATAAAAGTATTATAACTGAAAATATGAcaacaataaataaactacaattaACGCCACCATcattgaaatgtaaaatttgtggtagaaaatttaagcaaaaaatttctttaatgatACATGAACGTGGCCATTCTGATGATAAACCATATGAATGTAATTTAtgtcaattgaaattttatacacaaggttatttaaattttcatcaaaaaagtatacataaaatttgtacAACAATTAGTAAATCATTTAATTGTGAAATTTGTAatggtaaatttttaacaatatcaCTTTTACATATTCATATGAATAAAATTCATCTAAAAGACGAAAATACATCTGAAGAACTTGAAAAATCTAACAAAAATCCAgcagaatataaaaaaattggtgaaaatTCATCAAATTCAAGTGATTCAACGAAATATAAATGTCGATTTTGTCCTAAACTAATAAATCGTcgtacaaatttaataatacatgAACGTATTCATTTGGGTCAGCGACCACATTCATgtgaattatgtaataaaacaTTTCCATCAATTAGTTATGTTAAATTACATAAGAAAAATGCTCATAATATTACAGTACCAAGAATACAATATCAATGTGAATATTGTCCAAAAATTACTAcaactgaatattttttaactttacatattaataatacaCATCGTGAAGAATGTCCCCATGAATgtaataattgtttaaaaagATTTGCAATTATTGATGATTTAAATATGCATTCGAAAATTGAACATTCAACATTAAATGAATctgtaaatattaaatctactataaatgaacaaaataatggaaaagaaaatgatgagaataatttaaaatgtaattattgtTCAAAAAGttttagtaatttatataattttaatattcatttacgTAATCATCATACTGGTGAAAGACCATATTATTGTAGTTTGTGTGATAAAAATTTCTCATGTGGACCATATTTATGGAAACATAATCAATTTTGGCATACAGaagaaaaaacaacaacaactaacttaacaaaaatattaccaattaattataataagaaaatcatCTATCCAGAAAAAGATTTAACAGCTACTTCTTCATCATCAACAAAGACGAAAAATCCAAAAgaagattattatttatatgtacatgcATGTGAAATTtgtggtaaaaaatttaaaaaaattgcttattTAAAAATGCATGTGGCCAAACATACTGATACATATAAATGTGAAATTTGTGGTAAACGCTGTTCAAGTTCACACAATTTAAATGTTCACCAACAAATACATGTAAATGATAAAGGTGaatcaaaaattgataaaaatgaaattataacacctacaaaaaatgaaacatctgataatttattaaaagctGTTAATtcatgtattaaaaataaaatgagtaTTATTGGAGCATCGAAATTTTATAATCTTGATTTTAGAATGCTATATAAAAATGTAGCAATAAAACGAAgagaattaaatgaaaaattaaatataaataatgctAAAACTCAAGAAACATTTAATATCGATGCAAAACCATTTGATATTATTAATGAAGAAAAATCACCAATTGCTAGAATTTCGAAATCTAATAGATACCATACAAATCGTAaacgaatttataaaaaacgatcATCAACAGCTTTAGAAAATTCGAAATTCCGTCAAGAAGGTACAAAAGAAAGAGAAGCATTAATTAAAGCTGTTCGTTTATATGAAGCTGGTGAATTATCACAAGCACAGGTagcaaaatcatttaatatatcTGTAGCATCATTATGTCGCCATATGAGTACTGTACCAAGAATTGGTGAAACACAAGAGATTTTATCATCAAATGAGATTAATAATAGTATAGTAGAAATTAATAATGAGAAGTCAATAAAAGTTCCAACAGATTTAAGTACATGGTATACAGAAAATTCATCAAATTCAGATAATGATGATATGGAAATGGGAGAAGTTATAAAAGCAGAAGAAtgtttagataatttaaataaatccgagaatattgattttaaagaaattcGTAAAATTTTATCTCAACCATCAAAATCACTTTCAACAATTAATGTTGATAATAATTTGGAACAATTTAATGATGGAAAAAAAGATAATACTGATTTTGAAATTGACACAGATTATCAAAAATCAATAAAAGATATGGATGATTATAAATTCGATAATCAACAAAATAGTGTACGTCGGCATccaattgaaaaaatattacaagCTGTTGAAGAATATAAAAAAGGTGGTGTGTCACAAAGTAAAATTTgtgaaacatataaaatttcctTATCAACATTGAAACGTCATCTAAAGAAAtcaaaaaaaccaatttatcCGCATGATAATATGATGATGTATCAGCCAATGAATATAACTAATCAATCAGATAATCAGACAacacaaattaaaaatgaaatcaatCCATCATCGGAGAATTTAATAAAAGCTGTTAATTCTTGTCTTAAGAATAAAATGAGTATTATTGGAGCatcgaaattttataatttagattttaagATGCTCTATAAAAATGTAGCAATAAAACGTAgagaattattagaaaaatcaaatgaaaatagtttattaacaaaaaatgataatcctatattaaattatgaacaaaaattatttaataatgatgataaattatcaaataatatgaAATCATCAATGTTTTCAAATACACAAACAACTgcaatgaaattattatataatcgtaaacgaaaatttaaaaaacgagTACCATATGCTTTaggaaattcaaaatttcgGCAAGAAGGTACTGCCGAAAGGGCACTATTAATTAAAGCTGTTCGATTATATCGTAGTGGTGAAATGTCACAAGTTAAAGCtgcaaaatattgtaatatttcttTAGCAACATTATGTCGTCATATGAATAGTGTATCAAAAATTGATGAAACTAAAGAATATGATCAATTCGAAGAGAGAAACATTGAtgcattaaatattaataaagattttaattGGTCAAATACttgtaatcaaattaattatactaatgcaaattttgataatattcaacaacaacaacaacaacaaataaatgaaaatgttgctgaatattttgataattcaaataaaattataaatattgatttaaatgatAGTTTACAACGACCATCGACTTTTTCTACATCACAAACTGAATATAATAAAGATGATTGTATTATTGGTGGACAATTTAATTCATCATTTCCTATACATGAATTTTCTGAACATTCGGCATTTTTTTCATCTGATGATCAATTTTCTGGTAATAAATCTGATAAAACTGATGATGTATTACAAAGATGTTCAATTGAAAAAATTGCAAAAGCTATTGAAGAATATAAAAGAGGTGGTGTATCACAaagtaaaatatgtaaaatgtaTAGAATGTCATTATCAACATTACAACGTTATTTAAAAGATGAACAAAAACAACCAGTATtaccaaattataataaaccaACAACAATTATACCATCAATATCATcagcatcatcatcaacaatatcaacaataaatcaagataaaaattataatgatgagAATTTATTAAAAGCTATTTTAGCTGTACGTAATGAAGGACTTAGTCATTTTGATGCAGCAAATGCACATAATGTATCTGTATCAGCATTATATTTATCATTAACAAGAAATGAAGATAACCAGTAA
Protein Sequence: MEENNSNEILTTINTNNSNSNDNSNSNFPLIINNVKREIDIDFEDERLDTKDENYHSKCGEIFVSKDKEFTFHCSICNENYFNFNYFSEHVLYDQNHANQLVFLNNCTNNNSNNFIIPSLPLLLPSSSVTLANNPFRDYPDCENIVKTELTEDEKYIDYCDEKSSSSNVFVEDEMLEVISAPPAGFYQSNEFNEQQSDYSELNDEEPIILANLREEIMQEEISNNSTGNNNYAGFHKCNFCDKEFSRAWNLNIHLKRCKLNIGKIDYQQTQSNNKPDSTAFKIMCPICKMSFQREVNLNFHLKKYHKNTVWSHTEESLLRCDLCNTSFKRREYLRKHIKRHMAKYRKQSFLPNPIASDNKLECKECNLKFDEEYQLFAHQSTHLYTDSIETNEWDTKFSSNVDSSIPTTSYRDNENIPFEFVDNSTFDKINNPQYTCEQCDRTYNSEESFKLHNCINIFDRPHQCLTCNRSFMYQSYLKRHMKRCSNRNSFNETTDNKNNLDIFDNYDNDSEIRYEENSIKNNFSSIPSTDNEQLPTTPIKSTTSSPSKRRGSGNLLLKLFKCKFCKKVFRSKINLQNHLSIHLKSQNKSIITENMTTINKLQLTPPSLKCKICGRKFKQKISLMIHERGHSDDKPYECNLCQLKFYTQGYLNFHQKSIHKICTTISKSFNCEICNGKFLTISLLHIHMNKIHLKDENTSEELEKSNKNPAEYKKIGENSSNSSDSTKYKCRFCPKLINRRTNLIIHERIHLGQRPHSCELCNKTFPSISYVKLHKKNAHNITVPRIQYQCEYCPKITTTEYFLTLHINNTHREECPHECNNCLKRFAIIDDLNMHSKIEHSTLNESVNIKSTINEQNNGKENDENNLKCNYCSKSFSNLYNFNIHLRNHHTGERPYYCSLCDKNFSCGPYLWKHNQFWHTEEKTTTTNLTKILPINYNKKIIYPEKDLTATSSSSTKTKNPKEDYYLYVHACEICGKKFKKIAYLKMHVAKHTDTYKCEICGKRCSSSHNLNVHQQIHVNDKGESKIDKNEIITPTKNETSDNLLKAVNSCIKNKMSIIGASKFYNLDFRMLYKNVAIKRRELNEKLNINNAKTQETFNIDAKPFDIINEEKSPIARISKSNRYHTNRKRIYKKRSSTALENSKFRQEGTKEREALIKAVRLYEAGELSQAQVAKSFNISVASLCRHMSTVPRIGETQEILSSNEINNSIVEINNEKSIKVPTDLSTWYTENSSNSDNDDMEMGEVIKAEECLDNLNKSENIDFKEIRKILSQPSKSLSTINVDNNLEQFNDGKKDNTDFEIDTDYQKSIKDMDDYKFDNQQNSVRRHPIEKILQAVEEYKKGGVSQSKICETYKISLSTLKRHLKKSKKPIYPHDNMMMYQPMNITNQSDNQTTQIKNEINPSSENLIKAVNSCLKNKMSIIGASKFYNLDFKMLYKNVAIKRRELLEKSNENSLLTKNDNPILNYEQKLFNNDDKLSNNMKSSMFSNTQTTAMKLLYNRKRKFKKRVPYALGNSKFRQEGTAERALLIKAVRLYRSGEMSQVKAAKYCNISLATLCRHMNSVSKIDETKEYDQFEERNIDALNINKDFNWSNTCNQINYTNANFDNIQQQQQQQINENVAEYFDNSNKIINIDLNDSLQRPSTFSTSQTEYNKDDCIIGGQFNSSFPIHEFSEHSAFFSSDDQFSGNKSDKTDDVLQRCSIEKIAKAIEEYKRGGVSQSKICKMYRMSLSTLQRYLKDEQKQPVLPNYNKPTTIIPSISSASSSTISTINQDKNYNDENLLKAILAVRNEGLSHFDAANAHNVSVSALYLSLTRNEDNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00644392;
90% Identity: iTF_00644392;
80% Identity: iTF_00644392;