Basic Information

Insect: Trichogramma brassicae
Gene Symbol: AGAP009949_1
Assembly: GCA_902806795.1
Location: CADCXV010000502.1:994041-1042934[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.059 1e+03 -1.4 1.7 197 213 387 403 329 426 0.52

2 2 2.8e-09 4.8e-05 22.7 25.7 31 236 610 815 592 844 0.60

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.059	1e+03	-1.4	1.7	197	213	387	403	329	426	0.52
2	2	2.8e-09	4.8e-05	22.7	25.7	31	236	610	815	592	844	0.60

Sequence Information

Coding Sequence: ATGTCCACGGAGACGATGACTTATAAGCTGGGCGATCTTGTCTGGGCCAAAATGAAGGGGTACTCGCCGTGGCCAGGCCGTGTATCAAACCCCATCAAAGATATGAAAAAACCAGCTACTACAAAGAAGATCCCTATATATTGCATATACTTCTTTGGAACAAATAACTATGGATGGATTGATGAAGCTAATATTAAACCATATCAAGAGCACAAGGATCAGTGCAAACAAATGTGTAAAACAGCTAATTTCAAAGAAGCTTGCGATACTATCGAAAACTTCATAAGTGGTGGTGAAGAAACTCCCCCATTAGATGTAGCAACTGTATCTCAAGCTctcaaagataaaaatatccAAGCATCAGACTTGAAATTTGGATTTCTTGGTTTGGGTATCATGGGCAGTGGAATAGTTAAGAATTTATTGAACAGTGGACATAAAGTTGTGATTTGGAACAGGTCACAAGAGAAGTGCAACGATTTTGTCGAGGCAGGAGCTGAAAAGGGTCTCACTCCCGCAGATGTTGTCGCCATGTCTGACATTACTTTCTCTTGCGTAGCAGATCCCCAAGCTGCCAAAGAGATGGTTTTTGGCAATTGCGGAGTATTATCGGAAATCACGGCGGACAAGGGCTACGTCGAGATGACGAGTATCGACGCCGAAACATCGGCCGATATCTGCGAGGCGATCATGGCCAAGGGTGCGCGCTACCTCGAGGCTCAAGTGCAAGGCAGCAAACCGCAGGCCGAGGAAGGCAATCTGGTGATCCTCGGCGCTGGCGATCGGCAATTGTTCGACGACTGCAACAGCTGTTTCCAAGCAATGGGCAAAAACGCCATCTATCTGGGCGAAGTGGGCAATGCTTCGAAAATGAACTTGGTACTTCAAACGATGACTGGAATTTGCTTGGTTGGATTAGCTGAGAGCATGGCTCTGGCCGACCGTGCCGGTCTGCAACAGAAGGATGTGTTGGAGATTATGGAAATGACTTCATTAGCAAGCCCACTGCTTACGGAGAAGGGAAAAGAACCGATACATGTTACGCGAAATTTTAAGAAAGATTATCTTGAAACTTATCTTTCGTGCAAAAATTCGCGTTTGCAGGgaacgagcagcagcagtcgaccTCGACACATGCTACGATTGCTATACGGCCGCAGTAGCGAGTCTCTCTCTAGCAGCAGGTCATCGTGTGCACACGCAGCCAGCAggcagcagctctcgagcAATGTGCAATGGCCAACAcaacgtgttaaacaaAAAGACAAATGGGTACCGAGAATTCTCGTGTTGGCTACCATGTGCAATTACTATCGtgtTGAATGCGTATCAGCTGGATCAACTgataagaattttcaaattttaccatttttaCAAGAGTTCACTCGTTCAAAGATCGATAGACAATTAAGTGGCGCACAAAGCCGCGAGTGCTCGAAAAAAGGCCATATGTTGGACTCATCGCGCAAATATCCtcgcCTCTCGTGTTGGCGTCTCTCAACTtttgcgacgacgacaacgatgtgctgctgctgctccaccATAACTACGAGTTTTATTggtcagcaacagcagcatcttCCACTCCGTTTTGCCCGATGCACGGcatactttttctctctcgttctcggaTTAAATCCCAAGCCCGCCGGTAAGATAGTCCCTACCGGCTCACACTTCCTACCATatgtattCGTTGAGAGAGCTGCCCAACGTGAACGCGAGAGGCAAGCACGTGCAGCTATGTCGCATCAACACATCGACCACTCACGTAGTCGCTCAGCCAATATCCATCACAGCTCGCCCAGGAATGAGGAGGACTGTGACAATTCCTTGTTCGGCGCCCCAGTTCGgGTCAATCCAGAGTTTCAGGACCGCCTAACGCAACAGATACAATCCAAATTGGGTAATCATTCTCTAGTGAAGCACCTGCTTACCGATAGCGGCAAGGGCCTCATAGGAATAGACGGCGGGCAAGCGAATCGAGGCGGACTCTCGAAGAGCTCCGCAGTGCAGCCTGGCGGCGCGTTGAATCCCAACGAGTTCAAAAAGCCGGGAGGTCCGCGGCCACCCTCGTCGTCATCCGGCCAGGCGCCACCATCGAGCAggtcaagcagcagcagcgctcaCAAGTCCGGATACCCTCCTCCCTCGTCGAGGCTAGGGGGAAATTTTCcctctcagcagcagcagcagcaacagcagcagcaacaatcgTCACAGAAACCCACGAGTCACAGTAGCGATCACAATAAATTTGCGCCGAGTAGTAGAGGGAGTCACGCATTTAATGCTCCGAACTATGACAATGCCCAGAATTCGAGTTCGAGCTCAAGTTCGTCGAATCGTATGCGCGAAGTGAACCCACAGAAGTCGTCGTCGAAGAGCTACTCGGATATGTCCCGGTATCAAATGCCAGTGAAACAAGAAAATCCAATTAGCCACGAACAAATCAAGCATGAACCAAATAAGTTGGCTGCTTTACACGTAAATAAGCTGCCCAACTTAACCGCAGACGAGtccaaaaacacaattttggaGTTTCTCAACCAATGCCCAACAGCACCTGCACCTGTTGACACCATTCATCTACCTC
Protein Sequence: MSTETMTYKLGDLVWAKMKGYSPWPGRVSNPIKDMKKPATTKKIPIYCIYFFGTNNYGWIDEANIKPYQEHKDQCKQMCKTANFKEACDTIENFISGGEETPPLDVATVSQALKDKNIQASDLKFGFLGLGIMGSGIVKNLLNSGHKVVIWNRSQEKCNDFVEAGAEKGLTPADVVAMSDITFSCVADPQAAKEMVFGNCGVLSEITADKGYVEMTSIDAETSADICEAIMAKGARYLEAQVQGSKPQAEEGNLVILGAGDRQLFDDCNSCFQAMGKNAIYLGEVGNASKMNLVLQTMTGICLVGLAESMALADRAGLQQKDVLEIMEMTSLASPLLTEKGKEPIHVTRNFKKDYLETYLSCKNSRLQGTSSSSRPRHMLRLLYGRSSESLSSSRSSCAHAASRQQLSSNVQWPTQRVKQKDKWVPRILVLATMCNYYRVECVSAGSTDKNFQILPFLQEFTRSKIDRQLSGAQSRECSKKGHMLDSSRKYPRLSCWRLSTFATTTTMCCCCSTITTSFIGQQQQHLPLRFARCTAYFFSLVLGLNPKPAGKIVPTGSHFLPYVFVERAAQRERERQARAAMSHQHIDHSRSRSANIHHSSPRNEEDCDNSLFGAPVRVNPEFQDRLTQQIQSKLGNHSLVKHLLTDSGKGLIGIDGGQANRGGLSKSSAVQPGGALNPNEFKKPGGPRPPSSSSGQAPPSSRSSSSSAHKSGYPPPSSRLGGNFPSQQQQQQQQQQQSSQKPTSHSSDHNKFAPSSRGSHAFNAPNYDNAQNSSSSSSSSNRMREVNPQKSSSKSYSDMSRYQMPVKQENPISHEQIKHEPNKLAALHVNKLPNLTADESKNTILEFLNQCPTAPAPVDTIHLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -