Basic Information

Insect: Trichogramma pretiosum
Gene Symbol: lilli_1
Assembly: GCA_000599845.3
Location: NW:931971-1004802[-]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 6.3e-09 7.8e-05 21.6 41.3 31 249 67 293 48 331 0.52

2 7 0.047 5.9e+02 -1.1 1.6 404 447 346 389 333 406 0.73

3 7 0.00072 8.9 4.9 49.9 376 491 417 532 405 547 0.83

4 7 0.37 4.6e+03 -4.1 17.1 101 221 597 702 549 730 0.42

5 7 1 1.2e+04 -11.6 40.4 100 266 741 898 706 918 0.53

6 7 0.22 2.7e+03 -3.3 11.5 401 491 1037 1124 987 1204 0.46

7 7 0.18 2.3e+03 -3.0 0.4 189 221 1310 1342 1282 1352 0.61

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	6.3e-09	7.8e-05	21.6	41.3	31	249	67	293	48	331	0.52
2	7	0.047	5.9e+02	-1.1	1.6	404	447	346	389	333	406	0.73
3	7	0.00072	8.9	4.9	49.9	376	491	417	532	405	547	0.83
4	7	0.37	4.6e+03	-4.1	17.1	101	221	597	702	549	730	0.42
5	7	1	1.2e+04	-11.6	40.4	100	266	741	898	706	918	0.53
6	7	0.22	2.7e+03	-3.3	11.5	401	491	1037	1124	987	1204	0.46
7	7	0.18	2.3e+03	-3.0	0.4	189	221	1310	1342	1282	1352	0.61

Sequence Information

Coding Sequence: ATGAAGTCTTCCAGCGGCTACTATGACGACCGGAATCATATTTACAAAGTCTCTAACAAGTCCACCGTTGAGAGAGCTGCCCAACGTGAACGCGAGAGGCAAGCACGTGCAGCTATGTCGCATCAACACATCGACCACTCACGTAGTCGCTCAGCCAATATCCATCACAGCTCGCCCAGGAATGAGGAGGACTGTGACAATTCCTTGTTCGGCGCCCCAGTTCGgGTCAATCCAGAATTTCAGGACCGCCTAACGCAACAGATACAATCCAAATTGGGTAATCATTCTCTAGTGAAGCACCTGCTTACCGATAGCGGCAAGGGCCTCATAGGAATAGACGGCGGGCAAGCGAATCGAGGCGGACTCACGAAGAGCAGCTCCGCCTCGGTGCAGCCTGGCGGCGCGTTGAATCCCAACGAGTTCAAAAAGCCGGGAGGTCCGCGGCcaccctcgtcgtcgtccagcCAAGCGCCACCATCGAGCAGGtcaggtagcagcagcagcagcagcagcagcagcgctcaCAAGTCCGGATACCCTCCTCCCTCGTCGAGGCAAGGAAGTTTTCactctcagcagcagcagcaacagcagcagcagcagcagcagcaacaacaacaacaacaacaacaacaacaacaatcgtCACAGAAACCCACGAGTCACAGTAGCGATCACAATAAATTTGCGACGAGCAGTAGGGGGAGTCACGCATTTAATGCTCCGAACTATGACAATGCCCAGAATTCGAGTTCGAGCTCAAGTTCGTCGAATCGTATGCGCGAAGTGAACCCACAGAAGTCGTCGTCGAAGAGCTACTCGGATATGTCCCGGTATCAAATGCCAGTGAAACAAGAAAATCCAATTAGCCACGAACAAATCAACCATgAACCAAATAAGTTGCCTGCTTTACACGTAAATAAGCTGCCCAACTTAAACGCAGACGAgtccaaaaacaaaattctgGAGTTTCTCAACCAATGCCCAACGTCACCTCAACCTGTTGACAACATTCATCTACCTCaGCCTTTACAAAAAAACCGGATGAGGCCGACTCATCACGACGATCTTGCACAGGATCTGAATCTTTCCGAGACCAGCGACGAGGAAGAGGATGACAGGAAGTCAAAACAATTTCCAGTGGACAGTCACATGAGTATGGAGAATAATGGTCCAAGTCAATGGTTGTTAGCCGAAGCTTTTGCGGGCTCGACAAAACCAATGCCGCCTAAACTTACCGCTCCCAAGTGTCTCTCAGGCATACCGCCACATCATTCGCAACAAATACAACAAATgcagcaacaacgacaacagcagcagcaacaacaacagcagcagcaacaacaacagcagcagcagcaacaacagcagcagcagcagcagcagcagcagcaacaacaacaacaacaacaacagagcGCACCAGCTCCCTCGCCGAACGAGGCGCCTGCCTCGAGCCAGGAGAGAACCGCGAGCCCGGCCAACGATTCCGGAGACTCGTCGGCGAGCTCGGGCAGCGCTTCCGAGAGCTCCGAGTCGTCCGAGtcgtgctcgtcgtcgtgctccGACAGCTCggacgacagcgacgacgacgacaacgacgggGCCTCGGCCTCCAAGCAGAagaactcgtcgtcgtcggtggccGACGCCGCGGCCGCCACGGTCAAGGCGTCGCCGGTCTCGTCGCCGCTGAATCCGATCTCGCCCAAGATCGAGGTGCCCGTCGTGCCCGAGGTCGAGGAGACCAAGCCCCGATGGAATCTCGGCTCGTTCTTCAAGGCCGGCCAGCCCGATTTCAAGCAGGAGGACACGACGACggcgcagacgacgacgacgtcgtcgtccgcgtcgtcgacgcagcagcagttgaaGCAGCCGAAGATCGAGCCATCGTCGGCTCAGTCGCAGATCGCCGACAGCGGCGGCAAGGCGCCCGCCGAGCGCAGATCGTCGAGGCAGACGCGCGACTGGGACAGCGTCGTCGACGCCAACAAGAGGAAGAACAACATGGACATCGCCCAGCAGCTGTCGCtcagcagctcgagcgaggACGAGGGTCCTCCCAGCAGCAACACCGCCAAAGCAGTCAAAGAATCACAAAAAATACagGTGCCTGAAAAACCCAAAGCTCCAGACGCTAAGAAGCGTGGACGGCCCCGCAAAGTTGACAAAGCACCACCAGCCCCGGCACCGGTGGAAGTTCCGAAGAGCCAAACAGTCAACAAGCGGCATCAGACCACGAGCAAGCGCGCCACCAAGAGGAGTCCGAGTCCCGCGAAAAAGACCAAGAAGCCGATCAAATCGGCTCCCACGTTGAGTGACACCAGTTCCAGTGGCGAAATGGACTCGAGCGAAAGCGAGTCCGAATCTTCCAAGAGCGTCAAGAGGCCGACTGTCAGCGCAGCCAAGGACAGCAAATCCAACAAGAGGAGCCACctgagcagcagcgacagcgagGACGAGAGAGACAGTTACGacaataaaaatcgaaacaaaAAGTCTGGATCGAAGCAAACGATACAGAGGGAAGCATCATCCAAGGTTGACAAATCGAGTGCAAAATCCAAAGGAAGAAAGCCACGAAAAATCACAAGCGCAGCTGAGTGTCCCACGGACACCGACAGCGATTCCGACCATCATCAGAGTCACCGAAAGGTCGCAAGAGTACAACCTCGGCCGCGAGTTCCCCCAATGCCAAGTTCCAATGAAGACTCGGACAGCGAAAACGATATGGGTAGACGTCCAGAAGAAAGCAGTGGAAATGGCAAAGGCAAAGGAAAGAGCGGTGGTCAGGacaataagaaaaatgctCTACTCAGATTATTCGGCGATCGAGGAAGCAAAGGTGGCAAAGGAGGCAAAGGAGGAAAAGGGGGCGGTAAATGCGGCATTTATGTCGAAGAATACAACACAGATGGATTATACAAGTCACAAATCGAACCGGTACCACAAATTTGTCCCGAAGAGGTCAAAAGTGATAAGCCATCAAATCCTCTTCCCCCGGCTAAAACATCATTCAAGTGCTCCATCAATCTTAAAAAGCTTGGGATGGACGCCCAAACCTTCTTGACGGAAGTGTGCAGAATGCAGAATCAAGGAAACGTACCCAATACCAAATCATACTCAAGGCCGCAGAGCATCGAAGACAGCCAGGCCACGACGAGTAAAGTTCAATctgacaaaaagaaaattaatcggAAACCCGACACGGTCTACAAACCATCGGTAGACAGCAAACCCGAATCTTTGCTTGGCGATGgtcaaaagaaaagaaagcgcAAAAGTAGTATTGGTGATTTAGTTGATTCCAAAAGTCGATCAGATCTGAAAAGCGAAAAGAGAAAACGGAAAAGTAAAGAGAGCGAAGAAAACTTATTGTTAGTTAACCATCAGAGTGAAGTTTTGCCTACCAATCACGAAAGGGACATAAAAGCTCACTATGCTCTTATGAATACACAACCCAAAACTAGttatagaaatttttacaGTGAACATATAGAAGATATGGAGAGcttGAGGACAAACTACAATTGTCAAGAACACTACCTAACAGAAGCAAAACGTTTAAAGCATCTGGCTGATGCAGAGCCAGATCATACTACTCAGTCTTTACTTTATTTGGAATGTGGCATGTACTTCGTATTGACGGGTTACATTATGGAGCCGGGTATGGATCGTGCTGCATTCAGAATGTACACAGATACTTTGGTGATCATCAAgTTTATGGCCACAAAGTTAAGTGAAAAGGTCGAAAAAGCAGAAGATTCGATAGGGAAATTAACTAATATCAAAATACTAATTTTGAGCTTATGGGTCCAATCAATTTTATGTCAGAAATTATACAACATGTCGTTCAATGAGTTGAAGGAAACGCACAACGTCATAAGTGAATACTGCCAAAAATGTTTGCCTTCTGCTATTCAACAAGAAGGTCAAGCAGCCACGCCATGTCTGTCTCCTACACCTTCTCCTGCAGGTTCAGTCAATTCCGTGAACAGCCAAAGCAGTGGCTACAGCAGCGCAGAATTTGCAAATCGAGTATCCGTGCCGACATTATTAACGATGCCCGTTAATGTTCAATCAGCACTTTACAAATACCAAAAAGATATGGGCTTTCTGATGGGAGCTCACGAAAAATGGGACAAAGGATGTGCACTTGTGAAAGACCTCAATTGCGgttttttcaaagaattggATAGAAGTTATGGACCACTTTCGCTTCAAAGTTCGCCTGCCGATTTGGCTCGTTACGTGCAAGCAGGGATCAAGAAAATACGAGAGCTCTGA
Protein Sequence: MKSSSGYYDDRNHIYKVSNKSTVERAAQRERERQARAAMSHQHIDHSRSRSANIHHSSPRNEEDCDNSLFGAPVRVNPEFQDRLTQQIQSKLGNHSLVKHLLTDSGKGLIGIDGGQANRGGLTKSSSASVQPGGALNPNEFKKPGGPRPPSSSSSQAPPSSRSGSSSSSSSSSAHKSGYPPPSSRQGSFHSQQQQQQQQQQQQQQQQQQQQQQQSSQKPTSHSSDHNKFATSSRGSHAFNAPNYDNAQNSSSSSSSSNRMREVNPQKSSSKSYSDMSRYQMPVKQENPISHEQINHEPNKLPALHVNKLPNLNADESKNKILEFLNQCPTSPQPVDNIHLPQPLQKNRMRPTHHDDLAQDLNLSETSDEEEDDRKSKQFPVDSHMSMENNGPSQWLLAEAFAGSTKPMPPKLTAPKCLSGIPPHHSQQIQQMQQQRQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQSAPAPSPNEAPASSQERTASPANDSGDSSASSGSASESSESSESCSSSCSDSSDDSDDDDNDGASASKQKNSSSSVADAAAATVKASPVSSPLNPISPKIEVPVVPEVEETKPRWNLGSFFKAGQPDFKQEDTTTAQTTTTSSSASSTQQQLKQPKIEPSSAQSQIADSGGKAPAERRSSRQTRDWDSVVDANKRKNNMDIAQQLSLSSSSEDEGPPSSNTAKAVKESQKIQVPEKPKAPDAKKRGRPRKVDKAPPAPAPVEVPKSQTVNKRHQTTSKRATKRSPSPAKKTKKPIKSAPTLSDTSSSGEMDSSESESESSKSVKRPTVSAAKDSKSNKRSHLSSSDSEDERDSYDNKNRNKKSGSKQTIQREASSKVDKSSAKSKGRKPRKITSAAECPTDTDSDSDHHQSHRKVARVQPRPRVPPMPSSNEDSDSENDMGRRPEESSGNGKGKGKSGGQDNKKNALLRLFGDRGSKGGKGGKGGKGGGKCGIYVEEYNTDGLYKSQIEPVPQICPEEVKSDKPSNPLPPAKTSFKCSINLKKLGMDAQTFLTEVCRMQNQGNVPNTKSYSRPQSIEDSQATTSKVQSDKKKINRKPDTVYKPSVDSKPESLLGDGQKKRKRKSSIGDLVDSKSRSDLKSEKRKRKSKESEENLLLVNHQSEVLPTNHERDIKAHYALMNTQPKTSYRNFYSEHIEDMESLRTNYNCQEHYLTEAKRLKHLADAEPDHTTQSLLYLECGMYFVLTGYIMEPGMDRAAFRMYTDTLVIIKFMATKLSEKVEKAEDSIGKLTNIKILILSLWVQSILCQKLYNMSFNELKETHNVISEYCQKCLPSAIQQEGQAATPCLSPTPSPAGSVNSVNSQSSGYSSAEFANRVSVPTLLTMPVNVQSALYKYQKDMGFLMGAHEKWDKGCALVKDLNCGFFKELDRSYGPLSLQSSPADLARYVQAGIKKIREL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -