Basic Information

Insect: Ferrisia virgata
Gene Symbol: -
Assembly: GCA_900060175.1
Location: FIZR01016652.1:12871-20661[+]

Transcription Factor Domain

TF Family: AF-4
Domain: AF-4 domain
PFAM: PF05110
TF Group: Unclassified Structure
Description: This family consists of AF4 (Proto-oncogene AF4) and FMR2 (Fragile X syndrome) nuclear proteins. These proteins have been linked to human diseases such as acute lymphoblastic leukaemia and mental disabilities [1]. The family also contains a Drosophila AF4 protein homologue Lilliputian which contains an AT-hook domain. Lilliputian represents a novel pair-rule gene that acts in cytoskeleton regulation, segmentation and morphogenesis in Drosophila [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 4.4e-10 8.7e-06 25.4 10.4 4 219 19 243 16 257 0.43

2 7 1.8e-09 3.6e-05 23.4 19.9 339 513 266 473 253 474 0.70

3 7 1 2e+04 -7.8 14.0 127 221 487 578 473 624 0.34

4 7 1 2e+04 -8.4 21.8 109 243 707 835 657 872 0.35

5 7 0.62 1.2e+04 -4.8 11.1 116 234 1064 1181 1045 1213 0.45

6 7 1 2e+04 -5.9 22.0 110 235 1313 1440 1265 1479 0.46

7 7 0.84 1.7e+04 -5.2 7.1 447 482 1479 1515 1462 1522 0.67

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	4.4e-10	8.7e-06	25.4	10.4	4	219	19	243	16	257	0.43
2	7	1.8e-09	3.6e-05	23.4	19.9	339	513	266	473	253	474	0.70
3	7	1	2e+04	-7.8	14.0	127	221	487	578	473	624	0.34
4	7	1	2e+04	-8.4	21.8	109	243	707	835	657	872	0.35
5	7	0.62	1.2e+04	-4.8	11.1	116	234	1064	1181	1045	1213	0.45
6	7	1	2e+04	-5.9	22.0	110	235	1313	1440	1265	1479	0.46
7	7	0.84	1.7e+04	-5.2	7.1	447	482	1479	1515	1462	1522	0.67

Sequence Information

Coding Sequence: ATGGATAGTGTTTCAACTATGGCACACTTCGGGTTTCTGCTTTTCAACAGTGTCGAACGAGAACGTTTGAGAGAACGTGAAAGAGAAGCTCGCGCTCAGATGACTTTCGAAGCAGATCAACGAGTATCTCAAGATGTAACGAATTCAGCTCCGTTGTTTGGCGAAATAGTTCGTGTGAATCCAAAATCCAACGATCGTGAACGGCAACAAATTGAACGTAAATTAGGTCGCTTCGAGGACGTCAAACACCTATTAGCTGATCAAGATGTTACCAATCTGTTCGGCGTTGATGGTCAACCGCCGCCCAGCCCCGCACCCAATAATTCATCTGGTTCGTCGTCTTCGATGGTTGGACACGAATTCAAAAAGCCGAACGCATGTCCTCAATCTCATCAAACGAAATCTTCGCATCatcaccaccatcatcatcatcattctaGAGGCGGTCAAAGAAACGCCTTCGTCAAGCCTAACGATGGAAAGTTAACATACACGAATCGCGGTGGTTTCTATACACCCGCATCGGGTAAACATAGTACCAACATATCTTCAACGTTATTGGCTAAAACTGGAGGGAACTCGACGTCAAATTTATCCTTCAGCGGCGGAAACTACAACAGTACCTCAACCGGCAACAATTCGACGATTTCAGCGACTCATAATTGTACGTCAACGTCTAACAAAGCCTCGCCTTTGATTCAAGATTACGCTGCTAGAATTCAACAGTCGGCAGccaaaaatttaccgaaattaAATTGCGAGCTGAGAGATCCATTACGCGGATTGGATTGTAACGATGATAGCGCCTCCGTTTCTCAAAccaatgtagaaaatattttggatGAAATGACGTCGGGTTTTAGAACCCCGTTGACCGCCATAGCGGCTACACCGCGTAAGGAAGTTGAATCCAAATTTACGTTCAATCCCATCTCTGGAAAGGTAGAATCGTTAACACCGTTGTCTAGACCGCCTGTAGATAAAAGTACCAGATTGAATTCAACGAGTAATGTTTCGGGACCGAGTGGCAGCCGCGGTCCTTTCGTTTCGTCTGCGTTTCGAAACGACGAATTGACGAATGCGTTTCCGCGGTATTCTTCTACCCCGGTATCCGGTGCTGGAAGTACTGGTTTGTCGAGGGGCAGCGGCAGTTACGTATACTCGGCATCAGTCGTCGAAAACATATCGTCTTCTGCCGGTAAAGAGAGAAGCGATTCGGTCACATTGCCGTTACGGAAATGCGATGTAGTCGCTTCGAGTGATGTCAGAAATACGTCGTCGAGCGATGATAGTGACTCCGATTCGGGTTCAGAGAGCGAAGATTCTAGCAGCGATTCACCTTCACCGCCGTCGTTACCTTTGCCAGTGGTAACTGAACAAGAAGAGAGCAAGCATCgctggaatttgaaaaacttcttACCCCCGTCTGCGCATGGAAATACCACTCCAAATACGGCCCATAATTCGCAGTCGTATCGCCGCCAGAATtgcgaaaaactgaaaaacgaCGATTCAGATAGTTCGGCAGGTAGCGCGAGAAGAAAATCTCGACTGACTTCCTGTAGTACGTCGGATTCGGATAACGATAGCGCCAGATCACGTACCTCTTCGCGCAAACGTGCCGTAGATAACACCAAGGGTAATCTGAATGTCGGAGGCGTTGGTAATATTAGCTCAACGCCAGTTGAAGTCGCAATAAGCGGCCATAGTGCTGATTTAGCTGGTTCCAACGAGGGTGGCAATGCTGCCGGCGTTAATGGTGATAGCGTTAGCGCTACCGGAACAAGTACCAGCAGTAATTGCCTAAGCAGCGCCAACATGGCGGTCGCTTCATCTGCTACCAACACCATGAGCTTTGCGAATAATTCGTGTGGTGGCAGCGTCGGAAATAACAGTTGTGGCAGCAGCGGAGGAAATGGAAATATGACTGTGGTGGGCGTCGTCAGGCCTCATCAACGAAAACCTCCATCGCCGCAGATATTCCATCACATTGGTAGGAGTCGTAATTCAACCGGTCTACGTGATTTGTCTCCGGCGACGAACGACGAACGGTATACCGCGTTCGTGCAGCAACGTACCGTGAATTTGGGAAGTAGTTCAGGTGCCAGCGCTGCTGAGCCGCAGCGTGAAATATCCACTGGCATGAGCCGATCACTTATCAACGATCACTACCAACCACCTCGCAACAGCAGTAATAgcaataatagtaataatcaaaatagtaataataataataatagtaacactaacaacaataacaacaacaatatcAACTGTGGCGGTGGTAATAAAAGTAACAACAGCAATAGTGGCAGTAATATTGCTCCCACAGTTTCGGCCAACGCGAATGGTACCGTCGTGGCTAGTAATGATGATGAAGGAAGCAACGACAACCTTAAAATGAGCGTGCTGGAGTCAAATAGCAAATCGATCTATTCGACGAATAAAACGAATATCGCTGCTAAAGTGCGTCGTAAATCTAAATCGCCTGCGTCGGCATCAGCCAGCGAATCTCCAGTCAAGAAAAAAAGAGGTCGCAAACGCACGATTAAAGTACCAGAATTGTCGGACAGCGACGATGACATGCGTAGTAAGACGAGATCGGCTCCAGAAAAGAAAAGACCCGGTCGACCGCCTTTGAAGCGTAACGATGACGAAGATATGGACTGGAATTCGAGCTCTAGGCGTAAAATGCCCGATAAATTTCCGAATTCCGCGACCGTTTGGTGCGATCGCGAACGTCGTAGGAGTAGCTTACGAATGAGTAGTTTCACTACTGTTGATTCGGACAGCGAAATCGAAATACAAACAGCGACGGTGAAGCCGACGGCTCGCGTCATTCCGGCTGTGAAGAGAAAAGATGGCGGAAGCGGAAGCGTACGAGTTGATCGTGATTCTAGTTGTGAGTCAATGAGAAATGACAATGAATTTCACACCGTATCCAATGGAATTAAAAGTAACGGCAGTATCGCGAAAGCGCAAGAGAGTCCGCCTAAATTGGACGTTGAGTGTATAACCGTTCAAGATAAGAAGAAGAGTGACACATTGCGAAAGTTGTTTTCGCGACGAGAAGAAGGTGGCGGTAAAACTGGCGGCAAAGGTAAAGGCGGTAAAGGTAAGTGTGGCGTCATCGTGATGGAATCCGAAGTTGAACGCAAATTGTTGCGGCGTTCTTCTGTCGGCGGCAGTCCAACCTCAatgtcgtcttcgtcgtcaaCGGCCAACTTATCTAAAATGCAAGATCGCGTTCCGGACATGGCACACGTTGCCATATCTTCGCCGAATTTACGATCCAACGAAGTACAAGACAACAGATATTCGGAATTGTCGTGTGTGCCGTCTGTCATGAGTAGTGGCGGCTGCGTTCCCATCAAGACGATTACTAGCAACAGCAGCAGCAGTAGCTGTAACAACACCACCGTCACCACCAGCTCCACATCCACCACCACCAGCACCATCAGCatcaataacaacaacaacaacaacaacaacaatagtATCTGTACCAACAACGGTGAAAACCACCTGCAACTTCACCATCACCACCATCATTCCAACAACAGTGGTATTGAAACCGTTAAAGGTTCAGTCGAATTGACGATTCCTAAATTAACGTACAACGAAGGCGGTAAACCGTCGTTAATGTGTAAAATTGACCTGTCCAAGATACCATATATATTGGCAAAAAAACGTTCGGAGGAGATTCGAATCAAAACCGAACTGTCTGATACAAGGCAATCGGGATTAGTTGCATCGTTAGATGACGTAAGCGTTGGCGGCGGAGTCGAGAACGTTGCCACTTCGGCTTCTTCCATAGCTGGCATTGCTAGCCTGTCTCTAATCGAACCACTATCGGATCGCCGTCGTCACAAGGATAATTCCGCCTCGTTGAGTACGGTAACGTCGGTGTCGACTGCAAGCGGCGTCGTTACTGTAAATACCGATCAAGTTCCGATGGCTGTGGTCGATCATAGCAGCAATCTGTATCATCTCAAACGTGTTAAACAGCATCAAAACCAAGCCGCGGCCGCGCTTCCGCAGTCTCCGTTGTCATTATCTTCGTCGTCACCGTCGACGCGTAACCGTAAGAAACATtcgaagaaaacgaaaaatagtAAACGTAAACACCACGCAAACGAATCGCATGCTCCAACCGCAATATCACCTACATCGCGAACAGCTGTGGAAAACGACAACGGTTCCATTTTCGCAGCCGCATCCGCCGCTCACACTCCGTCTGTATATGCGACGGACATGGATTCCTCGCTGTCGAGTGATTCGGAGTCGAAGAAGTTATCCACCGTTGCCCATAACCACGCTCGTTTCAGtaatgaaaacagaaaaagatCTATGTTACGCGGTGGTACCTCTCTAGTCGTACCCGATTCAGTGCCTAGCAATTTAATGACGACGTGTTATCCGGTTGAAATTACCGATGTTCAACATCAAAGCGTGAACACAGTTATCGATCGTAGTAGCGCCGAAGACGAATCGTGGAATGGTTCAGACAGTAGCTGCAGTGACTGTTCGGCATCGGTATCGTCTACTCCTTGTCACGGTAACGGCACTGGCTCCGGTACCGGCGAGAAATGCACCAAGGTCGGCAAACGTTCTTCGCAGTATCGCGGTTGCGGAGGCGTCGGCGGCGGTaagaaaaggaagaaaaaattgagaaatgaaCAATCTCAACGTCATTCGTCATTGGGCGATTGTGAAGACGGCGACGGCGGGAACGCAGCGACGAGTTTGATACATTTGCAGAATGACAGAAATGGCGCTGTGGAGCCGGCAACAACGTTTAACGGCTATCACCAAGTACCTATTAGTGATCTGGTGCGACCTCCGGTGCCTACGCATCACGGTATTTACTATTCTTACTTGGAACATAAGGCCTCCGAAGAAATAAACTCCGAATCAGACAAGTATGTACTTAGATAA
Protein Sequence: MDSVSTMAHFGFLLFNSVERERLREREREARAQMTFEADQRVSQDVTNSAPLFGEIVRVNPKSNDRERQQIERKLGRFEDVKHLLADQDVTNLFGVDGQPPPSPAPNNSSGSSSSMVGHEFKKPNACPQSHQTKSSHHHHHHHHHSRGGQRNAFVKPNDGKLTYTNRGGFYTPASGKHSTNISSTLLAKTGGNSTSNLSFSGGNYNSTSTGNNSTISATHNCTSTSNKASPLIQDYAARIQQSAAKNLPKLNCELRDPLRGLDCNDDSASVSQTNVENILDEMTSGFRTPLTAIAATPRKEVESKFTFNPISGKVESLTPLSRPPVDKSTRLNSTSNVSGPSGSRGPFVSSAFRNDELTNAFPRYSSTPVSGAGSTGLSRGSGSYVYSASVVENISSSAGKERSDSVTLPLRKCDVVASSDVRNTSSSDDSDSDSGSESEDSSSDSPSPPSLPLPVVTEQEESKHRWNLKNFLPPSAHGNTTPNTAHNSQSYRRQNCEKLKNDDSDSSAGSARRKSRLTSCSTSDSDNDSARSRTSSRKRAVDNTKGNLNVGGVGNISSTPVEVAISGHSADLAGSNEGGNAAGVNGDSVSATGTSTSSNCLSSANMAVASSATNTMSFANNSCGGSVGNNSCGSSGGNGNMTVVGVVRPHQRKPPSPQIFHHIGRSRNSTGLRDLSPATNDERYTAFVQQRTVNLGSSSGASAAEPQREISTGMSRSLINDHYQPPRNSSNSNNSNNQNSNNNNNSNTNNNNNNNINCGGGNKSNNSNSGSNIAPTVSANANGTVVASNDDEGSNDNLKMSVLESNSKSIYSTNKTNIAAKVRRKSKSPASASASESPVKKKRGRKRTIKVPELSDSDDDMRSKTRSAPEKKRPGRPPLKRNDDEDMDWNSSSRRKMPDKFPNSATVWCDRERRRSSLRMSSFTTVDSDSEIEIQTATVKPTARVIPAVKRKDGGSGSVRVDRDSSCESMRNDNEFHTVSNGIKSNGSIAKAQESPPKLDVECITVQDKKKSDTLRKLFSRREEGGGKTGGKGKGGKGKCGVIVMESEVERKLLRRSSVGGSPTSMSSSSSTANLSKMQDRVPDMAHVAISSPNLRSNEVQDNRYSELSCVPSVMSSGGCVPIKTITSNSSSSSCNNTTVTTSSTSTTTSTISINNNNNNNNNNSICTNNGENHLQLHHHHHHSNNSGIETVKGSVELTIPKLTYNEGGKPSLMCKIDLSKIPYILAKKRSEEIRIKTELSDTRQSGLVASLDDVSVGGGVENVATSASSIAGIASLSLIEPLSDRRRHKDNSASLSTVTSVSTASGVVTVNTDQVPMAVVDHSSNLYHLKRVKQHQNQAAAALPQSPLSLSSSSPSTRNRKKHSKKTKNSKRKHHANESHAPTAISPTSRTAVENDNGSIFAAASAAHTPSVYATDMDSSLSSDSESKKLSTVAHNHARFSNENRKRSMLRGGTSLVVPDSVPSNLMTTCYPVEITDVQHQSVNTVIDRSSAEDESWNGSDSSCSDCSASVSSTPCHGNGTGSGTGEKCTKVGKRSSQYRGCGGVGGGKKRKKKLRNEQSQRHSSLGDCEDGDGGNAATSLIHLQNDRNGAVEPATTFNGYHQVPISDLVRPPVPTHHGIYYSYLEHKASEEINSESDKYVLR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -