Basic Information

Insect: Glaucopsyche alexis
Gene Symbol: STAT5B_1
Assembly: GCA_905404095.1
Location: FR990061.1:2023256-2052570[+]

Transcription Factor Domain

TF Family: STAT
Domain: STAT_bind domain
PFAM: PF02864
TF Group: Beta-Scaffold Factors
Description: STAT proteins (Signal Transducers and Activators of Transcription) are a family of transcription factors that are specifically activated to regulate gene transcription when cells encounter cytokines and growth factors. This family represents the DNA binding domain of STAT, which has an ig-like fold. STAT proteins also include an SH2 domain Pfam:PF00017.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.24 4.9e+03 -0.9 0.1 56 95 207 251 185 293 0.70

2 2 4.4e-47 8.8e-43 147.2 0.2 1 133 403 541 403 541 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.24	4.9e+03	-0.9	0.1	56	95	207	251	185	293	0.70
2	2	4.4e-47	8.8e-43	147.2	0.2	1	133	403	541	403	541	0.94

Sequence Information

Coding Sequence: atggcATCTTTTAGCAACGAAGAGTATGCTGACATACTGTACTGCTACGGTTTTTGTGATGGCAACGCAGCCGCTGCACGGGAAGAGTACCGGCGTCGTTTTCCTCGTCGAAATAATGTACCAAGTGCTGGAGTTTTTTCCGCGGCGTACCAACGCGTGCGGGAAAGTGGCTCTGTTCATCAAAGGCGACGTGATGCAGGAAGATCTCCTCGCTATGTTGTAGAAGACGAAGAGAGAATATTGGAACGTTTTGCAAGAGATCCGACCACCTCTACAAGAATTGTAGCGAAGCAACTGGGTTTAACGCAGTGGAAAGTGTGGTTCACCGTACATAGCGCTCGCACGCCGGAGCCGGAGGAGCAGCAGCGCTACTTCGTGGAGGAGCTGGTGGGCGAGATCCACGCGCACAGCGAGCTGCTGCTGTCTCCGGACATGTTCGTCACCAAGATGAAGCTCATCGAGGCGGCCAAAACCTTCCGGATCAAGTATAGTCACGCACCACACGAGCTGTACGCGTACATGCGGCACTGCCTGGGCCTGGAGATGGAGGTGATCCAGGCCGCCATGGGCCCGCAGTACCTGGCCCAGCCGCACACCGAGCGCAAGTACAGCGAGCTGATCACGGGCCTGCAGACGGTCCGACAGAAGGTGAACCTGGCGGCGGAGGAGATCCGCACGCTGCAGGCGAACATCGAGTCCCTGTCGCTGCAGTACCACGAGTGCCTCAAGAACAAGGGCCACATCAACTACCTCCAGCAGTCCGGCCCCATCACCACGGAGCGCCGCGAGCTGGAGGCCTGCCTGCGCCTGCAGATCGAGGAGATGGAGAGGAAGCTCAACGCGCTGGTGGCCCAGATCAACCAGTCCCAGATCGAGCTGGTGGACCGGCTGAAGGACAACATCAGCACGCTGCGGCAGCTGCAGTCCCAGGTCCTGGACGAGGAACTCATCAAGTGGAAGCGCGAGCAGCAGCTGAGCGGGAACGGCGTGCCGATGTCCGCCAACCTCAACACCATACAGGAGTGGTGCGAGCTGCTGGCGGACCTCATATGGAGCACGCGCCAGCAGGTCAAGAACGTGGCGCTAGTCACCAGCAAGACCATTAGCGAGCTGCGCCAGCCGCACCTGGCCGACATGCTCGACGACATGAGCAAGCAGATCACGAGCCTGCTGTCCACGTTGGTGACGTCGACGTTCGTCATCGAGAAGCAGCCGCCGCAGGTCATGAAGACCAACACCAGATTCACGGCGACAGTTCGGCTGCTGGTCGGCGGGCAGCTCAACGTGCACATGACTCCACCCCGAGTGACGGTGGTGATAATCTCGGAGCAGCAGGCCCAGCTGCTGCTGAAGTCGGAGACGGGGGGCGGGCGCGGCAAGCAGCCGGTGGAGTGCGGCGACATCCTCAACAACAGCGGCTGCATGGAGTACCAGCCCACCAGCCGCCAGCTCAGCGTCAGCTTCCGGAACATGCAACTGAGGAAGATCAAGCGCGCTGAGAAGAAGGGCACCGAGAGCGTGATGGACGAGAAGCTCACGCTGCTGTTCCAGTCCGAGTTCAACGTGGGCGGCGGCGAGCTCGTGTTCCAGGTGTGGACACTGTCGCTGCCTGTGGTGGTGATCGTGCACGGCAACCAGGAGCCGCACGGGTGGGCGACGGTGACGTGGGACAACGCCTTCAGCCCGCCCGGCCGCGTGCCCTTCGCAGTGCCGGACAAGGTGACCTGGGGCCAGCTGGCGGAGACGCTGCGCATCAAGTTCTGCTCGGCGACCGGTGGCGACCTCTCCGAGGACAACCTGCGCTTCCTCGCCGAGAAGATATTCAGGACCAACCTGCCACTGAACAGCCTGGAGCTGAACGGCATGAGCGTCAGCTGGACGCAGTTCTGCAAGGACGCGCTGCCCGAGCGCAACTTCACCTTCTGGGAGTGGTTCTACATGGTGGTGAAAGTCACCCGCGACTATCTACGCACACTGTGGTGCGACCGGCTGATAATGGGCTTTATCCAGAAGAAGCAAGCGGAGGAGATGTTGGCCAAATGCCCTCCGGGAACCTTCTTGCTGCGCTTCTCCGACTCCGAGCTGGGTGGCATCACCATCGCCTGGACCGGAGAGGGCAACGAAGTGTTCAGCCTGCAGCCGTTCACATCGCGCGACCTGATGCTGCGCTCGCTGGCAGACCGCATCCTTGACCTCGCCCAGCTGCAGTTCCTGTACCCGAATGTGGCGAAAGATGACGTTTTCTCCAAGTACTACACAAAACCGGAGAACGAGATGCTGAAGAACGGCTACGTGAAGCCGGTGCTGGTGACGACGCTGCCGCCCTACATGTCGCCCTCGCCCGCCTACGCGCACTCCCCCGACTCGCACCGCAACACGCCCAGTGTGCATAGCAGCTACTTCAGCGCGGCCACGCCGGCGCAGACGGAAGCGAGCTTCATGGACAGCGACCTGTTCGAGCAGATCCGCGCCTTCGAGCCCGAGGGCCTCGACGACTTCGACTTCTACAACGCCTCCAACGCCAGTATGAAGTGA
Protein Sequence: MASFSNEEYADILYCYGFCDGNAAAAREEYRRRFPRRNNVPSAGVFSAAYQRVRESGSVHQRRRDAGRSPRYVVEDEERILERFARDPTTSTRIVAKQLGLTQWKVWFTVHSARTPEPEEQQRYFVEELVGEIHAHSELLLSPDMFVTKMKLIEAAKTFRIKYSHAPHELYAYMRHCLGLEMEVIQAAMGPQYLAQPHTERKYSELITGLQTVRQKVNLAAEEIRTLQANIESLSLQYHECLKNKGHINYLQQSGPITTERRELEACLRLQIEEMERKLNALVAQINQSQIELVDRLKDNISTLRQLQSQVLDEELIKWKREQQLSGNGVPMSANLNTIQEWCELLADLIWSTRQQVKNVALVTSKTISELRQPHLADMLDDMSKQITSLLSTLVTSTFVIEKQPPQVMKTNTRFTATVRLLVGGQLNVHMTPPRVTVVIISEQQAQLLLKSETGGGRGKQPVECGDILNNSGCMEYQPTSRQLSVSFRNMQLRKIKRAEKKGTESVMDEKLTLLFQSEFNVGGGELVFQVWTLSLPVVVIVHGNQEPHGWATVTWDNAFSPPGRVPFAVPDKVTWGQLAETLRIKFCSATGGDLSEDNLRFLAEKIFRTNLPLNSLELNGMSVSWTQFCKDALPERNFTFWEWFYMVVKVTRDYLRTLWCDRLIMGFIQKKQAEEMLAKCPPGTFLLRFSDSELGGITIAWTGEGNEVFSLQPFTSRDLMLRSLADRILDLAQLQFLYPNVAKDDVFSKYYTKPENEMLKNGYVKPVLVTTLPPYMSPSPAYAHSPDSHRNTPSVHSSYFSAATPAQTEASFMDSDLFEQIRAFEPEGLDDFDFYNASNASMK*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01018355;
90% Identity: iTF_00786545;
80% Identity: -