Basic Information

Insect: Horisme vitalbata
Gene Symbol: NFIA_1
Assembly: GCA_951804965.1
Location: OX638095.1:25542463-25565859[-]

Transcription Factor Domain

TF Family: CTF_NFI
Domain: CTF/NFI and MH1 domain
PFAM: PF00859
TF Group: Unclassified Structure
Description: Nuclear factor I (NF-I) or CCAAT box-binding transcription factor (CTF) [2, 1, 5] (also known as TGGCA-binding proteins) are a family of vertebrate nuclear proteins which recognise and bind, as dimers, the palindromic DNA sequence 5'-TGGCANNNTGCCA-3'. This family was first described for its role in stimulating the initiation of adenovirus DNA replication [6]. In vertebrates there are four members NFIA, NFIB, NFIC, and NFIX and an orthologue from Caenorhabditis elegans has been described, called Nuclear factor I family protein (NFI-I) [4]. The CTF/NF-I proteins are individually capable of activating transcription and DNA replication, thus they function by regulating cell proliferation and differentiation. They are involved in normal development and have been associated with developmental abnormalities and cancer in humans [5]. In a given species, there are a large number of different CTF/NF-I proteins, generated both by alternative splicing and by the occurrence of four different genes. CTF/NF-1 proteins contain 400 to 600 amino acids. The N-terminal 200 amino-acid sequence, almost perfectly conserved in all species and genes sequenced, mediates site-specific DNA recognition, protein dimerisation and Adenovirus DNA replication. The C-terminal 100 amino acids contain the transcriptional activation domain. This activation domain is the target of gene expression regulatory pathways elicited by growth factors and it interacts with basal transcription factors and with histone H3 [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.01 1.7e+02 2.7 0.0 4 30 254 280 251 302 0.81

2 7 0.00094 16 6.1 2.3 146 204 330 394 299 400 0.66

3 7 0.0012 21 5.7 0.1 179 204 401 425 393 432 0.80

4 7 0.00018 3 8.5 0.1 179 206 432 458 427 470 0.81

5 7 0.0013 21 5.7 0.0 183 204 495 516 487 525 0.80

6 7 0.00088 15 6.2 0.1 182 204 525 547 517 557 0.80

7 7 5.6e-12 9.2e-08 33.1 5.0 179 272 554 641 547 645 0.81

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.01	1.7e+02	2.7	0.0	4	30	254	280	251	302	0.81
2	7	0.00094	16	6.1	2.3	146	204	330	394	299	400	0.66
3	7	0.0012	21	5.7	0.1	179	204	401	425	393	432	0.80
4	7	0.00018	3	8.5	0.1	179	206	432	458	427	470	0.81
5	7	0.0013	21	5.7	0.0	183	204	495	516	487	525	0.80
6	7	0.00088	15	6.2	0.1	182	204	525	547	517	557	0.80
7	7	5.6e-12	9.2e-08	33.1	5.0	179	272	554	641	547	645	0.81

Sequence Information

Coding Sequence: ATGTTCCAAGGAATCCACGTGGTCAGAGGTCCTGCCAAGTGGAGCCCGTGGCAACTGGCAGCGGTGGTCGCTTCGGCCGCCAACTCAGACGAGTTCCATCCGTTCATAGAGGCGCTGATGCCTTTTGTAAAGTCCTTTTCGTATACTTGGTTCAATTTACAAGCGGCCAAACGAAAATATTATAAGAAACATGAAAAACGGATGAGTCTTGAGGAGGAGCGGCATACTAAATATGAATTACAGAACGAGAAAGCAGAAGTGAAGCAGAAATGGGCATCGCGGCTACTCGGCAAACTGCGGAAGGACATCACGCAGGACTGCAGGGAAGACTTCGTGCTCAGCATCACAGGGAAGCGGCCGGCGGTCTGCGTTCTGAGCAACCCCGACCAGAAGGGCAAGATGCGACGGATAGACTGCCTCCGCCAGGCTGACAAAGTTTGGCGGCTTGACCTTGTAATGGTGATCCTTTTCAAGGCCATTCCTTTGGAAAGTACGGACGGTGAGCGGCTCGAGAAGCACCCTGAATGCACGCAGCCGGGTCTGTGCGTAAACCCTTACCACATCAACGTGTCTGTTAGGGAGCTGGACCTGTATTTAGCCAATTTCATCAACAGCTACGGTAATGGGAGCGACGGTCTGCCAGATATCCTAAGCGGTTCTCTCTCGCCCCACCCGCCTAGGGATAAAGAGAACGAACACGATGCTAAGACGAAAGGCTATAGCCACAATCCATACAACGGGGTAATTTGCAACGATATTATTCTAGCGACCGGAGTCTTCTCGTCGAAGGAACTATGGAAGTTGTCAAAAGCATCAATCCTCCAGGAGTCAGGCTCGGAGTCTCCTGGCGAGGGTGGCATCAAGCTGGAGTCTTCCTACTACTGCGGATACAACTCCCCAGCACCCCCTGCCTTCGAGCCACCACCTGAACGTGCACCCAGCACCATGCTAGTACCGCAGTGCTTTAGCATCCCCCACAGCTCGGCTGGGCTGAGTGCTGCACAGTCCCCCCTGGTGCCCTCAAATACCATCTTCTATCAGCACGCGCCAACCACCGACACGCACTCAACAGCGTCAGACGCTCTGTCTGGTCAGCACTCCACCAAGTATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAGCCAGGTGATGTCCAGCAACTGCAGCACTCCACCAAGTATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAGCCAAGAGATGTCCAGCAACTGCAGCACTCCACCAAGTATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAGCCAAGTGATGTCCAGCAACtgcagCACTCCACCAAGTATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTGGGAGATGGGGAACTAAGTGGTTATTCTCTGTCTGGTCAGCACTTCACTATGTATGACGACGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAACCAGGTGAGGTCCAGCAACTGCAGCACTCCACCAAGCATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAGCCAGGTGATGTCCAGCAACTGCAGCACTCCACCAAGTATGACGGCGCGCCGCAAGACTCCCTGGGAGACTTTGTGACGTTCGTGTGTCAGGAGCCAGGTGATGTCCAGCAACTGCAGttGTCACGAAGTCCAAAGCCAGCGTACTTCAGCAGCTCAATGCTACCGCCACCGCCACTCCCGCCCATGGCTCGACCTGTCGCCATCATCAGATCCACTGCAAGTGAACTGGTGGGCAACAGTGCAGGCGGGTCCCCTGCGTCTCCCGAGGTGCGATCTCCCCCCACCTCCCCCCGGAGACGCTCCCCCCACCCGTACAGAACAGAACACCCACCGATATCGCACTTCAATCACTTCCATCCACAGTCGCAACAAATGTTTACGTACGGTTCACTGGGCGGACTGGGCAGCGGGGCGAGCGGGGGAGGGGCGGTGCTGTCGGGGAGCGGGGGGGTGTCGCCGCCGGGAGGACTGGGCCTGTACGCGCCCAGAGCTTCCACTAGAGCTCCACCTCGGTGGAACGCACCATTCCCCACCCTGGAGGAAGAGTTTAATATGATGGCGGCGCCGGCCGGGCCGGAGCACGTCGTGCTGTTGGATGATGAGCGCTTCTTTCAATCCAGCGTGATAACCTCCGAGGCTACGGCCATGGACACGACCTCTGTCGGCCAGCCCGTCGACACCGACGACATCGCTCCCGACAAGGCGCCTGATCTCCGCTCCCCGTGA
Protein Sequence: MFQGIHVVRGPAKWSPWQLAAVVASAANSDEFHPFIEALMPFVKSFSYTWFNLQAAKRKYYKKHEKRMSLEEERHTKYELQNEKAEVKQKWASRLLGKLRKDITQDCREDFVLSITGKRPAVCVLSNPDQKGKMRRIDCLRQADKVWRLDLVMVILFKAIPLESTDGERLEKHPECTQPGLCVNPYHINVSVRELDLYLANFINSYGNGSDGLPDILSGSLSPHPPRDKENEHDAKTKGYSHNPYNGVICNDIILATGVFSSKELWKLSKASILQESGSESPGEGGIKLESSYYCGYNSPAPPAFEPPPERAPSTMLVPQCFSIPHSSAGLSAAQSPLVPSNTIFYQHAPTTDTHSTASDALSGQHSTKYDGAPQDSLGDFVTFVCQEPGDVQQLQHSTKYDGAPQDSLGDFVTFVCQEPRDVQQLQHSTKYDGAPQDSLGDFVTFVCQEPSDVQQLQHSTKYDGAPQDSLGDLGDGELSGYSLSGQHFTMYDDAPQDSLGDFVTFVCQEPGEVQQLQHSTKHDGAPQDSLGDFVTFVCQEPGDVQQLQHSTKYDGAPQDSLGDFVTFVCQEPGDVQQLQLSRSPKPAYFSSSMLPPPPLPPMARPVAIIRSTASELVGNSAGGSPASPEVRSPPTSPRRRSPHPYRTEHPPISHFNHFHPQSQQMFTYGSLGGLGSGASGGGAVLSGSGGVSPPGGLGLYAPRASTRAPPRWNAPFPTLEEEFNMMAAPAGPEHVVLLDDERFFQSSVITSEATAMDTTSVGQPVDTDDIAPDKAPDLRSP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00811055;
90% Identity: iTF_00811055;
80% Identity: iTF_00811055;