Basic Information

Insect: Apodemia mormo
Gene Symbol: sip1_1
Assembly: GCA_036924255.1
Location: JAUPFN010000021.1:7405780-7436467[+]

Transcription Factor Domain

TF Family: GCFC
Domain: GCFC domain
PFAM: PF07842
TF Group: Unclassified Structure
Description: This entry describes a domain found in a number of GC-rich sequence DNA-binding factor proteins and homologues [4, 5], as well as in a number of other proteins including Tuftelin-interacting protein 11 [1]. While the function of the domain is unknown, some of the proteins it is found in are reported to be involved in pre-mRNA splicing [1, 2]. This domain is also found in Sip1, a septin interacting protein [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 8.8e-35 2.1e-30 107.7 3.4 1 170 366 516 366 527 0.95

2 11 0.00075 18 6.2 1.4 142 170 593 616 589 627 0.84

3 11 0.00075 18 6.2 1.4 142 170 693 716 689 727 0.84

4 11 0.00075 18 6.2 1.4 142 170 793 816 789 827 0.84

5 11 0.00075 18 6.2 1.4 142 170 893 916 889 927 0.84

6 11 0.0086 2.1e+02 2.7 1.2 142 170 993 1016 989 1027 0.84

7 11 0.00075 18 6.2 1.4 142 170 1093 1116 1089 1127 0.84

8 11 0.0086 2.1e+02 2.7 1.2 142 170 1193 1216 1189 1227 0.84

9 11 0.00075 18 6.2 1.4 142 170 1293 1316 1289 1327 0.84

10 11 0.0086 2.1e+02 2.7 1.2 142 170 1393 1416 1389 1427 0.84

11 11 1.6e-25 4e-21 77.2 0.9 142 275 1493 1650 1489 1650 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	8.8e-35	2.1e-30	107.7	3.4	1	170	366	516	366	527	0.95
2	11	0.00075	18	6.2	1.4	142	170	593	616	589	627	0.84
3	11	0.00075	18	6.2	1.4	142	170	693	716	689	727	0.84
4	11	0.00075	18	6.2	1.4	142	170	793	816	789	827	0.84
5	11	0.00075	18	6.2	1.4	142	170	893	916	889	927	0.84
6	11	0.0086	2.1e+02	2.7	1.2	142	170	993	1016	989	1027	0.84
7	11	0.00075	18	6.2	1.4	142	170	1093	1116	1089	1127	0.84
8	11	0.0086	2.1e+02	2.7	1.2	142	170	1193	1216	1189	1227	0.84
9	11	0.00075	18	6.2	1.4	142	170	1293	1316	1289	1327	0.84
10	11	0.0086	2.1e+02	2.7	1.2	142	170	1393	1416	1389	1427	0.84
11	11	1.6e-25	4e-21	77.2	0.9	142	275	1493	1650	1489	1650	0.95

Sequence Information

Coding Sequence: ATGTCGGATGAAGAAGTTATTCGGTTTGAAATCACAGATAATGATTTAGAAAATGAATTTAACCCAAATAGAAACAGAAAAGCTAAAAGAGAACAACAAATATAtggTGTTTGGGCAAAAGACAGTGATGAAGATGATAATGAAGACAATGTCAGACAAAGAGTACGTAAACCGAAGGACTTCTCAGCTCCCATTGGCTTTGTGGCTGGTGGAGTGCAACAGGCTggcaaaaagaaagaaaaaaataaagAGTTAGAAGAATCTGAAGCTACAACATCATCCAAACCTAAACTAGCACCAGACAGTTCAGATGAAGAAATGCCTATGCCTGATGAAAGAGATACTGCTGGTATCAGAAAAGCTGGTCAAGGGATGAAATCTGCAAACCTTGGCGGCAATGTAGGCAGTTGGGAGAGGCATACTAAAGGCATTGGTGCAAAATTGTTATTACAaATGGGTTATCAACCAGGTAAAGGTTTGGGTAAAGATCTTCAGGGTATATCGGCACCAGTTGAAGCTACAGTGAGAAAAGGTAGAGGAGCTATTGGTGCTTATGGTCCTGAAAAGGCAGCACAAAAGGCAAAAAAAGAAGAAGAACGTCGTCAGAAAGAGAAAGAAGACAGCGAGAAGGGTAAAACAGAGAAGACATACAATTGGAAGAAATCGCACAAAGGACGGTACTTCTATAAAGATGCTGCTGACGTCATACAAGAGGGTAAACCTACCATGCATACAATAAGCAGCAGCTCGCTGGCGCGCGTGCCGGTGATCGACCTGACGGGGCGCGAGAAGCGTGTACTGAGCGGGTACCACGCCCTACGCGCGGCCGCGCCGCGTTTCGAGCACGAGCCGCGCCGCGACCTCACGCGCTTCGCCGCGCCCGCGCTGCTGCACAACCTGCAGCTCGTCGTCGACTGCTGCGAACAAGATATTATTCAAAATGAACGAGAATTACGCCAAGCTGAAGATGAAGTCGTAGTCCTAGAGAAGGAACTAGAAGAATGCAACATAGCGGTAAAACAACAAGACGAAGTCATTGATAAAGTCCAAGCTATTCTCACGCGTGTCGAACGATTAAACAGACCAGATGTATCACTTGAGTCTGTATTTGAAGTACTGGCTGAATTAAagGAAACATTCCCTCAAGAATACGAAATGTTTGGACTGGGCACGATAGCTGGCAACATCGTAAGTCCGCTGTTCAGTGCACTGCTGGCCAAGTGGGACCCACTCCAGGCTCCCGAAGAGCCTCTTACTACATTCCTCAAGTGGAGACCGCTGTTAACAGAGGATTCGTACAACACTCTGCTATGGCAACACTTCGTATCTCATGTCACTACAGCCGTGGAGTCATGGAACCCGCGGTCCCCGCAGGCGATGGTCCGTCTGTTCGAGGTGTGGTCTGGTGCGGCGCCGACGTGGGTGCTGGAGTCGTGTGCGGCGCGCTGTGTGGCGCCGCGGATACTGGCCGCCGTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCTCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCTCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCTCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGGTGCTGCCCTGGCACGACTGGGCAGGTACAGTACTCCTCACGTGCTGGCCGCCTGCGCGACTGGGACCCCACCGTCGACACACAGCCGCTGCACCACTGGgcgGCGCGCTGGTGCGCGGCGTGTACCCCGAGATCCGGTCGCGGCTGGCGCGCGCGCTGTCGGCGTGGCACCCGGCGGACGGGTCGGCGCGGCCGCTGCTGTCGGCGTGGCGGCGCGCCTGGGGCTCGGCGCTGCTGCCGCTGCTGCACCACCACGTGGCGCCCAAGCTCGAGCACTGCCTGCAGAACGCGCCCATTGATCTGCTCTCCCGGACTACACACAACTGCCCGGCGTGGGGCTGGTGCGTGGAGTGGATGGAGCTGCTGGGCGCGCCCACCATAGCGGCGATGGCGGCGCGCGTGCTGCTGCCGCGCTGGCTGGCCGCGCTGGCGGCCTGGCTCAACTCCGCGCCGCCGCACGCCACCGTGCTCGCCTCCTACACCGAGTTCAAGaaATTATTCCCAGAAGAAGTATTAAAAGAACCAGCGGTAAGGGAAGCATTTAGGAAAGCCTTGGATATGATGAACAGGAGCACAGACATTGATGCCGTAGAACCACCACCCCCACCGAGATTCACCATCACAGAAACCAAAGAAACTTCTAGAATAAGCGACGTTTTAGCATCCATAAACCAACAGAAGAGCTTCTCAGAGCTACTAGAATCTAGATGTATTGAAAAAGGAATTACTTTTGTACCTATAGCTGGGAAAACGCGAGAAGGAAGACCTTTGTACAAGATTGGCGAAATGCAATGTTATGTGATAAGAAATGTTATAATGTACTCTGACGATGGGGGTAGAACATTTTCGCCCATTGGTCTAGATAGGCTACTGAATATGGTGGAAGATtag
Protein Sequence: MSDEEVIRFEITDNDLENEFNPNRNRKAKREQQIYGVWAKDSDEDDNEDNVRQRVRKPKDFSAPIGFVAGGVQQAGKKKEKNKELEESEATTSSKPKLAPDSSDEEMPMPDERDTAGIRKAGQGMKSANLGGNVGSWERHTKGIGAKLLLQMGYQPGKGLGKDLQGISAPVEATVRKGRGAIGAYGPEKAAQKAKKEEERRQKEKEDSEKGKTEKTYNWKKSHKGRYFYKDAADVIQEGKPTMHTISSSSLARVPVIDLTGREKRVLSGYHALRAAAPRFEHEPRRDLTRFAAPALLHNLQLVVDCCEQDIIQNERELRQAEDEVVVLEKELEECNIAVKQQDEVIDKVQAILTRVERLNRPDVSLESVFEVLAELKETFPQEYEMFGLGTIAGNIVSPLFSALLAKWDPLQAPEEPLTTFLKWRPLLTEDSYNTLLWQHFVSHVTTAVESWNPRSPQAMVRLFEVWSGAAPTWVLESCAARCVAPRILAAVRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLLWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLLWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLLWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGAALARLGRYSTPHVLAACATGTPPSTHSRCTTGCCPGTTGQVQYSSRAGRLRDWDPTVDTQPLHHWVLPWHDWAGTVLLTCWPPARLGPHRRHTAAAPLGGALVRGVYPEIRSRLARALSAWHPADGSARPLLSAWRRAWGSALLPLLHHHVAPKLEHCLQNAPIDLLSRTTHNCPAWGWCVEWMELLGAPTIAAMAARVLLPRWLAALAAWLNSAPPHATVLASYTEFKKLFPEEVLKEPAVREAFRKALDMMNRSTDIDAVEPPPPPRFTITETKETSRISDVLASINQQKSFSELLESRCIEKGITFVPIAGKTREGRPLYKIGEMQCYVIRNVIMYSDDGGRTFSPIGLDRLLNMVED

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -