专利申请人和专利权人(单位)代码标准
发布时间:二○○一年十一月一日 发布文号:局长令第13号 发布单位:国家知识产权局 专利申请人和专利权人(单位)代码标准 根据中国专利行业标准在制定中要为社会公众服务、为国家宏观决策服务、为行业管理部门管理服务的...
1 总则
附录1核苷酸和氨基酸符号和特征关键词表
表1 核苷酸表
符号 |
含义 |
名称的来源 |
a |
A |
腺嘌呤 |
g |
G |
鸟嘌呤 |
c |
C |
胞嘧啶 |
t |
T |
胸腺嘧啶 |
r |
g或a |
嘌呤 |
y |
t/u或c |
嘧啶 |
m |
a或c |
氨基 |
k |
g或t/u |
酮基 |
s |
g或c |
弱作用 3H键 |
w |
a或t/u |
强作用 2H键 |
b |
g或c或t/u |
非a |
d |
a或g或t/u |
非c |
h |
a或c或t/u |
非g |
v |
a或g 或c |
非t,非u |
n |
a或g或c或t/u,未知,或其它 |
任何 |
表2 经修饰的核苷酸表
符号 |
含义 |
ac4c |
4-乙酰胞苷 |
chm5u |
5-(羧羟甲基)尿苷 |
cm |
2'-O-甲基胞苷 |
cmnm5s2u |
5-羧甲基氨甲基-2-硫代尿苷 |
cmnm5u |
5-羧甲基氨甲基尿苷 |
d |
二氢尿苷 |
fm |
2'-O-甲基假尿苷 |
gal q |
β,D-半乳糖Q核苷 |
gm |
2'-O-甲基鸟苷 |
i |
肌苷 |
i6a |
N6-异戊烯基腺苷 |
mla |
1-甲基腺苷 |
mlf |
1-甲基假尿苷 |
mlg |
1-甲基腺苷 |
mli |
1-甲基肌苷 |
m22g |
2'2-二甲基腺苷 |
m2a |
2-甲基腺苷 |
m2g |
2-甲基鸟苷 |
m3c |
3-甲基胞苷 |
m5c |
5-甲基胞苷 |
m6a |
N6-甲基腺苷 |
m7g |
7-甲基鸟苷 |
mam5u |
5-甲基氨基甲基尿苷 |
mam5s2u |
5-甲氧基氨基甲基-2-硫代尿苷 |
man q |
β,D-甘露糖Q核苷 |
mcm5s2u |
5-甲氧基羰基甲基-2-硫代尿苷 |
mcm5u |
5-甲氧基羰基甲基尿苷 |
mo5u |
5-甲氧基尿苷 |
ms2i6a |
2-硫代甲基-N6-异戊烯基腺苷 |
ms2t6a |
N-((9-β-D-呋喃核糖基-2-硫代甲基嘌呤-6-Yl)氨基甲酰)苏氨酸 |
mt6a |
N-((9-β-D-呋喃核糖嘌呤-6-yl)N-甲基氨基甲酰)苏氨酸 |
mv |
尿苷-5-氧化乙酸-甲基酯 |
o5u |
尿苷-5-氧化乙酸 |
osyw |
Wybutoxosine |
p |
假尿苷 |
q |
Q核苷 |
s2c |
2-硫代胞苷 |
s2t |
5-甲基-2硫代尿苷 |
s2u |
2-硫代尿苷 |
s4u |
4-硫代尿苷 |
t |
5-甲基尿苷 |
t6a |
N-((9-β-D-呋喃核糖嘌呤-6-基)-氨基甲酰)苏氨酸 |
tm |
2'-O-甲基-5-甲基尿苷 |
um |
2'-O-甲基尿苷 |
yw |
Wybutosine |
x |
3-(3-氨基-3-羧基-丙其)尿苷,(acp3)u |
表3 三字母表示的氨基酸表
符号 |
含义 |
Ala |
丙氨酸 |
Cys |
半胱氨酸 |
Asp |
天冬氨酸 |
Glu |
谷氨酸 |
Phe |
苯丙氨酸 |
Gly |
甘氨酸 |
His |
组氨酸 |
Ile |
异亮氨酸 |
Lys |
赖氨酸 |
Leu |
亮氨酸 |
Met |
蛋氨酸 |
Asn |
天冬酰酸 |
Pro |
脯氨酸 |
Gln |
谷氨酰胺 |
Arg |
精氨酸 |
Ser |
丝氨酸 |
Thr |
苏氨酸 |
Val |
缬氨酸 |
Trp |
色氨酸 |
Tyr |
酪氨酸 |
Asx |
天冬氨酸或天冬酰胺 |
Glx |
谷氨酸或谷氨酰胺 |
Xaa |
未知或其它 |
表3 三字母表示的氨基酸表
符号 |
含义 |
Ala |
丙氨酸 |
Cys |
半胱氨酸 |
Asp |
天冬氨酸 |
Glu |
谷氨酸 |
Phe |
苯丙氨酸 |
Gly |
甘氨酸 |
His |
组氨酸 |
Ile |
异亮氨酸 |
Lys |
赖氨酸 |
Leu |
亮氨酸 |
Met |
蛋氨酸 |
Asn |
天冬酰酸 |
Pro |
脯氨酸 |
Gln |
谷氨酰胺 |
Arg |
精氨酸 |
Ser |
丝氨酸 |
Thr |
苏氨酸 |
Val |
缬氨酸 |
Trp |
色氨酸 |
Tyr |
酪氨酸 |
Asx |
天冬氨酸或天冬酰胺 |
Glx |
谷氨酸或谷氨酰胺 |
Xaa |
未知或其它 |
表4 经修饰的和不常用的氨基酸表
符号 |
含义 |
Aad |
2-氨基已二酸 |
bAad |
3-氨基已二酸 |
bAla |
β一丙氨酸,β一氨基丙酸 |
Abu |
2-氨基丁酸 |
4Abu |
4-氨基丁酸,哌啶酸 |
Acp |
6-氨基已酸 |
Ahe |
2-氨基庚酸 |
Aib |
2-氨基异丁酸 |
bAib |
3-氨基异丁酸 |
Apm |
2-氨基庚二酸 |
Dbu |
2,4二氨基丁酸 |
Des |
赖氨素 |
Dpm |
2,2'-二氨基庚二酸 |
Dpr |
2,3-二氨基丙酸 |
EtGly |
N-乙基甘氨酸 |
EtAsn |
N-乙基天冬氨酸 |
Hyl |
羟基赖氨酸 |
aHyl |
别-羟基赖氨酸 |
3Hyp |
3-羟基脯氨酸 |
4Hyp |
4-羟基脯氨酸 |
Ide |
异赖氨素 |
aIle |
别-异亮氨酸 |
MeGly |
N-甲基甘氨酸,肌氨酸 |
MeIle |
N-甲基异亮氨酸 |
MeLys |
6-N-甲基赖氨酸 |
MeVal |
N-甲基缬氨酸 |
Nva |
正缬氨酸 |
Nle |
正亮氨酸 |
Orn |
鸟氨酸 |
表5 与核苷酸序列相关的特征关键词表
关键词 |
说明 |
allele
|
相关的个体或菌株含有相同基因的稳定的其它形式,该形式区别 于这一位置的现有的序列(和或许其它序列) |
attenuator
|
(2)位于启动子和第一个结构基因之间,引起转录的部分终止的序列区段 |
C_region
|
免疫球蛋白轻和重链的恒定区,和T-细胞受体α,β,和γ链;根据特定的链可 |
CAAT_signal
|
CAAT盒;位于可能参与RNA聚合酶结合的真核生物转录单位的起始点的75bp |
CDS
|
编码序列;对应于蛋白质中的氨基酸序列的核苷酸的序列(位置包括终止密码子) |
Conflict |
在这一位点或区域,单独确定的“相同”序列有所不同 |
D-loop
|
置换环;线粒体DNA内的一个区域,其中RNA的短的序列与DNA的一条链配对, |
D-segment |
免疫球蛋白重链的多变区,和T-细胞受体的β链 |
Enhancer
|
顺式-作用序列,它增强了(一些)真核生物启动子的作用,并能在任一方向和与 |
Exon
|
编码剪接mRNA部分的基因组区域;可以含有5'UTR,所有CDS,和3'UTR |
GC_signal
|
GC盒;位于真核生物转录单位起始点上游的保守的富含GC区域,可以以多重拷贝 |
gene |
鉴定为基因的生物学意义的区域,并已经指定名称 |
iDNA |
间插DNA;通过几种重组中的任何一种能被消除的DNA |
intron
|
被转录的DNA区段,但通过同时剪接位于其两侧的序列(外显子)即可从转录本内 |
J_segment |
免疫球蛋白轻链和重链的连接区段,和T-细胞受体α,β和γ链 |
LTR |
长的末端重复,在确定序列的两端直接重复的序列, 类型典型地见于逆转录病毒中 |
mat_peptide |
成熟的肽或蛋白质的编码序列;翻译后修饰之后成熟的或最终的肽或蛋白质产物 |
misc_binding |
不能用任何其它Binding关键词(primer_bind或protein_bind)表述的与另一个 |
misc_ difference |
特征序列与记载中存在的有所不同,并且不能用任何其它不同关键词(conflict,unsure,old_sequence,mutation,variation,allele或modified_base) |
misc_feature |
不能用任何其它的特征关键词表述的具有生物学意义的区域;新的或少见的特征 |
misc_recomb |
任何一般性的,位点特异性的或复制的重组事件的位点,该位点中有不能用其它重组 |
misc_RNA |
不能用其他RNA关键词(prim_transcript,precursor_RNA,mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS, rRNA,tRNA,scRNA和snRNA)限定的任何转录本或RNA产物 |
misc_signal |
含有控制或改变基因功能或表达之信号的任何区域,所述信号不能用其他Signal关键词(promoter,CAAT_signal,TATA_signal,-35_signal,10_signal,GC_signal,RBS,polyA_signal,enhancer,attenuator, |
misc_structure |
不能用其他Structure关键词(stem_loop和D-loop)表述的任何二级或三级结构或构象 |
modified_base |
被指示的核苷酸是经修饰的核苷酸,并应由被指示的分子(在mod_base修饰词意义中给出)所取代 |
mRNA |
信使RNA;包括5'非翻译区(5'UTR),编码序列(CDS,外显子)和3'非翻译区(3'UTR) |
mutation |
在此位置处,相关品系的序列中具有突然的,可遗传的变化 |
N_region |
在重排的免疫球蛋白区段之间插入的额外的核苷酸 |
Old_sequence |
在此位置处,所表述的序列修改了此序列以前的版本 |
PolyA_signal |
聚腺苷酸化之后内切核酸酶裂解RNA转录本所必需的识别区域;共有序列=AATAAA |
PolyA_site |
RNA转录本上的位点,通过转录后聚腺苷酸化该位点将被加上腺嘌呤残基 |
Precursor_RNA |
仍不是成熟的RNA产物的任何RNA种类;可包括5'剪切区(5'clip),5'非翻译区(5'UTR),编码序列(CDS,外显子),间插序列(内含子),3'非翻译区(3'UTR),和3'剪切区(3'clip) |
prim_transcript |
初级(最初的,未加工的)转录本;包括5'剪切区(5'clip),5'非翻译区(5'UTR),编码序列(CDS,外显子),间插序列(内含子),3'非翻译区(3'UTR)和3'剪切区(3'clip) |
prim_bind |
起始复制,转录或逆转录的非-共价的引物结合位点;包括合成的例如PCR引物元件的位点 |
Promoter |
参与RNA聚合酶的结合以启动转录的DNA分子区域 |
protein_bind |
核酸上非-共价的蛋白质结合位点 |
RBS |
核糖体结合位点 |
repeat_region |
含有重复单位的基因组区域 |
repeat_unit |
单个重复元件 |
rep_origin |
复制起点;复制核酸以得到两个相同拷贝的起始位点 |
RRNA |
成熟的核糖体RNA;将氨基酸装配成蛋白质的核糖核蛋白颗粒(核糖体)中的RNA成份 |
S_region |
免疫球蛋白重链的开关区;它参与重链DNA的重排,导致来自相同B-细胞的不同免疫球蛋白类的表达 |
Satellite |
短的基本重复单位的很多串联重复(相同或相关的);大多数具有的碱基组成或其它性质与基因组的一般水平不同,这使得它们与大部分(主带)的基因组DNA分离开来 |
ScRNA |
小的细胞质RNA;几个小的细胞质RNA分子中的任何一个存在于真核生物的细胞质和(有时)核中 |
sig_peptide |
信号肽编码序列;被分泌的蛋白质的N-末端结构域的编码序列;此结构域涉及新生多肽与膜的结合;前导序列 |
SnRNA |
小的核RNA;很多小的RNA种类中的任何一个都被局限于核中;几个snRNA参与剪接或其它RNA加工反应 |
source |
鉴定序列中特定范围的生物来源;此关键词是强制性的;每一项至少要有一个跨越整个序列的单一来源关键词;每个序列可允许有一个以上的来源关键词 |
stem_loop |
发卡结构;由RNA或DNA单链的相邻(反向)互补序列之间的碱基一配对形成的双螺旋区域 |
STS |
序列标记位点:表述基因组上作图界标并能通过PCR检测的短的,单拷贝DNA序列;通过测定STS系列的次序即可作出图谱的基因组区域 |
TATA_signal |
TATA盒;Goldberg-Hogness盒;在每个真核生物RNA聚合酶Ⅱ转录单位起点前约25bp处发现的保守的富含AT的七聚体,它可能涉及使酶定位以正确地起始;共有序列=TATA(A或T)A(A或T) |
terminator |
或者位于转录本的末端或者与启动子区域相邻的DNA序列,该序列可导致RNA聚合酶终止转录;也可以是阻抑蛋白的结合位点 |
transit_peptide |
转运肽编码序列;核编码的细胞器蛋白质N-末端结构域的编码序列;此结构域参与将蛋白质翻译后运送到细胞器中 |
tRNA |
成熟的转移RNA,,小的RNA分子(75-85个碱基长),介导核酸序列翻译成氨基酸序列 |
unsure |
作者不能确定此区域的准确序列 |
V_region |
免疫球蛋白轻链和重链的可变区,和T-细胞受体α,β和γ链;编码可变的氨基末端部分;可由V_segment,D_segment,N_region和J_segment组成 |
V_segment |
免疫球蛋白轻链和重链的可变区段,和T -细胞受体α,β和γ链;编码大多数可变区(v_region)和前导肽的最后几个氨基酸 |
variation |
含有来自相同基因的稳定突变的相关系列(例如RFLP,多态性等),在此(和可能其它)位置处所述相同基因与被表述的不同 |
3’clip |
在加工过程中被切下的前体转录本3'端大部分区域 |
3’UTP |
不被翻译成蛋白质的成熟转录本的3'末端区域(终止密码子之后) |
5’clip |
在加工过程中被切下的前体转录本5'端大部分区域 |
5’UTP |
不被翻译成蛋白质的成熟转录本的5'末端区域(起始密码子之前) |
_ 10 _signal |
Pribnow盒;细菌转录单位起点上游约10bp处的保守区域,它可能参与结合RNA聚合酶;共有序列=TatAaT |
_ 35 _signal |
细菌转录单位起点上游约35bp处的保守六聚体;共有序列=TTGACa[]或TGTTGACA[] |
表6 与蛋白质序列相关的特征关键词表
关键词 |
说明 |
CONFLICT |
不同的论文报道了不同的序列 |
VARIANT |
作者报道存在序列变体 |
VARSLIC |
由可选择的剪接产生的序列变体的表述 |
MUTAGEN |
经实验操作已改变的位点 |
MOD_RES |
残基的翻译后修饰 |
ACETYLATION |
N-末端或其它 |
AMIDATION |
通常位于成熟的活性肽的C-末端 |
BLOCKED |
不能被测定的N-或C-末端封闭基团 |
FORMYLATION |
N-末端甲硫氨酸的 |
GAMMA-CARBOXY- GLUTAMIC ACID HYDROXYLATION |
天冬酰胺,天冬氨酸,脯氨酸或赖氨酸的 |
METHYLATION |
通常为赖氨酸或精氨酸的 |
PHOSPHORYLATION |
丝氨酸,苏氨酸,酪氨酸,天冬氨酸或组氨酸的 |
PYRROLIDONE CARBOXYLICACID |
已形成内部环内酰胺的N-末端谷氨酸 |
SULFATATION |
通常为酪氨酸的 |
LIPID |
脂质组成成分的共价结合 |
MYRISTATE |
通过酰胺键与蛋白质成熟形式的N-末端甘氨酸残基或内部的赖氨酸残基结合的豆蔻酸基团 |
PALMITATE |
通过硫酯键与半胱氨酸残基或通过酯键与丝氨酸或苏氨酸残基结合的棕榈酸基团 |
FARNESYL |
通过硫酯键与半胱氨酸残基结合的法尼基 |
GERANYL-GERANYL |
通过硫酯键与半胱氨酸残基结合的香叶基-香叶基基团 |
GPI_ANCHOR |
与蛋白质成熟形式C-末端残基的α-羧基相连的糖基-磷脂酰肌醇(GPI)基团 |
N_ACYL DIGLYCERIDE |
原核生物脂蛋白成熟形式的N-末端半胱氨酸,所述脂蛋白具有酰胺-键联的脂肪酸和通过酯键连接了两个脂肪酸的甘油基 |
DISULFID |
二硫键;“FROM”和“TO”终点表示通过一个链-内二硫键连接的两个残基;如果“FROM”和“TO”终点是完全相同的,则二硫键是链-间键,而说明书领域示出交联的性质 |
THIOLEST |
硫醇酯键;“FROM”和“TO”终点表示通过硫醇酯键连接的两个残基 |
THIOETH |
硫醚键;“FROM”和“TO”终点表示通过硫醚键连接的两个残基 |
CARBOHYD |
糖基化位点;碳水化物(如果已知)的性质在说明书领域给出 |
METAL |
金属离子的结合位点;说明书领域示出金属的性质 |
BINDING |
任何化学基团(辅酶,辅基,等等)的结合位点;基团的化学性质在说明书领域给出 |
SIGNAL |
信号序列的范围(前肽) |
TRANSIT |
运转肽的范围(线粒体,叶绿体或微体) |
PROPEP |
前肽的范围 |
CHAIN |
成熟蛋白质中多肽链的范围 |
PEPTIDE |
被释放的活性肽的范围 |
DOMAIN |
序列中感兴趣的区域的范围;所述区域的特征在说明书领域给出 |
CA_BIND |
钙-结合区域的范围 |
DNA_BIND |
DNA--结合区域的范围 |
NP_BIND |
核苷酸磷酸酯结合区域;核苷酸磷酸酯的特征示于说明书领域 |
TRANSMEM |
转膜区域的范围 |
ZN_FING |
锌指区域的范围 |
SIMILAR |
与另一个蛋白质序列具有相似性的区域;与那个序列有关的精确的资料在说明书领域给出 |
REPEAT |
内部序列重复的范围 |
HELIX |
二级结构;螺旋,例如α-螺旋,3(10)螺旋,或Pi-螺旋 |
STRAND |
二级结构;β-链,例如氢键连接的β-链,或分离的β-桥中的残基 |
TURN |
二级结构转角,例如H-键连的转角(3-转角,4-转角或5-转角) |
ACT_SITE |
涉及酶活性的氨基酸 |
SITE |
序列中任何其它感兴趣的位点 |
INIT_MET |
已知序列以起始密码子甲硫氨酸开始 |
NON_TER |
序列末端的残基不是末端残基;如果应用于位置1,这表示第一个位置不是完整分子的N-末端;如果应用于最后一个位置,这表示此位置不是完整分子的C-末端;对此关键词没有说明书领域 |
NON_CONS |
非连串残基;表示序列中的两个残基不是连串的,在它们之间有很多末测序的残基 |
UNSURE |
序列的不确定性;用于表述不能确定序列排列的序列区域 |
附录2:
序列表样例
<110> ××基因开发有限公司
<120> 序列表样例
<160> 3
<170> PatentIn Version 2.1
<210> 1
<211> 389
<212> DNA
<213> 草履虫种(Paramecium sp.)
<220>
<221> misc_feature
<222> (80,100,112)
<223> n =a或g或c或t
<220>
<221> CDS
<222> (279)...(389)
<400> 1
agctgtagtc attcctgtgt cctcttctct ctgggcttct caccctgcta atcagatctc 60
agggagagtg tcttgacccn cctctgcctt tgcagcttcn caggcaggca gncaggcagc 120
tgatgtggca attgctggca gtgccacagg cttttcagcc aggcttaggg tgggttccgc 180
cgcggcgcgg cggcccctct cgcgctcctc tcgcgcctct ctctcgctct cctctcgctc 240
ggacctgatt aggtgagcag gaggaggggg cagttagc atg gtt tca atg ttc agc 296
Met Val Ser Met Phe Ser
1 5
ttg tct ttc aaa tgg cct gga ttt tgt ttg ttt gtt tgt ttg ttc caa 344
Leu Ser Phe Lys Trp Pro Gly Phe Cys Leu Phe Val Cys Leu Phe Gln
10 15 20
tgt ccc aaa gtc ctc ccc tgt cac tca tca ctg cag ccg aat ctt 389
Cys Pro Lys Val Leu Pro Cys His Ser Ser Leu Gln Pro Asn Leu
25 30 35
<210> 2
<211> 37
<212> PRT
<213> 草履虫种(Paramecium sp.)
<400> 2
Met Val Ser Met Phe Ser Leu Ser Phe Lys Trp Pro Gly Phe Cys Leu
1 5 10 15
Phe Val Cys Leu Phe Gln Cys Pro Lys Val Leu Pro Cys His Ser Ser
20 25 30
Leu Gln Pro Asn Leu
35
<210> 3
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 根据大小和极性而设计,以用作XYZ蛋白的α和β链之间的接头的肽。
<400> 3
Met Val Asn Leu Glu Pro Met His Thr Glu Ile
1 5 10