浅谈人工智能类专利撰写思路

发布时间: 2021-04-09

作者:张思齐 专利工程师

人工智能(Artificial Intelligence,英文缩写为AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能在技术层面通常涉及语音、图像识别、自然语言处理、大数据和计算机视觉等技术,上述技术均可能涉及数学模型的生成和应用。

随着人工智能的广泛应用,基于人工智能的专利申请越来越多。此前,国家工业信息安全发展研究中心、工信部电子知识产权中心最新发布了《2020人工智能中国专利技术分析报告》(以下简称“报告”)。该报告显示,在新基建政策的激励下,中国人工智能技术专利申请数量不断增长。截至2019年底,我国人工智能技术专利申请总量首次超过美国,成为全球申请数量最多的国家。尽管2020年新冠肺炎疫情爆发,但我国人工智能技术创新并未因此受阻,截至2020年10月,我国人工智能专利申请共计69.4万件,同比增长56.3%。

基于上述情况,相关领域的专利代理行业从业者应尽早了解并学习人工智能类专利的撰写方式,以提高从业技能。

笔者基于浅薄的撰写经验,对涉及人工智能的技术方案进行概括,认为基于人工智能的发明创造主要涉及模型结构、训练过程、实际应用过程等几个方面的改进。对于上述几种改进方式,笔者总结出如下权利要求撰写的准备思路。

通常情况下,人工智能类申请文件中,在独权中通常描述利用人工智能模型进行实际应用的具体过程,但如果发明点为训练过程的改进,则应在独权中描述模型的训练过程。

一、对于模型结构上进行改进的发明创造,为突出发明点,在撰写方法权利要求时,可采用将模块“动作化”的方式,对模型中每层构造的处理进行说明。例如,对于某个已有模型A,现有技术包括依次连接的输入层a、中间层b和输出层c,而发明改进点在于在中间层b后输出层c之间引入一质量评估层d。则独权可描述为:

通过输入层a对输入数据进行处理,获得数据1;

通过中间层b对数据1进行处理,获得数据2;

通过质量评估层d对数据2进行xx处理,获得数据3;

通过输出层对数据3进行处理,获得输出结果。

上述举例的质量评估层d,其对应的“XX处理”可例如为“质量评估”,以突出该发明点在整个方案中所起的作用;同时,对于数据3,也可通过命名突出该技术特征的作用,例如多尺度的质量指标等,以便于在技术效果中阐述技术方案所能达到的效果。此外,还需在从权中对质量评估层d的具体构造或数据处理方式进行描述。

二、对于在训练过程进行改进的发明创造,应在方法的独权中重点描述训练过程,而对于后期的实际应用过程,可在独权中通过静态限定的方式进行撰写,或另起从权进行撰写。例如在独权最后描述:获得训练完成的模型,以便通过该模型进行XX实际应用(或对数据进行处理,获得结果数据)。

在训练过程中的改进例如对损失函数的改进,目前已有的损失函数通常根据样本标注(期望输出)和实际输出获得,当方案的改进点在于在计算损失函数时,引入对样本的分布评估时,可布局如下:

一种XX模型的训练方法,其特征在于,包括

获取样本集,样本集包括样本数据和样本数据的样本标注;

构建模型对样本数据进行处理,获得实际输出;

对样本数据进行分布评估,获得分布评估指标;

根据样本标注、实际输出和分布评估指标确定损失函数;

利用损失函数调节所述模型的参数,获得训练完成的模型。

应当注意的是,对于在训练阶段改进的技术方案,在布局权利要求时,需要考虑技术方案的完整性。若该改进点无法作为独立的技术方案,则应当撰写完整的训练方案,以保证技术方案的完整与独立,例如上述例子中权利要求所描述的技术方案。但某些方案仅涉及训练阶段的某一独立环节的改进时,例如样本采集环节,则可定位该具体的独立环节为一独立的技术方案,而无需布局模型的整套训练过程或模型应用阶段,以避免不当缩小权利要求的保护范围。

三、对于在实际应用过程进行改进的发明创造

应在独权中重点描述实际应用过程。例如,在实际应用中将两个已有模型进行结合,基于两个模型的结果综合确定最终结果的方案,可在独权中描述对上述过程进行描述,突出每个模型在整个方案的作用。

在撰写权利要求时,如果技术方案中既包括模型的训练阶段也包括模型的应用阶段,模型的应用阶段以及训练阶段都具有创新点时,可以考虑构建两个独立权利要求。如果发明的创新点体现在模型的应用阶段,模型的训练只是现有技术,或者是现有技术的简单组合,或是对模型的应用阶段起到辅助作用且创造性不是很明显,可以将模型的训练阶段列入从属权利中。

此外,笔者此前所接触的一涉及人工智能的新案,其中模型的训练、结构均为现有技术,改进点在于将该方案应用在对某一种特定诈骗行为的识别场景中。这类技术方案发明人会认为其创新程度很高,但就专利申请的角度来说,其新创性高度可能并不高。对于某一应用场景,在现有技术中已经存在使用神经网络模型的应用的情况下,欲申请的技术方案若只是考虑更多维度的模型输入信息,且对模型本身不具有适应该场景的改进,创造性也是不足的。对于这种情况,可将网络模型看作一个黑盒子,当输入特定的数据,就能输出相应的结果,或指示某类特定信息的结果,在进行权利要求的撰写时,无需纠结网络模型的内部结构以及其训练过程。

此时,在撰写独立权利要求时,应将侧重点多放在数据的预处理、模型的输入、输出数据部分,例如图像中特征的标记等,如果模型的训练过程中对解决技术问题有一定影响,可以将模型的训练过程作为从属权利要求。例如,在上述所举实例中,笔者认为,在布局独权时可对该类特定的诈骗行为进行详细的描述。即说明该模型输出的结果是指示识别对象为XX型对象的概率,其中,该XX型对象是指通过某一特定的诈骗流程进行诈骗的用户对象。当然,为避免出现敏感词汇,“诈骗”等带有色彩的字词可替换为“非正常交易”、“异常结算”等词汇,并在说明书中对其进行进一步的解释。

以上内容为笔者根据个人撰写经历总结出的在人工智能领域类专利申请文件中权利要求的撰写思路。当然,人工智能领域涉及的知识十分广阔,在撰写权利要求时,构建的方式也不完全是绝对的,需要具体情况具体分析。上述浅见若有纰漏之处,还请批评指正。

返回上一页