人工智能算法的专利客体问题

发布时间: 2024-01-19

作者:宿彦博 专利代理师

算法(Algorithm)是指采用系统性的方式描述解决问题的策略机制,通常是一系列计算与数据处理指令的集合,能够针对一定规范的输入,通过计算机执行这些指令来获得所要求的输出。

人工智能是当下热点技术领域,算法正是人工智能技术的核心。随着越来越多的企业、院校、个人等创新主体参与到人工智能研究与技术开发中,相关的知识产权保护需求越来越旺盛,会产生大量的人工智能算法专利申请。

专利法第二条第二款规定:发明,是指对产品、方法或者其改进所提出的新的技术方案。专利法第二十五条第一款第(二)项规定:对智力活动的规则和方法,不授予专利权。

由于人工智能算法天然的带有数学基因,导致算法相关的方案可能被认为是智力活动的规则或方法,或者被认为不属于技术方案,从而无法获得专利权。本文基于专利法与《专利审查指南》中的规定,并结合具体案例,来讨论如何规避与应对人工智能算法的专利客体问题。

方法一:在专利申请文件中布局有关具体应用领域的内容

人工智能中,很多重要算法是不区分应用领域的通用算法,如逻辑回归,梯度提升,深度学习中的注意力机制等。对于创新主体而言,若对通用算法进行了改进,甚至提出了新的通用算法,一般希望获得能够覆盖多领域的知识产权保护范围。

然而,未结合具体应用领域的通用算法方案通常都存在客体方面的缺陷。《专利审查指南》20200201修改(即国家知识产权局公告的自2020年2月1日起施行的修改)内容中提供了如下案例:

一种建立数学模型的方法,其特征在于,包括以下步骤:根据第一分类任务的训练样本中的特征值和至少一个第二分类任务的训练样本中的特征值,对初始特征提取模型进行训练,得到目标特征提取模型;其中,所述第二分类任务是与所述第一分类任务相关的其它分类任务;根据所述目标特征提取模型,分别对所述第一分类任务的每个训练样本中的特征值进行处理,得到所述每个训练样本对应的提取特征值;将所述每个训练样本对应的提取特征值和标签值组成提取训练样本,对初始分类模型进行训练,得到目标分类模型;将所述目标分类模型和所述目标特征提取模型组成所述第一分类任务的数学模型。

分析认为该解决方案不涉及任何具体的应用领域,其中处理的训练样本的特征值、提取特征值、标签值、目标分类模型以及目标特征提取模型都是抽象的通用数据,利用训练样本的相关数据对数学模型进行训练等处理过程是一系列抽象的数学方法步骤,最后得到的结果也是抽象的通用分类数学模型。方案属于智力活动的规则和方法,不属于专利保护客体。

笔者认为,为了使人工智能算法专利申请符合客体方面的规定,并尽可能为申请人争取较大的保护范围,专利代理师在撰写专利申请文件时,在与发明人就应用领域进行充分沟通确认的情况下,可以对应用领域进行多梯度布局。这样在日后的审查程序中,根据具体情况对权利要求的应用领域进行限定,有可能获得覆盖多个领域或较大领域范围的专利权。

具体地,代理师与发明人沟通确定方案的重点应用领域,可结合申请人的产品来定。在独立权利要求中可以不限定应用领域,在从属权利要求或说明书中,布局多个应用领域(如包括重点应用领域及其平行领域),或者布局重点应用领域的上一层级领域,再针对重点应用领域详细描述方案实现过程。例如,如某机器学习模型的训练方案,其重点应用领域为图像处理,可先说明方案中的训练数据包括图像数据、视频数据、音频数据、文本数据…,针对每一种数据的情况,描述方案实现过程,并可以针对图像数据进行详细描述。或者,可先说明方案中的训练数据包括多媒体数据(图像数据的上位),针对多媒体数据描述方案实现过程,再进一步说明多媒体数据可以是图像数据,并提供关于图像数据的详细训练过程。

案例1:

一种用于知识蒸馏的网络训练方法,其特征在于,包括:将样本数据输入教师网络,获得所述样本数据对应的软标签数据,将所述样本数据输入学生网络,获得所述样本数据对应的预测数据;基于所述预测数据、所述软标签数据和所述样本数据对应的硬标签数据,构建损失函数;根据所述损失函数更新所述教师网络中的参数和所述学生网络中的参数。

说明书中还记载了以下内容:在对象分类的应用场景中,样本数据可以是预先选取的样本对象的特征数据,硬标签数据可以是样本对象的分类标签;更具体的,在图像分类的应用场景中,样本数据可以是样本图片,硬标签数据可以是样本图片的分类标签。软标签数据可以是教师网络对样本对象进行分类的第一概率数据,表示教师网络判定样本对象属于每个分类的概率,预测数据可以是学生网络对样本对象进行分类的第二概率数据,表示学生网络判定样本对象属于每个分类的概率;更具体的,在图像分类的应用场景中,软标签数据可以是教师网络识别样本图片中是否存在目标对象(如猫、狗或汽车等)的概率,预测数据可以是学生网络识别样本图片中是否存在目标对象的概率。

在实质审查过程中,审查员提出上述权利要求不属于专利法第二条第二款规定的技术方案。虽然权利要求未限定网络训练的应用领域,但说明书中描述了对象分类和图像分类两个具体的应用领域(场景)。分别将两个应用领域的技术特征与权利要求相结合,可以得到两个应用领域中的网络训练方案。

其中,对象分类的范围更大,在答复审查意见时,可以先采用对象分类的技术特征进行限定。具体地,在(独立)权利要求中增加以下技术特征:所述教师网络和所述学生网络用于对象分类,所述样本数据包括样本对象的特征数据,所述硬标签数据包括所述样本对象的分类标签,所述软标签数据包括通过所述教师网络对所述样本数据进行分类得到的第一概率数据,所述预测数据包括通过所述学生网络对所述样本数据进行分类得到的第二概率数据。若审查员认为上述修改后的权利要求仍然存在客体问题,可以采用图像分类的技术特征进行限定。具体地,在权利要求中增加以下技术特征:所述教师网络和所述学生网络用于图像分类,所述样本数据包括样本图片,所述硬标签数据包括所述样本图片的分类标签,所述软标签数据包括通过所述教师网络识别所述样本图片中存在目标对象的概率数据,所述预测数据包括通过所述学生网络识别所述样本图片中存在目标对象的概率数据。这样进行梯度性修改,有机会争取到更大的保护范围。

此外,基于上文提到的应用领域多梯度撰写方式,在进行客体问题相应的修改时,可以在权利要求中限定多个应用领域,如限定训练数据为图像数据、视频数据或音频数据,并对其他技术特征也进行适应性修改,如果在其中每个领域中都能形成具体可行的方案,这样的修改方式也有可能克服客体缺陷。

需要说明的是,在说明书中描述人工智能算法在特定领域的应用时,不仅仅需要限定人工智能算法的特征与特定领域的技术特征间的对应或关联关系(如上述训练数据与图像数据的对应关系),最好完整描述算法在特定领域中的实现过程,并说明其在该领域所解决的技术问题与产生的技术效果。

方法二:将人工智能算法与计算机实体相结合

《专利审查指南》规定:如果涉及计算机程序的发明专利申请的解决方案执行计算机程序的目的是解决技术问题,在计算机上运行计算机程序从而对外部或内部对象进行控制或处理所反映的是遵循自然规律的技术手段,并且由此获得符合自然规律的技术效果,则这种解决方案属于专利法第二条第二款所说的技术方案,属于专利保护的客体。

人工智能算法依托于计算机来执行计算或数据处理指令,如果剥离计算机实体,则人工智能算法本质上属于抽象的数学计算过程。而将人工智能算法与计算机实体相结合,若算法的改进能够对计算机的运行过程等产生有益效果,则这样的改进方案一般属于技术方案。因此,专利代理师可以与发明人沟通确认计算机执行算法指令的过程,在撰写专利申请文件时,除了对算法本身的计算过程进行描述外,可以增加对计算机执行算法指令的过程进行描述,例如包括计算机的处理器、存储器等组件执行数据读取、加载、运算、存储等指令的过程。若算法的改进效果为降低时空复杂度、减小数据集等,则反映到计算机实体上,可产生降低处理器或内存开销等技术效果。在审查程序中,可以将计算机实体相关的技术特征加入到权利要求中,形成计算机实体的技术方案,以克服客体缺陷。

案例2:

一种神经网络剪枝方法,其特征在于,包括:获取第一神经网络,所述第一神经网络包括BN层(步骤110);利用样本数据集确定所述第一神经网络的基础损失,根据所述BN层的变换参数确定所述第一神经网络的正则损失(步骤120);基于所述基础损失与所述正则损失更新所述第一神经网络的参数(步骤130);根据所述变换参数对所述第一神经网络进行剪枝(步骤140)。

说明书中还记载了以下内容:在步骤110中,可以将第一神经网络加载至内存,例如,可以将第一神经网络的原始数据从非易失性存储器加载至易失性存储器中,以使处理器运行第一神经网络。第一神经网络的原始数据是指未经处理的数据,通常包括第一神经网络的参数与结构数据,结构数据可以是基于参数的计算关系,如中间层之间、神经元之间的前向传播计算关系,具体地,结构数据可以包括第一神经网络的结构相关的代码,如可以是用于执行中间层之间、神经元之间相关计算的代码。在一种实施方式中,可以在内存中划分出用于加载第一神经网络的区域,可以包括结构数据存储区与参数存储区。结构数据存储区用于存放结构相关代码,其所引用的参数可以通过指针指向参数存储区内特定参数的地址。在第一神经网络的训练过程中,可能需要频繁对参数进行更新,则更新参数存储区内的参数数值即可。在一种实施方式中,在确定被裁剪通道的情况下,可以将被裁剪通道的参数作为待裁剪参数,从第一神经网络中删除待裁剪参数以及与待裁剪参数相关的结构数据,该结构数据可以包括涉及待裁剪参数的相关计算的代码。示例性的,在步骤140中,可以从易失性存储器中删除待裁剪参数以及与待裁剪参数相关的结构数据,将裁剪参数后的第一神经网络作为第二神经网络,以替代原第一神经网络,如可以将第二神经网络存储至非易失性存储器中,以覆盖原第一神经网络。从而减少神经网络所占用的存储空间,并提高计算机后续加载与运行神经网络的速度与效率。

可见,在上述权利要求中,描述了一种神经网络模型剪枝算法,并未限定具体应用领域,属于通用算法。若审查员认为该权利要求不符合客体方面的规定,可以依据说明书的记载,将存储器相关的技术特征添加到权利要求中,从计算机的角度描述网络参数更新与剪枝过程。例如,修改后的权利要求如下:将第一神经网络的原始数据从非易失性存储器加载至易失性存储器,第一神经网络包括BN层,原始数据包括第一神经网络的参数与结构数据;通过处理器运行第一神经网络,利用样本数据集确定第一神经网络的基础损失,根据BN层的变换参数确定第一神经网络的正则损失;基于基础损失与正则损失更新第一神经网络的参数;根据变换参数确定第一神经网络的被裁剪通道,将被裁剪通道的参数作为待裁剪参数,确定与待裁剪参数相关的结构数据;从易失性存储器中删除待裁剪参数以及与待裁剪参数相关的结构数据,得到作为第二神经网络,将第二神经网络存储至非易失性存储器以覆盖第一神经网络。通过这样的修改,使得算法特征与处理器、存储器等技术特征相互支持、共同作用产生有益效果,整体上形成技术方案,属于专利保护的客体。

结语

以上提供了两种从代理端应对人工智能算法专利客体问题的思路。在实践中,应根据申请人的实际需求选择合适的撰写与审查意见答复方式。例如,申请人的产品领域非常具体,那么需要对应用领域进行重点布局,并在修改时首选将算法方案修改为其产品领域内的技术方案。无论采用哪种撰写方式,都需要注意算法特征与技术特征的紧密联系,需要将算法方案落地到具体领域或计算机实体上,写明完整的实现过程及其技术效果,这对于方案是否构成技术方案至关重要。

返回上一页