时间:2024-06-19
李静茹
摘要
随着人工智能技术在各个应用领域的快速发展,涉及人工智能技术的专利申请数量也有着爆发式增长,基于智慧芽公开数据,近5年人工智能技术的中国专利申请已经累计64.85万件,涉及的分支领域包括:计算机视觉、自然语言处理、机器人等。从技术层面分类来看,人工智能的核心技术至少涉及模型训练和模型应用两个侧重点,这两个核心侧重点也是专利代理师在撰写申请文件前,需要考虑的布局的两个核心方面,而在布局维度上,如何对这两个侧重点进行全面、有效的保护,是代理师面对该类案件的重点和难点,例如,模型训练明显涉及底层技术,在后续侵权阶段,所撰写的权利要求如何克服侵权识别存在的隐形问题。本文旨在通过探讨人工智能领域专利申请可能存在的难点,以及克服上述难点的撰写策略,对人工智能领域专利申请文件的撰写进行探讨。
关键词:人工智能、权利要求、撰写角度、撰写方式
正文
人工智能是指由人制造出来的机器所表现出来的智能能力,通常人工智能被理解为计算机模拟人类的智力活动的过程,并且已经广泛应用于计算机视觉、自然语言处理、机器人等领域。机器学习是人工智能的核心,可以建立模型模拟人类的智力活动,并在数据的使用过程中通过学习新知识调整已经建立的模型,使得模型的性能不断得到改善。从技术层面分类来看,人工智能的核心技术至少涉及模型训练和模型应用两个侧重点,其中,模型训练是对模型不断进行学习调整的过程,而模型应用是利用模型进行实际处理的过程。
如本领域技术研究人员所熟知的,人工智能专利申请的技术内容通常涉及智能算法、算法模型等抽象规则和通用方法,并且主要依赖计算机执行,这里的计算机可以是通用计算机,例如,简单由存储器和处理器构成的计算机。基于我们对于专利法第2条第2款以及第25条关于专利保护客体的理解和经验,用于保护人工智能技术的专利申请可能存在的第一个难点是保护客体问题,即涉案专利的技术内容是否属于专利法规定的保护客体。
同样的,由于人工智能的技术内容往往是以程序代码的形式存储在存储介质中,并依赖计算机等具备计算资源的设备进行运行,从而产生其技术方案所能实现的技术效果,如果我们将上述运行过程理解为一个黑盒处理过程,从而存在侵权识别上证据收集难度较大的情况,因此,人工智能技术的专利申请存在的第二个难点是侵权识别度不高。
另外,人工智能领域使用的机器模型通常为深度学习模型,例如神经网络模型,模型的层次结构较深、参数量较大,对设备的性能要求较高,因此,模型训练通常由服务器执行,而模型应用通常是由客户端执行。由此可知,人工智能专利申请中执行主体有可能不一致,后续在侵权诉讼中可能会出现责任不清,难以确定侵权者的难题。因此,人工智能专利申请存在的第三个难点是侵权主体不清晰。
基于上述浅述,针对上述三个难点对人工智能领域专利申请的撰写策略进行探讨。
一、针对不符合保护客体的难点
《专利审查指南修改草案》中规定:“如果权利要求中涉及算法的各个步骤体现出与索要解决的技术问题密切相关,如算法处理的数据是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程,并且获得了技术效果,则通常该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。
如果权利要求的解决方案涉及深度学习、分类聚类等人工智能、大数据算法的改进,该算法与计算机系统的内部结构存在特定技术关联,能够解决如何提升硬件运算效率或执行效果的技术问题,包括减少数据存储量、减少数据传输量、提高硬件处理速度等,从而获得符合自然规律的计算机系统内部性能改进的技术效果,则该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。
如果权利要求的解决方案处理的是具体应用领域的大数据,利用分类聚类、回归分析、神经网络等挖掘数据中符合自然规律的内在关联关系,据此解决如何提升具体应用领域大数据分析可靠性或精确性的技术问题,并获得相应的技术效果,则该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。”
由上可知,为了克服不符合保护客体的难点,在人工智能领域专利申请的撰写过程中,可以采用下面三种不同策略:
第一种策略可以是,在权利要求中体现算法的应用领域,并且在权利要求的各个步骤中均进行体现。例如,申请号为201711097372.0的涉案专利,其核心技术是利用奇异谱分析和局部敏感哈希算法,从大量数据中发掘风能变化的固有规律,从而提高对风能的短期预报精度,可以达到预测时间短,预测结果准确、稳定的效果,还能够避免分别预测两个分量带来的误差累计和只预测一个分量带来的固定误差,使预测更加精准。该技术方案的实现步骤由数据的计算过程组成,针对这类计算步骤为重点的方案,通常采用执行主体(通常是硬件主体)在自动运行过程中执行上述计算步骤,达到该执行主体的物理结果,从而可以在各个步骤中体现风能预测的执行过程,例如该专利权利要求中,撰写有如下技术特征:历史风能数据;平均趋势分量和波动风量;平均趋势段和平均分量段;预报结果为风电输出功率,因此,采用上述技术特征所解决的风能预测的问题是技术问题,且这些特征都与要解决的风能预测的技术问题密切相关,从而该权利要求限定的技术方案符合专利法第二条第二款的规定。
第二种策略可以是,在权利要求中体现算法特征与计算机系统的内部结构存在特定技术关联,例如,申请号为201510401619.8的涉案专利,其核心技术是在模型训练时,对于不同大小的训练数据,选择适用于该训练数据的最佳训练方案进行训练,避免由于固定地采用同一种训练方案对所有大小的训练数据进行训练而导致的对其中一些训练数据的训练速度变慢的问题。该技术方案的实现步骤由数据的计算过程组成,针对这类计算步骤为重点的方案,通常采用执行主体(通常是硬件主体)在自动运行过程中执行上述计算步骤,达到该执行主体的物理结果,从而可以在权利要求中体现该技术方案与执行主体的执行过程是紧密结合的,并且可以改善计算机系统内部性能,例如,该专利权利要求中,撰写有如下技术特征:计算不同候选训练方案的训练耗时,并选择训练耗时最小的训练方案作为最佳训练方案,不同候选方案包含的处理器的数量不同,因此,采用上述技术特征所解决的问题是技术问题,且通过对分布式系统中计算资源的调度来提升计算机系统的整体执行效果,从而该权利要求限定的技术方案符合专利法第二条第二款的规定。
第三种策略可以是,在权利要求中体现出技术方案挖掘出了数据之间符合自然规律的内在关联关系,也即,技术方案中需要处理的数据和处理得到的结果之前之间的关联关系是否是客观、普遍、稳定的,例如,申请号为201410038251.9的涉案专利,通过获取用户对教育资源选择行为的样本数据,依据用户的偏好信息和学习记录实现资源推荐,解决了如何提升用户个性化资源推荐的准确性的问题。在该权利要求中,由于用户的偏好信息和学习记录能够反映出用户对某类教育资源的感兴趣程度,因此,采用上述技术特征所解决的用户个性化资源推荐的问题是技术问题,且用户学习行为与教育资源推荐结果之间的内在关联关系符合自然规律,从而该权利要求限定的技术方案符合专利法第二条第二款的规定。
二、针对侵权识别度不高的难点
在模型训练和模型应用两个侧重点中,模型训练阶段通常是在服务器内部运行,整个模型训练流程都是以程序代码的形式存储在存储介质中,其他人员轻易无法查看到模型的训练过程;而模型应用阶段通常需要与用户进行交互,例如,由用户提供模型处理的原始数据,并将模型处理后的处理结果返回给用户查看,其他人员容易确定模型应用阶段的技术效果。因此,采用模型训练的侧重点所撰写的权利要求的侵权识别度比,采用模型应用的侧重点所撰写的权利要求的侵权识别度。
由上可知,为了克服侵权识别度不高的难点,在人工智能领域专利申请的撰写过程中,可以从模型应用的侧重点进行权利要求的撰写,并且在权利要求的撰写过程中,侧重于用户与客户端之间的数据交互,客户端与服务器之间的数据交互为重点,对整个算法实现方案进行描述,从而增加人工智能领域专利申请的侵权识别度。
三、针对侵权主体不清晰的难点
通过对人工智能领域专利申请进行分析可知,人工智能领域专利申请中算法改进点主要在于:模型结构本身的改变,模型训练方式、训练样本、损失函数构建等方面的改进,以及模型处理流程的改变等。上述改进点涉及到的执行主体既可以包含服务器,又可以包含客户端,因此,人工智能领域专利申请在撰写过程中,为了避免侵权主体不清晰的难点,通常采用从某一个执行主体进行单侧撰写。在单侧撰写过程中,特别需要考虑,如果发明点涉及另外一个执行主体,如何在保证单侧撰写的同时,体现另一个执行主体对应的发明点。
涉及人工智能的专利申请通常保护的是一种方法(如语音识别方法、图像识别方法等),专利申请中的权利要求属于方法权利要求。而方法权利要求通常采用步骤或流程等技术特征来描述,不仅仅包含步骤或流程本身,还包含步骤或流程之间的执行顺序,因此,方法权利要求的撰写方式可以认为是一种“动态限定”的方式。与“动态限定”相对应的是“静态限定”,“静态限定”是指将步骤或流程转换为功能性限定的方式进行描述,使得转换后的步骤或流程只是客观存在的状态,不再存在执行顺序,例如,将步骤或流程“利用训练样本对初始模型进行自监督学习,得到图像处理模型”转换为“图像处理模型是利用训练样本对初始模型进行自监督学习得到的”。
由上可知,为了避免侵权主体不清晰的难点,人工智能领域专利申请在撰写过程中,首先确定单侧撰写的执行主体,然后采用“动态限定”方式对该执行主体的算法流程进行撰写,并采用“静态限定”方式对另一个执行主体的算法流程进行撰写。
综上所述,针对不同难点,人工智能领域专利申请在撰写过程中可以采用不同的撰写策略,考虑到人工智能领域专利申请的复杂性,在权利要求撰写过程中,需要对所有难点进行综合考虑,从而确定权利要求要求的撰写策略,达到提升人工智能领域专利申请撰写质量的目的。