机器学习及其商业和医学诊断方法的可专利性
——关于人工智能领域的专利申请及保护

2019-01-23 08:59:14张政权
专利代理 2019年4期
关键词:专利法机器人工智能

张政权

一、机器学习程序固有的技术性

机器学习是人工智能一个非常重要的分支,或者说它是人工智能的核心之一,因此对于机器学习,从认识上来说,其本身究竟是否属于技术特征甚为重要。

例如,笔者与同事代理的名称为“使用对概率相关性和环境数据的建模与分析的交通预报”的发明专利申请①微软公司.使用对概率相关性和环境数据的建模与分析的交通预报:200510113396.1[P].2006-05-24.,要求保护一种能够预测包括意外事件在内的非典型事件的交通预测系统。发明描述了基于统计的机器学习构造预测模型的系统和方法,所述统计方法可以是贝叶斯网络、隐藏马尔可夫模型、神经网络、支持向量机等机器学习中的一种。

该申请的权利要求如下:

“一种便于传递、可视化或警告交通图的系统,包括:

生成涉及交通参数的预测的预测模型组件,所述预测模型组件包括涉及在一阈值概率以上和/或以下发生的事件的意外事件定义并能够预测意外事件在将来的发生,所述预测模型包括:

效仿典型用户作出预测的方式的用户期望模型,这些方式是有限个数的变量之间的相关,

世界模型,所述世界模型是与用户期望模型相比将更多变量及其间关系纳入考虑的更复杂的概率模型,其中相当数量的此类变量和关系在生成预测时不被用户考虑;以及

至少部分地基于所生成的预测,图形地输出交通参数的界面组件,

其中,所述意外事件定义基于所述用户期望模型和所述世界模型之间的比较来被更新,

其中,如果意外事件的预测的发生概率落在所述阈值概率之外,则所述用户被警告。”

在实质审查中,申请人收到了驳回决定书。其理由是由于计算机系统可访问充分数量的数据,因此计算机系统上使用的预测模型可比人类产生更准确的预测结果。由此可见,已经存在利用计算机技术,如计算机预测模型进行预测的方案。如此看来,该申请要解决的问题是如何对交通进行预测,尤其是非典型或意外事件的预测,这属于非技术问题,且为了解决该非技术问题,采用的手段并没有给现有计算机技术带来任何技术上的改变,其实现依赖于人的思维活动,属于人为的规定,不受自然规律的约束。因此,申请所请求保护的方案并非技术方案。

基于此,我们首先要讨论的是,涉及机器学习的手段是否属于技术手段?

机器学习包括有线性回归、决策树和支持向量机等传统的算法以及如卷积神经网络和循环神经网络等深度学习算法,大多数机器学习算法的一个普遍适用的流程包括对大量数据的收集和预处理,以及对数据集的训练、测试并完成建模等。

在Wrox 国际IT 认证项目组汇编的《大数据分析师权威教程》里,机器学习被定义为是机器从过去的经验中学习,并用这些经验改善其性能的过程。并认为,机器学习算法用于开发新算法和技术,使机器自身能够从分析的数据或者经验中学习②Wrox 国际IT 认证项目组.姚军,译.机器学习、大数据分析和可视化[M].北京:人民邮电出版社,2017:4-5.。

国内专家将机器学习定义为“研究的是如使计算机能够模拟或实现人类的学习功能,从大量数据中发现规律、提取知识,并在实践中不断完善和增强自我”③谭营.人工智能知识讲座[M].北京:人民出版社,2018:84-85.。

根据《专利审查指南》(2019 版)第二部分第九章的规定,如果涉及计算机程序的发明专利申请的解决方案执行计算机程序的目的是为了改善计算机系统内部性能,通过计算机执行一种系统内部性能改进程序,按照自然规律完成对该计算机系统各组成部分实施的一系列设置或调整,从而获得符合自然规律的计算机系统内部性能改进效果,则这种解决方案属于《专利法》第2 条第2 款所说的技术方案,属于专利保护的客体。

由于机器学习所说的机器实际上就是指计算机,而机器学习是由计算机自身实现的学习,它不是人的思维活动。进一步,根据以上对机器学习相关定义和内涵的理解,机器学习算法与计算机之间必然存在特定的关联,而对机器学习算法的应用和改进显然可以使得计算机内部的性能获得了改进。因此,毫无疑问,涉及机器学习程序的内容应当就属于技术手段,能够构成技术方案。

二、机器学习应用场景的限制

机器学习程序由于其固有的技术属性,不应被归入《专利法》第25 条第1 款规定的不授予专利权的客体范畴。但是,从当前的审查实践来看,单纯的机器学习算法不能获得授权的原因在于它的适用面极广,即它可以适用于各个领域。如果为其授予专利权,将会造成事实上的技术垄断,遏制公众的创新力,不利于社会的发展和进步。因此,如果机器学习算法与具体的应用场景结合在一起,则有可能获得授权。

例如,名称为“面向情报大数据的决策树增量学习方法”的发明专利申请④哈尔滨工程大学.面向情报大数据的决策树增量学习方法:201710259763.1[P].2017-09-22.,该申请的权利要求如下:

“1 .一种面向情报大数据的决策树增量学习方法,其特征是:

步骤一、结点n0 作为决策树T 的根结点,计算n0 的结点分裂度量值SC(n0),如果n0 是可分结点,那么将n0 放入待分裂结点集合Q 中;

步骤二、如果决策树T 中叶子结点的个数小于限定的最大叶子结点数并且待分裂结点集合Q 非空,对于待分裂结点集合Q 中的所有结点重复执行步骤三到步骤六的操作;

……;

步骤七、根据构建的决策树,利用改进的IID5R算法进行增量学习,从而生成最终的决策树。”

从某种角度来看,该机器学习算法没有与具体的应用场景结合起来,在实质审查中可能会遇到麻烦。

该申请的实施例中提及了该发明利用UCI 机器学习数据库中的信贷审批数据集对发明进行验证,包括两组实验,其中之一是NOLCDT 算法与C4.5 算法的对比实验。实验结果表明,发明提出的NOLCDT 算法比传统的决策树算法C4.5 算法的准确度要高。但实验只是作为对其发明方法的有效性进行验证用,如果能够选择若干应用场景作为应用举例,并且根据该机器学习算法的若干应用场景增加并列的独立权利要求写入申请则更好。

而如果从另一种角度来看,说明书中提及的一种信贷审批数据集作为其机器学习的训练或实验用的数据集,虽不是该申请明确提出的属于发明的应用场景,但不容置疑,该发明提出的方法既然是取UCI 机器学习数据库中的信贷审批数据集进行验证,也就是说,其方案至少是能够应用于该具体的类似的应用场景的。

在该情况下,申请人是否可以在申请提交后的后续审查程序中,将权利要求的方案具体限定到这样的场景?因为笔者从已经公开的不少有关机器学习的申请中看到,申请人在描述发明的方案时,注意力往往在于机器学习本身的建模,而容易忽略对机器学习应用场景的描述。对于这样的情况,如果一律予以否定着实有些可惜。因此,是否可以针对这种情况给申请人提供某种补救的方法,例如,在答辩发明的机器学习算法不符合《专利法》第25 条第1 款的时候,容许申请人在意见陈述书中明确这样的机器学习算法实际上是应用于某种特定应用场景的,并对保护范围作相应的限定。也就是说,只要申请人将其中的机器学习算法缩限到某一具体的应用场景,则视为该申请是符合《专利法》第25 条第1 款的。由于申请人在意见陈述中所作的解释已经产生了“禁止反悔”的效应,故其在以后的诉讼程序中不可以再重新解释该机器学习算法也适用于任何其他的应用场景。这样就可以防止通过补救方法获得的专利权在以后的维权程序中被滥用。

对于类似的问题,建议也可以参照《专利审查指南》(2019 版)第二部分第十章“关于化学领域发明专利申请审查的若干规定”的有关申请日后补交的实验数据的情况,给予申请人提供一次补交其请求保护的机器学习算法适用于某具体应用场景的实验数据,只要表明该补交的实验数据所证明的技术效果是所属技术领域的技术人员能够从该专利申请原始公开的内容中得到的就行。

三、AI 商业方法的可专利性

此处“商业”一词指的是大商业的概念,包括商务、零售、金融、广告、拍卖、管理和预测等等。仍以本文开头提及的交通图的发明专利申请为例,该申请在提交了复审请求后,专利复审委员会最终作出了撤销该驳回决定的复审决定,其理由如下。

1.权利要求的解决方案采用的手段有:生成涉及交通参数的预测的预测模型组件来预测交通事件,基于生成的预测以图形方式输出交通参数,而且当预测到意外事件时给用户警告,这些都属于通过计算机执行对外部数据的处理,属于遵循了自然规律的技术手段。

2.该解决方案利用计算机预测交通事件,解决了如何生成意外事件预测井输出给用户的问题,属于技术问题。

3.并获得了对意外事件的预测并图形化或警告输出给用户的效果,属于技术效果。

由于申请人在提交复审请求时并未对该权利要求进行修改,故实质审查部门的驳回决定和专利复审委员会的复审决定针对的是同一个方案,但是,对于同一个方案,两者在有关方案所要解决的问题是否为技术问题的认识上差别甚远。

(一)关于技术问题

有关发明要解决的问题是否为“技术问题”,首先,在根据《专利法》第2 条第2 款判断发明要求保护的客体时,需要与发明的“技术手段”和“技术效果”协同考虑,这个阶段是不引入现有技术的。但是,在根据《专利法》第22 条第3 款判断发明是否具备创造性时,审查员仍然首要审查发明所要解决的问题,即要对该发明实际所要解决的问题作重新考量。尽管审查中所依据的上述两款法条的目的是不完全相同的,但总的来说,仍疑似有重复确定发明所要解决的“问题”的问题。

既然根据《专利法》第22 条第3 款,在检索了现有技术后所重新确定的“问题”才是发明实际上需要解决的问题,是否可以把有关发明所要解决的问题是否为“技术问题”的判断过程,完全放在对发明的创造性判断的这个阶段?亦即,在根据《专利法》第2 条第2 款判断申请的发明的技术方案时,不再把发明所要解决的问题是否为“技术问题”作为必要条件,而是重点考察发明的技术手段和技术效果方面,只要根据发明的方案判断是能够获得技术效果的,就视其符合该条该款。

进一步说,即使在创造性判断阶段,是否也一定要将“技术问题”作为首要条件?在李永红老师主编的《“互联网+”视角下看专利审查规则的适用》一书中,对欧、美、日专利审查规则中有关发明专利创造性判断中的操作流程进行了归纳⑤李永红.“互联网+”视角下看专利审查规则的适用[M].北京:知识产权出版社,2017:111-112.,其中,我国与欧洲专利局的判断方法相近,但是欧洲的操作流程虽然将确定对发明的技术性做出贡献的特征放在首位,但对发明的“客观技术问题”的确定却是安排在对发明的技术效果的确定之后进行的。而从美国专利商标局和日本专利局的操作流程来看,采用的创造性判断方法中并未对发明的“技术问题”有特别的规定。

反观我国专利审查中对发明的创造性的判断流程,如果在对比了发明与现有技术的区别特征,认为发明实际解决的问题不是技术问题后,就直接断定发明对现有技术未作出技术贡献,并宣布该发明不具备创造性。由于没有再进一步对发明是否是“显而易见”进行判断,实际上还是停留在对发明请求保护的客体的判断上。因此,作者也建议,是否至少可以参考欧洲的审查规则,将发明的客观技术问题放到对发明是否是“显而易见”进行判断时一并考虑。

由于人工智能常常涉及基于人类思维的方案、基于人类行为的方案、基于环境感知的方案、基于学习的方案等该领域最具特色的内容,故人工智能的应用从发展的前景来看,已经涉及许多传统上被认为是非技术的领域,包括商业、金融、管理、教育、娱乐等等。其所要解决的问题也有可能从传统的观念上讲并非是技术性的,那么我们如何来认识这个问题呢。

笔者认为,“技术性”的定义在各个社会发展阶段都具有不同的含义。在农业时代,如何播种,如何收割应当是一种技术。但是,根据《专利法》的含义,只有具备工业化生产意义上的方法和产品才能是其保护的对象。

因此,工业化的产品及其制作方法等就属于“技术性”的范畴。到了第三次工业革命的时代,计算机产业蓬勃发展,除了硬件技术外,软件更起到了主导的作用,那么能说软件设计不是技术活?人工智能涉及各个领域和行业,即涉及技术领域也涉及非技术领域,有的确实是解决一个传统上认为的非技术问题,或者是应用了某些制定的规则,但是因为采用了技术手段,却获得了一定的技术效果,似不应将其排除在专利授权范围外。

(二)关于人为规定

由于人工智能是使机器具备人类的智能,因此,在人工智能的许多应用场景中,可能会应用一些人为制订的规则。例如,商业规则、教学规则、语言规则、交通规则、管理规则、娱乐规则,等等。而反映这些规则的特征通常表现为非技术的特征。那么,含有类似规则的发明能不能获得专利权?

以上例举的交通图的案例中,有关阈值和意外事件的定义确实与人为规定有关,但是,审查意见作出的,如何对交通进行预测,尤其是非典型或意外事件的预测,其实现依赖于人的思维活动,属于人为的规定,不受自然规律的约束的结论,同样不为笔者所接受。非典型或意外事件虽然不属于常规的交通现象,但是它的发生仍然是一种自然现象,比如,某一时间段的足球比赛结束时的人流爆发现象,某个大雪天的道路打滑现象,某家大商店的临时促销活动时的拥堵现象等等。而对这种意外事件进行定义,并根据其发生的概率定一个阈值,由计算机程序最终判断是否要向用户报警,这种非技术特征和技术特征组合形成的手段也可以视为是一种技术手段。

《专利法》和《专利审查指南》(2019 版)所说的智力活动的规则和方法是指人的智力活动的规则和方法。而机器学习方法与传统的基于人为设定规则的方法的显著不同在于它使得计算机具有了自组织、自适应、自学习的能力,能够利用自己学习到的能力有效地解决那些人为设定的规则里没有包含的状况⑥谭营.人工智能知识讲座[M].北京:人民出版社,2018:84-85.。因此,机器学习不属于人为规定,它的学习过程,包括训练和建模需要受到自然规律的约束。

从上述案例中我们可以体会到,虽然人为规定属于一种非技术特征,但是只要将它与计算机技术紧密地融合在一起,包括将反映规则方法的参数嵌入计算机程序,使之成为计算机数据处理的对象,由这种非技术特征和技术特征组合形成的手段也可以被视为一种技术手段。

四、AI 疾病诊断方法的可专利性

有关疾病的诊断和治疗方法,属于《专利法》第25条第1款所规定的情形,不能授权。《专利审查指南》(2019 版)第二部分第一章规定:“一项与疾病诊断有关的方法如果同时满足以下两个条件,则属于疾病的诊断方法,不能被授予专利权:

以有生命的人体或动物体为对象;

以获得疾病诊断结果或健康状况为直接目的。”

例如发明名称为“一种基于超声图像的多模型肝脏弥漫性疾病智能诊断方法及系统”的中国专利申请⑦哈尔滨工业大学.一种基于超声图像的多模型肝脏弥漫性疾病智能诊断方法及系统:201810658611.3[P].2018-12-21.,具体涉及利用深度学习算法提取图像特征与图像纹理特征相结合并应用XGBoost 算法在超声图像上实现肝脏弥漫性疾病智能诊断的方法,它是人工智能方法在基于超声图像的诊断中的应用。根据其说明书的描述,肝脏出现弥漫性病变之后,病变部位的声阻抗也随之变化,这种变化会反映到超声图像中。因此超声科医生可以观察超声图像中回声状况的变化,依据自己经验来诊断是否是脂肪肝或肝纤维化,但这种方法有很大的主观性,且需要多年的临床经验。

基于卷积神经网络的深度学习方法具有自动学习特征的能力,近两年在医学图像处理的各种应用中展现出了卓越的能力。它符合人眼感受图像的原理,可以全自动地学习大量的特征,替代了手工选取特征。该方法实现图像分类的流程可以概括为,采用卷积层与池化层提取海量的特征,使用全连接层实现特征降维,最后采用Softmax 层实现分类。发明将基于深度学习算法提取的图像卷积神经网络特征与图像纹理特征结合起来,应用XGBoost 分类器实现了基于超声图像的肝脏弥漫性疾病分类。该发明在实验中所用的肝脏超声图像均为哈尔滨医科大学附属第二医院超声科医生在实际病例中采集的,共有1419 张正常肝脏图像、764 张脂肪肝图像、741 张肝纤维化图像共计2924 张。发明取其中2123 张做为训练集,801 张做为测试集。该申请的权利要求如下:

“1 .一种基于超声图像的多模型肝脏弥漫性疾病智能诊断方法,其特征在于它包括以下步骤:

步骤一:采用传统的直方图均衡算法对肝脏超声图像进行预处理;

步骤二:基于GoogleNet 架构的卷积神经网络应用深度学习算法实现肝脏弥漫性疾病的初步分类;

步骤三:将图像的卷积神经网络特征和传统算法提取的图像纹理特征相结合得到多模型特征,基于多模型特征应用XGBoost 分类算法实现肝脏弥漫性疾病的最终分类。”

权利要求2 对上述的步骤三作了展开。从权利要求的内容来看,该申请的方案不是以有生命的人体或动物体为对象的,它的处理对象是超声图像。而《专利审查指南》(2019 版)规定:“如果一项发明从表述形式上看是以离体样品为对象的,但该发明是以获得同一主体疾病诊断结果或健康状况为直接目的,则该发明仍然不能被授予专利权”。亦即,如果将该超声图像视为一种离体样品,则发明同样不能获得授权。

这里,暂且不论所述的“超声图像”是否属于一种“离体样品”,但是,发明的方案是采用深度学习算法,对收集到的大量病例图像数据分别整合为训练集和测试集进行训练、建模和分类。我们可以设想该申请要求保护的场景其实有两种情况:第一种情况是要求保护该诊断方法的实现方式,防止他人未经许可仿制、复制或安装相同的软件,或生产含有该软件的诊断机器;第二种情况是要求保护该诊断方法的临床应用,防止他人未经许可在自己的机器上使用该软件。

对于第一种情况,由于方案直接处理的对象不是个体的病例,它是对相关疾病的大数据分析,收集的是批量图像数据,然后利用机器学习的训练方法,建立一个分类模型,最终对相关的病例作出判断。因此,该发明不是以获得同一主体疾病诊断结果或健康状况为直接目的。从这一点来看,它没有落入《专利法》第25 条第1 款所述的不授予专利权的范畴。

对于第二种情况,方案作为临床应用,需要对个体的病例进行诊断,并给出诊断结果。因此,它疑似以获得同一主体疾病诊断结果或健康状况为直接目的,从这一点来看,它落入了《专利法》第25 条第1 款所述的不授予专利权的范畴。

换句话说,类似的方案在第一种情况下是可专利性的,它可以用来对抗他人未经许可仿制、复制或安装相同的软件,或生产含有该软件的诊断机器。而类似的方案在第二种情况下是不可专利性的,它不能对抗医生在给病人诊断时有选择诊断方法的自由。

传统的疾病诊断中,医生可以通过望、闻、问和切对患者的疾病进行直接判断,此时,医生心中有一个经验上的判断标准;也可以借助于物理或生化仪器通过声、光、磁、电等参数对患者的疾病进行间接判断,此时,仪器反映的参数与健康或疾病的标准之间有一个人为设定的规则。

但是,与传统的医学诊断方法不同,基于机器学习的医学诊断方法中,没有人为设定的一个健康或疾病的标准,即没有根据个别医生的经验设定的标准。基于机器学习的医学诊断是计算机采用相关算法对医学大数据进行训练、测试后获得的一种模型,包括分类器等等,它是计算机自行学习的结果。虽然它采集的数据中也有医生对病例的分析和诊断,但是最终形成的模型和分类器是计算机对大量病例、研究论文等数据的分析、统计和归类等实现的,相对于个别医生的经验,它是一种再学习的结果,其中也凝聚了程序设计人员的劳动成果⑧张政权.人工智能领域的专利申请及保护[M].上海:复旦大学出版社,2019:266-267.。

事实上,由于医学领域包括疾病诊断和手术方法等也是近年来人工智能的最大应用领域,有时候我们也在思考,随着人工智能的发展,许多疾病诊断和治疗其实是由计算机为主导的机器替代医生去做了,类似这样的方法其实是由程序设计人员设计的,包括用机器学习的方式完成的,它与医生根据自己的经验进行判断和采取的动作似乎是不一样的。第一,它们不是直接以有生命的人体或动物体为对象,而是通过例如机器学习的方法在分析和研究了大量的图像和数据后才获得的一种诊断方法,应用时主要以图像或数据作为直接处理的对象;第二,这种由软件实施的方法当然是可以在产业上利用的。那么,当实施这种方法的软件可以被安装或传送到例如通用的诊断仪器甚或通用的计算机上,它也不能单独获得专利保护吗?当医院或者医生例如在一台通用的设备上安装或调用了多个这样的软件,他或她可以有选择使用的自由吗?

因此,作为一个建议,当涉及疾病诊断的方法权利要求的主题或特征部分明确是一种机器学习实施的方法时,是否可以不被列入《专利法》第25 条第1款第3项所规定的范畴。因为,如此限定的技术方案并非是医生个人的经验或者判断,而是一定得利用计算机执行该机器学习程序才能实施的。

当然,作为申请人,最可靠的办法还是应在权利要求书中增加一组采用程序模块撰写的权利要求,或者采用存储介质撰写的权利要求。

五.结 语

最近,国家知识产权局发布了关于就《专利审查指南》第二部分第九章修改草案(征求意见稿)公开征求意见的通知,并在征求意见稿的说明中指出:“涉及人工智能等新技术和新领域新业态的发明专利申请明显区别于其他发明专利申请,其特点在于,在发明解决方案中,除了技术一般还包含算法或商业方法等智力活动规则和方法的特征”。这一方面表明了人工智能等新技术、新领域和新业态发明专利申请的特殊性,另一方面表明相关部门也在努力探索人工智能等新技术、新领域和新业态的发明专利申请在审查规则方面的改进,以积极应对新形势下的新挑战。本文上述提出的观点和建议也作为对该征求意见的通知的响应,并期望能有更多的同行和人工智能领域的相关人员积极参与并予以指正。

猜你喜欢
专利法机器人工智能
美国新专利法下的“现有技术”(上)
英语世界(2022年9期)2022-10-18 01:12:02
机器狗
环球时报(2022-07-13)2022-07-13 17:18:39
机器狗
环球时报(2022-03-14)2022-03-14 18:19:44
Fintech可专利性初探——兼议《专利法》第2条修改
法大研究生(2019年2期)2019-11-16 00:40:08
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
未来机器城
电影(2018年8期)2018-09-21 08:00:06
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
专利侵权行政执法的边界——兼论《专利法》第四次修改
知识产权(2016年5期)2016-12-01 06:59:05
专利法第四次修订中的两个重要问题
知识产权(2016年3期)2016-12-01 06:57:07