人工智能工具本质初探

人工智能工具本质初探

摘要:AI首次被作为发明人提交的专利申请再次引发了人们对专利制度的讨论。现有专利制度不要求发明创造体现发明人主观要素的规定使得发明人资格“唯结果论”风行。然而发明人必须首先是人类主体才能对其发明创造承担相应的权利义务,而AI与普通计算机没有本质区别,目前AI所采用的新技术形式不足以使AI实现从普通计算机到发明主体的飞跃,所以AI仍是人类的工具。科学家对算法和数据库的选择是AI产物的创造性来源,是人类的实质性贡献所在。编写出算法的科学家必然也能依照算法进行产品研发,而AI的作用仅在于加速这一质变过程中的量变。因此,现有专利制度可以适用于AI产物,而无需借用职务发明制度来解决AI产物的归属以及另设AI产物专利审查标准。

关键词:人工智能;发明人;机器学习;大数据

0引言

2019年8月1日,英国萨里大学爆料:“世界第一例由AI独立完成并作为独立发明人申请的发明创造已经提交专利审查!”1萨里大学以名为Dabus的AI为发明人分别向美国专利商标局、欧盟专利局以及英国专利局提交了两项专利申请。随后,美国专利商标局于8月27日就AI能否作为其产物的发明人获得专利授权的问题向社会公开征求意见。2这则新闻继“AI能否成为作者”“AI产物是否构成作品”等热门话题之后将对AI问题的讨论带到了专利实践当中,引起大量法律学者呼吁美国和欧盟当局承认AI的“发明人资格”,是对国际专利制度里程碑式的挑战。3而中国于2018年上半年对AI初创企业的投资已高达36亿美元,占此前七年全世界在相关领域投资额的7.2%。4因此,AI发明人资格及其产物归属问题的解决对我国而言亦具有重要意义。然而,现有专利制度是否有必要通过扩大解释发明人概念来接纳AI为发明人,从而通过职务发明制度来解决AI产物归属问题,尚值得商榷。同时,AI产物归属和责任承担问题一直是学界讨论的重点,此外还有许多观点认为应当就专利审查标准进行修改以适应AI产物的跨领域综合性。因此,本文以AI专利发明人资格的讨论为切入点,试图通过辨析AI与普通计算机之间不存在本质差异来论证AI的工具本质,从而为上述难题的解决贡献绵薄之力。

1唯结果论发明人资格之否定

美国专利法第103(a)节以及我国《专利审查指南》第二部分第四章6.1节的规定体现了专利制度只关注客体属性的特点,现代专利制度仅要求发明创造满足专利“三性”要求即可受到专利权保护,而不要求专利体现发明人的个人思想情感特征。这本是现代专利制度为满足工业发展对“早先无体财产保护理论”[1]作出的重要突破,但却在区分创造主体方面留下了巨大的“漏洞”,成为支持AI发明人资格的学者所主张的“专利发明人唯结果论”(下称“唯结果论”)观点,即创造出可专利发明产物的就是发明人。此外,支持AI享有发明人资格的观点还包括“AI得出了连科学家自己都未曾预料到的结果”[2]以及“科学家除了基本的算法和数据之外没有任何实质性的贡献”[3],因此人类科学家无法解释自己对AI可专利产物的实质性贡献所在,从而无法原始取得对AI产物的权利。这也是前述三家专利局难以就“授予AI发明人专利权”作出快速判断的原因,同时也使得许多学者据此认为“能够创造出可专利产物的”AI拥有发明人资格,从而人类才能通过职务发明制度享有对AI产物的权利。然而,人类之所以能成为发明人,其基础在于发明人本身就是具有权利能力的自然人。而AI作为人类的创造物,可以被大量复制,并且这些复制品可以拥有完全相同的硬件设备和算法。那么在一个流水线上“诞生”的机器人是同一个主体还是完全相同的不同主体呢?公司法人的拟制主体资格由其登记设立时获得,自然人则因出生而获得权利能力。但“创造”出可专利性产物只是使AI拥有了“发明人进行发明创造”的假象,相比之下,其他与之完全相同且具备“自主创造能力”的AI却仍只是工具,因为“创造”出可专利产物而赋予AI的权利能力不啻为“无源之水”,不能因此倒推AI为相关产物的发明人并对发明人概念进行扩大解释。例如DeepMind公司强大的Watson平台精通医学、咨询、烹饪等多领域的知识,Watson的这些能力既然可以被综合进一个AI之中,那么也必然可以分别由不同的Watson1、Watson2、Watson3所掌握,但是“只精通特定领域但已产出创造性产物的”Watson1、Watson2、Watson3与“精通多领域知识但未完成创造性产物的”Watson在“发明能力上”上很难解释具有何种差异。而根据“唯结果论”的观点,仅精通特定领域的AI却能够获得发明人资格并由此承担权利义务,这是不合理的。因此,唯结果论有个隐含的前提条件是“发明主体为人”,每个人生来就享有权利能力并据此能够获得发明人的权利义务。若仅因AI已经完成可专利产物就赋予其发明人资格,那么对于这种问题的讨论就必须涉及AI的主体性。而“创造出”可专利产物的AI与普通计算机之间的差异是否足以使AI具备了主体性的要件,就是解决问题的关键所在。

2AI与普通计算机没有本质区别

“世界上最有价值的资源已经不再是石油,而是大数据了。”5沃尔玛公司通过分析销售数据向顾客提供个性化服务,华尔街“德温特资本市场”公司分析3.4亿微博账户留言来决定公司股票的买入或卖出,阿里公司根据中小企业购买情况进行放贷的坏账率仅为0.3%。[4]大数据中不仅存在巨大的经济价值,对医学大数据的解读还可能解锁各种疾病的成因以及新的治疗途径,从而推动药物研发和生命科学的发展。[5]而这些数据每天都在爆炸式地增长,人类科学家仅依靠自身能力进行阅读和研究是不可能将这些大数据的价值进行最大化利用的。因此,人类开始设想如何教会计算机像人一样进行思考、识别、记忆、判断,[6]在这种需求的推动下,AI技术进入了现代化发展阶段。

2.1深度学习:新技术背后的旧形式

为了对特定的大数据进行分析,AI首先需要掌握的技能应当是对大量相关性参差不齐的数据进行归纳、整理。神经网络就是一项模拟人脑对信息进行处理的计算机系统,6其灵感来源于哺乳类动物大脑表示信息的方式。[7]对大脑层状网络进行模拟形成的“神经网络”就是现代AI技术的基础。[8]将“神经网络”再进行组合,就形成了“深度神经网络”,即目前“机器学习”的技术基础。此处的“深度(Deep)”是一个技术术语,它指的是神经网络的层数,浅层神经网络拥有一个“隐层”用于数据学习和分析,而深度神经网络根据不同的需求拥有大量“隐层”,这些“隐层”允许AI对数据进行分层次的特征学习。[9]数据经过上一层模型后的结果会被作为初始数据输入次一层的模型,“隐层”的设置可以突出AI对每一层数据进行学习的重点,从而易于对数据进行分类和预测。[10]因此,相比于搭建每一层神经网络并将其串联,科学家对于每个“隐层”的设置是更为重要的,他们通过掌控AI深度学习、数据处理的每个节点来保证AI对于数据的处理是“合理”“符合要求”的,从而才能尽可能地保证最终结果的有效性。而从其本质来说,每一层神经网络所负担的作用与笔记本电脑没有根本差异,任何被输入的信息都被分类存储在特定文件夹中,只是使用者的大脑在笔记本电脑的使用中代替“隐层”对信息进行了选择、分类,而这些文件夹就决定了未来数据在这台电脑中的去向,将这些电脑串联形成庞大的神经网络就具备了对大数据进行处理的设备基础。机器学习最简单的应用就是:日本食品生产公司Kewpie使用了18000张土豆丁照片来训练其AI对不同品质土豆丁的识别能力,并将其用于土豆丁挑拣[9],这些照片在输入前就已经被划分为不同的等级,因此AI在进行自动挑拣时会将对应到照片的土豆丁分拣为不同的等级。而深度学习的目的不仅仅是使AI将大数据归纳整理,更是为了训练AI对未来大数据进行层次处理的能力。因此,深度神经网络仍属于基础技术。由“自然语言处理系统(理解能力)”“深度神经网络(学习能力)”以及“推理预测算法(决策能力)”构成的“认知系统”才是目前AI对于人脑认知能力进行模拟并被应用于大数据处理的技术核心。[5]该技术的应用典型是IBM公司的Watson系统。Watson所涉猎的领域众多,拥有强大的数据处理能力、学习能力和预测能力,它曾于2015年4月出版过一本名为《和Watson大厨一起认知烹饪》的食谱,7并且可以在17秒时间内阅读3469本医学专著、248000篇论文、69种治疗方案、61540次实验数据以及106000份临床报告后提出三个最优选的治疗方案。[11]美国学者KevinKelly曾于2014年造访IBM公司对Watson系统进行参观,他对Watson的描述为:“Watson原型机大约有一间卧室那么大,四壁由10台立式冰箱形状的机器组成,其背部是杂乱的电线和电缆。并且它的内部出奇的热,好像是活着的星团。”8因此可以看出,目前的深度学习技术还依赖于将各个浅层神经网络进行物理堆叠构成深度网络,并且这一系统的运作需要消耗大量的能量。同时,因为AI学习能力非常强大,所以整个学习过程必须得到大数据支持,简单的数据难以使AI掌握相关领域的整体特征。但这种能力并非越强大越好,AI不懂得“过犹不及”的道理,这在2012年前给科学家造成了极大的麻烦。“认知系统”对大数据进行归纳、整理就涉及将各项数据进行联系,这种对数据的处理叫做“拟合”。在计算机的早期发展中,由于算力和算法的弱后以及“噪音数据”9的存在,“弱拟合”的状况时有发生,即计算机因能力弱而只适用于小量、简单数据的处理。随后,设备、算法技术以及自然语言数据库的精进解决了AI处理能力弱的问题。但随着AI能力的增强,科学家在利用AI对数据进行处理时又遇到了“过拟合”的问题,即AI过于强大以至于样本数据中的不相干特征都被进行了联系,导致AI无法对样本形成合理的特征划分而无法对样本外的数据进行处理。[12]一直到2012年,Hinton及其学生的“Dropout算法”10才有效克服了“过拟合”的影响,并被广泛应用至今。[13]这种方法的原理就是以一定的概率放弃或停止各个神经网络节点,从而使AI摆脱数据不必要特征的影响。总而言之,AI是为大数据而生的,大数据亦因AI而发挥价值。深度学习与认知系统的强大展现出了AI在大数据处理中的价值,而弱拟合和过拟合问题的存在表明:AI无论是进行简单的数字计算还是大数据处理,它始终只做了一件事——“计算”,这与普通计算机没有区别,并不是像人一样思考。因此AI深度学习并非拥有无限的可能,其计算结果的“合理”与人类脱不了干系。但除此之外,还存在另一种“广为人知”的机器学习系统,使人们看到了一丝“创造性之光”。

2.2强化学习:新形式背后的老套路

近几年火热的“人机大战”有2016年阿尔法狗对战韩国棋手李在石和2017年阿尔法狗对战中国棋手柯洁。人类棋手几度落败后,社会对于AI的关注达到了顶峰,AI已经超越人类的说法一时间沸沸扬扬。但较少为公众所知的是,仅在阿法尔狗战胜柯洁的大概5个月之后,其研发公司DeepMind又研发了一款名为“AlphaGoZero”的围棋AI,并在短短的数天内击败了此前的阿尔法狗。而“AlphaGoZero”所采用的机器学习技术称为“强化学习(reinforcementlearning)”系统。为了对采用深度学习技术的老款阿尔法狗进行训练,DeepMind公司一共提供了3000万个棋局供其学习,并且这个过程花费了3周的时间。11相比之下,强化学习系统使得“AlphaGoZero”在围棋学习上拥有更强的能力。DeepMind公司对“AlphaGoZero”的“成长”过程作了如下记录:“第0天,它仅具有基础围棋规则数据;第3天,它的能力已经超过了击败李在石的“阿尔法狗李”了;第21天,它的能力已经媲美击败柯洁的“阿尔法狗master”了;第40天,在没有任何人为干预和历史数据输入的情况下,它仅依靠自己下棋成为了世界上最强的棋手。”12可见,强化学习系统不会为AI提供任何供其学习或参考的数据,而仅为其提供适当虚拟或真实的“训练环境”,由其自身在工作过程中积累相关经验并更好地完成任务,这在一定程度上真正地解放了科学家对于“解决方案”的构思。显然,强化学习看起来比深度学习具有更强的“创造能力”,也更加不受科学家的限制,但这一系统的应用对环境有着很高的要求。“训练环境”的构建对强化学习的效果起着决定性的影响,但通过特定环境训练开发的AI难以应对训练中未曾遇到的问题,并且当将训练模型从虚拟环境转移到现实中时,一切问题都会变得复杂。13以自动驾驶汽车为例,其目的在于以最快的速度、最高的安全性以及舒适度将乘客从起点送到目的地,但道路状况包含着无法计算的信息量,使得技术人员不可能考虑到所有的情况,而这恰好与强化学习模型的功能相契合,即让AI自己寻找最优的路径和方式来完成行驶任务。但暂不考虑训练的成本,仅就普通自动驾驶出租车而言,每小时的驾驶会产生10的2500亿次方量的数据,相比之下较为简单的自动下棋也会在每小时产生10的150次方量的数据。[14]庞大的数据量引发的首要问题就是存储空间的不足,其次要考虑的是如何将虚拟训练场景复制到现实中。可见,强化学习系统的核心在于“重复”,输入围棋规则由AI自行对弈并记录胜利的方式或搭建道路环境由AI自行选择前往终点的最佳方式,从而让AI自己完成升级过程,因此科学家对规则的设置就决定了该系统的进化方向。“只要功夫深,铁杵磨成针”这句俗语可以用来简单概括强化学习系统的原理,其中反映创造性并起决定作用的是“使AI下决心磨杵”的科学家,而“下功夫磨杵的AI”虽功不可没但并非是创造性的来源。因此AI技术的“新”,仅在于形;究其根本,与普通计算机无异。

2.3AI产物是“质”“量”变的统一

综上所述,尽管旧形式靠新技术转换了模样,新形式被建立在老套路上,但AI的本质仍由原本的式样和手段决定。深度学习技术的发展历程说明AI的能力不能过于强大,[8]AI不懂得如何“合理”运用自己的能力,或者说AI只知道发挥自己的能力,这与人类不同,不是创造性的体现。同时,强化学习系统的作用是在无数次“犯错”中找到最适合的方案,这也是为人类所支配的。因此,AI自身及其可专利产物与人类之间的关系便昭然若揭了。人类史上诸多伟大的发明都是偶然发现的,如杀鼠灵、青霉素、硝化甘油烈性炸药等等,AI能够在一定程度上避免科学家错过这些机缘巧合。[5]但在没有算法的情况下,机器完成创造的可能性有多大呢?法国数学家EmileBorel于其1913年的论文中介绍了“无限猴子定理”:让100万只猴子任意地敲打打字机,并将其成果收集起来,一年以后将会得到世界上最大图书馆馆藏书籍的所有类型和语言的复制件。[15]根据这个假想,让一只机器猴没日没夜地以每秒1000字的速度任意敲击打字机,其首次得到完整莎士比亚作品所需要的时间是3.8乘以10的8217259次方年,而宇宙的年龄却仅为1.4乘以10的10次方年。[15]这是以完全没有算法的普通机器进行估算的,但即使是“200秒即可完成超级计算机10000年算力”14的谷歌量子计算机也不能明显缩短这一时间跨度。因此,如果没有算法的引导,计算机只能在理论上拥有完成可专利产物的可能。而算法对AI可专利产物的决定性作用往往被人们所忽视,算法被视为是人类对AI最低限度的干预,甚至不被视为人类对AI的干预。15这种观点忽视了AI与人类之间的联系,将AI与人类的新生儿相比拟,认为拥有算法的AI已经不受人类控制并成了独立个体。而现实并非如此,即使是超级计算机也无法与人类大脑相比拟。就健康人脑而言,大脑皮层中的约1000亿个神经元与其他1000至10000个神经元相连接[16]形成了125万亿个链接,其拥有的存储容量可以高达1000千兆字节,大脑的信息处理速度可达每秒1000万亿次,而其能量消耗仅为每天1800卡;而以2014年的超级计算机为例,将当时世界上所有计算机通过各种网络相连接也只能产生100亿个链接,当年最强的美国计算机TITAN也仅有20千兆字节的存储容量,其处理速度虽高达每秒10万亿次,但每天消耗的能量也达到了可点亮美国8000座房屋的8.4兆瓦。[17]人类之所以无法在计算层面击败计算机的原因就在于:人脑是兼顾人体一切生存、沟通、记忆、计算等功能的器官,而计算机只需要完成计算即可。[17]因此,AI拥有的并不是像人类一样全面的能力,如果婴儿的潜力如海洋一样宽阔,那么AI的潜力就是在计算层面拥有海洋的深度。AI也要受到时间、能量、规则的限制,要想让它们在有限的时间内完成特定的任务,就必须设定相应的算法和数据对AI进行定向指引,所以科学家对算法的编程以及对数据的选择才是AI产物创造性的来源。能够对算法进行编程的科学家必然也能够自己按照算法的规则进行计算或实验,也因为科学家懂得如何进行计算和实验,相应的AI算法才得以产生。而AI之于人类的优势就在于不受体力和精力的限制以及强大的计算能力,它的作用就在于帮助科学家理性地、没有偏见地、大量快速地进行计算和实验。因此,科学家对于算法的构建就包含了他们对技术方案的“构思”。但“巧妇难为无米之炊”,科学家对于大数据的筛选则是为这一“构思”的执行准备好了“原料”。AI深度学习需要数据;AI对计算结果进行验证也需要数据。在AI强大的拟合能力下,杂乱的多领域信息、过少量的信息、错误的信息以及“噪音”数据等等都会使最终机器学习的效果大打折扣。在可持续的环境中维护一个数据集本身就是一个挑战,同时还要允许AI能够对信息进行快速分析;当添加其他类型的数据时,数据很快就变得不可管理,除非将额外的信息组合进原有信息并链接两者的类型。[5]因此提供给AI学习的数据必须是清楚准确的、特征一致的。这些必须由科学家进行手动筛选,或由科学家提前为AI设定好信息索引的标准。综上,不论是深度学习还是强化学习AI都与普通计算机没有本质差异,因此不存在能够赋予AI主体性的条件。科学家对算法的编程和数据的选择是AI创造性技术方案的决定性“质变”因素,而AI根据算法进行快速的计算则是“质变”过程中的“量变”因素,“人工智能的出现仅仅是提前将这些技术方案发明出来”[18]。科学家对于AI的干预都已经被编写到AI的“基因”当中,即使在AI开始工作后不再对其施加人为控制,AI的工作目的和工作方式都脱离不了人类控制,否则会出现算法编写和数据库选择存在漏洞,会产生无价值的结果。因此,AI产物是人类利用AI完成的成果,其与AI一样都属于人类的财产。AI是人类的工具,从人类一开始对其的构思乃至到人类无限的未来,这一点都不会改变。

3AI不会改变现有专利制度

由于AI具有强大的能力,许多学者都提出了关于现有专利制度对AI产物适用性的质疑,主要涉及AI产物的归属、AI产物的专利审查标准以及AI发明人资格。只要认识到AI的本质是人类的工具,这些问题便迎刃而解了。3.1不宜新设AI产物专利审查标准由于AI拥有强大的跨领域数据收集和处理能力,目前专利制度的“三性”判断标准对AI产物的适用性也引起了关注。吴汉东认为“关于AI生成物的创造性判断与以往的标准不同,其创造性识别不仅要观察相关人员的知识和技能,还应考量申请人所用的发明工具。”[6]还有邓建志[19]、季冬梅[3]也认为应当对AI产物的可专利性提出不同的审查标准。而这些学者们的理由是AI所能援引的文献远远超出了人类发明者和专利审查员所能掌握的范围,并且专利审查都是按照不同领域划分的,审查员难以对多领域元素的结合产物进行可专利性判断。然而,由于AI技术研发困难,其发展呈现出明显的“两极分化”景象。16所以就目前而言,适用于AI产物的审查标准不仅是难以创设的,更是难以实施的。与上述学者观点不同的是,刘友华认为只要AI产物符合专利“三性”要求即可对其进行保护。[18]曹建峰则主张发挥AI在专利审查中的作用,“AI技术能够缓解专利审查负累、提高专利检索效率。”[20]AI技术并非是普通人民的特权,作为公权力机关的专利局也可以引入AI技术用于各项专利的审查,帮助审查员提高文献检索效率以及专利审查能力。并且据美国专利商标局于2019年7月16日的报导,该局正与国际专利局一同探索AI技术在专利审查中的应用。17就其根本而言,专利制度的目的在于造福人类,那么专利审查标准亦是取决于人类生活生产的需要。只要AI的应用也反映了这一价值取向,那就不至于在专利制度中创设两种不同的标准。3.2AI产物归属于使用者关于AI发明人资格及其专利归属的问题,国内外学者近来愈发注重通过职务发明制度来使人类雇主“正当地”对AI雇员的创造产物拥有财产权。英国萨里大学教授RyanAbbot认为将非人类也视为发明人可以促进创造性计算机的发展从而激发智力财产的创造。[21]美国科技咨询公司副总裁RussPearlman认为类比职务发明人与其雇主之间的关系,将AI视为是雇员,可以规避对于AI是否属于法律人或自然人的考量,从而使人类受让得到AI发明产物的权利。[22]刁舜亦认为职务发明保护模式可以适配AI产物保护,将AI本身拟制为发明人,而AI使用者被视为雇主而成为专利权人。[2]因此就这些学者而言,最好的途径是对专利制度的相关概念进行扩大解释从而“正当化”人类对于AI产物的权利。[23]然而,这种观点本身就将AI视作是受人支配的“物”,更不必说“通过立法肯定AI发明人的工具地位”会对人类发明人的地位和权利造成不良影响。若不希望对现有发明人制度造成明显的影响,承认AI发明人地位还需要解释AI的权利能力,并且雇佣、委托、劳动关系的建立必须以双方的合意为前提。总而言之,通过职务发明制度来解决AI产物的归属问题,其实是“在沙地上建立房屋”,其结论无法适用。AI与普通计算机不存在本质差异,利用AI创造出物品的使用者就是该产物的权利人。

4总结

万法之初均以原则为首,望顺应社会发展,包罗相同事物。同者,借已有制度规范;异者,复注巨资建高楼以容。然时代瞬息,异者生,同者“亡”,标新立异者盛行。若非见其同者,见于异,以异者立法,恐枉费社会资源。故初见异者,宜揭其表象,察其同,避免大动干戈。AI与普通计算机之间的差异在于新的形式和技术手段,但它们的本质无异,AI仍属于人类的工具,没有带来新的主体和新的问题。因此AI不能拥有发明人资格,也不会引发AI产物归属的纷争。AI一切的行为均由其使用者“指使”,只要看透这一本质,任何AI产物相关的话题都将戛然而止。

作者:季善豪 单位:华东政法大学知识产权学院