人工智能对知识产权应用的影响

人工智能对知识产权应用的影响

摘要:人工智能尤其是区块链技术为版权的交易许可分别提供了登记确权机制、自动交易工具和信息公示网络,具有降低成本、节省时间、公开透明和民主参与等积极作用,但也存在着算法开发、系统局限、存储容量等技术障碍,观念普及困难等事实障碍和数字货币有待承认等法律障碍。人工智能技术对专利的开发运营具有一体化的检索、匹配和管理作用,并有助于建立标准必要专利的多样化许可体系。人工智能还有助于对与知识产权相交织的数据进行重组、再利用、增强可扩展性,以及发掘数据废气的价值,并在此过程中创造出新的知识产权保护客体和交易对象。

关键词:人工智能;知识产权应用;数字版权;专利运营;数据资产

无论是在国家还是企业的知识产权战略中,知识产权应用都居于重要的地位。只有良好的知识产权应用才能为知识产权的创造提供更多的经济激励,为知识产权的保护提供价值衡量的标准,以及为知识产权的管理提供动态有序的流程体系。新一代人工智能技术的兴起则对知识产权的应用产生了非常积极的影响,促进了知识产权的交易、运营,拓展了知识产权的创新性利用方式,更为优化地实现了知识产权的经济价值和社会价值。

1数字版权的人工智能交易

版权一经作品完成即自动产生的特点使其免去了授权审查的时间、金钱、信息和人力资源成本,但客观上也使得权利缺少了一种公示公信的机制,对其转让、许可等市场交易活动造成了一定的不利影响。虽然版权人可以通过自愿登记的方式进一步确定和巩固其作为权利主体身份的证据,并可以通过加强自我版权管理或者授权著作权集体管理组织来帮助其更好地实现权利的许可,但是在网络环境下,这些活动本身也需要新信息技术的支持,新一代人工智能就是这样一种可以提供强有力支持的技术。目前,在理论上探讨较多且国内外已有实践应用的数字版权管理和交易人工智能技术主要是区块链技术。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。[1]2017年5月,阿姆斯特丹大学的信息法研究所专门举办了“区块链和版权论坛”。在该论坛上,布拉茨•博多指出,通过对数字“物品”的代币化,区块链本质上强化了网络世界的拟制稀缺性。这些代币可以是版权作品的数字复制件,也可以涉及作品使用的权利、许可条款或报酬支付。区块链技术允许这些物品通过自我执行的“智能合约”进行自动交易,以及创建可靠和透明的交易记录,而无需可信中介。由于其具有深远的潜力,利益相关者对区块链技术的兴趣很高。权利人、集体权利管理组织、数字内容平台、初创企业、投资者以及基础设施提供商等,似乎都在基于区块链的解决方案中以某种模式进行投资。丹尼尔•葛维斯进一步分析认为,对艺术家(作者和表演者)而言,区块链可以对数字项目例如音乐文件中歌曲的“智能信息”进行编码,范围涵盖所有权等典型的权利管理信息、使用许可和支付条款。从用户的角度来看,区块链允许访问带有嵌入信息的歌曲,清楚地标识允许的用途,限制和价格。用户可以根据所需的用途签订合同,并以透明的方式直接向艺术家付费,而无需中间人的参与。[2]由上可知,区块链技术为版权的交易许可分别提供了登记确权机制、自动交易工具和信息公示网络,具有降低成本、节省时间、公开透明和民主参与等积极作用。具体而言,在版权登记环节,区块链技术可以建立一个全网公开、不可篡改的权利公示系统。对于在网络环境下直接以数字形式创作的作品而言,区块链的时间戳可以直接帮助其完成版权权属的登记和证明,并且这种登记的效力几乎是不可推翻的。对于非数字形式的作品而言,只要其首次数字化时的权属状况是真实的,其通过区块链完成的登记同样也具有极强的证明力。就当下而言,由于我国的官方著作权登记机构基本尚未采用区块链技术,因此由私人平台所完成的区块链版权登记可以看作是一种特殊的“作品署名方式”,能够有效推定作者的身份。[3]在区块链登记中,每个版权人都可以获得唯一的链上标记(Token)作为身份编码。以这种身份编码和预设的条件为基础,版权人就可以与使用人以智能合约的方式完成各种许可或转让交易,尤其是方便进行支付小额对价而以特定方式对作品进行一次性使用的交易。区块链在促进版权交易便捷的同时能够保障交易安全,因为每个区块都公开记录了整个链上的每次版权交易,所有人都能获悉交易内容,掌握私钥的人即可以查询到整个交易记录,无权处分、未经授权而进行许可或分许可的行为根本无法得逞。区块链的分布式存储和去中心化架构还使得传统的出版商主导的发行模式和事实上具有垄断性的著作权集体管理模式遭受巨大的挑战。在区块链版权交易中,权利人不仅可以自主决定数字作品的数量、价格、时间等,而且可以在交易完成后第一时间获得相应的版权收益,区块链技术服务提供者仅提取较低比例的佣金。[4]区块链避免了因信息不对称如出版商隐瞒销售作品的数量等所造成的利益损失,降低了由著作权集体管理组织这样的中间人进行管理和收转许可费的时间和人力成本。在某种意义上,如果说互联网促进了作品创作的草根化和平民化,那么区块链技术则使得作品版权经济价值的实现过程更加公开、公平和民主。应用区块链技术进行版权交易的商业实践自2014年以来也逐渐发展起来,截止2018年5月,全球已有40个区块链版权交易平台上线运营,新上线项目市值在2017年达到17.12亿美元,并且,2018年仅1-5月份的新上线项目就达到了2017年的88.2%,反映出该行业较为明显的上升态势。区块链版权领域进入全球加密货币市值Top200榜单的项目数量也逐年增加,表明该行业的运营已经具有持续稳定的成熟度。在具体的交易模式上,除了版权作品本身的直接交易以外,还包括版权衍生品的交易以及内容社区和分发。前者主要是指基于版权未来收益的资产证券化方案,版权作品的收益权众筹等。后者是指基于区块链上真实记录的内容创建、内容下载、内容评价推荐等行为设计奖励规则,鼓励内容创作者创作出更多令人满意的优质内容,鼓励用户主动挖掘并推荐优质的内容,内容创作者也可以根据链上付费购买的记录来获得长期收益以及调整创作策略。[5]国内外的代表性区块链版权交易平台基本上涵盖了文字、音乐、图片、影视等主要的作品类型。例如,德国的Ascribe就是一家通过区块链技术实现音乐作品版权交易的公司。其平台的使用流程是:①登录歌曲“发行”页面;②启动Prototype(使用“数据区块链”所需的前端框架);③点击歌曲的“下载”;④建立以太账本钱包;⑤用比特币给第④步建立的钱包充值;⑥钱包到账的时候,正式的下载链接出现。[6]Binded是一个致力于图片版权区块链管理和交易的平台,并且其可以通过Twitter和Instagram等社交网络账户轻松连接。亿书则是国内的一家致力于知识组合和知识分销的区块链版权平台,其将用户的不同资源、不同用户的资源进行简单组合,形成一篇新文章、新杂志、新图书,系统记录各自版权和贡献比例,组合形成的文章、书籍、视频等衍生品,可以使用亿推工具快速分发到网络,系统基于智能合约,根据组合比例自动分配报酬给用户。该区块链平台为用户提供了内容挖矿、研发挖矿、广告挖矿、存储挖矿、运营挖矿等多种与版权相关的交易选择。[7]2017年,我国还成立了“影联区块链版权交易平台”,先后实时撮合完成了6万多笔有关影视作品的版权交易。[8]基于区块链的数字版权交易并非总是一片坦途,其还存在着若干技术、事实和法律上的障碍。技术上的第一个障碍是关于哈希算法和哈希值的。哈希算法是通过将某段信息转换成一个固定长度的二进制字符串来抽取其数据特征,产生哈希值。哈希值的生成花费巨大。它是根据文件大小、时间、类型、创作者等计算出来的,单一因素的细微改变都可能引起最终结果的巨变,谁也无法预料下一个哈希值是多少,也没有更改它的软件。[9]在缺少行业巨头研发系统的情况下,区块链版权交易中的各种动态信息的哈希值不易确定和维持。技术上的第二个障碍与系统的局限性有关,目前的区块链版权交易平台都是具有时空局限性的系统,哈希值比对和智能合约的订立都必须在同一个区块链系统中进行,而难以实现全球互联网内的跨区块链操作。[10]技术上的第三个障碍是版权信息的存储容量问题。自2013年以来,区块链的数据量每年都成倍地增长。这就意味着,版权信息存储的成本可能很高,为准备存储相关数据的用户提供正确的激励将是一项非常具有挑战性的任务。[11]如果一开始并不在链上存储数字版权信息而在链下进行存储,则就会存在接入区块链之元数据的真实性问题,并且外部存储版权信息的数据库就会成为交易架构的“中心”,从而大大影响区块链版权交易所具有的去中心化、不受中间方控制的优点。区块链版权交易在事实上面临的障碍是,尽管其有着去中心化、公开、透明、民主和可信任等特点,但对于大多数的网络用户和作者来说仍然是非常陌生的新事物,人们对它的参与度并不高,也就没有办法产生经济上的“网络效应”,使越来越多的版权人能够以完全自治的方式实现版权的许可、转让和收益,而且它还可能受到著作权集体管理组织等传统的中心化版权管理机构的抵制和反对。在法律上,加密货币和智能合约等新技术的性质仍充满争议,有些国家则明确禁止前者的使用,这也或多或少影响了区块链版权交易模式的推广和普及。

2专利技术的人工智能运营

人工智能在专利技术运营中的应用实际上与为专利开发而进行的专利战略信息检索挖掘密不可分,是一个整体的流程,因为企业申请专利时不仅要考虑其在法律上的可专利性问题,更重要的是确信其具有实施的价值、符合市场的需求、具有交易的前景。有学者通过研究指出,智能化、自循环、高效率的专利开发运营生态系统包括数据层、数据处理层、知识层、应用层等四层结构。数据层包括专利基础数据、专利扩展数据、企业数据、经济数据、金融数据、高校信息数据、标准数据、科技成果数据、平台数据和其他数据。数据处理层主要是用人工智能的创造性算法来提炼数据的特征及价值。知识层由理论知识库、词典和专利技术发展规律、技术需求发展趋势和高价值专利组成,是对专利数据进行深层分析以挖掘其内在知识和发展规律的过程。应用层包括专利运营平台、智能检索系统、专利分析系统、专利评估系统和协同创新平台,其中的专利运营平台具有供需信息智能对接的作用。以中国专利技术开发公司设计的中国专利运营平台为例,其提供了两条对接渠道,其中一条即是由系统调用智能检索功能进行自动匹配对接,既包括对供方信息的需求自动匹配对接,也包括对需方信息的自动匹配对接。该专利运营平台接入智能检索、专利分析以及专利评估系统入口,以全面实现待交易数据的查询、分析及价值评估。[12]香港的InQuartik公司则开发了供知识产权专业人士使用的智能平台“专利云”。该智能专利平台以大数据分析为基础,在整个专利生命周期内为用户提供服务,包括发现技术发展的见解,优化预算和资源分配,提高专利组合的质量和价值,最大限度地减少不必要的专利投资,以及最大化专利投资回报率。此外,版权交易中应用的区块链技术同样可以用作专利尤其是标准必要专利的运营。首先就一般性专利交易的公示需求来看,尽管各国专利法都明确建立了完整的专利登记和公告系统,其中对专利权的效力、归属、转让、质押、许可等都有相应的备案要求,我国《专利法》第10条第4款甚至规定专利申请权或专利权的转让采用登记生效要件主义,但是实践中完成这样的登记相对耗时较多,如专利权的质押登记平均要1月左右才能完成,不利于提高交易的效率和督促合同的及时履行,使用区块链和智能合约技术则可以有效避免这一问题。[13]实时履行、公开透明、不可篡改的区块链专利交易模式不仅对于个体的专利权人具有较强的吸引力,而且也为我国专利行政部门更好地提供公共服务,推进《专利法修订草案(送审稿)》第82条所创设的“当然许可”制度提供了可能。在标准必要专利联盟的组建过程中,人工智能技术可以对影响联盟成败的关键因素,包括专利的技术优势、质量、联盟中的专利提供方与被许可方数量、专利许可的条件、专利许可组合方案的复杂度、技术与产品上市的时间点、市场接受度、政策影响力、地区的习惯与喜好、企业之间的竞争、消费者定价、利润分配、经销商提成、公司的利润等进行综合计算。在标准必要专利联盟成立后,运用区块链技术可以提高专利信息透明度与正确性、以人工智能判断是否为标准必要专利、以智能合约有效管理专利联盟运营细节包括授权条件、利润分配与支付,并可分析确认标准必要专利。标准必要专利联盟的管理费用,如专利申请费用、专利维护费用、联盟管理成本和税费、专利诉讼费用等也需要一个复杂的计算机制来筹划。交易平台上的智能合约和人工智能模块则有利于简化用户操作流程和缩短专利联盟管理时间,从而使之可以适用于各种类型的专利联盟,包括防御型互不侵犯的联盟、保险型的联盟、攻击性的联盟等。

3数据资产的人工智能利用

在数字经济时代,大数据与知识产权之间存在着紧密的联系。大数据是促进知识产权业态发展的技术支撑,知识产权是大数据创新技术的应用载体,两者既是资源又是手段,相互促进、相互融合。大数据将碎片式的、相互独立的知识产权“信息孤岛”和“应用孤岛”连接起来,形成信息共享的知识产权新业态。知识产权保护大数据应用全过程和创新发展的全领域。[15]不仅如此,在大数据中,结构化、半结构化和非结构化的数据混合在一起,并非只有受知识产权保护的数据才有意义,所有的数据都是有价值的。“数据的价值从它最基本的用途转变为未来的潜在用途。这一转变意义重大,它影响了企业评估其拥有的数据及访问者的方式,促使甚至迫使公司改变他们的商业模式,同时也改变了组织看待和使用数据的方式。”[16]人工智能差不多是最擅长采集、存储、分析、处理和利用大数据的技术,其首先在数据的直接商业使用中具有重要的作用,主要是基于用户个人信息、行为、位置、社交网络等数据而进行的个性化推荐、交叉推荐、品牌监测等营销类大数据应用。由于其商业模式清晰可见,市场需求旺盛,因此是目前互联网上最热门、最普遍的应用,被互联网广告、电子商务、微博、视频等公司普遍采用。[17]例如,亚马逊公司的AmazonML就是采用监督学习的机器学习方法“按照过去的记录找到趋势,通过当前的数据来预测未来”。具体而言,其可以从过去信用卡的购买记录、不良使用记录预测购买方式是否正确使用;按照事先积累的顾客的性别、年龄等属性信息,在网上的操作记录、商品的购买记录,以及电子商务地址对顾客购买商品的情况进行预测。[18]除了直接的用途之外,数据往往具有多重的潜在创新用途,其价值也是所有可能用途的总和,这些创新用途多数恰恰是经人工智能分析计算之后被发掘出来的。数据的第一个常见创新用途是它的二次利用。例如对于用户搜索的关键词数据,其直接用途是完成与搜索相关的商品或服务推销,而其二次智能分析则可以揭示某一段时间内消费者整体在某一方面的偏好。数据二次利用的商业潜能激发了人工智能技术公司与大型数据控制公司之间的合作及交易模式。数据的第二个常见创新用途是它的重新组合。数据的新颖组合会产生比其原始呈现状态不一样的效果乃至新的经济价值,已经是众所周知的道理。面对海量的数据,只有人工智能可以快速地选择和完成对所需数据的重新组合及分析,从而产生人们想知道的某种研究结果。数据的第三个常见创新用途是在收集阶段增强数据的可扩展性。例如,备受争议的谷歌街景汽车不仅拍摄了房屋和道路的照片,而且同时采集了GPS数据,检查了地图信息,甚至加入了无线网络名称,从而在优化地图服务的同时能够方便应用其自动驾驶技术。数据的第四个常见创新用途是其智能折旧和更新。大部分数据在经过一段时间以后都失去或部分失去其基本用途,此时再继续依赖旧数据不仅不会增加价值,而且还会破坏新数据的价值。因此,亚马逊等公司都通过人工智能建立了复杂的模型来帮助自己区分有用和无用的数据。最后,数据的创新用途还体现在所谓“数据废气”的价值上。数据废气是指当人们通过搜索或者网络交互行为没有发现自己所要的信息后做出的附属行为,包括浏览了哪些页面、停留了多长时间、鼠标光标停留的位置和输入了什么信息等。数据废气是很多智能服务的机器学习源泉,如语音识别、垃圾邮件过滤、翻译等。当用户指出语音识别程序误解了他们的意思时,他们实际上有效地“训练”了这个系统,让它变得更好。[19]在发现数据的创新用途并有针对性地使用智能工具之前,企业通常需要建立常规性的数据资产智能管理系统。该智能管理系统首先会全面收集和整合企业的业务数据、交易数据、日志数据、有关联的第三方数据等技术和业务元数据,构建分布式数据库,帮助定义和维护数据匹配规则,并对数据的完整性、规范性、一致性、准确性、时效性、唯一性,数据的流向,数据的使用频率,数据之间的关系等进行分析和评估,完成数据清洗。[20]通过智能管理系统中内置的搜索引擎,还可以实现对数据的自动标签和智能检索,生成类似于专利地图的数据资产地图。在数据的人工智能利用过程中,数据本身、数据使用和交易所涉及的商业模式、数据分析加工的技术和结果都可能成为知识产权保护和许可的对象。当然,在数据使用者与产生数据的原始主体之间还存在着很多其他权益上的分配和保护问题。

4结语

人工智能尤其是区块链技术消除了法律上版权因缺乏强制登记制度而公信力不足的缺陷,真正实现了版权交易的自由、平等和民主,因此即便在技术和法律上还存在若干障碍的背景下,仍然极大地促进了版权产业的发展和繁荣。在技术领域,人工智能可以建构专利开发运营一体化的平台,智能检索、分析专利的价值,匹配专利技术的市场需求,建立标准必要专利的许可体系。人工智能还可以对与知识产权相关或混合在一起的各类数据进行直接和间接的挖掘、计算和利用,在维护和实现数据价值的同时,创造出新的知识产权保护客体。

作者:李宗辉 单位:南京航空航天大学