来源:互联网新闻 编辑:余姚网 时间:2023/06/07 03:14:18
原标题:数据权利初探
编者按 大数据正在改变我们的时代。阿里巴巴集团董事局主席马云断定:人类社会正从以计算机为核心的IT时代迈向以数据为核心的DT(Data technology)时代。大数据已经在很多行业带来变革性的影响,未来大数据还将会打通营销全链路,极大地节省社会成本,提升效率。作为DT时代最重要的资源,数据的法律地位怎样确立、权属如何界定等等,极为重要却尚未有定论。本文试图在数据分类的基础上探讨数据的权利边界。
□陈小江
从“数据”到“大数据”是源于以云计算为代表的技术创新使得数据的收集和使用变得容易并助长了数据的大爆发,由此开创了数据价值被重新定义和发掘的新纪元。
虽然数据有很多的特征,但笔者认为数据最重要且易被忽视的特征是被记录。如果数据没有被记录,不以一定的载体存在,讨论数据及数据权利并无实际意义。比如到超市买一瓶水,如果付现金,这条数据未被记录;如果使用超市会员卡支付,超市记录了这条数据,才存在讨论这条数据权利的问题。
《英国1998年数据保护法》是比较少见的在立法中对数据进行定义的立法例,从该法对数据的定义中亦可以看出被记录是数据的重要特征。该法“第一部分初始性规定”的“基本解释条款”第一条中规定,“数据是指下述信息:(a)根据发出的处理指令自行运行的设备所处理的信息;(b)为了由上述设备加以处理而记录的信息;(c)作为相关存档系统的组成部分或为了成为相关存档系统的组成部分而记录的信息;(d)不属于(a)、(b)或(c)项规定的信息,但属于第68条所规定的可得记录的组成部分。
数据内容与数据载体的二元结构
就数据本身而言有多种理解维度,“一千个读者眼里有一千个哈姆雷特”。
作为权利客体的“数据”,笔者认为可以分为数据内容和数据载体二元结构。数据内容决定着数据的价值,数据载体是讨论数据权利的前提。
数据内容即日常生活中人们所谈论的数据,属于“什么数据”的范畴,如个人数据、经营数据、行业数据等,人们对数据的描述大多都是从内容的维度出发。
数据载体讨论的即是从“数据”到“可用数据”的范畴。数据只有被记录才使讨论数据权利成为可能。数据载体是指数据被记录后经过加工计算被存储的形式。
当数据量小时,数据价值依赖于原始的数据内容,从数据内容中依据逻辑思维直观的获取价值,数据形式就是其原始的形式,载体的问题可以忽略。当面对海量数据时,原生数据可以直观获取的价值是有限的,数据价值依赖于算法加工计算后从总量数据的相关性中获取价值。数据价值挖掘方式的变化,使得数据载体的问题成为一个非常关键的问题。原生数据就像原油一样,原油并不能直接被使用,它需要经过加工、提炼成汽油才能被使用。数据记录方对于合法收集的数据需要经过加工计算,产出为数据处理系统可读取的数据方可实现数据价值,而其间的数据采集、存储、计算、加工、管理等需要投入巨大的成本,因此数据记录者的合法权利应当得到立法认可。
数据分类
1.专有数据与公有数据
从数据内容的维度,数据可以分为专有数据和公有数据。专有数据是指数据内容有明确的数据主体指向的数据,如隐私数据、商业秘密数据,这类数据从内容上可以直接判断出数据内容归属于某类主体。专有数据可分为个人数据、企业数据和政府数据三类。公有数据是指数据内容无明确数据主体指向的数据,如门址库数据、商品数据,这类数据从数据内容上无法分辨数据内容归属于哪类主体。需要说明的是,公有数据不表示这类数据上没有承载数据权利。
2.原生数据和衍生数据
从数据内容的产生方式,数据可以分为原生数据和衍生数据。原生数据指不依赖于现有数据而产生的数据,例如用户发表的评论数据,用户使用服务的日志数据。衍生数据指原生数据被记录存储后经过算法加工、计算、聚合成系统可读取的数据,例如偏好数据、信用数据。
具体某种数据均可以按照上述两种分类维度进行细分。以专有数据下的个人数据为例,按照原生数据和衍生数据再次细分如下:原生数据可以分为用户提交的数据(例如用户注册时填写的手机号码、邮箱)和用户行为的记录数据(例如浏览、点击的日志数据);衍生数据可以分为偏好数据、关系数据等。
数据权利
多数情况下,数据记录者并非数据内容主体,数据内容主体与数据载体主体的分离增加了数据权利问题的复杂性。如APP的用户日志,数据内容主体是用户,而用户日志的数据载体主体是APP的服务商,一份数据上承载有两个主体的权利。讨论数据权利即是为了厘清数据所承载的多种权利的边界。
数据记录者是否对数据享有权利?权利是一个法律概念,并非天然存在,法律为何要创设权利这个概念,并通过国家强制力来保障?究其立法本意,无非在于两点:一是激励权利人的持续创造,产生价值;二是确定归属方,以便其有足够的激励机制来推动秩序的完善。为了讨论的方便,笔者将数据记录者对数据的权利称为数据专有权,用户对数据的权利称为个人数据权。并以个人数据为例分析个人数据上两类主体的数据权利边界。按照前述个人数据的分类,用户的个人数据权及数据记录者的数据专有权的权利边界的关系如下:
1.对于原生数据中用户提交的数据,首先用户享有个人数据权;在用户授权的情况下数据记录者在授权范围内享有数据专有权;数据专有权是因用户授权后的“权利让渡”而产生的权利。(图一)
2.对于原生数据中用户行为的记录数据,同时并存用户和数据记录者分别享的个人数据权和数据专有权,当用户行为的记录数据中涉及个人数据时,两种权利发生交叉,此时交叉部分落入到个人数据权的范畴,此种情形下的个人数据权即是数据专有权的边界。(图二)
3.对于衍生数据,首先数据记录者享有数据专有权;当衍生数据涉及个人数据时,该部分数据用户享有个人数据权,此种情形下的个人数据权即是数据专有权的边界。(图三)
图一:原生数据-用户提交的数据
图二:原生数据-用户行为的记录数据
图三:衍生数据
数据记录者承担了数据存储、计算、加工的巨大成本,并为发掘数据价值推动经济发展、解决社会问题等起到了积极作用,数据记录者对数据拥有的合法权利应当得到认可和尊重。厘清数据主体与数据记录者对数据的权利边界,有利于激励数据主体更多的生产数据,积累数据资源,激励数据记录者更好地记录数据,发掘数据价值,建立一种良性秩序,实现两种权利的平衡,使得数据资源更好地服务于社会。
(作者单位:阿里巴巴集团法务部)