什么是大数据以及大数据的法律保护

更新时间:2015-06-03 14:09 找法网官方整理
导读:
如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’则是第三次浪潮的华彩乐章。

  一、大数据潮起

  (一)大数据的意义

  古希腊思想家毕达哥拉斯认为数是世界的本源,也许这是人类初次领悟到数的伟大。著名未来学家阿温.托夫勒在1980年出版的《第三次浪潮》中预言:“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’则是第三次浪潮的华彩乐章”。

  从出现文明到2003年,人类总共才创造5EB(百亿亿字节)的数据,但现在仅两天就造出相同数据的数量。互联网每天收发着3000亿电子邮件;百度每天响应超过60亿次搜索请求;每天上传到Facebook的照片甚至达到2.5亿张的天文数字。信息是由数据构成的,大数据无疑是信息经济的制高点,也是经济和社会赖以运行的基础。掌握大数据意味着对内容的控制、用户偏好的了解和市场趋势的洞悉。数据既是企业的核心资产,也是核心的竞争优势。技术和大数据始终是百度的战略基石,马云为阿里规划的平台、金融、大数据三个发展阶段更能揭示数据对互联网企业的终极意义。

  大数据的运用范围极其广泛,几乎无所不包。百度利用从互联网搜索等多个应用获得的数据推出针对具体用户的精准网络广告;沃尔玛超市在海量的购物统计结果中发现众多男性用户购买婴儿尿布时会附带购买啤酒,并利用这个发现安排商品摆放位置,从而增加了相关商品的销售;视频网站Netflix通过研究网站数据分析出观众对影视内容、风格、导演、演员的偏好,成功推出红遍全球的《纸牌屋》;谷歌利用搜索数据推出流感预测,把大数据应用到社会公益领域;微软纽约研究院经济学家David Rothschild利用大数据连续在2012年和2013年成功预测24个奖项中的19个和21个。Rothschild利用大数据预测的最高准确率是在2012年成功预报处美国总统选举51个选区结果中的50个结果,准确率高达98%。大数据的神奇可见一斑。

  

 (二)什么是大数据

  技术、经济和产业界在实践中对大数据有不同的理解和定义。其中IBM对大数据给出的4V特征受到学者和产业界众多认可。IBM的4V特征即大数据量(Volume)、快速变化(Velocity),庞杂内容(Variety)和(不)精确性(Veracity)。著名产业调研机构Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。Gartner给出的大数据的3V特性和 IBM相当接近,分别是巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。

  大数据并不是固有的法律词汇,法律中也找不到与技术或产业意义上的大数据完全对等的概念。中国《著作权法》第十四条所规定的汇编作品,即“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品”;欧盟数据库指令第一条规定了可受特殊权利保护的数据库是指经系统或有序的安排,并可通过电子或其他手段单独加以访问的独立的作品、数据或其他材料的集合。汇编作品可以看成有独创性的数据集合,欧盟规定的数据库可以是不含独创性的数据集合。汇编作品和数据库是最接近大数据的保护客体,因此,符合条件的大数据可以主张著作权或特殊权利保护。区别在于法律不关注汇编作品或数据库的体量有多大,也不会区分数据是否类型多样、是否准确以及是否在变动。

  二、大数据法律保护现状

  (一)版权外的数据保护

  大数据是很多IT企业的核心资产。据不完全统计,仅国内A股上市公司中主营大数据相关业务的企业就有数据技术提供商超图软件、科大讯飞、拓尔思,数据服务提供商上海钢联电子、广联达、大智慧、四维图新等20多家。上市公司卷入的新类型数据权利侵权纠纷不断涌现,包括同花顺集团两家子公司在2012年底被万得信息技术公司在上海市第一中级人民法院索赔9,920万元人民币,以及上海钢联电子最近在上海、江苏、北京、广东等全国各地法院起诉多家网站未经许可使用原告网站的钢材交易数据。数据集合根据不同情况可能受到多项法定权利的保护,数据保护并不是单项选择题。根据中国法律,在版权法(著作权法)之外就有商业秘密权、隐私权、人身权、合同债权以及不正当竞争保护可能被主张。

  1.商业秘密保护

  《反不正当竞争法》第十条第三款规定:“本条所称的商业秘密,是指不为公众所知悉、能为权利人带来经济利益、具有实用性并经权利人采取保密措施的技术信息和经营信息。”根据该项规定,满足秘密性、保密性、实用性的技术信息和经营信息即可以作为商业秘密保护。随着司法实践对商业秘密认定不断倾向做宽泛解释,通过主张商业秘密权保护数据的案例呈增多趋势。在衢州万联网络技术有限公司与周慧民等侵害商业秘密纠纷上诉案中,一审被告周慧民等是一审原告万联公司的前员工,在2004年5月底至6月初从万联公司离职后创办与其相竞争的网站,利用从万联公司擅自截取的50多万个注册用户信息,通过在互联网公告和通过QQ群通知等方式引导原告注册用户到被告网站。两审法院均认为虽然单个用户的注册用户名、注册密码和注册时间等信息是较容易获取的,但是(原告)网站数据库中的?、注册密码和注册时间等信息形成的综合的海量用户信息却不容易为相关领域的人员普遍知悉和容易获得,此外,上述用户信息又具有实用性,万联公司也对上述用户信息采取了保密措施。法院由此认定万联公司的网站用户注册信息属于商业秘密,判决五被告共同赔偿原告经济损失100万元。

  2.合同法保护

  上证所信息网络有限公司(下称上证信息)诉新华富时(新华富时)指数有限公司违约案缘由是上证所信息公司曾通过合同授权新华富时使用上海证券交易所实时股票行情编制指数,授权明确禁止使用上证指数开发衍生产品。法院审理后认为,原被告之间签订的合同依法有效,新华富时利用上证指数开发指数期货的行为违反合同约定,应承担违约责任

  3.反不正当竞争法保护

  《反不正当竞争法》第二条规定:“经营者在市场交易中,应当遵循自愿、平等、公平、诚实信用的原则,遵守公认的商业道德。本法所称的不正当竞争,是指经营者违反本法规定,损害其他经营者的合法权益,扰乱社会经济秩序的行为。”反不正当竞争法具有高度抽象性和个案中宽泛解释的弹性,能够对成文法静态保护的权利形成兜底的动态保护。援引郑成思老师的著名比喻,就是如果把专利法、商标法、版权法这类知识产权单行法比作冰山,那么反不正当竞争法就如冰山下使其赖以漂浮的海洋。

  尤其在对不满足版权法对独创性要求的数据集合进行保护的案件中,禁止不正当竞争往往是原告和法院的标准选项。上海霸才数据信息有限公司与北京阳光数据公司技术合同纠纷案二审中,北京市高级人民法院认为一审原告霸才公司的SIC实时金融信息作为一种新型的电子信息产品应属电子数据库,在本质上是特定金融数据的汇编,这种汇编在数据的编排和选择上并无著作权法所要求的独创性,不构成著作权法意义上的作品,不能受到著作权法的保护。但霸才公司作为特定金融数据的汇编者,对数据的收集、编排,即SIC实时金融信息电子数据库的开发制作付出了投资,承担了投资风险。该电子数据库的经济价值在于其数据信息的即时性,阳光公司正是通过向公众实时传输该电子数据库的全部或部分而获取收益,阳光公司对于该电子数据库的投资及由此而产生的正当利益应当受到法律保护。

  4.人身权

  个人信息受隐私权保护,2013年引起不小风波的大规模开房记录泄露事件属于对当事人人身权中隐私权的侵害。以DNA基因序列为代表的个人信息同样是典型的隐私权保护客体。

  (二)数据库的版权保护

  1.汇编作品模式的数据库保护

  根据《著作权法》第十四条的规定,汇编作品是在选择或者编排中体现独创性的作品集合或其它信息集合。《著作权法》对汇编作品的该条与《世界知识产权组织版权条约》(WCT)第五条规定及《与贸易有关的知识产权协议》(TRIPS协议)第十条二款的规定实质相同。从以上著作权法规定和中国加入的知识产权国际条约规定可知,著作权所保护的汇编作品可以由电话号码、交易行情、股票走势等不能单独构成作品的信息、数据或其它材料组成,这一点使著作权保护在理论上延及数据。但汇编作品并不能覆盖很多极具利用价值的数据库,以汇编作品版权模式保护大数据有先天不足,致使立法本意与法律实践可能产生南辕北辙的效果。

  2.版权保护中的独创性难题

  具有独创性是作品受著作权保护的前提,也恰是数据库版权保护取舍两难的症结。《著作权法》将数据库划为汇编作品的类型,规定其内容的选择或者编排体现独创性。要求数据库满足作品的构成要求就必然要求数据库具有独创性,接踵而来的难题是能独立构成作品的数据库并不需要法律专门规定就可以直接受到著作权保护,而很多具有高度商业价值迫切需要法律保护的事实信息类数据库如号码簿、通讯录、地图或交易行情却不具有独创性。精选类汇编作品如《唐诗三百首》、《古文观止》、《新概念作文选》贵在选择得当,不同汇编者对内容选择和编排可能差异巨大,独创性显而易见。而大全类数据库如《永乐大典》、《四库全书》、《唐诗大全》、《吉尼斯世界纪录大全》或《法规大全》则正好相反,其价值在于数据材料的全面而不在于选择,所以汇编人的个性和偏好都会降低而不是有助于数据库的价值。大全类数据库的编篡可能需要巨大投入,《永乐大典》和《四库全书》分别是明清两代以举国之力完成的浩大工程,这与个人或独立团队就能完成的精选类汇编作品有重大不同。按独创性标准衡量汇编作品的保护,可能使具有重大意义和实用价值的大全型数据库成为弃子。

  3.结构保护的边界

  从另一个方面看,汇编作品的结构和编排体例虽然可能体现作者在选择或者编排上的独创性,却未必具有保护价值。数据库结构与数据相比如同仓库与存货,真正价值往往在数据本身而不是结构。航班信息按时间早晚、价格高低、打折多少、航空公司名称排列都可以,实质都是同一个信息集合。而很多行业类数据库结构在逐步标准化和统一化,例如财务报表,也使对数据结构的保护失去意义。而在检索技术对所有数据库都普遍运用的情况下,数据库的结构随时可以变化,也表明保护数据库结构很多情况下如同鸡肋。进一步来看即使对数据结构进行保护,也可以在使用他人数据库实质性内容时改变编排来轻易规避侵权责任,这又是汇编作品模式对数据库保护力所不能及的。

  4.案例解读

  如前所述,以汇编作品版权模式保护数据库的重大缺陷之一在于无法保护众多有很高商业价值却没有著作权法所要求的独创性的数据库。北京市第一中级人民法院 2009年二审的大众点评网诉爱帮网民事裁定书中指出:“大众点评网对于网友点评文字系按照时间顺序排列,排列方式是常见的排列方式,并不具有独创性。同时,本案现有证据亦无法看出被上诉人对于用户点评的内容进行了选择”。二审法院据此认为大众点评网中网友点评字的集合不构成汇编作品,推翻了一审法院对原告点评数据库受版权保护的判决。

  通过认定数据库具有独创性从而适用版权保护的也有以下典型却仍有争议的案例。在上海市高级人民法院二审的上海易图通信息技术有限公司诉上海城市通网络信息技术有限公司地图作品侵权纠纷案中,法院认为,“根据我国著作权法规定,具有独创性的地图作品,受到法律保护。因此,无论被上诉人制作的上海1:2000数字化地图是否为底图,只要其具备独创性,即应受到我国著作权法保护。本案中,被上诉人制作的上海1:2000数字化地图,是其根据对上海地区的道路、河流和铁路信息的测量数据,根据自己独特的判断和取舍方法,绘制出的具有与其他地图不同表达方式的地图作品,具有独创性,属于我国著作权法规定的地图类图形作品,受到法律保护。”

  在该案判决书中法院并没有提到地图的测量数据受保护,而是指出根据测量数据绘制地图时的独特判断和取舍方法具有独创性,所以地图可受保护。按此思路,未经人工处理的测绘原图以及卫星云图等图形类数据集合由于没有经过独创性的判断和取舍,其是否受版权保护必然富有争议。

  在北京市高级人民法院二审的中经网数据有限公司与香港中华网国际网络传讯有限公司侵犯著作权纠纷案中,法院在判决书中指出“中经网数据有限公司(中经网公司)经营管理的中国经济信息网(中经网)网页上所载的“中经景气动向”、“中经先行合成指数”等图表的曲线走势图并不是抄袭他人的,而是独立完成的。其次,正是因为中经网公司带有主观性的差值填补、季节调整才使图表中某些“点”的位置的安排体现了与其他公司所制作的图表的区别。无论是图表坐标轴刻度的选择,还是颜色背景的选择,均使得整个图表的形态会因绘制者不同的判断而呈现出区别,即上述曲线走势图表所表达的内容能体现制表人员独自的判断。因此,中经网网页上的所载的上述图表具有我国著作权法所保护的作品的独创性。”对金融业而言,行情数据本身才是最有价值的资产,只要有准确、及时、充分的数据,用很多软件可以非常容易的实现多种多样的图形表达。即使Excel软件都可以提供饼图、柱状图、曲线图、星状图等等数十种选择,何况强大的专业分析软件。把无足轻重的制表人员的判断作为图表可以受版权保护的理由,虽然达到保护金融数据库的目的却造成了逻辑的崩溃。

  三、数据库保护的未来

  (一)以反不正当竞争法保护数据库

  反不正当竞争法和版权法相比具有弹性好,解释能力强,能在一般法保护不足情况下对权利进行兜底保护的优点。但以反不正当竞争法保护数据库并非万全之计,反不正当竞争法的适用同样有着自身难以克服的缺点。首先,反不正当竞争法的立法目的是保护市场秩序而不是直接以私权作为保护对象。数据库权利保护更多基于私权而不在抽象的市场秩序。其次,反不正当竞争规则大多由原则条款构成,不正当竞争行为的界定有高度不确定性,在个案中受裁判人主观认知的影响较大,很容易使案件结果难以预测。在德国,案情基本相同的两个数据库不正当竞争纠纷案在不同的法院得到了不同的判决。案件之一是1993年汉堡联邦地区法院审判的一个电子电话号码案,被告直接从原告的电子电话号码簿里下载数据编入自己的电子电话号码簿,其行为被汉堡联邦地区法院判决为不正当竞争行为。而在1994年法兰克福上诉法院审理的另一个案件中,被告将官方7万多页的电话簿稍作修改,将其中有关德国电话转接的数据扫描进三张光盘组成的电子数据库,法院却判决被告的行为不构成不正当竞争行为,理由仅仅被告的电子数据库与原告的纸质数据库不存在直接竞争,原告数据库中不受版权保护的数据可以为包括竞争者在内的任何人自由利用。

  (二)以特殊权利保护数据库

  欧盟部长理事会1995年通过并在次年生效的《关于数据库的法律保护的指令》(Directive 96/9/EC on thelegal protection ofdatabases,下称数据库指令),另辟蹊径规定了对不构成作品、不受著作权保护但又有实质性投资的数据库给予特殊权利(sui generis rightprotection)保护的解决方案。数据库指令第七条第一款规定:“各成员国应为在数据库内容的获取、检验核实或选用方面,对证明在质量与 /或数量做出实质性投资的数据库制作者赋予防止对数据库内容的全部或在质量与/或数量做出实质性投资的数据库为实质部分进行摘取(extraction)与/或反复利用(re-utilization)的权利。”该项数据库特殊权利保护的期限为15年。

  欧盟立法在将不受著作权保护的数据库纳入专门法/特别权利的保护范围,以及避开保护意义不大的数据库结构编排而直接针对最有价值的数据库内容摘取/利用进行保护这两点上取得了显著进步。数据库特殊权利保护作为新生权利种类难免引发理论上的不同观点。不少学者认为特殊权利保护使数据面临被垄断,信息自由受到重大威胁。然而信息和有形资产不同,其具有近乎零成本无限复制和传播的特性,更重要的是版权和特殊权利都只是有限专有权,而并非专利权那样具有绝对的排他效力的垄断权。数据库特殊权利的权利人并不能排除他人对独立完成或独立创作的同样的数据库单独享有权利,所以数据库特殊权利并不像假设那样容易阻碍信息自由流动。

  制度但数据库指令创设数据库特殊权利作为一项制度创新当然会冒风险,有其自身理论积淀和实践检验的不足。首先,在各种新客体和新的侵权方式层出不穷的背景下,不经充分论证就在现有规定外另起炉灶、规定特殊权利可能过于匆忙。若技术发展使新事物和权利客体继续涌现而为之一一设立特殊权利保护,特殊复特殊,处处是特殊也就难言特殊。其次,数据库特殊权利明确指出立法目的是保护对数据库的“投资”,这个理念与其说是基于法理不如说更倾向产业政策。美国国会分别在 1996年、1997年和1999年三度讨论和欧盟数据库指令同样以保护投资为思路的三个数据库特殊保护的法案,即H.R.3531法案、 H.R.2652法案和H.R.354法案,立法机关最终未能达成一致。欧盟委员会在2005年在对数据库特殊权利立法效果的调查结果中也评估认为特殊权利的令人费解(The “sui generis”rightis difficult to understand),且没有达到设立特殊权利保护的经济效果(Theeconomicimpact of the “sui generis”right is unproven)。

  (三)以版权邻接权保护数据库

  知识产权法受新技术以及社会、经济趋势变化的影响巨大,在所有部门法中变动最活跃最频繁。GUI(交互界面)、实用艺术品、计算机软件等特殊或具有交叉保护特点的客体层出不穷,始终推动知识产权法自我革新和进化。把设立新权利作为解决新问题的标准模式很可能为将来埋下又一个新问题,应对的最好办法是对现有法律资源深入挖掘和优化利用。

  天气、行情、地理位置等大量的数据属于事实信息,很难受版权保护;传统的作品独创性理论也排除了用版权保护具有高度实用价值但在选择、编排上没有独创性的大全型数据库的可能。版权法不保护思想与事实的基本理论以及独创性要求使大量数据库难以寻求版权保护,而适用邻接权保护可以延伸至版权所不及的客体。版权邻接权又被称为传播者权,是版权法为保护传播而不是原创所赋予的权利。尤其对于重在搜集整理的大全型数据库,其内在价值既非独创性也不在于所谓“投资”,而在于传播和充分利用数据信息。以邻接权保护数据库从理论到实践都是契合的。

  德国《著作权法》第87条规定受邻接权保护的数据库是系统地或者按一定方法排列,可通过电子或者其他方式获得的,在搜集、校对或者呈现上需要有质或者量的实质性投资的作品、数据或其它材料的汇集。考虑到德国《著作权法》已在第4条“汇编著作和数据库著作”赋予具有独创性的数据库以汇编作品享受的同等保护,德国的数据库立法和欧盟的双轨制是一样的。但德国法没有像欧盟那样寻求创建新的权利体系而是从既有的邻接权制度中发掘传统著作权法的潜力。在德国以外,俄罗斯《联邦民法典》第1333条(规定数据库制作者)和第1334条(规定数据库制作者专有权)也是明确以保护投资而不是独创性为目的、以邻接权模式保护数据库的范例。

  四、结语

  注意力经济理论认为互联网时代的内容已不再稀缺,相反有信息过载的趋势。有效内容很容易被天文数字的无关信息淹没,用户在海量信息中寻找有效内容的成本之高已经严重削弱了内容创作的意义。有效内容的搜集和传播在互联网时代获得了比创造内容更优越的地位,而这种搜集的成果相当多是无独创性的数据库。不仅如此,分析技术、智能技术和商业模式的革命使数据对企业竞争、经济发展和社会生活产生了超出前人预料的巨大作用,这些被称为大数据的数据集合基本都属于难以适用著作权保护并且用反不正当竞争法等也难以保护充分的特殊客体。

  经济学和产业实践中的大数据与版权法中无独创性的数据汇编/数据库本质上有对应关系。以邻接权保护大数据的立法模式比用版权、数据库特殊权利、商业秘密权、隐私权、合同和反不正当竞争等保护大数据更加贴切,在法律理论上能够自洽,在实践中可以满足对无独创性却有很高利用价值的数据集合的保护需求。在大数据已成为全球经济支柱产业之际,中国在新一轮著作权法修法中应该认真研究并及时纳入数据库保护的邻接权体系,避免在对众多以搜集为重心、以传播为主要价值的数据库在《反不正当竞争法》之外无法寻求保护的局面。

温馨提示:法律问题具有较强的专业性,如有疑问,建议一对一咨询专业律师
我在互联网金融法领域有丰富的实战经验 ,如果你需要针对性解答,可以向我在线咨询。
响应时间 平均2分钟内
已帮助 160974
在线咨询
声明:该作品系作者结合法律法规、政府官网及互联网相关知识整合,如若内容错误请通过【投诉】功能联系删除。
相关知识推荐
用什么法律保护自己
公司聘请律师事务所C作为代理,先期支付10w元作为代理费用前期付款 并签署<委托代理协议>,但是协议中并未对协议的终止问题作出明确规定. 你们没有与律
拿什么法律保护我么
你好,该房产没有预售证,属于违法销售,可要求退回房款,并要求不高于一倍的赔偿,详情电询。
法律到底保护什么人
你还击时是在对方正在侵害你的时候进行的吗?如果是对方打你之后你才还击的,不属于正当防卫,属于时候防卫,你需要承担相应的责任,建议你来电或当面咨询。
找法网咨询助手
官方
当前在线
立即咨询
找法网咨询助手提醒您:
法律所涉问题复杂,每个细节都有可能决定案件走向,若问题紧急,建议 立即咨询 律师,并详细描述自身问题,以获得 针对性解答。24小时在线,平均5分钟回复。
什么法律可以保护未成年人
您好,请明确你的法律问题。
大数据金融定义
大数据金融定义
大数据金融
已经交了15年社保,能退休吗?
您好,建议向社保机构确认
我以朋友的名义贷款买车。现在他把车开走了怎么办?
你好,建议提供证据,要求对方返还车辆
河东区询问律师价格是多少
起诉律师费用大概多少,法律没有明确的规定。律师费的定价是由当地的价格主管部门和司法行政部门共同制定的,具体收费可以由律师事务所和当事人参照该定价标准协商进行收取
搬迁安置房要卖出,需要交多少税
动迁安置房买卖需要缴纳的税费包括:1、契税:房款的1%、1、5%或3%,根据面积的不同,其适用的税率不同,一般面积越大的,适用的税率越高。2、交易费:3元/平方
武汉蔡甸区老小区改造后收物业费合理么
法律分析:1.老旧小区改造前无物业服务收费或物业服务收费(每月每建筑平方米)不足0.4元(含0.4元)的,改造后基准收费标准不得超过现物业服务等级收费标准二级(
你好。我想问下,南京怎么交社保,交满多少可以领取生育金?
一、生孩子领取生育金条件1、领取生育保险金需要满足下列条件:(1)在职人员必须按规定参加社保,生育时累计缴纳生育保险满12个月以上,生育的当月和补缴生育保险费用
1分钟提问 海量律师提供在线解答
  • 1
    提交咨询
    详细描述您所遇到的问题或纠纷并发送
  • 2
    接入律师
    耐心等待律师解答,平均5分钟及时响应
  • 3
    获取解答
    还有疑问?60分钟无限次追问
立即咨询