网络数据爬虫与数据侵权

网络法读书会

报告人:李铭轩

2018年3月

首先介绍一下这两个案例的案情和判决结果,先说一下hiQ 诉领英案。案件的双方当事人分别是领英公司和 hiQ 公司。领英公司是全球最大的职业社交网站,在它的网站上有非常海量的注册用户的职业相关信息,判决里提到领英在那个时候已经拥有了5亿的用户。hiQ 公司是一个提供人力资源信息服务的公司,它主要基于领英网站上的公开的信息,对其进行统计分析,从而为客户提供人力资源管理方面的信息。它主要有两款产品,一款叫作 keeper,主要是告诉雇主哪些雇员有很大风险离职,从而做好应对工作;还有一款叫作 skill mapper,顾名思义,它就是对雇员的工作技能做一些分析,提供相应的信息。 hiQ自身不是一个社交网站,它并不拥有大量的用户职业信息,因此它是完全地依赖于领英上公开的用户职业信息,才得以去推行其商业模式。所以它就要去大量地抓取领英上的数据。领英一开始也容忍了 hiQ 的数据获取和使用行为,其中的原因并不清楚。但是,就在这个案件发生前不久,领英正好宣布要提供与 hiQ 类似的服务。所以这个判决里也推断,领英很有可能是准备进军到另外一个市场时,出于排除竞争对手的目的,突然对 hiQ 采取了这样一个措 施。于是,领英在2017 年 5 月 23 日向 hiQ发出警告函,要求它停止抓取数据。领英在警告函里表明,如hiQ不停止抓取行为,将违反一系列联邦法和州法,主要是美国的 CFAA 也就是计算机欺诈和滥用法,同时领英也已经采取了技术手段制止 hiQ 的抓取行为。但是 hiQ 反而主动出击,先向联邦地区法院提起了诉讼,要求联邦法院判发临时禁制令,也就是要求领英不得阻止它去获取其网站上公开的信息。

本案的法官最终支持了hiQ 的诉求。其判决中的分析主要是围绕着临时禁制令的框架展开。在美国,是否颁发临时禁制令,主要考虑四个因素:胜诉的可能性、是否有难以弥补的损害、对双方利益的权衡和公共利益。判决书里也提到了这四个因素。判决书还指出其在分析中用了一种叫作“sliding scale” 的方法,直译过来叫作滑动计算法。意思就是在考虑这四个因素时,如果某一 个因素特别明显地有利于一方,那么它可以弥补在另外一个因素方面的不足。所以法官认为,在是否有难以弥补的损害、对双方利益的权衡和公共利益这三个因素考量上,对 hiQ 是非常有利的,在这种情况下,对胜诉的可能性这一因素的要求,就可以相对较低。如果说之前对胜诉的可能性的要求是“likely to succeed on the merits”,那现在只要证明有“there are ‘serious questions going to the merits’”就可以了。

首先,从损害以及双方困难的权衡来看,hiQ的商业模式完全基于领英的数据,如果不颁发禁制令,任由领英禁hiQ抓取数据,那很可能hiQ 就完了,会造成难以弥补的损害。从双方困难的权衡来看,hiQ的困难也可能更大。同时,法官也反驳了领英关于损害用户隐私的主张,他主要认为hiQ 抓取的是用 户公开的数据,不涉及到隐私的问题,另外,领英其实上并不禁止其他的第三方去抓取这些公开的数据,所以损害隐私这个理由是不成立的。而且经过了那么长的时间,领英容许 hiQ 去抓取这些数据,它也没有提出足够的证据去证明 在这么长的时间里产生了什么样的损害。这是判决在损害以及双方困难的权衡 方面的主要论证。

其次,在接下来的部分,判决从胜诉可能性的角度进行论证,主要是针对 几个法律的适用问题。第一,领英主张 hiQ 继续访问会违反 CFAA 的规定,就是 说他未经授权侵入了受保护的计算机系统。法官认为,这里的关键问题是,在 领英通过发警告函明确禁止访问后,hiQ 继续抓取领英的公共数据是否构成 CFAA 规定的“未经授权访问计算机”。领英提出了两个案例(Power Ventures 案和 NosalⅡ案)来支持其观点,但法官认为,这两个案例与本案不同的地方 在于,其数据不是公开的,而是受密码验证系统保护的。法官认为,CFAA 中的 “未经授权”需要在历史背景下解释。从历史背景看,国会立法的目的是为了 处理非法侵入私人计算机、尤其是受密码保护的计算机的问题。法官认为,将本案的情形认定为“未经授权”事实上超出了立法目的,扩大解释了“未经授 权”的范围。判决还引用了 Orin Kerr 教授的观点,认为网络一般被认为是内 在的公开的(inherently open),如果要构成 CFAA 语境下的“未经授权访问计算机”,必须要有类似密码保护的验证系统。因此,法官认为,领英要求 hiQ 停止访问其网站的公开部分,并不会使 hiQ 的继续访问落入 CFAA 的规制范围。 第二,hiQ 主张领英的行为违反了加州宪法规定的言论自由。HiQ 之所以引用加 州宪法而非美国宪法第一修正案,是因为加州宪法规定的言论自由范围更加广泛,不只可以用来限制公权力机关,还可以用来针对私主体。在加州最高法院 判决的 Robins v. Pruneyard Shopping Ctr.案中,法院强调大商场作为公共 论坛的重要性,大商场不能阻止个人在其中进行政治演说等活动,也即言论自由优先于私人所有权。但本案的法官指出,目前还没有法院将 Pruneyard 这一 判例扩张到互联网领域,一旦扩张到互联网领域,可能会带来无法估量的后 果,因此法官秉承较为谨慎的态度,没有支持 hiQ 的这一主张。第三,hiQ 主 张领英的行为违反加州不正当竞争法。加州不正当竞争法规制的不正当竞争行 为不仅包括实际违反反垄断法的行为,也包括违反了反垄断法的政策或精神 (the policy or spirit of the Sherman Act)的行为。HiQ 主张领英的行为 从两方面违反了反垄断法的精神:一,领英不正当地利用其在职业社交市场的 权力来获得在数据分析市场上的限制竞争的优势;二,领英的行为违反了“必 要设施原则”。判决认可了 hiQ 的主张,认为 hiQ 证明了领英在职业社交市场 占有主导地位,并且试图在数据分析市场与 hiQ 开展竞争,而且领英发布竞品 与禁止 hiQ 抓取数据的时间大体一致。因此,法官认为领英禁止 hiQ 抓取其数 据的目的是为了消除 hiQ 这一数据分析市场的竞争对手,其行为很可能违反了 反垄断法的精神,从而违反了加州不正当竞争法。第四,hiQ 主张领英违反了 普通法上的禁反言原则。但判决中没有支持 hiQ 的这一主张,法官认为,用户 将自己的资料公开并不意味着他允许第三方以任何目的收集和使用其数据,领 英也没有向用户承诺他们的数据会被如此使用。综合上述对各种法律适用的分析,判决认为对胜诉可能性这一因素的分析对 hiQ 更加有利。

最后,判决从公共利益的角度进行了分析。案件双方都认为对自己有利的裁决更有利于公共利益,因为更有利于信息的自由流动。HiQ 认为,私主体不应当有权力限制他人获取公开的信息,否则它将有权决定谁可以参加互联网上的思想市场(marketplace of ideas)。领英认为,引起严重的宪法(言论自由)问题。领英则认为,如果用户知道他们的数据可以被第三方不受限制地收集和分析,他们将更加不愿意在网上公开这些信息,法院如果颁布禁制令会产生“寒蝉效应”。判决认为,从公共利益的角度的分析更加支持 hiQ 的主张, 一方面,领英用户对公开数据的隐私保护诉求是不确定的,另一方面如果适用 CFAA 来阻止第三方获取网络上的公开信息,会对互联网上的公共讨论和信息流 通造成威胁。综合四个因素方面的考虑,判决最终支持了 hiQ 的主张,要求领英取消对 hiQ 的技术措施,撤回警告函,并不得以同样理由发出警告函。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容