一、基本信息
(一)案例信息
司法辖区:美国
审理机关:美国加利福尼亚北区联邦地区法院
案件编号:17-cv-03301-EMC
主审法官:Edward M. Chen
纠纷类型:侵权及不正当竞争
产业分布:数据产业
判决日期:2022年11月4日
审理结果:驳回原告的动议;部分同意并部分驳回被告的动议
(二)涉案当事人信息
原告:hiQ Labs, Inc.
被告:LinkedIn Corporation
二、案件背景
LinkedIn是一家职业社交网络平台,在全球拥有超过8.5亿的注册用户。LinkedIn允许用户设置他们的个人信息公开级别,如果用户将信息设置为任何人可见,那么其他人无需登录LinkedIn网站即可查看该用户的教育背景、工作经历等资料。LinkedIn认为抓取(scraping)是一种使用自动化手段从网站上提取信息的过程,对它和它的会员不利,专门成立了一个团队来防止抓取行为,并设置了相应拦截机制。如果想要抓取数据,则必须获得LinkedIn的授权并遵守其有关规定。
hiQ是一家数据分析公司,为企业提供员工资料。它开发了“Keeper”和“Skill Mapper”两款产品来帮助企业分析员工流动趋势,制定用人计划。hiQ公司的数据来源主要是LinkedIn网站上的完全公开的个人信息,且自2014年起一直在规避LinkedIn网站设置的技术措施。hiQ还雇佣了被称为“turker”的独立第三方在“登录”LinkedIn时手动查看和确认hiQ客户的员工信息以保证产品质量。当turker的真实账户被LinkedIn屏蔽时,hiQ还指示他们创建虚假账户。
hiQ每年都会组织产品会,邀请参会者分享数据、分析领域的实践经验。至少从2014年起,LinkedIn派人参加该产品会。2017年5月,LinkedIn向hiQ发送了警告信函,指控hiQ未经授权抓取数据的行为违反了法律,并表明已经采取了技术措施禁止hiQ访问其网站。hiQ要求LinkedIn承认其拥有访问公共页面的权利,并向美国加利福尼亚北区联邦地区法院(以下简称“加州北地区法院”或“法院”)提起诉讼,寻求禁令救济并主张LinkedIn构成侵权干扰以及不正当竞争,同时请求法院作出初步禁令。
三、本案之前的诉讼程序
2017年8月14日,加州北地区法院支持了hiQ的初步禁令请求,认为hiQ证明了其遭受“不可弥补的损害”的可能性,因为其企业的生存正面临威胁;而LinkedIn禁止hiQ抓取其网站上的用户信息获得的利益并没有超过hiQ继续经营能得到的利益。另外,基于公共利益的考量,如果允许LinkedIn这样的公司自由决定谁可以获取以及使用原本向公众公开的数据,会有造成信息垄断的风险。因此,加州北地区法院命令LinkedIn撤回警告信,移除任何会使hiQ无法访问LinkedIn网站用户公开资料的技术壁垒,并且未来也不得继续设置这样的法律和技术障碍。
LinkedIn向美国联邦第九巡回上诉法院(以下简称“第九巡回上诉法院”)就上述初步禁令提起上诉。2019年9月,第九巡回上诉法院维持了加州北地区法院的决定。随后,LinkedIn向美国最高法院(以下简称“最高法院”)申请了调案复审令。2021年,最高法院批准了该复审令,裁决撤销原判并发回第九巡回上诉法院参照Van Buren v. United States一案进行重审。2022年4月,第九巡回上诉法院再次维持了原判,认为Van Buren案恰恰为上诉法院之前的决定提供了有力支持。
四、本案的法律分析
(一)本案的提起
2022年8月,LinkedIn发现hiQ不再继续经营,认为重大事实发生了改变且有必要解除禁令,因此向加州北地区法院提出了解除初步禁令的请求,加州北地区法院同意了该请求并解除了初步禁令。本案是加州北地区法院对原告的其余诉讼请求以及被告在反诉中的诉讼请求作出的判决。
(二)LinkedIn方的简易判决动议
LinkedIn在其简易判决动议中的请求包括:(1)请求法院就hiQ的违约责任作出部分简易判决;(2)请求法院就hiQ方主张的侵权索赔事项作出简易判决。LinkedIn主张了加州诉讼特权来禁止这些索赔,并主张hiQ无法证明侵权索赔所需的要素。
1. hiQ的违约责任
LinkedIn主张,hiQ抓取和使用LinkedIn平台用户数据来销售产品以及指示第三方通过创建虚假账户复制LinkedIn网站数据的行为违反了LinkedIn平台的用户协议。
(1)hiQ对数据的使用和抓取行为
LinkedIn认为,其平台的用户协议明文禁止了对其网站数据的抓取行为,并且明确描述了用户的权利义务。hiQ辩称,用户协议的表述存在歧义,协议的不同条款之间存在矛盾。hiQ主张抓取数据就是一种访问和复制LinkedIn用户信息的方式,因此协议中“当您分享信息,其他人可以浏览、复制并使用这些信息”以及“访客可能会在您设置的权限范围内访问并分享您的信息”这些表述与禁止抓取数据的规定相矛盾。法院认为,告知用户其数据可能会被浏览、复制和使用与禁止抓取数据的规定并不冲突。这两个概念并不相互排斥,警示用户第三方可能收集他们选择公开的数据并不意味着第三方可以通过被明令禁止的方式进行数据收集。因此,LinkedIn平台的用户协议的用语本身并不存在歧义。
hiQ还辩称,有旁证显示LinkedIn的一些行为表明抓取并没有被其明确禁止。LinkedIn员工的内部邮件透露出LinkedIn“一般不会追究公共抓取行为”。LinkedIn自己也会抓取其竞争对手的网站数据,且LinkedIn的母公司也在抓取LinkedIn平台的数据。而LinkedIn未采取措施更是表明协议并不禁止抓取行为。法院认为,只有在证明语言“可合理接受”的含义时,旁证才可被采纳。hiQ提供的旁证并不能否定或削弱用户协议的明文条款,且LinkedIn未遵守或未执行协议也并不与协议条款矛盾,更不会导致协议条款产生歧义。
综上,法院认为LinkedIn平台的用户协议的有关表述明确禁止了hiQ抓取数据和未经授权使用其抓取的数据的行为。
(2)hiQ指示第三方创建虚假账户复制数据的行为
hiQ辩称其并不需要为第三方的行为承担责任,因为没有证据表明第三方抓取了任何资料信息,且第三方是独立承揽人,hiQ无需对其行为负责。同时,也没有证据表明存在任何实际损害。
法院认为,首先,第三方在hiQ的指示下违反用户协议,在LinkedIn平台上注册了虚假账户,这一点是无可争辩的。hiQ曾在文件中明确表示过“可以使用虚假电邮创建虚假账户来避免被LinkedIn平台禁用”,而第三方遵照了这一指示。双方都违反了用户协议。
其次,即使第三方是独立承揽人,hiQ也不能就此逃避责任,因为第三方同样也是hiQ登录LinkedIn平台的代理人。承揽人和代理人的区别主要就在于控制保留的程度。本案中,很显然hiQ保留了对第三方登录事项的高度控制,指导第三方如何进行相应操作,而hiQ对此没有提出相反证据。
最后,法院认为,尽管hiQ主张LinkedIn没有因第三方的行为遭受任何损害,但在合同违约案件中,没有遭受显著损害的原告可以主张象征性赔偿损害。
综上,法院认为hiQ指示第三方创建虚假账户复制数据的行为违反了LinkedIn的用户协议。
(3)hiQ方的积极性抗辩
① 不洁的手
hiQ抗辩称,LinkedIn主张违约的目的是为了阻止hiQ访问数据并让hiQ破产。法院认为,“不洁的手”在加州是一项适用于合同违约的积极性抗辩。判断LinkedIn的行为是否构成不洁的手需要考虑以下三点:第一,存在类似的判例法;第二,行为本身构成不当行为;第三,不当行为与损害之间存在因果关系。只有上述三点同时满足,才能判定“不洁的手”抗辩成立。本案中,hiQ没有援引类似的判例法,仅凭这一点就足以驳回hiQ的“不洁的手”之抗辩。
② 权利放弃
hiQ抗辩称,LinkedIn早在2014年10月就知道了其抓取和使用数据的行为,但一直没有采取措施,还派人参加了hiQ的会议,表明LinkedIn已经放弃了合同权利,其不能主张hiQ违约。法院认为,没有证据表明LinkedIn知晓hiQ指示第三方在其平台创建虚假账户的行为,因此LinkedIn没有放弃合同中阻止虚假账户的行为的权利。法院仅针对hiQ抓取和使用数据行为支持了hiQ的该项抗辩。
③ 禁反言
根据Lentz v. McMahon一案,禁反言需要满足四个条件:第一,被禁反言的一方必须知晓事实;第二,被禁反言的一方必须有意将其行为付诸行动,或其行为必须使主张禁反言的一方有权利相信其意图如此;第三,另一方应当不了解真实情况;第四,被禁反言的一方依赖该行为造成损害。
法院认为在本案中,hiQ抓取并使用数据的行为在上述四个要素上仍然存在重大事实争议。LinkedIn可能在2014年就知道了hiQ的抓取行为,其派人参加hiQ产品会的行为,让hiQ认为LinkedIn默许了hiQ规避其平台防止抓取行为的机制。因此,法院支持了hiQ对于其抓取和使用数据的行为的禁反言抗辩。
至于hiQ指示第三方的行为,由于LinkedIn并不知晓该行为,法院不支持hiQ对于该行为提出的禁反言抗辩。
④ 显失公平
hiQ抗辩称,用户协议在程序和实质两方面都存在显失公平。hiQ认为,“LinkedIn禁止复制资料”与“仅访问网站”不能兼容,因为网站无法区分请求来自于浏览网页的人还是抓取信息者。因此,每个访问LinkedIn网站的人都违反了禁止通过任何技术复制资料的规定,LinkedIn的用户协议存在实质上的显失公平。法院认为,hiQ就一种不适用于本案的情形,即仅访问LinkedIn网站做出了显失公平的抗辩,试图让法院将用户协议解读为禁止任何人使用LinkedIn的服务,而这种解读是任何一个理性的人都不会作出的。因此,hiQ未能证明用户协议存在实质显失公平,法院就无需再考虑程序方面的问题,法院最终未支持hiQ的该项抗辩理由。
(4)法院的结论
综上所述,法院认定hiQ指示第三方创建虚假账户抓取信息的行为构成违约,而其抓取和未授权使用信息的行为不构成违约,因此部分支持了LinkedIn对主张违约责任的请求。
2. 加州诉讼特权
加州诉讼特权是Cal. Civ. Code第47条(b)项的规定,主要内容为司法程序或其他官方正式程序中进行的通信享有诉讼特权,该行为不会产生侵权责任。
LinkedIn诉称,hiQ主张的侵权和不正当竞争索赔受到了Cal. Civ. Code第47条(b)项规定的加州诉讼特权的阻止,因为hiQ主张的损害是由LinkedIn向其发送的警告信导致的,而警告信是为可能发生的诉讼所作出的沟通。hiQ则回应称该条法律规定不适用,因为警告信不是其遭受损害的唯一原因,而且是LinkedIn反竞争计划的一部分,并主张法院应当适用努艾尔—本宁顿规则(Noerr-Pennington doctrine)。
法院比较了原被告各自主张的两条法律规则,认为努艾尔—本宁顿规则的本质是那些起诉政府部门要求赔偿的人,就其起诉行为免于承担法定责任。加州诉讼特权适用于任何符合下列条件的通信:(1)在司法或准司法程序中进行;(2)由诉讼当事人或法律授权的其他参与者进行;(3)为实现诉讼目的而进行;(4)与诉讼存在某种联系或逻辑关系。加州诉讼特权的适用范围更广,且不考虑行为人的动机、意图和道德因素。本案中,LinkedIn诉前的警告信函可能属于加州诉讼特权的适用范围,但需满足其他要求,即通信必须与即将发生的诉讼或司法程序有一定的关系,而该诉讼和司法程序是出于解决争议的“善意”而并非仅仅为了谈判达成和解而采取的策略。
法院审查了该“善意”要求。法院认为hiQ没有提供任何证据证明LinkedIn在发送警告信时存在恶意或不开启诉讼的目的。而该警告信是经由LinkedIn的律师发出的,证明LinkedIn了解该信函的法律意义,并对后续的诉讼已经有了预期。因此,LinkedIn的行为符合“善意”要求。
法院进一步认定了LinkedIn行为的性质,认为该行为确属“沟通”性质。区分“沟通”与“非沟通”取决于控诉要旨。认定加州诉讼特权是否适用的关键在于判断损害是否是由具有沟通性质的行为导致的。法院认为在本案中,hiQ的损害是由于LinkedIn发出的警告信函导致的,而该信函正是诉讼的控诉要旨。
综上,法院认为加州诉讼特权适用于本案,因而支持了LinkedIn的主张,驳回了hiQ的侵权索赔主张及不正当竞争。
(三)hiQ方的简易判决动议
hiQ在其简易判决动议中主张LinkedIn基于CFAA提出的诉讼请求已经超过了两年的诉讼时效。hiQ根据LinkedIn员工内部的两封邮件链,认为LinkedIn在2014年就知道了hiQ其抓取行为,比提起诉讼的2017年早了两年多。LinkedIn则就员工是否实际知晓提出了异议。即使员工注意到了抓取行为的存在,也不能代表公司知道了该行为。
法院认为,hiQ的主张不一定能得到支持,除非能推断LinkedIn在2015年6月7日前知道或应当知道其因hiQ的抓取行为遭受了损害。法院采用了O’Connor v. Boeing N. Am., Inc.一案确立的两步分析法来认定LinkedIn是否能合理提出其诉讼请求。首先,是否有站在LinkedIn立场上的理性人注意到损害并询问损害发生的原因。其次,如有上述情况,判断该询问是否能揭示损害的原因和本质,LinkedIn是否将其写进了诉讼请求里。法院认为,hiQ提供的2014年10月和2014年12月的邮件链并不能证明上述两点,因此不支持hiQ超过诉讼时效的主张。
(四)LinkedIn方进行证据制裁的动议
该制裁动议与hiQ在AWS与Splunk的云服务器上存储的数据证据有关。hiQ丢失了存储在这两个服务器上的大部分数据。前者的服务器上的数据包含了hiQ从LinkedIn平台上抓取的实际信息;后者的服务器上的数据则记录并保存了hiQ每次的抓取数据尝试及其失败率。LinkedIn要求法院对hiQ丢失证据的行为作出制裁。
2015年修正的《联邦民事诉讼程序规则》(以下简称《民诉程序规则》)第37条(e)款规定:“……(e)未能保存电子存储信息。如果由于一方当事人未采取合理措施,导致本应在预期诉讼前或诉讼过程中保存的电子存储信息丢失,且这些信息不能通过额外的发现来恢复或替代,则法院应当:(1)在发现另一方当事人因信息的丢失而受到损害时,可命令采取不超过补救该损害所必需的措施;或(2)只有在发现一方当事人的行为意在剥夺另一方当事人在诉讼中使用该信息的权利时,采取如下措施:(A) 推定丢失的信息对当事人不利;(B)指示陪审团可以或必须推定该信息对当事人不利;或(C)驳回诉讼或做出缺席判决。”
hiQ对其负有保存数据的义务,且永久失去了争议数据并没有异议。因此,法院对如下事项进行了分析:(1)根据《民诉程序规则》第37条(e)款(2)项,hiQ是否具有剥夺LinkedIn在本案中使用该信息的意图;(2)根据《民诉程序规则》第37条(e)款(1)项,证据灭失是否对LinkedIn造成了损害;(3)如需制裁,应当采取何种制裁措施。
1. 没有充分证据证明hiQ具有可依据第37条(e)款(2)项进行制裁的必要意图
第37条(e)款(2)项并未要求法院审查LinkedIn是否受到了损害,因为如果能认定hiQ存在法律规定的意图,那么就可以推断LinkedIn受有损害。本案的双方当事人都认可hiQ是出于故意未保留有关证据,但对这一行为是否足以证明存在“剥夺LinkedIn在诉讼中使用该信息的权利的意图”存在分歧。法院认为,hiQ明知而不保存数据的行为本身并不能证明“剥夺意图”;换句话说,“剥夺意图”不能仅通过hiQ是否对销毁证据知情来证明。
此外,法院认为有直接和间接证据表明hiQ丢失数据是出于疏忽或降低成本的目的。首先,hiQ陷入了财务困境,无力支付使用服务器的费用,因此失去了服务器账户。尽管hiQ的财务状况不能免除其保存证据的责任,但可以表明它丢失证据并不是为了剥夺LinkedIn使用信息的权利。其次,hiQ并未在诉讼一开始就急于删除证据,而是在诉讼开始多年后才开始删除,因此,其证据丢失的时间可以表明hiQ缺乏“剥夺意图”。最后,hiQ曾尝试恢复其在AWS和Splunk两服务器上的数据,尽管这些尝试基本没有成功,但可以说明hiQ并未打算向LinkedIn隐瞒证据。
综上,法院认为hiQ的行为并非出于剥夺LinkedIn有关权利的意图,而更像是疏忽。法院援引了Meta Platforms, Inc. v. BrandTotal Ltd.一案,认为“疏忽,即使是严重疏忽,也不足以依据第37条(e)款(2)项规定作出不利推论”。因此,法院认定没有足够的证据证明hiQ的行为存在必要的意图而应受到第37条(e)款(2)项的制裁。
2. 根据第37条(e)款(1)项,hiQ的证据灭失对LinkedIn造成了损害
法院认为,hiQ数据的丢失导致无法对其抓取请求量和被屏蔽的次数进行准确认定。没有这些数据,LinkedIn必须通过其他手段来预估这些数据。尽管hiQ主张LinkedIn可以通过自己服务器上的数据来计算,但没有指明具体的计算方式。因此,法院认可了LinkedIn的专家证言,即LinkedIn本可以从丢失的数据中取得更准确的抓取记录。
此外,数据丢失还使得LinkedIn受到了经济损害,因为它不得不付费让专家和顾问来分析hiQ的原始数据,并利用内部人力资源,花费大量的时间进行计算。
综合上述分析,法院部分支持了LinkedIn的制裁动议。
(五)法院的审理结果
主审法官依据加州法律做出了如下认定:(1)LinkedIn平台用户协议的条款不存在歧义;(2)hiQ证明其行为未被用户协议禁止的外在证据不具有可采性;(3)hiQ指示第三方创建虚假账户违反了用户协议;(4)hiQ指示的第三方为其代理人;(5)hiQ应当承担违约责任,即使LinkedIn并未遭受实际损失;(6)hiQ的“不洁之手”抗辩不成立;(7)对于LinkedIn是否知道hiQ的抓取操作仍存在争议。
最终,加州北地区法院部分支持并部分驳回了LinkedIn在简易判决动议中提出的请求,部分支持了LinkedIn的制裁动议,并驳回了hiQ在简易判决中提出的请求。
五、启示
HiQ诉LinkedIn网络爬取个人信息纠纷一案自2017年开始经历了漫长的诉讼程序。本案的判决是美国加州北地区法院在2022年8月解除初步禁令后,对hiQ与LinkedIn之间的其他未决诉求作出的。但由于该判决由地区法院作出,因此判决结果仅对加州法院生效,对其他州法院仅具有参考价值,并不产生约束力。数据爬取行为在美国其他地区的法院如何被认定,仍需要根据更多的判决来确定。
数据爬取技术在网络信息资源迅猛增长的当下已经成为了非常普遍的搜索技术,但无论是对该技术本身的使用,还是对爬取后得到的数据的使用,都存在一定的法律风险。比如,使用数据爬取技术有可能造成对计算机信息系统的破坏,甚至构成犯罪;使用爬取得到的数据可能会对知识产权和公民的隐私权造成侵害。但数据作为驱动企业创新的重要资源,考虑到维护公平、自由的市场竞争秩序,不应当随意禁止数据爬取行为。因此,规制数据爬取行为应当考虑数据合理保护与防止数据垄断之间的平衡。
数据爬取行为的法律边界仍是一个需要深入讨论的问题,相关法律法规也亟待完善。企业如要主张他人的爬取行为非法以及其对网络平台的数据的合法权益,应当自发现他人行为后尽早提起有关诉讼,并可以参考本案,从违约责任、不正当竞争等角度制定合适的诉讼策略。
-
近年来,NFT交易兴起成为热门,在国内外引起了不少的关注。2021年3月,艺术家Beeple将他的作品《Everydays: The First 5000 Days》(《每一天:前5000天》...2025.05.12
-
近日,国家税务总局开办的《中国税务报》刊登了高文大连办公室合伙人于荣年律师与税局业务骨干、税院老师合作撰写的原创文章《合同视角分析:直播打赏收入...2025.05.09
-
2025年4月29日,国务院总理李强签署国务院令,公布修订后的《中华人民共和国植物新品种保护条例》(以下简称《条例》),标志着我国植物新品种保护制度进入...2025.05.06
国内有影响力的优秀律师,提供全方位、多领域、高质量的专业法律服务,始终不负所托。