技術(shù)無罪?江湖傳言,互聯(lián)網(wǎng)上50%以上的流量都是由爬蟲創(chuàng)造的,很多人都表示:無爬蟲就無互聯(lián)網(wǎng)的繁榮。也正因?yàn)榇?,網(wǎng)上各種爬蟲教程風(fēng)靡不絕,惹各路大神小白觀之參與之。但是,無節(jié)制的背后往往隱藏著風(fēng)險(xiǎn),類似“只因?qū)懥艘欢闻老x,公司200多人被抓!”、“程序員爬蟲竟構(gòu)成犯罪?”等報(bào)道也時(shí)有發(fā)生。關(guān)于爬蟲合法性的討論,CSDN也在此前的《爬蟲到底違法嗎?這位爬蟲工程師給出了答案》、《不要在爬蟲犯罪的邊緣瘋狂試探!》等文章中進(jìn)行了探討——但是,關(guān)于爬蟲的爭論一直甚囂塵上。
近日,美國法院駁回 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴一事件,似乎又為網(wǎng)絡(luò)爬蟲的自由添磚加了瓦。決議表明:任何可公開獲得且未經(jīng)版權(quán)保護(hù)的數(shù)據(jù)都可供抓??!可以說,這是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時(shí)代的歷史性時(shí)刻。那么,作為開發(fā)者的你,如何看到這一事件呢?關(guān)于爬蟲的風(fēng)險(xiǎn)性又該怎么定論?
2019年末,美國上訴法院駁回了 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴。
這項(xiàng)決議是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時(shí)代的歷史性時(shí)刻。這項(xiàng)決議表明,任何可公開獲得且未經(jīng)版權(quán)保護(hù)的數(shù)據(jù)都可供網(wǎng)絡(luò)爬蟲自由抓取。
但是抓取數(shù)據(jù)的商業(yè)用途仍然有限
然而,這項(xiàng)決議并沒有授予 HiQ 或其他網(wǎng)絡(luò)爬蟲將抓取獲得的數(shù)據(jù)用于商業(yè)目的的自由。
例如,網(wǎng)絡(luò)爬蟲可以在 YouTube 上搜索視頻標(biāo)題,但由于這些視頻已獲得版權(quán),因此不可以將 YouTube 視頻轉(zhuǎn)發(fā)到自己的網(wǎng)站上。
一般來說,無論你以何種方式獲取數(shù)據(jù),數(shù)據(jù)(包括視頻或音樂之類的媒體文件數(shù)據(jù))的版權(quán)依然有效。
某些形式的網(wǎng)頁爬蟲仍然是非法的
這項(xiàng)決議也沒有賦予網(wǎng)絡(luò)爬蟲自由地從需要身份驗(yàn)證的站點(diǎn)獲取數(shù)據(jù)的權(quán)利。
例如,根據(jù)規(guī)定網(wǎng)絡(luò)爬蟲不可以登錄到 Facebook 并下載用戶的數(shù)據(jù)。
該規(guī)則不包括那些要求用戶在認(rèn)證之前必須同意使用條款的網(wǎng)站,因?yàn)橥ǔ_@些服務(wù)條款都會(huì)禁止諸如自動(dòng)收集數(shù)據(jù)之類的活動(dòng)。
但是,由于公開站點(diǎn)無法要求用戶在訪問數(shù)據(jù)之前同意任何服務(wù)條款,因此用戶可以自由使用網(wǎng)絡(luò)爬蟲程序從站點(diǎn)收集的數(shù)據(jù)。
各個(gè)網(wǎng)站仍然可以使用技術(shù)來限制網(wǎng)絡(luò)爬蟲
盡管如今各個(gè)公司不太可能通過法律途徑應(yīng)對網(wǎng)絡(luò)爬蟲程序,但他們?nèi)匀豢梢酝ㄟ^其他方式限制網(wǎng)絡(luò)爬蟲。
例如,各個(gè)網(wǎng)站可以使用“限速”等技術(shù)來防止爬蟲程序一次下載太多網(wǎng)頁。此外,各個(gè)網(wǎng)站還可以使用 CAPTCHA 等技術(shù)來測試是用戶還是網(wǎng)絡(luò)爬蟲正在請求該頁面。
這些技術(shù)通常用于防止惡意機(jī)器人導(dǎo)致網(wǎng)站超載,引起網(wǎng)站崩潰。但是,這些技術(shù)也可以廣泛用于限制網(wǎng)絡(luò)爬蟲的自動(dòng)抓取。
LinkedIn可能會(huì)進(jìn)一步上訴
盡管美國上訴法院駁回了LinkedIn的請求,但他們可能還有最后一步棋:向美國最高法院提出上訴。
美國最高法院有權(quán)推翻上訴法院的判決,而且還可以撤銷網(wǎng)絡(luò)爬蟲公開使用非版權(quán)數(shù)據(jù)的合法化。但是,并非所有上訴至最高法院的決定都能得到實(shí)際的審查。
但是,我們?nèi)匀豢梢哉J(rèn)為最高法院很可能會(huì)審查本案的裁決。畢竟數(shù)據(jù)政策和相關(guān)的隱私問題是相對較新的法律,而且會(huì)對 LinkedIn 等公司產(chǎn)生重大的商業(yè)影響。
-
Web
+關(guān)注
關(guān)注
2文章
1272瀏覽量
69759 -
爬蟲
+關(guān)注
關(guān)注
0文章
82瀏覽量
7023
發(fā)布評論請先 登錄
相關(guān)推薦
ADS8556電路,測干電池電壓得到的結(jié)果有上下0.01V的偏差,是不是太大了?
DAC80004的轉(zhuǎn)換速率是不是用setting time這個(gè)參數(shù)來衡量
IP地址數(shù)據(jù)信息和爬蟲攔截的關(guān)聯(lián)
揭秘貼片功率電感發(fā)燙究竟是不是燒壞了
詳細(xì)解讀爬蟲多開代理IP的用途,以及如何配置!
THS3091放大了脈寬是1ns的脈沖,脈沖的脈寬展寬,是不是THS3091的壓擺率不夠?
谷景告訴你屏蔽繞線功率電感是不是感量越大性能越好
STM32G0如果只執(zhí)行寫保護(hù)編程時(shí),先擦除選項(xiàng)字節(jié),此時(shí)讀保護(hù)字節(jié)是FF,那是不是就讀保護(hù)生效了?
STM32的USB速度提不上去是怎么回事?
STVD是不是不支持C99?
請問STM32Cube包含的FATFS例程是不是已經(jīng)支持8G以上的SD卡了?
STM32F207V FSMC是不是上電運(yùn)行后就應(yīng)該用示波器測量能夠在PB7管腳上測量到一個(gè)鎖存信號(hào)了?
一文看懂插件環(huán)形電感線圈究竟是不是隨便繞的
![一文看懂插件環(huán)形電感線圈究竟<b class='flag-5'>是不是</b>隨便繞的](https://file1.elecfans.com//web2/M00/C3/E0/wKgZomXvEVCAHAw-AABRcrePJbw02.webp)
評論