3B大戰(zhàn)牽出Robots疑云 360搜索用戶數(shù)回落
作者:網(wǎng)絡(luò)轉(zhuǎn)載 發(fā)布時間:[ 2012/9/7 10:06:20 ] 推薦標(biāo)簽:
一個是搜索引擎市場具有壟斷地位的巨頭,一個是頗具爭議的闖入者,這場圍繞搜索引擎的“3B大戰(zhàn)”進入了第二個回合:釣魚。
幾天前,百度工程師放出“鬼節(jié)捉鬼”的釣魚策略,將爭論引向一直以隱私安全為底牌的360。問題出在一個叫做Robots的協(xié)議上。360被指不遵守協(xié)議,直接用瀏覽器抓取用戶瀏覽信息,可能致使用戶信息泄露。“3B大戰(zhàn)”的對手百度等互聯(lián)網(wǎng)公司發(fā)出了要求員工卸載360瀏覽器的號召,搜狗CEO王小川也表示應(yīng)遵守Robot協(xié)議,擔(dān)心360在安全上做裁判又做球員。
CNNIC新的統(tǒng)計數(shù)據(jù)顯示,360搜索覆蓋中國網(wǎng)民比例已由上周的13.04%降為11.61%,覆蓋人數(shù)由3420萬降為3052萬,近一周時間,損失用戶達368萬。
3B大戰(zhàn)第二回合,落在了瀏覽器端直接搜集網(wǎng)頁信息的爭議上!睹咳战(jīng)濟新聞》在調(diào)查中發(fā)現(xiàn),Robots協(xié)議被瀏覽器開發(fā)人員視為“Google自己制定的協(xié)議規(guī)范”,“連行業(yè)規(guī)范都算不上”,搜索引擎對用戶隱私權(quán)的定義,目前還是空白。
百度非原創(chuàng)式捉“鬼”
8月31日,一則由百度工程師發(fā)布的微博引發(fā)了業(yè)內(nèi)的廣泛討論。
這位名叫趙明華的百度互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)部經(jīng)理稱,百度的工程師制作的幾個特殊頁面沒有任何外鏈,由于搜索引擎爬蟲只能通過鏈接爬行網(wǎng)頁,因此這個網(wǎng)頁是完全封閉的 “孤島”,不可能被搜索引擎抓取到。但令人意外的是,百度工程師試著在360搜索中輸入以上關(guān)鍵詞,結(jié)果這個網(wǎng)頁赫然出現(xiàn)在搜索結(jié)果第一行,并可以直接點擊訪問瀏覽網(wǎng)頁內(nèi)容。但再換百度、谷歌、搜狗、搜搜等其他瀏覽器搜索相同內(nèi)容,卻無法返回相應(yīng)網(wǎng)頁。
為什么一個完全封閉的網(wǎng)頁竟然能被360搜索引擎抓取到?趙明華的解釋是,他曾用360瀏覽器打開過這個網(wǎng)頁。在360瀏覽器的隱私策略中,注明了360安全瀏覽器會在用戶的計算機上記錄有關(guān)瀏覽歷史記錄的實用信息。
百度認為,百度釣魚流程揭示了360搜索存在安全隱患:只要用戶通過360瀏覽器訪問過一個網(wǎng)頁,無論是私人賬號信息,還是公司內(nèi)網(wǎng)機密數(shù)據(jù),都會被360瀏覽器記錄下來,并被360搜索爬蟲抓取、上傳到360服務(wù)器。
不過,360卻有著自己的說法。360在官方微博上指出,百度以所謂的“孤島”數(shù)據(jù)污蔑360泄露用戶隱私。其實百度的做法很簡單,只要通過外部鏈接引導(dǎo)360爬蟲抓取頁面,同時屏蔽其他搜索引擎,然后切斷外鏈,可以造成只有360搜索收錄所謂“孤島”的假象。
9月2號,360董事長周鴻?對此回應(yīng),“這是百度在濫用Robots協(xié)議,阻礙360進入搜索市場。”
百度“鬼節(jié)抓鬼”的行為,在互聯(lián)網(wǎng)界并非首例。2011年初,谷歌由于懷疑必應(yīng)借鑒其搜索結(jié)果,也采取過這種做法。
2010年10月份,谷歌注意到Bing的搜索結(jié)果越來越多地和谷歌重合,頭條結(jié)果相同的趨勢也越來越高,由此必應(yīng)抄襲了他們的搜索結(jié)果。
為了驗證猜想,谷歌在去年12月進行了一場釣魚行動。他們選擇了100個異常釣餌進行手動搜索排名,將這些關(guān)鍵詞的搜索結(jié)果指向毫無關(guān)聯(lián)的頁面。當(dāng)時約20位谷歌工程師在電腦上使用IE瀏覽器來搜索這些關(guān)鍵詞,然后通過IE在谷歌上搜索這些釣餌,誘使必應(yīng)上鉤。兩周后,谷歌工程師再通過必應(yīng)搜索當(dāng)時的釣餌,預(yù)先埋下的結(jié)果開始陸續(xù)出現(xiàn)在必應(yīng)結(jié)果中,由此發(fā)現(xiàn)必應(yīng)通過IE收集用戶上網(wǎng)的隱私數(shù)據(jù),直接記錄上傳了用戶訪問網(wǎng)址并隨后放入搜索結(jié)果中。
搜索引擎與商業(yè)網(wǎng)站博弈
趙明華稱,360繞過了Robots協(xié)議,利用瀏覽器記錄并上傳用戶數(shù)據(jù)和上網(wǎng)行為,并形成自己的網(wǎng)址庫,再用偽裝和隱藏過的爬蟲來抓取快照,生成搜索結(jié)果。
那么,從瀏覽器端直接搜集網(wǎng)頁信息是否正當(dāng)?
實際上,Robots協(xié)議并非強制性法規(guī),而是搜索引擎誕生后,互聯(lián)網(wǎng)業(yè)界經(jīng)過長期博弈,終在搜索引擎與商業(yè)站點、公眾知情權(quán)和用戶隱私權(quán)之間達成的一種妥協(xié)。
據(jù)《每日經(jīng)濟新聞》了解,早期的互聯(lián)網(wǎng)主要是“用戶-網(wǎng)站”模式。用戶通過網(wǎng)站獲取信息,網(wǎng)站通過吸引用戶點擊來實現(xiàn)廣告收入。不過,當(dāng)谷歌把搜索引擎變成一種成功的商業(yè)模式之后,很多網(wǎng)站原有的商業(yè)模式遭到了嚴(yán)重破壞。
為了維護自身的利益,一些歐美大型網(wǎng)站聯(lián)合起來與谷歌談判,要求谷歌“有所為有所不為”,于是有了Robots協(xié)議。該協(xié)議的核心思想是要求Robots程序不要去檢索那些站長不希望被直接搜索到的內(nèi)容,并將約束Robots程序的具體方法規(guī)范成格式代碼,成了Robots協(xié)議。一般來說,網(wǎng)站是通過Robots.txt文件來實現(xiàn)Robots協(xié)議。
國內(nèi)使用Robots協(xié)議典型的案例是淘寶網(wǎng)拒絕百度搜索。此外還有大量的用戶注冊、郵件等信息,都利用Robots協(xié)議來防止這些內(nèi)容在互聯(lián)網(wǎng)上被搜索到。
相關(guān)推薦
相關(guān)產(chǎn)品

最新發(fā)布
性能測試之測試環(huán)境搭建的方法
2020/7/21 15:39:32軟件測試是從什么時候開始被企業(yè)所重視的呢?
2020/7/17 9:09:11Android自動化測試框架有哪些?有什么用途?
2020/7/17 9:03:50什么樣的項目適合做自動化?自動化測試人員應(yīng)具備怎樣的能力?
2020/7/17 8:57:06幾大市面主流性能測試工具測評
2020/7/17 8:52:11RPA機器人能夠快速響應(yīng)企業(yè)需求,是怎么做到的?
2020/7/17 8:48:05Bug可以真正消滅嗎?為什么?
2020/7/17 8:43:03軟件測試基本概念是怎么來的?軟件測試生命周期的形成歷經(jīng)了什么?
2020/7/16 9:11:10