Google搜索反對人工干預搜索


Google搜尋演算法首席工程師阿米特·辛格(Amit Singhal)有在Google官方落部格網上對Google的搜尋排名演算法的原則進行了介紹,以下為辛格博客全文:

同年5月,Google工程副總裁尤迪·曼博(Udi Manber)對搜尋品質事業部進行了介紹,該事業部主要負責對搜尋結果進行排名,旗下包含多個團隊。其中,曼博談到了核心排名團隊、國際搜尋團隊、用戶介面團隊和評估等其他一系列團隊。在這裏,我重點談一下核心排名團隊。

首先自我介紹一下,我叫阿米特.辛格,在Google負責搜尋排名團隊,在Google從事搜尋業務已有8年。在學術界,搜尋被稱為資訊檢索。1990年我在讀研究生時就開始接觸搜尋,做了10年資訊搜尋研究員後,我於2000年加盟Google,一直從事搜尋排名工作至今。

Google搜素排名是一套演算法,用來查找與用戶查詢內容相關度最高的文檔。我們每天要對海量的網頁進行數億次的查詢,而每一次查詢都需要使用這套演算法。網頁搜尋是訪問量最高的搜尋服務,但其他搜尋業務也使用這套演算法,如圖片搜尋、新聞搜尋、地圖搜尋、產品搜尋和書籍搜尋等。 關於搜尋排名,人們問我最多的問題是:“你們是如何做這件事情的?”當然,首先要建立一套先進的排名系統,這點我在以後會詳細介紹。今天,我先簡單介紹一下Google搜尋排名:

1、全球相關性最高的搜尋引擎

2、簡單易用

3、無需人工干預

第一點很明顯,鑒於我們對搜尋業務的激情,我們絕對要確保每位用戶獲得相關度最高的搜尋結果,我們將其稱之為“不落後”原則。對於來自任何國家、任何語言的搜尋,如果提供的搜尋結果關聯度不高,就會激勵我們進行改進。

第二點也很明顯,每個系統架構師不都希望自己的系統簡單易用嗎?搜尋系統同樣如此,但我們需要處理來自全世界多種語言的搜尋,因此很容易使系統變得很複雜。在這方面,在保證搜尋品質的前提下,我們儘量保持系統的簡易性。這是一件需要持續改進的工作,也是值得做的事情。每週,我們要對排名系統進行10次改進,每一次都要確保簡單性。這套簡單易用的系統同時還有利於創新,事實也證明了這一點。因此,簡單易用很重要。

談到搜素排名,如果不談“是否進行人工干預”那將是不完整的討論。 Google搜尋演算法本身就是人類智慧的結晶,但最終對搜尋結果進行排名的是搜尋演算法,而無需人工干預。我們認為,任何個人的主觀判斷都具有個人主觀性,因此,通過搜尋演算法自動排名比人工干預更適合。

此外,我們反對人工干預的第二個原因是,一次失敗的查詢結果就意味著我們需要對搜尋演算法進行改進。改進搜尋演算法不只是提高一次搜尋查詢結果,而是整個查詢結果,且針對全部語言。這裏還要補充一點,我們對所推薦的網站有明文規定,對於一小部分違反政策的網站我們將採取行動,如違法、具有兒童色情內容、存在病毒和惡意軟體的網站等。