微軟+Powerset就能擊敗Google

微軟購買火熱的創業公司powerset有何計畫?這個3歲的公司由巴尼 佩爾博士創辦,並於最近啟動了針對維琪百科的語義搜索體驗。   

人們懷疑微軟買下這個公司不是僅為加強其搜索業務的。很可能是複製維琪百科解決方案,把powerset插入流覽器中,在這篇博客裏我們看一下這起並購背後的故事。

開始的大多數評論認為powerset產品發佈並沒有給人留下深刻印象。評論家欣賞有創新性的語義用戶介面也認識到其潛力,但認為它不會在很大程度上改善維琪百科。所以從冷淡的評論來看,被微軟收購出於意料。10億的價格標籤大約是將5倍於A系列的12億再加8億的投資投給公司。微軟執行層一定堅信powerset是與google戰鬥的武器。

今天的powerset是什麼

給定一組非結構化的資訊,powerset應用自然語言加工技術從正本中提取概念和關鍵語義概念,然後建立語義索引(和google的類似)及實體之間的關係概念圖。此圖通常是用RDF三倍數表示的。

powerset創新之一是語義表面化於用戶介面。載入語境插件幫助用戶流覽非結構化資訊。 許多人認為powerset是一個普通的語義搜索引擎,但它的首款產品就限於wikipedia,將該技術大範圍應用到整個web世界,價值就很高了。

為什麼powerset很強大 幾年前語義技術出現的時候,人們開始談論語義網站或是語義搜索怎麼樣成為google的殺手。因為語義搜索可以傳遞更多相關的結果,因為它“知道”內容。 業內認為不是那麼回事,語義搜索與google使用的統計方法相比沒有特別大的優勢。在博客Semantic Search - Myth and Reality中有相關討論。

powerset最厲害的是什麼呢?正是它不嘗試將網頁作為一個整體來搜索。現在,這一解決方法在wikipedia成功了,但基礎構架是通用的,所以也可以應用到其他網站以增強效果。成熟的語境概要可以用來搜索任何內容。 不處理整個網頁,這一方法在針對具體的網站時可能會被首先考慮。 對google的正面消息是什麼?

今天的powerset不是google殺手。從這點上說,只有巨大的動力才會有機會。 在搜索市場,google佔有率很大——潛力更大,如果雅虎的交易完成。人們對google很有信心:簡單,是,不完美,但已足夠好了,搜索結果要好於live搜索。 如果微軟買了powerset,並把它和live 搜索整合,可能會是另一個在底線上的沒什麼影響的收購。事實上,在live搜索blog上的宣佈也是如此。

排在首位的收購原因是獲取人才;第二個是相信NLP 和語義演算法能填補當今搜索的漏洞。 powerset帶來的僅僅是有意思的技術;沒有帶來動力,那微軟是怎麼想的?可能會有更微妙的發揮,因為已經有杠杆作用的事實:powerset在像wikipedia這樣的知識網站運行的不錯。

可能微軟打算將powerset應用在它自己的網站上,將powerset整合在ie流覽器裏。 設想流覽wikipedia ,每個頁面都有語義,現在通過網頁周圍的主要資訊源來提高這一體驗。 提供語境,語義體驗使得微軟能讓人們停留的時間更長些,除去他們花費在google搜索上的時間。 這是很重要的一點,因為google沒能在搜索上掙錢,它是靠廣告盈利的。

在廣告業微軟能打過google嗎? 微軟尋求解決的真正問題是廣告。直到現在,網站已明確了廣告的兩個基礎-門戶和搜索。 門戶在每個頁面顯示廣告;刷新內容的人們越多,顯示的廣告也越多,網站盈利也就越多。搜索模式作為另一個選擇出現,現在更成功,成為獲取廣告收入的一條路。

利用powerset和其他語義技術,又出現另一種模式:覆蓋在現有的內容上的語境資訊探索。 如果微軟能夠把人們從google的主頁面引開,遊戲就會發生重大的改變。流覽器是微軟最厲害的工具之一——其默認頁是live 搜索。

微軟想贏取廣告商,就要用流覽器做更多的工作。把powerset的語義搜索器整合到流覽器並設為默認將會改變遊戲。這不是簡單的。一個有官僚作風和執行問題的大公司是不可能迅速、完美的將語義融合到流覽器中的。

結論 兼併powerset是微軟引人關注的行為。這家炙手可熱的語義創業公司被很多公司盯上了。 計畫是怎樣的?微軟買下這家公司不會僅僅為加強live 搜索。很可能的計畫是複製wikipedia的解決方法,然後把powerset合併在ie流覽器上。 這是個很大膽的遊戲,要求嚴格執行——並不是後來微軟所表現出來的那樣。