
Google 宣佈完成新一代的搜尋架構索引系統,可以較舊版索引加快 50% 的速度,呈現搜尋結果。
Google 在 2009 年 8 月宣佈,該公司將針對其搜尋技術進行大改造,開發名為「咖啡因」(Caffeine) 的新架構,而此系統的推出,正好是在微軟公司 (Microsoft) 表示將強化其在搜尋引擎領域發展,擴大結合 Big 搜尋與雅虎 (Yahoo!) 網頁功能的 1 個月之後。 Yahoo! 當時是全球排名第 2 的搜尋入口網站。
Google 是在 2009 年 8 月開始測試 Caffeine,當時該公司表示預期可在當年年底假期上線,並表示該技術是從 2006 年來所做最重大的搜尋技術改變。
Google 於本週三 (6/9) 時指出,該公司打造咖啡因索引系統乃是為了讓使用者在不斷擴大的漫漫網海之中,能夠獲得更新的搜尋結果。
如果要更了解咖啡因索引系統的運作方式,使用者首先必須了解,Google 在執行搜索時,並不會根據使用者輸入的關鍵字來搜尋所有網頁,而是針對網頁索引來搜尋。因此,搜尋結果的品質好壞,取決於搜索引擎如何維持最新的索引系統。
在舊的系統體系下,是由許多階層所構成,某些階層的更新速度較快,但主要階層平均約須數週才會更新一次,Google 的搜索卻必須在其龐大的網頁更新資料庫中進行匐匍搜尋與分析,有些個人網頁的更新可能就未必會即時收錄其中,除非整個批次更新作業完成。這也就意味著,Google 的索引和最新的網頁資料之間,勢必存在著若干的時間差。
然而,透過咖啡因索引系統,Google 在搜尋網頁時,不再一次分析整個網路,僅針對小部分網路進行分析,且一天 24 小時持續更新其全球搜尋索引。
Google 工程師 Carrie Grimes 在其公司部落格中指出,一旦發現新的網頁,就會把它直接加入索引當中,使用者也因此更容易找到更新的資訊。
Google 表示,咖啡因每秒可平行處理數十萬的頁面,分析並把更新資訊加入新的索引當中,並以每天數十萬 GB 的速度增加。咖啡因在 Google 資料庫的儲存量,約在 1 億 GB 左右。
Grimes 表示,這樣子的成長速度,必須要有 62.5 萬台最大容量的 iPod,才能儲存等量之資料。如果把這些資料變成紙張串連起來,至少會有 40 哩之長。
參與咖啡因先期測試的人員,在這個搜尋平台即將推出之際,發表了一些他們的看法。這些測試人員表示,透過新系統所獲得的資料,將比舊版系統更多也更加正確。
根據 Experian Hitwise 的分析, 2010 年 5 月份時的文件搜索排名,Google 在網路搜尋結果中占了 71.4% 。排名第二的是雅虎,但和第一名還存在頗大的落差,僅有 14.96%;Bing 則繼之於後,只有 9.43% 。
然而,Hitwise 指出,微軟公司在 5 月份時,在四個搜尋分類上有顯著的成長,反映出該公司在垂直市場上的聚焦重點。 Bing 的搜尋結果,主要是關於汽車、健康、購物以及旅遊,和前一年同月相比,分別成長了 95% 、 105% 、 100% 以及 71% 。
在 2010 年 3 月,微軟公司宣佈,該公司將針對 Bing 進行一系列的強化動作。而其中最為人所津津樂道的,就是微軟改善了 Bing 的快捷列功能,根據搜尋引擎針對使用者所做的搜尋來顯示結果。
