2008-05-01

Google研究人員將PageRank應用在圖片搜尋

Google研究人員將PageRank應用在圖片搜尋
文/陳曉莉 (編譯) 2008-04-30

Google在內部進行實驗,發現其不相干圖片出現的比例減少了83%,不過Google能否在成本效益下大規模採用該技術仍是個難題。


兩位Google工程師上周在北京舉行的全球網際網路會議(IW3C2)上說明了他們正在研發的新一代圖片搜尋技術,該圖片搜尋技術借用了Google PageRank概念,找出圖片上視覺性的關聯,以期有更佳的圖片搜尋品質。紐約時報將其新開發的圖片搜尋技術稱之為VisualRank。

PageRank是Google搜尋引擎核心技術之一,它根據網頁之間互相的超連結來評估網頁的排名,根據被連結的頻率及次數來判斷該網頁的重要性。而VisualRank則是採用類似的概念,找出圖片間的關聯性,但該關聯性主要依賴於圖片間所出現的同樣特徵的圖像。

根據這兩位工程師所提出的研究報告,現階段的商業搜尋引擎在圖片搜尋上多半根據嵌在圖片上的文字敘述來提供搜尋結果,例如圖片名稱或是網頁上對於圖片的描述文字等,而無視於圖片上真正呈現的內容,所以圖片搜尋的品質多半不佳。

因此,Google分析圖像間的連結架構,並採用PageRank的運算模式,替每個圖像評分,找出每個圖像的相對重要性。

除了圖像分析技術迄今仍是個尚待解決的問題,電腦還無法自動偵測人類很容易辨識的圖像之外,要進行大規模且數量日益增長的圖像比對所費不貲。

Google則是比對鮮明的圖像特色來傳遞與搜尋字串更具關聯的搜尋結果,例如該團隊測試搜尋麥當勞時,針對麥當勞的M圖像進行搜尋及分析不同圖像的關聯性,發現結果良好。

若要大規模採用仍面臨兩大難題,一是它需要進行圖像處理,例如什麼是圖像特徵,或是這些特徵可能出現在圖片的各處或有各種角度的呈現,二則是即使判定了圖像特徵,如何利用相關技術及資訊來為這些圖片排名。

Google在內部進行實驗,鎖定前兩千種在Google產品搜尋最常見的關鍵字,例如iPod或Xbox等,然後根據其排序系統與Google原本的圖像搜尋結果找出前十大圖片,發現其不相干圖片出現的比例減少了83%。

Google工程師將原本用在網路文字搜尋的連結及分析技術延伸到圖像搜尋中,即使在這些圖像間並沒有實際的連結,但透過有效的方法來推斷特定圖像會出現在圖片的哪個部份,結果超越了原來Google的圖像搜尋服務。

即使Google找到改善圖片搜尋結果的方法,但各界關心的仍舊是Google能否在成本效益下大規模採用該技術,以及新技術是否會影響Google圖片搜尋的速度等。(編譯/陳曉莉)

http://www.ithome.com.tw/itadm/article.php?c=48743

--
[垃圾桶] 裡沒有會話群組?

沒有留言: