2007-10-22

蓋茲仍然有話要說 (上)

http://taiwan.cnet.com/enterprise/technology/0,2000062852,20125404,00.htm

蓋茲仍然有話要說 (上)

Ina Fried•唐慧文譯  2007/10/22

比爾.蓋茲多年來總是說,在不久後的某一天,我們就能用手寫辨識、音控和觸控的方式來操作電腦。

至今他仍然不改口。日前接受CNET 專訪時,蓋茲暢談語音辨識(speech recognition)技術已有斬獲之處,並預測這種技術未來的一些用途。

繼 微軟推出新的企業電話軟體之後,蓋茲談到商用電話為什麼多年來一成不變,以及如果一旦把電話功能併入PC網路,產生什麼樣的改變。蓋茲也提到觸控螢幕運算 的可能性,並指出多重觸控(MultiTouch)的概念非常熱門,不論是運用在微軟的桌面觸控型電腦Surface上,還是在iPhone上。

依照既定計畫,蓋茲明年在微軟將改任兼職職務。但他也說過,會繼續監督一些重大計畫的進展,並指出推動自然語言介面(natural language interface)可能是他繼續努力的計畫之一。他也關注搜尋和Office的未來。

以下是蓋茲訪談的摘要:

問:你何時看到語音發展的潛力?多年前,你可曾見過某種早期的展示,讓你看出其中潛在的可能性?

蓋茲:當然,電腦應該可以處理語音,這種觀念已存在多時。這是一種自然的溝通方式。在1970年代,DARPA出資贊助研究員(包括哈佛研 究員)從事語音辨識研究。人們於是覺得,嘿,這應該是輕而易舉的事。讓電腦懂得語音的夢想,很早以前就有了。而,把資料網路與語音網路融合為一的夢想,也 是很早以前就有了。

微軟早年即看出,軟體魔力可運用在這兩者上,不只是對資料網路而言,對語音網路及視訊網路也一樣,所需我們一直積極投入這方面的研發。坦白說,真正令我們訝異的,是世人很容易感到滿意,不願意冒險改用新的平台,特別是把商用電話移到新平台。

企業用來管理電話通話的這些用戶電話專用交換機 (private branch exchange;PBXs)系統,其實只是電腦,一直與普通的架構並存。這些系統的線路、名錄、伺服器元件等,都保留著。我們一直耐心地在這方面投資。 事實上,在1999年,我們就推動本公司第一款大規模的語音、PBX型計畫。

那麼,我可以說,在那個時候,你認為夢想可以提早實現?

蓋茲:隨著我們把軟體魔力運用在新的事物上,再怎麼提早也不為過。我們不想太晚切入這塊領域。我們察覺,必要的拼圖開始匯集起來,所以我們 覺得有理由放手投資。我們希望參與其事,特別是在Exchange、Outlook和Office大受歡迎之後。因為人們用我們的軟體做各種事情,只差用 來打電話。我們的想法是,好吧,現在我們應該也把電話功能納入。這對我們來說,是顯而易見的一大商機。

過去八年來我們看到,已有數目夠多的消費者用網際網路傳輸的經驗良好,所以有這個意願把PC也帶進這個領域來。

提到語音辨識,一個觀念是,有些應用程式是值得投資的,即使不能達到100%精準的辨識率。找出這些區域,是不是讓語音辨識成為主流的關鍵呢?

蓋茲:沒錯。記得,我們現在做的是整合式的通訊(unified communications),而語音辨識其實不是非常關鍵的一種元素。只是其中的一些層面。舉例來說,你做語音會議時,我們可以告訴你,誰在講話。但 今天若進行傳統的語音會議,是令人相當氣餒的,因為你不知道誰上線、誰離線,而且某某人開口說話時,你不知講話的是誰。

又如RoundTable (微軟360度視訊會議攝影機),我們使用視訊與音訊線索,來辨認誰在講話,然後把焦點對準他。你總是能對整個室內情況一覽無遺,同時也可放大檢視。所 以,假如有什麼地方不尋常,你可以先用全室的觀點來看,找出發生何事。就像攝影師會找出觀眾有興趣的目標,然後把鏡頭對準那個目標一樣。全景觀點可以辦到 這一點。 (未完,待續)



--


[垃圾桶] 裡沒有會話群組。 當您有 2000 MB 以上的儲存空間時,誰還需要刪除郵件?!

沒有留言: