具有超強(qiáng)計(jì)算能力的谷歌公司已成為超級(jí)翻譯服務(wù)提供商,傳統(tǒng)翻譯公司今后還有用么?
在2004年谷歌的一個(gè)會(huì)議上,大家的討論集中到一封韓國谷歌粉絲寫的電子郵件上。谷歌創(chuàng)始人之一謝爾蓋·布林(Sergey Brin)便用一款該公司已通過授權(quán)的翻譯系統(tǒng)把這封信翻譯成英文。 該郵件的原意是谷歌是廣受歡迎的搜索引擎,但是自動(dòng)翻譯卻譯成“生魚片鞋子它希望,谷歌是綠洋蔥東西!” 布林當(dāng)即表示,谷歌應(yīng)該能比這做得更好。6年后,谷歌的免費(fèi)在線翻譯服務(wù)能處理52種語言,比其他任何類似的免費(fèi)翻譯系統(tǒng)都多。每周人們使用它來翻譯網(wǎng)頁和文本多達(dá)上億次。 卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)語言技術(shù)研究所(Language Technologies Institute)副研究員阿隆·拉維(Alon Lavie)稱,在不局限于某一特定專業(yè)領(lǐng)域的計(jì)算機(jī)翻譯系統(tǒng)中,“谷歌的翻譯是超一流的”。 谷歌也致力于開拓搜索服務(wù)以外的領(lǐng)域,不過輸贏參半:數(shù)字圖書項(xiàng)目深陷侵權(quán)訴訟中,其新推出的社交網(wǎng)絡(luò)服務(wù)Buzz又激起了用戶對隱私泄露的恐慌。種種此類情況顯示,谷歌在挑戰(zhàn)商業(yè)傳統(tǒng)和文化習(xí)慣時(shí),有時(shí)也不免失策。 但是谷歌此次從翻譯服務(wù)中迅速脫穎而出并躋身頂級(jí)翻譯服務(wù)提供商,足以向人們證明谷歌在處理復(fù)雜問題上所發(fā)揮出來的強(qiáng)大計(jì)算能力。 如果把谷歌為網(wǎng)頁搜索而建立的數(shù)據(jù)中心網(wǎng)絡(luò)連在一起,可算得上是目前世界上最大的計(jì)算機(jī)。谷歌正是用這樣的方式將其強(qiáng)大的計(jì)算能力應(yīng)用在翻譯技術(shù)上。比如,上個(gè)月谷歌稱正在研究將其翻譯工具與圖象分析進(jìn)行結(jié)合,這樣當(dāng)人用手機(jī)對著一份德語菜單拍照片,就能馬上得到英文翻譯。 “谷歌的機(jī)器翻譯是展示谷歌的戰(zhàn)略愿景的最佳例證之一,”科技圖書出版商奧萊利傳媒(O’Reilly Media)的創(chuàng)始人兼首席執(zhí)行官蒂姆·奧萊利(Tim O’Reilly)說道,“這項(xiàng)業(yè)務(wù)本不受人重視,但谷歌能對海量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行深入挖掘,簡直達(dá)到了其他人所無法達(dá)到的境界,并愿意為解決這些復(fù)雜的問題、搶得市場先機(jī)而做出必要的投資。” 開發(fā)翻譯機(jī)器一直被視為人工智能領(lǐng)域中最大的挑戰(zhàn)之一。數(shù)十年來,計(jì)算機(jī)科學(xué)家們嘗試使用一套基于規(guī)則的方法——教給計(jì)算機(jī)兩種語言的語法規(guī)則并在電腦中存儲(chǔ)必要的詞典。 但是到上世紀(jì)90年代中期,研究人員開始傾向于使用一種所謂的統(tǒng)計(jì)方法:他們發(fā)現(xiàn),如果將海量的文本和對應(yīng)的人工翻譯輸入電腦,電腦就能在翻譯新文本時(shí)做出正確的猜測。 這種技術(shù)雖然需要海量的數(shù)據(jù)和計(jì)算能力,卻恰好能發(fā)揮谷歌的計(jì)算特長。 “我們的基礎(chǔ)設(shè)施非常適合使用這項(xiàng)技術(shù),”谷歌工程副總裁維克·岡多特拉(Vic Gundotra)說道,“我們可以采用其他人做夢都不敢想象的方法?!?p> 自動(dòng)翻譯系統(tǒng)目前還遠(yuǎn)不夠完美,就是谷歌的免費(fèi)在線翻譯服務(wù)也不會(huì)立刻使人工譯員失業(yè)。專家稱要計(jì)算機(jī)自己學(xué)會(huì)斷句,翻譯再重組句子還是極其困難的。 但谷歌的翻譯服務(wù)已經(jīng)能很好地傳達(dá)新聞的要點(diǎn),也為人們提供了便捷的翻譯服務(wù)。馬里蘭大學(xué)帕克分校(University of Maryland, College Park)語言學(xué)副教授、機(jī)器翻譯專家菲利普·雷斯尼克(Philip Resnik)說:“如果你只需要粗略快捷的翻譯,谷歌翻譯就是你的不二之選?!?p>
正如該領(lǐng)域中的對手(如微軟和IBM公司),谷歌已將聯(lián)合國會(huì)議文件(人工翻譯的六種語言文本)及歐洲議會(huì)文件(23種語言文本)輸入了其翻譯引擎中。這些原始資料都被用于訓(xùn)練谷歌在線翻譯系統(tǒng)識(shí)別這些最通用的語言。 除此之外,谷歌還搜索了網(wǎng)頁上的文本,圖書掃描計(jì)劃中的文件以及其他來源的語言文件。對于比較晦澀的語言,谷歌發(fā)布了“翻譯工具箱”幫助用戶進(jìn)行翻譯,并將譯文文本添加到其語料庫中。 谷歌的服務(wù)可能會(huì)對IBM等公司的翻譯軟件的銷售造成影響,但是自動(dòng)翻譯也不可能變成谷歌的搖錢樹,至少用谷歌的廣告業(yè)務(wù)收益標(biāo)準(zhǔn)來衡量是如此。不過谷歌的在線翻譯能在其他幾個(gè)方面獲得收益。 由于谷歌的廣告遍及全球網(wǎng)絡(luò),凡是能提高網(wǎng)絡(luò)用戶使用便捷性的服務(wù)都會(huì)使谷歌受益。而且在線翻譯可能挖掘到有趣的新應(yīng)用。上周谷歌宣布將使用語音識(shí)別技術(shù)為英語的YouTube視頻生成字幕,這些英文字幕能被翻譯成其他50多種語言。 “這項(xiàng)技術(shù)能消除語言之間的障礙,”負(fù)責(zé)谷歌機(jī)器翻譯團(tuán)隊(duì)的首席科學(xué)家弗朗茲·奧奇(Franz Och)說道,“有了它,任何人都能暢通無阻地交流?!?p> 奧奇之前曾是就職于南加州大學(xué)(University of Southern California)的德裔科學(xué)家。他回顧說起初他不太愿意加入谷歌,擔(dān)心谷歌只是把機(jī)器翻譯作為一個(gè)邊緣項(xiàng)目。后來谷歌的另一位創(chuàng)始人拉里·佩奇(Larry Page)給他打了電話,消除了他的疑慮。 “他說機(jī)器翻譯對谷歌的發(fā)展至關(guān)重要,”于是奧奇2004年加入了谷歌。 當(dāng)許多類似谷歌翻譯的系統(tǒng)工具使用多達(dá)十億單詞的文本來創(chuàng)建語言模型時(shí),谷歌的詞匯量已達(dá)到數(shù)百億。奧奇說:“處理的文本越多,所建的語言模型就會(huì)越好?!?p> 他們的努力得到了回報(bào)。一年后,谷歌在一次由美國政府組織的高級(jí)翻譯系統(tǒng)測試中勝出。 谷歌用類似的方法——超強(qiáng)的計(jì)算能力,海量的數(shù)據(jù)及統(tǒng)計(jì)方法——處理其他復(fù)雜問題。比如,2007年谷歌開始提供800-GOOG-411(免費(fèi)名錄輔助服務(wù))處理語音問詢。憑借著這項(xiàng)服務(wù),谷歌搜集到成千上萬人的語音資料,以便提高其識(shí)別英語口語的能力。 一年后谷歌推出了語音搜索系統(tǒng),該系統(tǒng)足以媲美那些其他公司耗費(fèi)數(shù)年才建立起來的類似系統(tǒng)。 去年年底,谷歌又推出了一項(xiàng)名為“Goggles”的服務(wù),該服務(wù)分析手機(jī)圖片并與上十億張的網(wǎng)絡(luò)圖片進(jìn)行匹配,包括來自谷歌街景(Street View)服務(wù)的街道圖片。 奧奇承認(rèn)說谷歌的翻譯系統(tǒng)仍有待完善,但它正在越變越好,“目前谷歌在線翻譯系統(tǒng)的質(zhì)量改進(jìn)曲線仍在急劇上升?!?p> ?。ū疚淖g自New York Times網(wǎng)站)
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/9101032201/105559.html
愛華網(wǎng)


