文章內(nèi)容

幾種方式AI干起了實時翻譯,咱們離逾越言語的鴻溝還有多

時間:2018-05-28 05:42來源:網(wǎng)絡(luò)整理 作者:珠海翻譯公司 點擊:

原文:Look, man, you don’t got to do anything. This one means a lot to me.

騰訊、百度、阿里巴巴等國際互聯(lián)網(wǎng)公司將深度學(xué)習(xí)理念運用到機器翻譯,在智能翻譯畛域繼續(xù)發(fā)力,推出多款基于神經(jīng)網(wǎng)絡(luò)技術(shù)的在線翻譯和手機運用。甚至在手機閱讀器的晉級戰(zhàn)爭中,智能翻譯也被當(dāng)作重要性能改造,搜狗手機閱讀器推出“智能翻譯”,匯合了語音對話翻譯、AR實時翻譯、拍照翻譯等罕用性能。

智能翻譯的確取得了令人驚喜的進展,拿著手機和老外停止日常交換已經(jīng)基本沒有成績。然而智能翻譯還存在“短板”,會有“詞不達意”的時分,AI要想更進一步發(fā)展,和有著數(shù)十年沉淀的高程度翻譯員停止競爭,能夠還需求從以下幾個方面停止致力。

搜狗手機閱讀器智能翻譯:Recently we have noticed an international view that China has become the world's largest economy. On the one hand, it challenges the leadership of the United States. On the other hand, the Chinese are hitchhiking in many international affairs. I would like to ask what you think of this view.

2026年0月,Google公布谷歌神經(jīng)機器翻譯(GNMT: Google Neural Machine Translation)系統(tǒng),聲稱該系統(tǒng)應(yīng)用神經(jīng)網(wǎng)絡(luò)技術(shù),模仿人腦的神經(jīng)思索形式,產(chǎn)出媲美人工翻譯的高品質(zhì)譯文,并將誤差升高了66%-86%。谷歌公司己經(jīng)將該技術(shù)運用于網(wǎng)頁翻譯與手機運用,譯文品質(zhì)顯著降職。

2、基于實例的機器翻譯方法。從已有的翻譯閱歷知識出發(fā),將源言語句子切分為翻譯知識中見過的短語片段,經(jīng)過對已有翻譯資源停止主動總結(jié),得出雙語對照的實例庫,并設(shè)計規(guī)定解決雙語對如實例庫中的歧義性等成績,完成對新的源言語句子停止翻譯。

原題目:AI干起了實時翻譯,咱們離逾越言語的鴻溝還有多遠(yuǎn)

谷歌翻譯:Alone in a foreign land for the stranger,every festive times.

文 | 草原騎士

2、提高語境理解才能

例如:“這蘋果不大好吃”。那么該句有兩種不同的理解結(jié)果:這蘋果不大/好吃(蘋果不大,然而味道好),這蘋果/不大好吃(蘋果味道不好)。兩家AI都未能分清句子結(jié)構(gòu)發(fā)音上的差別,都默許翻譯為“蘋果味道不好”。

翻譯的關(guān)鍵在于兩個詞:look和man。谷歌的翻譯也對,而看起來,搜狗手機閱讀器的翻譯結(jié)果更合乎生存實踐。

2、大量補充書面語化語料

深度學(xué)習(xí)可以主動學(xué)習(xí)形象特色示意、建設(shè)源言語與指標(biāo)言語之間簡單的映射關(guān)系,給統(tǒng)計機器翻譯的完成提供新路徑,目前已經(jīng)在詞對齊、言語模型訓(xùn)練、解碼等模塊的優(yōu)化運用方面取得較多成果。例如,2006年谷歌公布基于短語的機器學(xué)習(xí)(PBMT)系統(tǒng),該系統(tǒng)將句子合成成詞和短句,停止一一翻譯。它的弱點在于忽略了高低文,因此譯文品質(zhì)不佳。2026年谷歌公布的神經(jīng)機器翻譯GNMT,將句子視為基本單元,不再對詞和短句一一翻譯,顯著改善了譯文品質(zhì)。