日語翻譯Facebook翻譯謬誤導(dǎo)致一名建筑工人被抓,機(jī)器翻
六、對(duì)結(jié)果的剖析
BLEU為機(jī)器翻譯結(jié)果與人工翻譯結(jié)果對(duì)比值(縱坐標(biāo)應(yīng)為%,作者遺記標(biāo)注,下同)??赡芸吹诫S著文本中退出噪聲的比例添加,機(jī)器翻譯的結(jié)果快速降落。
三、數(shù)據(jù)
2、黑箱對(duì)抗訓(xùn)練
4)只要用Nat數(shù)據(jù)集來訓(xùn)練,能力提高Nat數(shù)據(jù)集測(cè)試的魯棒性。這個(gè)結(jié)果表明了計(jì)算模型和人類的體現(xiàn)之間的一個(gè)重要區(qū)別——在學(xué)習(xí)言語時(shí),人類并沒有明白地裸露在噪聲樣本中。
如作者所說:“咱們的目標(biāo)有二:
發(fā)現(xiàn):
作者首先測(cè)試了用潔凈(Vanilla)文本訓(xùn)練出的模型能否可以經(jīng)受住噪聲的考驗(yàn)。
作者抉擇了三種不同的神經(jīng)機(jī)器翻譯(NMT)模型以做對(duì)比,分別為:
七、總結(jié)
讓咱們用Rand+key+Nat的charCNN模型來翻譯一下前面那個(gè)凌亂的德語翻譯吧:
以色列警方此刻正監(jiān)管網(wǎng)絡(luò)來找一群稱為“l(fā)one-wolf”的恐懼分子,所以立馬就留意到了這條形狀。
五、兩種方法改進(jìn)模型2、meanChar模型
從上面的結(jié)果可能看出,多種噪聲同時(shí)訓(xùn)練charCNN的模型的魯棒性更好。But why?
輸入文本是亂七八糟的德語文本,但人類翻譯仍然可以根據(jù)文本猜測(cè)到意思,而目前幾個(gè)優(yōu)良的機(jī)器翻譯模型則體現(xiàn)很差。
四、潔凈文本訓(xùn)練翻譯模型
一、噪聲對(duì)機(jī)器翻譯影響有多大?