Fork me on GitHub

机器学习自动翻译失落的语言

  1886 年,英国考古学家 Arthur Evans 发现一块古老石头上刻着未知语言。石头来自于地中海的克里特岛。 Evans 动身前往希腊的这个岛屿发现了更多刻有文字的石头石板,时间可以追溯到公元前 1400 年左右。

  他与同行确定了两种文字,其中最古老的被称为 Linear A,上溯至公元前 1800 年到 1400 年左右;另一种被称为 Linear B,是在公元前 1400 年后出现的。

  许多人尝试破解这些古老的文字,但都失败而归。直到 1953 年业余语言爱好者 Michael Ventris 破解了 Linear B。原因是他做了两个重要假设,其一是他假设 Linear B 中大量重复的字指代的是克里特岛;其二是假设内容多数与古希腊有关。两个假设被证明都是正确的。但 Linear A 至今仍未破解。

  MIT 的两位研究人员与 Google AI 实验室的 Yuan Cao 开发了一种机器学习系统,能自动翻译失落的语言,他们演示了用它去破译 Linear B(未提及 Linear A)。他们的研究报告发表在预印本网站 arxiv 上。

 

来自:
Solidot

作者:Johnson
原创文章,版权所有,转载请保留原文链接。