Fork me on GitHub

AI拍照翻译软件大测评

  鱼羊 发自 凹非寺 
  量子位 报道 公众号 QbitAI

  世界这么大,怎么忍得住不出去看看?

  想象一下,当你聆听着普吉岛海浪的浅唱,层层波纹把夕阳的柔光从海岸线那头传递而来,这种时候,面前再摆上一份海鲜冬阴功,岂不妙哉?

  那么,问题来了:萨瓦迪卡,请先点菜吧亲。

  面对这样的菜单,我只想说,请放过福建人好吗?

  信泰国友人的神翻译,还不如自己拿上神器,只需轻轻一扫,真相即刻大白。

  这就是谷歌翻译最受欢迎的功能,即时相机翻译。

  只需将镜头对准菜单,即使语言不通,点菜也无需比拼演技:

  T 恤上奇奇怪怪的文字,也可以科学“避雷”:

  简直是出国旅行,必备良品。

  在谷歌新一轮的更新之后,即时相机翻译再次进化,支持语种数量达到了88 种,可译语言更是超过了 100 种。

  以前的版本还只支持中英文互译,现在,无论是日语韩语马来语,还是法语德语阿拉伯语,通通都能在相机里直接显示成中文。

  甚至没有网络,也依然好用。

  其实,不只是谷歌,国内有许多厂商早已推出了具有拍照翻译功能的翻译 APP,比如百度翻译,网易有道词典,搜狗翻译等等。

  那么问题又来了,到底,即时拍照翻译哪家强啊?

  拍照翻译大比拼

  量子位抱着好奇的心态,开展了一番实时拍照翻译 APP 横(wan)评(shua)。

  首先介绍一下出场选手:

  从左到右,依次是搜狗翻译,百度翻译,谷歌翻译和网易有道词典。

  几位选手背后,都有神经网络机器翻译(NMT)技术的加持。

  必须首先说明的是,搜狗、百度和谷歌三家都能实现即时翻译,也就是说不用拍照,把手机摄像头怼上去就可以了,而网易有道词典则必须把图片拍下来。

  但是,在其他家都能拍照翻译,导入图片翻译的情况下,谷歌却并不具备这一功能。

  Round 1:英译中

  出门在外,最常用到的功能还是英文翻中文,我们先出一道简单题:

  来看看各位选手的表现。

  这一轮大家翻译得都不错,唯有谷歌出现了一点小 bug,把“左边”和“因为”的位置给弄错了。

  单说实时P图的情况,搜狗和谷歌的表现则比百度和有道两位选手更好一些,搜狗胜在画面清晰干净,而谷歌则更贴近原来的风格。

  下面提升一下难度:

  Emmm,这一轮看来是有点为难选手们了。

  一方面,这道题确实比较绕口,另一方面,原图的渣像素也影响了选手们的发挥。在这一轮里,只有谷歌识别出了图片下方文字中的 2017 这个数字,但即便如此,它也并没有能准确翻译出这句话。

  这一轮里,就翻译的质量而言,搜狗翻译略胜一筹,而P图方面,谷歌依然表现突出。

  综合来看,第一轮是搜狗翻译胜出了。

  Round 2:中译英

  试过英译中,再来试试中译英吧。

  中文素材就比较常见了,量子位随手拿出了一盒立顿红茶。

  首先登场的是一号选手搜狗翻译。

  搜狗的表现十分亮眼。A whole cup of sunshine这个翻译简直完美,“红茶”准确翻译成了“black tea”,连“茶香沁人”这样的表述都大致表达了出来,鹅妹子嘤。

  再来看二号选手百度翻译的表现。

  对比之下,百度的翻译效果就差了一些,但也能把大概的意思翻译出来。

  接下来请出三号选手谷歌翻译。

  谷歌同样将“一整杯的阳光”翻译成了“Whole cup of sunshine”,但其余部分的翻译并不出色。

  最后一位选手,是网易有道词典。

  这一回合,有道的表现惊艳全场,也是唯一一个把“泡出”翻译对了的 APP。虽然有“fresh young leaves”这样的翻译出现,但整体看来瑕不掩瑜,跟搜狗难分伯仲。

  鉴于搜狗的P图技术比有道高出那么一丢丢,这一轮的第一名,还是判给搜狗吧~

  Round 3:日语挑战

  谷歌这回更新,主打的就是多语种互译。而对于国内的胖友们来说,新马泰和日韩如今已是热门旅游路线,到了这些地方,有时候英文恐怕也不太好使。

  不止是谷歌,搜狗、百度和网易有道也并不是仅仅局限于中英互译。其中,百度还支持日语、韩语和法语,而搜狗还支持中英文之外的 9 种不同语言,网易有道支持的语种则达到了 20 种。

  p.s. 有道词典还支持文言文

  那么这一轮,我们就来测试一下众位选手日文转中文的能力吧。

  题目是这样的:

  从诸位选手的表现来看,这一轮,优胜奖应该颁给谷歌,并且这一次不靠强大的P图技术。

  只有百度和谷歌把面、饭和披萨三种食物都翻译了出来,但百度出了个大 BUG,生生把午餐的价格抬高了 800 日元。

  Round 4:泰语挑战

  在量子位暗戳戳地开始搜索泰国菜单的时候,搜狗翻译,百度翻译和网易有道词典三位选手宣布退出演播厅。

  因为,在场只有谷歌翻译一位选手支持泰语转中文。

  Emmm,虽然不战而胜,但还是让我们来检验一下这位选手的实力吧。

  请看题:

  谷歌作答:

  虽然没有竞争对手,但这个表现确实也相当能打了。

  不正经总结

  最后,让我们把退场的三位选手请回台前,来做一个小小的不正经总结。

  从中英互译的表现来看,国产的搜狗翻译拿到了综合表现第一名。翻译准确,既能轻轻一扫即翻译,也能拍照翻译。即时翻译的P图效果,和P图大佬谷歌相比也各有千秋。堪称国货之光。

  而到了小语种比拼环节,谷歌展现出了科技巨头的深厚积累,且不说泰语环节完全没有对手,在日语即时翻译的效果上也优于其他选手。并且,谷歌的P图效果是所有选手中最贴近原风格的。

  还要提一嘴的是,搜狗翻译、谷歌翻译和网易有道词典都支持自动语言检测,也就是说即使你并判断不出面前的是哪国文字,内置 AI 也能帮你把它们翻译出来。但在实际测试中,这个功能的反应比较慢。

  如果你想问到底哪个好用,那么量子位的小建议如下:

  中英翻译的质量上,搜狗翻译和网易有道词典略胜一筹,鉴于有道词典只能拍照后翻译,而搜狗翻译既可拍照,也支持扫一扫实时翻译,实际的使用中搜狗翻译可能更方便一些。

  而小语种的场景下,还是谷歌翻译表现更佳,无论是在翻译质量还是在支持的语种数量上都更为出色。不过谷歌的缺点也比较明显,从测评的结果来看,它似乎只能一行一行翻译,也就是说当一个长句被排成了两行,谷歌翻译的翻译效果就不一定准确了。

  并且,虽然谷歌修复了屏幕闪烁现象,翻译的文字稳定了很多,但实测之中相机的角度还是会对翻译的效果造成比较大的影响。

  而这个问题,支持即时翻译的这几个软件多多少少也都存在,所以使用这一功能的时候,还是要求要持稳相机。

  总体而言,有了神经网络机器翻译技术,手机翻译 APP 们的能力是越来越强大了。

  据谷歌介绍,基于深度神经网络,其采用的 GNMT 模型在庞大的并行语料库(输入/输出文本对)上进行端到端训练,无需事先规定明确的语言规则。

  从实验结果来看,在内置了神经网络翻译技术之后,某些语言的测试中错误率直降 55%-85%。

  彩蛋

  你以为文章这就结束了?

  最后的最后,给各位看官送上一个小彩蛋。

来自:
量子位(ID:QbitAI)

作者:Johnson
原创文章,版权所有,转载请保留原文链接。