-
“你打篮球像蔡徐坤”:微信翻译这个bug是怎么回事?
关键字: 微信翻译蔡徐坤打篮球bug吴亦凡
硅星人认为,微信应该进一步、更加详细地告知我们:这个bug为什么会出现,由哪些因素所导致。
一方面,微信翻译背后的技术确实比较复杂。解释它,有助于用户去理解它的工作原理,明白这个翻译结果的背后,可能有着十分复杂的技术原因。
另一方面,你关掉了"you are so"句式,还会出现学校简称;关了学校简称,还会有更多会触发bug的词被发现。发现一次关一次?这样伤害的是正常使用翻译功能用户的体验,长此以往总不是办法。
遗憾的是,微信方面表示,以上面微博为准,不再更多置评(或许是因为不想继续惹恼蔡徐坤的粉丝吧。)同时,中文互联网上完全找不到针对此事靠谱的技术解答,即便在知乎上,相关主题下面也都是用户在分享自己发现的bug截图,没有人解释原因。
既然这样,不妨让硅星人来试试?
我们采访了多位机器学习专家,并在接下来的篇幅里 1)解释微信翻译用的到底是什么技术;2)再尝试回答"you play basketball like caixukun" 这句话,为什么在微信翻译里被翻错了。
微信翻译用的是什么技术?
硅星人经过多方面了解,确信微信英汉互译系统采用的是目前机器学习领域比较火的“神经机器翻译”(Neural Machine Translation, 简称 NMT) 技术,由微信AI团队自研。
从外行人的角度来看,NMT在翻译一句话时,做了这些事情:
Step 1: 在一定程度上模仿人脑的思维方式,NMT根据一个单词在整个句子(可以是长句)当中的语境,为这个单词建立一个神经网络的模型,形成一个语义表示。
比如单词是英语的 dog,可以理解为NMT在它的“大脑”里形成了一条狗的印象。
Step 2: 按照在句子甚至段落中的语境,将模型重新转化成另一种语言。
比如 dog 翻译成法语就是 “le chien”;但如果语境是“一条狗生下了小狗”,那么 dog 就会被翻译成阴性的"la chienne"。
(NMT不是真的在大脑中形成狗的视觉印象,事实上整个过程跟图像完全没有任何关系。这个所谓的“印象”,通过一连串向量 (vector) 表示。狗的例子来自于 Microsoft Translator [1])
NMT的主要优势是对长句子(甚至段落)有着不俗的翻译能力,阅读起来上下文连贯程度接近人翻。问世之后,NMT 也逐渐被微软、Google、百度、腾讯等大公司的翻译产品所采用。
“机翻技术一直在不断迭代更新,以前基于规则,过去十年主要基于统计,现在我们开始用神经网络。神经机器翻译是目前机器翻译上比较火的一项技术。我们绝大多数的大语种翻译已经基于这个技术了,“在美国一家顶级科技公司的研究分支担任资深研究员的王夏*告诉硅星人。
”在机翻技术发展的每个阶段,科研人员都会遇到一些问题。NMT也存在一些问题,比如整个过程的可解释性是非常低的,”他说。
硅星人翻译一下这句话的意思:在具体案例的层面上,一个NMT的系统为什么会把一句话 ABCDE 翻译成 abcde,研究者目前是很难将翻译过程解释清楚的。
这句话为什么被翻错了?
当NMT翻错了的时候,可能发生了哪些情况?
其实错没错、错误严重不严重,都是人来决定的。在机器眼里没有对错,选定的答案就是机器认为概率最高或最有可能的那个答案,因为一切都按照模型、算法运转着。
接受这一点,你才能理解这句话为什么翻错。
接下来进入正题
- 原标题:“你打篮球像蔡徐坤”:微信翻译这个bug是怎么回事?
- 责任编辑:程北墨
- 最后更新: 2019-03-07 10:26:12
-
中国页岩气单井日产量创新高
2019-03-07 07:28 能源战略 -
苹果供应商晒折叠屏大招:正研发可折玻璃
2019-03-06 21:38 苹果新“品” -
去年我国研发经费支出近2万亿元,比上年增11.6%
2019-03-06 21:03 科技前沿 -
只差一块钱,小米9和iQOO到底谁更香?
2019-03-06 17:41 手机 -
中国存储器能否打破海外垄断?
2019-03-06 17:29 TMT观察 -
-
小米卢伟冰总结魅族Note 9:遗憾还在继续
2019-03-06 17:06 -
三星正研发两款折叠屏手机,一款类似华为Mate X
2019-03-06 16:22 大公司 -
去年全球智能手机出货量减少5.1% 北美锐减13.2%
2019-03-06 14:57 手机 -
观点:提速降费与5G使能兼顾 运营商如何兼顾
2019-03-06 13:30 -
格力手机3代上架官网 售价3600元
2019-03-06 13:22 -
动工在即!华为要用100亿打造上海青浦研发基地
2019-03-06 12:14 大公司 -
“夜视眼药水” 治色盲有戏
2019-03-06 11:14 -
最新报告:万亿研发经费,中国都花在哪儿了?
2019-03-06 10:28 科技前沿 -
苹果iPhone XI配置曝光:三摄、水下模式、黑暗模式
2019-03-05 20:10 手机 -
中国空间站安排上了!将首次向国际开放
2019-03-05 19:30 航空航天 -
销量不佳,iPhone再次全网疯狂降价
2019-03-05 18:23 手机 -
张小龙请回答:微信这些功能是咋想的?
2019-03-05 14:27 TMT观察 -
英特尔与紫光展锐5G情断,2大关键因素露馅
2019-03-05 13:49 TMT观察 -
紫光展锐自主研发的春藤510是一款怎样的5G芯片?
2019-03-05 13:37 科技前沿
相关推荐 -
特朗普又“眨眼”:中方来谈吧,签个“特殊协议” 评论 80“中国打贸易战有秘密武器:AI机器人大军” 评论 105中国不买美国液化气了,换中东 评论 110把中国货“藏”在加拿大,“我们赌特朗普会认怂” 评论 98最新闻 Hot
-
特朗普又“眨眼”:中方来谈吧,签个“特殊协议”
-
“共和党人气坏了,但碍于特朗普只能保持不安的沉默”
-
暴跌71%!马斯克叹气:我劝过特朗普,听不听由他
-
12州联合起诉:特朗普,收手吧
-
特朗普警告泽连斯基:再打3年,你国都没了
-
美媒放风:特朗普考虑大幅下调对华关税,或降至50%-65%
-
最后一刻,他俩都不去了
-
“纯关税壁垒最粗暴,欧盟快和中国谈吧”
-
总计7亿欧元,欧盟对苹果、Meta“罚酒三杯”
-
“中国打贸易战有秘密武器:AI机器人大军”
-
“俄乌都得在领土上让步,再不同意美国就退出”
-
中国不买美国液化气了,换中东
-
把中国货“藏”在加拿大,“我们赌特朗普会认怂”
-
涉及稀土,马斯克:正与中方协商
-
美国着急放风“即将与日印达成协议”,其实只是…
-
通用电气CEO:别打了,我们还没给中国交付...
-