昨日(9月21日),一位同传译员声讨科大讯飞“AI同传造假”,在网上引起了轩然大波。对此,科大讯飞回应称,科大讯飞从没讲过AI同传的概念,始终强调是人机耦合模式。目前人工智能无法替代同传,只是帮助同传提升效率,这里有一些误会。公司随后表示,在该次会议上,科大讯飞提供的只是会议转写上屏服务。
每经编辑 赵云
资料图(图片来源:视觉中国)
显然,人工智能(AI)做同传,肯定不是先人工翻译,再由机器识别并读出来。
昨日(9月21日),一位同传译员声讨科大讯飞“AI同传造假”,在网上引起了轩然大波。
对此,科大讯飞回应称,科大讯飞从没讲过AI同传的概念,始终强调是人机耦合模式。目前人工智能无法替代同传,只是帮助同传提升效率,这里有一些误会。公司随后表示,在该次会议上,科大讯飞提供的只是会议转写上屏服务。
21日深夜,科大讯飞又通过旗下微博账号 讯飞听见发布声明,同样强调“人机耦合”的概念。
而在科大讯飞站到舆论中心的同时,另一个问题也来了——AI同传如今能力怎么样了,会不会抢走同传译员的饭碗?
9月20日晚间,用户名为“Bell Wang”的同传译员,在知乎发表了一篇名为《科大讯飞,你的AI同传操(qi)作(zha)能更风骚一点吗》的文章,很快引起了网友及媒体关注。
图片截自知乎
文章称,9月20日,Bell来到上海国际会议中心,为2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会做现场同传。
Bell表示,在没有任何告知的情况下,科大讯飞在上海某会场冒名使用同传译员翻译成果且打上“讯飞听见”的logo。而后,他还发现该大会在直播平台上播出,给出的实时同传是机器人声,朗读的内容却是他和搭档的翻译被讯飞识别后转化成的文本。
他同时也表示,科大讯飞事前没有告诉他和他的搭档现场会有语音识别的字幕,也没有告知直播用的同声传译是用机器识别并朗读他和搭档的翻译,更没有征得他们的同意就冒名使用了他们的翻译成果。
换句话说,Bell认为,现场所谓的“AI同传”流程如下:
他很快收到朋友发给他的直播介绍,上面写着:“知领直播引入科大讯飞智能语音技术,实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报,带给你不一样的视听体验”。
于是在愤怒之下,Bell发文揭发科大讯飞“所谓智能翻译的真相”,称这里压根没有人工智能翻译,都是人类智能翻译。
一石激起千层浪,更多的同声传译工作人员在知乎发声,写下自己见过的“大型翻车现场”。
据多家媒体报道,21日下午,科大讯飞董秘、副总裁江涛回应,科大讯飞从没讲过AI同传的概念,始终强调是人机耦合模式。人工智能目前是无法替代同传的,只是帮助同传提升效率,这里有一些误会。
人机耦合是什么意思?字面上看,“耦合”在物理学上指两个或两个以上的体系或两种运动形式间通过相互作用而彼此影响以至联合起来的现象——化用到科技圈,“人机耦合”大意即为强调人与机器的“紧密配合”、“相互影响”。
科大讯飞方面称,在9月17日的世界人工智能大会上,公司董事长刘庆峰已经明确了是人机耦合模式,即机器和人的协同翻译。翻译字幕上中英文同时显示时是嵌入式机器实时全自动同传,单个语种显示时是人工同传。人工翻译时,讯飞听见可以帮助同传提升效率和水平。
据澎湃新闻,9月21日18时30分许,科大讯飞给其发去题为《关于所谓的“同传造假”,我们有话说》的情况说明。文章称,因某会议现场机器转写问题,致同声传译老师对科大讯飞产生误解。经了解,作如下说明:
科大讯飞智能会议系统主要提供两种解决方案:一种是离线翻译,现场全自动翻译并同步展示在屏幕上,没有任何人工同传参与。比如在世界人工智能大会上,马云、马化腾、李彦宏、雷军等人的发言,科大讯飞都是用的这套方案。
另一种是仅提供会议转写上屏服务,比如这次2018创新与新兴产业发展国际会议。主办方考虑到大会专业技术背景,以及参会者来自不同国家、不同口音等情况,专门配备了专业同传译员。科大讯飞应主办方要求仅需提供语音识别技术,直接转写译员翻译结果并在会场大屏呈现,同时应主办方邀约,在直播中合成识别结果,展示科大讯飞语音合成技术。
但有趣的是,在昨日晚间,“讯飞听见”发布的同题文章中,对两种解决方案的描述却出现了微妙的调整,第二种方案出现了早前版本中没有的“人机耦合”,而“转写译员翻译结果并呈现”则变为了“提供语音撰写和翻译结果给同传参考”。
每经小编(微信号:nbdnews)检索发现,在科大讯飞的官方媒体账号上,对于“人机耦合”的最早表述,出现在2016年6月。当时,科大讯飞高级副总裁杜兰前往西班牙,出席了第十二届“中国未来领袖”计划。在一场研讨会上,杜兰说:
人类对人工智能不必焦虑。未来,一定是人和机器耦合的时代,“跨界”将会带来相互合作的无比繁荣的产业生态。
一年后,科大讯飞总裁刘庆峰在接受采访时则说,“人机耦合互动,我认为是未来人工智能最有希望做成的。”
能做到同传的人,无疑是语言方面的天才。让AI去做同传,则是让人工智能处理自然语言,但人工智能显然不具备“天赋”——简单地说,AI做翻译,靠的是海量的分析数据和帮助AI进行学习的模型及优化算法(比如学习根据场景不同辨别一词多义,或是理解口语的模糊逻辑)。
但理论层面的东西,比如自然语言处理(NLP)、隐马尔可夫模型(Hidden Markov Model,HMM)等术语,小编不可能“简单地”讲清楚。因此本文主要根据媒体公开报道,带大家了解一下AI同传的进展。
2017年6月,科大讯飞发布了全球首款实时中英互译神器——晓译翻译机。当时许多宣传文章称,这款产品“可以让人工同传消亡”,“是同声传译终结者”。
这种不切实际的字眼引起广大同传工作者的不满。不过,翻译机的出现也让人困惑,一直闹得火热的AI同传停留在了什么层次?距离同传人员“被下岗”还有多久?
一方面,2017年6月29日,科大讯飞就自己刊文《拒绝神化人工智能技术需踏实前行》称,
目前机器翻译已经取得非常大的进步,在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平,能够帮助人们在一些场景处理语言交流的问题,但距离会议同传以及高水平翻译所讲究的“信、达、雅”还存在很大的差距。
讯飞一直所努力的,是希望通过语音转写和翻译技术帮助同传提高工作效率、减少失误,形成人机耦合的同传新模式,并不是去替代同声传译。
刘庆峰当时在接受采访时也再三强调,希望外界不要神化人工智能技术。“我们从来没有说过要取代同传的职位。我想即使是专业八级的人也不一定能保证说自己就具备了同传的水平。”
另一方面,今年上半年的博鳌亚洲论坛上,首次出现了AI同传。然而据钛媒体称,在如此重要的场合,现场配备的腾讯AI同传却掉了链子,闹出词汇翻译不准确、重复、短语误用等“乌龙”。
图为AI同传内容(图片来源:钛媒体)
在一片质疑声中,腾讯于4月10日做出回应,承认“腾讯同传”确实出现了错误,答错了几道题。据东方网当时报道,业内人士表示,在大型国际会议上使用机器同传主要有两大难点。
一是国际会议同传是语音识别和文本翻译的结合,会场噪音、每个人的停顿语气词等语音信号会对后面的翻译产生影响。
二是会议对于及时性要求很高,不可预知情况很难控制,很难给机器足够的自我调整时间。要解决机器翻译对未知困难的自适应性,相对较难。
但同时也有专家指出:
“机器翻译类似于一个嗷嗷待哺的小孩,有可能成长为一个拥有和人类智能类似的‘人’。过去几年,深度学习的普遍应用让更多的研究者和企业有了开展机器翻译的机会。我希望大家能多些耐心,不要一味地教这个小孩过多的算法,而应该耐心地让这个小孩能多接触不同情景,发掘其自身潜力。”
“从这个意义上,机器翻译和人工翻译是相辅相成的关系,不久以后机器可能会代替一些不专业的翻译者,但是专业的翻译者很难被替代。”
资料图(图片来源:视觉中国)
每经小编(微信号:nbdnews)注意到,就在几天前(9月17日),同样是在上海举办的2018世界人工智能大会上,讯飞听见和腾讯同传,两家语音转文字产品就已展开过一场放在“台面”上的较量。
据媒体报道,马化腾当天在主题演讲时表示“腾讯同传现场采用依靠机器完成,而不是人机协作”;随后上台演讲的刘庆峰则说:“我们希望用机器帮助顶尖同传更好的发展他的能力,机器和人未来必须是协同的。”
在产品表现方面,两家公司最后打了个平手:
从英文流利程度来看,似乎腾讯同传更胜一筹。每逢嘉宾进行演讲语种切换,而科大讯飞的现场反应速度需要更长时间。
而到了一日本专家发表演讲时,腾讯同传直接“罢工”,科大讯飞则凭借实时将现场同声传译的中文语音转文字继续工作。
但需要注意的是,没有噱头也没有出错的人类,更像是当天同传工作的主角。和以往一样,同传工作人员被安排在所有座位后方的一间口译室中,轮流透过耳机接收讲者的讯息,然后对着麦克风进行翻译。坐于会场中的听众通过特殊的音讯接收设备,收听着同声传译员的翻译。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。