5月24日,“极客公园 Rebuild 2019 科技商业峰会”现场,王小川作为当天活动第一位演讲嘉宾,回到家乡成都,带来主题为“人和机器的共创未来”的演讲,并演示了目前在语音识别、唇语识别、语音合成、AI语音变声等领域的技术应用。
每经记者 余蕊均 每经实习记者 程晓玲 每经编辑 杨欢
搜狗CEO王小川 图片来源:每经记者 张建 摄
“大家好,欢迎来到极客公园2019年现场……”当搜狗CEO王小川的这句话“变成”高晓松的声音传进听众的耳朵,台下掌声四起。
这是发生在“极客公园 Rebuild 2019 科技商业峰会”现场的一幕。5月24日,作为当天活动第一位演讲嘉宾,王小川回到家乡成都,带来主题为“人和机器的共创未来”的演讲,并演示了目前在语音识别、唇语识别、语音合成、AI语音变声等领域的技术应用。
“我们一直在寻求人和机器的关系。”王小川表示,谈未来,一定要理解二者的关系。当阿尔法狗带来“启蒙”后,究竟什么样的工作将会被取代?人类是否会被机器取代?——这也是过去三年,王小川被问得最多的事情。
搜狗CEO王小川 图片来源:每经记者 张建 摄
阿尔法狗带来“启蒙”
纵观人类历史发展,每次都源于重要的技术突破,而距离人类最近的信息文明,正在计算机和互联网的推动下快速发展。阿尔法狗与李世石的“人机大战”,王小川将之称为一场“启蒙运动”。
“比赛后,我们发现很多年轻朋友把阿尔法狗称为狗狗,对它有很高的接受度,围棋九段选手们把它称为阿老师。”王小川说,“今天,我们通过拟人化的方式接纳了机器。这种接纳的速度会更快一些。”
那么,什么样的工作将会被取代?人类是否会被机器取代?
王小川从机器的强大与局限性两个层面作出解释。他认为,尽管在听觉、视觉等对信息低层次处理的感知上,人工智能已经具备足以超越人类的强大能力,但在以语言为代表的认知领域,机器最终只能成为为人类服务的辅助工具。
他进一步解释道,如果以语言为核心去探讨与之相关的感知和认知,感知是处理语音、图像,认知则是处理对话、翻译和问答。以搜狗最新的AI探索为例,他表示,“搜狗是中国今天To C领域语音识别量最大的引擎。因为我们拥有中国最大的输入法,每天有超过6亿次语音识别请求,包括语音修改,目的就是以语言为核心使得人跟人通过感知能进行更好的沟通。”
语音识别之后,唇语识别、语音合成、AI语音变声等更多技术应用也陆续上线。其中,搜狗首次投入实用的AI语音变声技术,可以把任何人的声音转化成特定声音,“堪称人类表征学习的一次重大突破”。
无论是“变声”为高晓松或东北腔,从专业角度看,这种技术已经不再是简单的语音合成,而是同时将语音、语调、情感做出的迁移。王小川说,与之类似的场景是未来技术可能为人类社会带来的颠覆性变化。
让表达和信息获取变得更简单
值得注意的是,再度亮相峰会的搜狗同传,全程吸引着观众的目光——对比中英翻译准确率,有人感叹“同传要失业了”,也有人发现“AI的理论课”被翻译为了“爱的语文课”。
尽管还未做到百分百完美,但另一个问题在于,当技术进化得越来越准确,人类真的会被机器取代吗?
对此,王小川引用了学术上一个有名的悖论——人脑太聪明了,我们竟然能造成出一台比自己更聪明的机器;人脑太聪明了,我们不能造出一台比人脑更聪明的机器。
“这两个句子都是成立的。”在他看来,未来我们所做出的人工智能跟人脑不是进行直接的比较,也不是做出拟人的机器成为人工智能发展的未来,而是走不同的道路。
王小川表示,在人类最擅长的领域里,机器的设计原理从目前可知道的技术程度是无法到达的;反过来,机器所擅长的领域,人也做不到。同时,人类所共有的智能、生命力以及适应环境的能力,在可见的技术里面,机器也不可能具备。
谈及人与机器的未来关系,王小川认为,技术将和人产生新的融合,它会改变人类,让人类变得更强大,这意味着人与机器协同进化的未来。
在他看来,担心人类被机器取代或超越,其实是一种狭隘的思想,人类应当去接受机器在很多场景下替代人的部分功能,或者增强人的部分功能。
“我们的使命是在人工智能中做简单的工作,让表达和信息获取变得更加简单,在大时代找到自己的位置。”王小川总结到。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。