阿里巴巴开发出一个人工智能(AI)模型,其在斯坦福大学阅读理解测试中的得分超出了人类。据报道,阿里巴巴上周让其深度神经网络模型接受了测试,要求AI给出超过10万个问题的确切答案,而这些问题所构成的试卷被认为是当前世界检测机器阅读水平的最权威标准之一。由阿里巴巴数据科学技术研究院开发的这一AI模型在测试中得了82.44分,相比人类对手82.304的得分稍胜一筹。
每经编辑 周禹彤
人工智能逐步取代人类的工作,早已不是什么新鲜事了。
不过生而为人,大概内心总有点骄傲,觉得在人类的一些保留领域,总不可能被机器战胜的,比如语言文学。人工智能的数据库和算法再厉害,总不能比人类更懂得李白的浪漫和莎翁的幽默吧?
▲图文无关 图片来源:摄图网
然而每经小编注意到,斯坦福大学问答库公布的最新测试结果显示,阿里巴巴开发的智能软件SLQA+和微软的R-NET+都在一对一较量中战胜了人类选手。
同时,阿里的SLQA+还在统一标准的总分对比中战胜了微软R-NET+,成为这个问答库历史上的最高分。
小时候曾被语文课的阅读理解支配过的学渣们,不知道会不会感到恐惧。现在连机器人的语文都比你好了!
每日邮报甚至打出标题:在世界上最难的阅读理解测试中,阿里巴巴的AI破天荒地战胜人类!
英国金融时报指出,随着人工智能对人类语言理解越来越精准,很多曾被认为是专业人士才能胜任的工作都将逐渐被机器人取代,例如博物馆讲解员、客服人员和远程服务的维修技术人员等。
有的媒体甚至“不怀好意”地提醒道,每年双11期间,淘宝的客服人员都忙不过来。如今阿里自己拥有了阅读理解能力超强的AI,要是客户咨询“我的包裹怎么还没到”这类标准问题,未来用机器人处理客户提问效率还更高。
每经小编注意到,斯坦福大学问答库(SQuAD,又称斯坦福大学问答理解数据集)创立于2016年,被自然语言处理学界公认为业内最重要的数据库。
此数据集所有文章都是在全部维基百科页面随机抽取的,数据集的量为当今其他数据集(例如WikiQA)的几十倍之多。SQuAD一共有大约10.8万个问题,以及配套的23215个科普文章段落,成为测试人工智能阅读理解水平的一块重要试金石。
在2018年1月之前,虽然很多人工智能软件得分都相当高,但还没有战胜过人类代表的记录。
每经小编注意到,问答库里的问题设置都有一定难度,并非简单地抓取文字就能回答。
比如,某段的一个问题是,“什么是导致降雨落下的原因”,答案为“重力”。这在文章中需要精确地理解一个包含几层意思的从句结构才能正确回答。
1月5日,来自阿阿里巴巴数据科学研究院(iDST)的SLQA+模型最终取得了82.440的答案匹配度,超越了人类的82.304分。而在另一场比赛中,微软亚洲研究院自然语言计算组的R-NET+模型同样战胜了人类选手。
不过在统一对比的F1标准分(答案部分匹配也能取得一定分数)上,阿里的SLQA+战胜了微软R-NET+,排名问答库第一。
每经小编注意到,中国企业腾讯、科大讯飞以及浙江大学、复旦大学和国防科大的人工智能模型也在这个问答库的历史排行榜中稳居前列。
自动化问答击败了人类选手,对我们来说意味着什么?
对于这个问题,未来主义杂志Futurism认为,这意味着在不久的将来,与人面对面打交道的客户服务活动,都可以被AI取代。就连销售这种传统上被认为需要很强的人际交流能力的职位,也可以被“听得懂人话”的人工智能取代了。
▲图文无关 图片来源:摄图网
毕竟今后的AI可以做到精准理解客户的诉求,并通过海量的文本数据搜寻最合适的答案。
特别是人类将会迈进万物联网的时代,物联网会让人工智能客服的的使用范围更加广泛。过去当你的笔记本电脑出现故障时,你可能在电话这头费劲地描述问题,再根据工程师的远程遥控指示操作修复,这种情景可能会一去不复返了。
每经小编注意到,作为智能客服的阿里小蜜,就采用了这种机器学习阅读理解技术。当顾客对某个商品提出一些基础性的问题时,机器可以直接对商品详情页面中的信息进行阅读和归纳,来解答用户的疑问,提高服务效率。
在双 11、双 12 等流量较大的购物节活动中,这样的自助服务非常有效果。把这些基础性的问题交由智能客服去解决,复杂问题再留给人工客服,可以极大提升工作效率。
除了电商零售行业之外,机器语言理解技术还可以用于博物馆解说指南、在线医疗问题解答等领域中。
英国金融时报指出,双11期间,发货受到延迟的买家可能会蜂拥提问,“我的包裹现在到哪里了”。这种场景其实和斯坦福问答库的问题设置非常类似,阿里的AI完全可以根据手头的信息作出判断和回答。
每经小编注意到,在注定将成为下一代“风口”的人工智能领域,中国起步较早,目前处于世界领先的地位。
每日电讯报感叹说,阿里巴巴从创立到成为世界前十大公司之一,只用了不到20年,“中国速度”实在惊人。
目前,百度在无人驾驶汽车领域的大力研究初见成效,一些最新成果在拉斯维加斯举行的“消费电子展”(CES)上受到好评;腾讯的微信用户达到9亿,也在积极投身大数据领域研究,而阿里数据科学研究院团队则刚刚在全世界最严格的阅读理解测试中取得了历史性的突破;科大讯飞等中国企业的技术实力,也得到了国外媒体的公认好评。
金融时报指出,人口近14亿的中国拥有7.3亿网民,背靠这个海量的市场和数据集合,加上中国政府的大力支持,中国正在人工智能研究上全面超过美国。这个1500亿美元(约合人民币9720亿元)的大市场,未来将会由中国人来主宰。
每经编辑 郑直
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。