8月,第四范式与商务印书馆旗下科技公司万邦同和共同为商务印书馆建设学术出版专业大模型,这也是国内首个出版领域大语言模型。第四范式董事长戴文渊在接受《每日经济新闻》记者采访时表示,这个专业大模型恰恰代表了未来AI的工作模式:不再是简单的“客户提供数据、公司输出模型”的单一流程,而是一个持续迭代、不断优化的过程。
每经记者 可杨 每经编辑 杨夏
在如今的大模型时代,市场上已经不乏具备翻译功能的大模型,但对于出版业而言,真正的挑战在于如何确保翻译的质量和精确度,以满足出版社级别的高标准。“混合专家模型”通过对商务印书馆出版的哲学、历史、法学、经济等上百个专业领域书籍的翻译术语库的训练,确保译文精准度达到“出版级”,解决传统机器翻译准确度差,原文上下文理解不足、译文机翻痕迹重等核心问题。
面对AI技术,大多数人的第一反应往往是思考其可能带来的颠覆性变革;而在看到AI能够完成的工作后,人们的第二反应可能是觉得它仍然显得笨拙、无法胜任某些工作。
近日,在《每日经济新闻》创刊20周年之际,第四范式董事长戴文渊接受《每日经济新闻》记者采访时建议,把当前的人工智能技术视为一名实习生。实习生的初期工作成果可能并不完美,但他们确实能够分担部分工作负担,学习到达一定阶段后,这些“实习生”或许就能胜任更加复杂和重要的工作任务。
长久以来,专业学术翻译面临人才稀缺、周期长、成本高、效率低、难度大等痛点,基于此,8月,第四范式与商务印书馆旗下科技公司万邦同和共同为商务印书馆建设学术出版专业大模型,这也是国内首个出版领域大语言模型。
第四范式的定位是用AI能力服务各个垂直领域。以第四范式与商务印书馆的合作为例,戴文渊指出,虽然当前市场上的许多大模型已经具备了翻译功能,但真正的挑战在于如何确保翻译的质量和精确度。简单的机器翻译早在十几年前就已实现,随着大模型技术的兴起,翻译质量虽然有所提升,但要达到更为严格和专业的水准,如出版社级别的翻译——要求万字之中只允许出现一个错误,并且必须确保术语的专业性,那么,大多数的通用模型还无法满足这一需求。
第四范式与商务印书馆的合作,是基于商务印书馆多年来在数据与专家资源层面的累积,共创一款能够达到出版级别的专用大模型,这是第四范式在众多垂直领域探索与实践之一。
将大模型应用于出版这样的高度专业化领域,并非第四范式一己之力能够做到,而是一个双方深度合作的过程,即所谓的“混合专家模型”。戴文渊介绍,这背后的运作逻辑在于,模型会持续分析并学习商务印书馆的专业数据,同时每天输出翻译成果。这些成果并非直接用于出版,而是需要经过商务印书馆专家的指导和反馈。例如,当某句话的翻译不够准确时,专家会提出改进意见,这些意见随后被纳入AI的学习过程中,从而实现模型的持续优化和提升。
戴文渊认为,这恰恰代表了未来AI的工作模式:不再是简单的“客户提供数据、公司输出模型”的单一流程,而是一个持续迭代、不断优化的过程。以商务印书馆为例,假设其团队中原本有五位专家,现在加入了一名“机器人员工”。这名新员工与五位专家一起工作,每天在专家的指导下产出并改进工作成果,随着时间的推移,他能够承担的工作任务会越来越多,从而提升了商务印书馆的出版效率。
在大模型技术的广泛应用中,戴文渊坦言,虽然某些低门槛、重复性的工作确实会受到一定影响,但至少在目前看来,人类工作并不会被完全取代。举例而言,以往专家在翻译英文文章时,往往需要从零开始、逐字逐句进行翻译;而如今,他们可以在AI已完成的翻译稿件基础上进行修改。并且,随着技术的不断进步和优化,需要人工修订的比例将逐渐降低。他认为,这是一个无限趋近于零的过程,但也许永远不会达到“零”。
面对AI技术,大多数人的第一反应往往是思考其可能带来的颠覆性变革。然而,在看到AI能够完成的工作后,人们的第二反应往往是觉得它仍然显得笨拙、无法胜任某些工作。戴文渊解释说:“我们一开始就把当前的人工智能技术视为一名实习生。”实习生的初期工作成果可能并不完美,但他们确实能够分担部分工作负担。同时,在与实习生的合作过程中,人们可以看到他们每天都在进步和成长。到达一定阶段后,这些“实习生”或许就能胜任更加复杂和重要的工作任务。
具体到翻译工作中,初期可能只是从通用的翻译功能起步,无法达到出版标准,但是通过与已经出版的标准译文进行对比,大模型能够自动识别并改进翻译结果。这一阶段的进步主要依赖于对历史数据的训练,而无需过多的人机交互;第二阶段,涉及没有既定标准答案的翻译任务时,翻译的准确性就需要依赖专家的反馈来不断提升。在这一阶段,模型会不断地从专家的指导中学习和进步。
随着AI能力的不断提升,它对于人类专家指导的依赖会逐渐减少,直到趋近于零。当模型对行业专家的依赖越来越低,AI也将能够赋能更多小型出版社,推动整个出版行业的发展。
戴文渊认为,对于出版行业来说,拥抱新技术已成为不可逆转的趋势。
他表示,回想三四十年前,电脑确实逐渐替代了人们当时的大部分工作,然而,人类总能发掘出新的价值所在。如今,我们正身处另一个变革的时代,未来AI技术同样有可能接管人类目前从事的众多工作。但这并不预示着“人”被替代,相反,人类一定能探寻到新的、能够发挥价值的领域。
从长远的角度看,对于出版业等传统行业而言,接纳这些以大模型为代表的新兴技术,最先显现的改变将是效率的显著提升,与之相应的,利润水平也会迎来增长,与此同时,戴文渊认为,如果效率能达到极致提升,商业模式也可能随之改变。
他举例称,未来的传播媒介可能不再局限于纸质,而是真正转向电子书,这将大幅降低传播成本,书籍的售价可能从现今的几十元甚至上百元,低至一分、两分,这一定需要技术的革新。他认为,颠覆性的变革,不仅局限于出版业,所有行业都需要做好准备,迎接技术革新可能带来的颠覆性影响。生产力的革新,势必会引发生产关系和商业模式的重塑,因此,探寻新的商业模式显得至关重要。
从第四范式的视角来解读,戴文渊认为,新质生产力代表的是一种价值获取模式的转变。
他表示,过去的增长模式,类似于不断地建造新的房屋,从两座到第三座、第四座,从而实现增长。然而,在新的生产力模式下,我们或许无需再通过建造更多的房屋实现增长,而是对现有的两座房屋进行翻修和升级。改造后,这两座房屋不仅能容纳原先四座房屋的人数,还能为他们提供更加优越的居住体验。而这种模式的转变,无疑会让那些过去对数字化转型或智能化不感兴趣的企业,开始重新拥抱这种转型。
戴文渊认为,这是必然趋势,因为当前,已经难以再依赖大规模的资源和投资来拉动增长,而必须依靠效率的提升来驱动价值的增长。“在拥有充足空地的情况下,似乎只需增加房屋建设即可实现增长,那么技术进步的重要性就显得不那么关键了。但从当前情况来看,必须朝着优化现有土地使用的方向努力,因为无论是否愿意接受,现在已没有更多的空地可供建设。”
“对于传统行业而言,新质生产力可能预示着他们的生产模式需要进行变革”,戴文渊分析道,虽然目前的第一波增长主要来源于传统模式与新技术的结合,从而实现了效率的提升,但更大的想象空间并不局限于在传统模式上获得增量,而是当掌握了更高效的技术时,整个生产模式有可能发生翻天覆地的变化。他认为,在下一阶段,AI的角色将不再局限于对传统模式的改进,“当新技术出现时,模式需要发生变化”。
对于AI产业而言,在推进新质生产力的过程中,戴文渊判断,未来几年内,AI公司可能会迎来一个时代性的转折机会,即AI技术将从后台走向前台。现在,行业内已经能看到AI公司开始To C,十年前,如果要做一家AI技术公司,可能只能面向B端客户,因为像推荐引擎这样的技术无法直接服务于C端。然而,现在人工智能技术已经有机会直接触达用户。戴文渊认为,也许在三至五年后,这一趋势将更加明晰。“未来三到五年,AI面向C端与面向B端的体量会达到相当水平,甚至To C可能成为一个更大的体量,这都是有可能的。”
对于那些还在等待或正在进行新质生产力改造的传统企业而言,戴文渊建议,第一步需要认知到AI技术的价值,当认知到AI后,就需要开始思考如何利用这种新的工具来改变他们的生产方式,以提高效率或开拓新的业务领域,“开始往这个方向想了,我觉得离成功就不远了”。
封面图片来源:视觉中国-VCG41N1472123004
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。