◎端侧模型的价值在哪里?比如,一家机器人公司生产的情感陪伴机器人,结合终端侧模型,能够使机器人更加理解用户,实现情感交流,为用户带来巨大的情感价值。
◎李大海表示,预计到2026年底,达到GPT-4水平的端侧模型将诞生,这将极大地推动端侧产品快速落地和广泛应用。
每经记者 可杨 每经编辑 文多
在斯坦福大学学生组成的AI团队被指涉嫌抄袭面壁智能的端侧模型MiniCPM-Llama3-V 2.5之后,这家发源于本土的大语言模型公司受到了更多的关注。
“其实通过这次的事件,我们也对开源更有信心。”再次谈起不久前的被抄袭风波,面壁智能CEO李大海说道。
抄袭事件最终以斯坦福大学学生道歉并删除相关模型作为句点,但关于端侧模型的讨论却愈加热闹。
6月15日,在接受包括《每日经济新闻》记者在内的媒体采访时,李大海表示,端侧模型的优势在于其成本效益和可靠性。
他表示,随着技术的进步,同等智能水平模型的参数规模正在以每8个月减半的速度缩减,预示着其知识密度的显著提升。预计到2026年底,达到GPT-4水平的端侧模型将诞生,这将极大地推动端侧产品快速落地和广泛应用。
图片来源:北京智源大会主办方提供
2019年发布全球首个知识增强大模型ERNIE后,面壁智能还发布了中国首个中文大模型CPM-1。现在,端侧模型(Edge Model)——即在设备端上运行的人工智能模型,是面壁智能发力的重点方向。目前,端侧模型通常面向需要快速响应、对隐私保护有较高要求或网络环境不稳定的场景,例如智能家居控制、移动设备上的语音助手、自动驾驶汽车等。
对终端应用领域,李大海表示,无论是PC(个人电脑)、手机、智能汽车,还是前沿智能终端,都有众多实际应用场景与硬件相结合。
举例来说,一家机器人公司生产的情感陪伴机器人,其形态酷似猫咪,旨在满足那些热爱猫咪但却因过敏或行动不便等原因无法养猫的用户的需求。此类产品结合终端侧模型,能够使机器人更加理解用户,实现情感交流,为用户带来巨大的情感价值。
李大海认为,尽管现在很多方案依旧采用云上模型,但当端侧模型可以应用后,设备成本会更低,且可靠性更高,不需要依赖网络,在用户需求交流时,基于端侧模型的陪伴机器人能够迅速作出反应。基于这种比较优势,在适用端侧模型的场景中,大家会更倾向于选择端侧解决方案。
目前,端侧模型在特定场景下,已经完全可控,但何时能够大规模应用?
李大海介绍,相同智能水平的模型,每8个月其参数规模将减少一半,这与摩尔定律具有一定的相似性。在同等性能下,参数规模缩小,说明大模型的知识密度在不断提高。
他表示,大模型知识密度提升、端侧算力增强这两个因素叠加,面壁智能有信心在2026年底前研发出达到GPT-4水平的端侧模型,当端侧模型能够实现GPT-4水平时,很多端侧的产品会更快落地。
对于全球已问世大模型各自的优势,李大海认为,当前大模型已经成为主流技术共识,在这一大方向下,有更多细分的方向在探索。从构建最大、最智能模型的维度而言,我国整体相较于最先进水平还存在一定的差距,这主要由资金投入、算力供应、基础设施建设的重视程度等因素共同决定。
与此同时,我国在很多领域也有自己的创新与探索,大家各有特点。长期来看,中国拥有丰富的数据资源,而数据是第一性质的能力,优质的数据是构建优质大模型的重要因素。
李大海表示,中国在很多方向上都有自己的创新跟突破。“在大模型这个领域,现在它不是独木桥,需要大家协同创新,创造更新更大的价值。”
图片来源:视觉中国
在开源与闭源之争中,面壁智能是坚定的开源派。
李大海在采访中也表示,会坚定地坚持开源。他认为:“开源跟商业模式有相关性,在我们看来,开源闭源其实只是商业模式其中的一部分。”
李大海表示,端侧模型本身参数相对受限,因此目前它的技能点是有限的,尚不能与GPT-4相提并论,这是一个过程。在当前任何一个场景下,厂商如果需要提供足够优质的解决方案,就需要针对该场景进行定制化的训练,开源一个通用的模型后,仍需通过训练使其适应各种场景,所以开源并不会影响其商业模式;从另一个方面来说,开源能够让更多人去尝试,这能让行业里更多的资源和注意力关注到端侧,这对行业发展是非常好的事情。
“我觉得这个世界的魅力就在于它的多样性。”李大海并不排斥关于开源闭源的讨论。
他解释道:“就像遗传算法,我们不同的人有不同的想法。(抱着)不同的想法去做验证,可能对于某个个体来说,验证是失败,但这个失败对于人类整体来说是有价值的。最后当有人成功时,技术就会沿着最短路径一起往前走。”
以OpenAI最早提到“暴力美学”为例,李大海表示:最初行业里很多人其实并不认同,但是当它得到了突破,大家就放下自己的偏见。“开源闭源的争论,我觉得并不是很重要,重要的是不同团队朝着不同方向,大家各自付出最大的努力,获得成功以后,其实也在为人类的边界做贡献。”
李大海觉得,开源更像是“蚂蚁雄兵”。
闭源模式的优势在于,如果商业模式和数据飞轮的判断能够跑通,其效率可能更高。而开源的优势,是在当前技术及应用场景尚不明朗的背景下,“蚂蚁雄兵”的开源模式能有更广泛的创新探索。
刚刚经历的被抄袭事件增加了李大海对于开源模式的信心,因为发现这件事的是面壁开源社区的用户,随着事件逐步受到关注,更多用户参与进来,帮助面壁发现了更多实质性问题。“如果没有开源,其实我们很难干一件事情,所以开源其实有很强的自净能力。”
图片来源:北京智源大会主办方提供
李大海认为,技术的发展,长期里容易被低估,短期里容易被高估。
他解释说:“大家容易在短期过高地期待它的变化,觉得好像就是‘一日看尽长安花’这种状态,但其实它会有它的规律,要跟场景结合。大家要知道这个技术的边界、怎么能够跟需求的边界更好地匹配,这个是需要时间的。”
李大海认同2024年已经步入AI应用落地元年的观点,在很多场景,AI已经在逐步落地;另一方面,从技术水平的角度看,他认为如果三年以后再回顾,会发现其实大模型已经改变了千行百业,方方面面其实都受到了影响,这就是今天正在发生的事情。
面对未来可能到来的大模型的洗牌期,李大海主张:“天下武功,唯快不破。”在这样一个快速变化的环境中,公司必须具备足够迅速的自我迭代能力,不断审视实际环境的变化,并动态调整自身策略。虽然战略大方向需要保持稳定与定力,但具体的执行策略要不断升级认知,持续提升方法论。
技术迭代以及创新商业可能需要时日,但市场期待却往往有其期限。这一轮的人工智能浪潮,是否还会像过往一样面临潮起潮落?
李大海认为,答案是否定的。因为很多AI在现有场景下的落地都已经发生或正在发生,因此他持乐观态度。过去,AI的发展主要依赖于相关从业者的热情推动,而这一次,整个行业所有的聪明人都会投入到AI应用之中,这是一个本质的变化。“我们相信它是产业级别,是一个所谓的第四次科技革命级别的变化。”
“最重要的是它让人们看到了AGI到来的可能性。或者说按当前的技术路线,我们确实能够往AGI这个方向走到最远,以目前能看到技术方向,它是能走得最远的技术方向。”李大海表示。
谈及面壁智能未来的商业模式创新问题,李大海表示,从技术发展的规律来讲,一般先是技术创新,然后应用创新,再然后才是商业创新,所以商业模式创新往往会落后于技术和应用落地的速度。
具体到面壁智能而言,李大海表示,商业创新还是要看商业模式是让谁受益、谁来交付。现阶段,人工智能技术的主要作用在于赋能传统和现有场景,其另一价值在于创造新场景,这种创新具有颠覆性,同时需要系统承担失败的可能性。他认为,面壁智能不仅在尝试颠覆性创新,同时也会与传统场景相结合,为传统领域赋能,这一发展方向具有较高的确定性,因此也会继续与合作伙伴共同探讨在此方向上的商业模式探索。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。