近日,出门问问创始人李志飞接受《每日经济新闻》记者专访。他认为,当前AI产业面临需求不足、供给过剩且差异化程度低的问题。出门问问从AI硬件转型AI应用,并基于自身需求对模型进行迭代。李志飞认为,AI应用需打造真正有需求的产品,当前还处于浮冰上,要保留跃上坚冰的能力。
每经记者 可杨 每经编辑 董兴生
备考的时候,渴望高分过关的人,最讨厌押不中题的感觉——既想要提高命中率,又不希望因为误判知识点走太多弯路。
创业者也时常会面临如此令人抓心挠肺的时刻,这种心理状态可以简单概括为“彷徨”。
已经创业12年的李志飞最近偶尔会有这样的彷徨时刻,即便他已经在AI应用的创业大潮中浮沉了两轮,即便他创立的“出门问问”已在港股上市,成为“AIGC第一股”。不论是经验还是成就,李志飞的创业成绩单在业内看来都可圈可点。
《每日经济新闻》创刊20周年之际,出门问问(HK02438)创始人、CEO李志飞近日接受记者专访。和不少喜欢描绘胜利时刻的企业经营者不同,李志飞呈现出一种“审视自我”的状态。他坦言,自己不缺乏“押错题”的体验,总是开放地与来访者探讨自己的困惑。
李志飞 图片来源:受访者供图
对当前AI Agent(智能体)和端侧AI这类AI应用的“大势所趋”,李志飞持审慎态度。这与他当年从谷歌离职、回国创业,立志用“AI+语音”重新定义人机交互时的情形大相径庭。
大模型创业潮中,李志飞早早放弃了预训练这条烧钱的“真理之路”,又早早逃离了讲故事融资的“圈套”,他坚持要回归商业本质——打造可持续盈利能力。
当下AI行业的状态,被李志飞形象地比喻为“在浮冰上练习”,他等待着跳跃至坚冰之上的机会,并仍然期待着科技能让人类的生活更美好。
就在不久前,AI眼镜高调重回江湖。百度官宣了小度AI眼镜;小米也被传出入局;Rokid联手通义千问以及眼镜品牌暴龙,预计在明年上半年上市新一代AI+AR眼镜。
AI硬件的风似乎吹了回来。而在创业早期立志要打造下一代移动语音搜索产品的出门问问,早在2020年就已经改弦更张,将业务模式从AI硬件+AI项目制“百分之百、彻底换掉”。
自研智能硬件业务成本高、库存重,SaaS(软件运营服务)业务竞争激烈。“一方面,成本、复杂度都很高;另一方面,收益难以保障。尤其是to B(面向企业)业务中,不同项目间可复用的东西较少,项目规模越大,亏损越多。”李志飞阐述了换道的原因。
早期的业务模式难以盈利,李志飞决心改变,新的技术产品令他眼前一亮。
2020年6月,OpenAI推出的GPT-3,展现了超出以往的通用性。与之前版本相比,GPT-3具有更强大、更灵活和更复杂的文本生成能力,显著降低了人机交互的门槛。
李志飞看到了新的方向,如果模型通用,也许可以解决to B服务领域项目成本高昂的问题。
于是,出门问问开始尝试着手自研类GPT技术,2022年发布自研大模型“UCLAI”,并于2023年4月升级发布“序列猴子”。彼时,李志飞说:“如果说ChatGPT是100分,我们的模型只有50分。虽然还有差距,但(起码)看到了上哈佛的希望。”
然而,行业很快再次发生了变化。2023年7月,Meta和微软合作,推出了开源大型语言模型LLaMA2,在性能上比肩GPT-3.5。
“这可能不是创业公司的机会,如果做最基础的模型开发,需要算力方面的巨大投入。”李志飞意识到。
扎克伯格曾表示,Meta的LLaMA 3系列模型需要价值“数亿美元”的算力来训练,预计未来的模型需要数十亿美元或更多的算力。
李志飞第二次做出放弃的决定:放弃从0到1做预训练模型。
“中国有几个公司能够每年投入如此巨额的资金?”李志飞认为,LLaMA的开源让大模型技术的供给不再具备稀缺性,基于开源技术进行优化、构建模型,效果可能比从零开始训练的模型好。而如果当下仍然强调“从0到1”做预训练模型,“要么是自欺欺人,要么就是搞不清什么状况”。
李志飞不看好纯模型公司的商业模式,按token计费的价格战让企业失去了盈利空间,但模型能力的迭代需要巨额的资金消耗,企业进而失去了独立能力——要么与政府绑定,要么与巨头绑定。
但对现在的李志飞和出门问问来说,解决商业模式的问题,靠自己的努力真正打造出一家可持续盈利的公司,是更重要的事。
图片来源:受访者供图
一家有模型迭代能力的AI应用公司——这是李志飞给出门问问的定位,他将公司的业务重点放在AI应用探索上。很多AI应用公司会选择直接调用第三方模型,但出门问问依旧坚持基于自身需求对模型进行迭代。李志飞认为,“产模结合”才有可能构建起所谓的数据飞轮效应。
无论是放弃过去的大项目制,还是放弃做一家纯模型公司,出门问问无疑都放弃了一些“故事”。作为一家上市公司,至少从股价层面看,这是有压力的。
李志飞毫不讳言出门问问的股价表现有些“糟糕”。但他认为,从业务层面看,出门问问每年都在朝着更加健康的方向发展:项目制、硬件业务营收占比逐渐减少,毛利率在提升,亏损在逐步收窄。出门问问正在成为一家拥有健康可持续盈利模式的公司。
在AIGC(人工智能生成内容)时代,依靠流量与广告赚钱不再是主流,订阅率和留存率成为衡量产品成功与否的必要指标。以出门问问AIGC解决方案的拳头产品“魔音工坊”为例,截至目前,“魔音工坊”注册用户数达800万,付费用户数达60万,同时,“魔音工坊”平均订阅周期达到14.2个月。面向企业的数字人产品“奇妙问”,平均订阅周期在12个月。
“我们其实最大的问题是不讲故事,但又没有规模大到不需要讲故事。”李志飞认为,从技术转化为产品,再形成商业模式,这一过程可能需要三四年的时间才能成功转型。但创业十余年,李志飞坚持认为,迎合资本不是长久之计,作为一个商业主体,必须不断思考如何可持续盈利,尽量做高毛利率的产品,AI时代以真实的用户付费率作为衡量产品和需求的核心指标。
当前,大模型公司和应用层创业公司面临着巨大的压力,资本期待回报,但企业盈利能力尚未形成。
李志飞认为,根源在于AI产业当前的发展遭遇了需求不足的问题。一方面,需求增长没有预期中迅速;另一方面,供给却远超市场预期,且差异化程度较小。
“大家都在探索破局的方法。”在回国创业前,李志飞的身份是一名工程师,对他来说,从工程师到创业者,意味着自己从解题的人变成了定义题目的人,思维的转变是最痛苦的事。
李志飞说,因为工程师的想法是围绕既定目标进行解题,多数情况下,是面对一个明确的问题进行求解。然而,在创业或产品开发中,更多的是要定义这个“题目”本身,选择发展方向、商业模式或交互方式,这些都不是预设好的题目,而是开放性的。
“到今天我也觉得本质上我还是一个工程师,给我一个复杂的题目会让我更加兴奋。”“你刚才问我很多问题,我觉得我都是没有标准答案的。”在采访后半程,李志飞坦言,到底做什么样的产品、用户是谁、怎么去竞争,都是需要定义的题目,对这些问题,他还没有标准答案。
这种感觉让他想起小时候考试的经历,“其实我是焦虑且兴奋的”。
李志飞仿佛再一次开始做练习题。“当方向不明确的时候,唯一能做的就是先做几个练习题。但练习的过程心里难免焦虑,因为不知道学了这个,对解题能力的提升有没有用。”
李志飞还阐述了一个“浮冰与坚冰”的理论。“当前,我们处于一块浮冰上,时刻面临着坠落的风险,大家在竭力寻找‘坚冰’,但没有人知道坚冰在哪里。尽管如此,我们至少还置身于冰块之上,而有些人已经掉进水里。这时,大家唯一能做的就是以最低的能耗在浮冰上运作,等待坚冰显现,并期待彼时依旧具备一跃而上的能力。”
“目前看不到坚冰在什么地方。”李志飞认为,这就是AI应用今天的状态——连用户需求的问题都还没有完全解决。
在李志飞看来,相对于移动互联网时代的微信、滴滴、美团、抖音,今天的AI产品没有这么“刚需”,留存度、活跃度称得上“糟糕”。AI需要打造真正有需求的应用,例如C端的微信、抖音,B端的钉钉、飞书,这些是真实有用的应用产品,对用户而言是一种“不可能再回去”的体验。
AI应用的坚冰什么时候会出现?“都在探索。”李志飞说。
大模型迭代,消除幻觉是关键。而市场对AI的态度,也经历了类似的过程——应用落地碰壁,祛魅开始了。而祛魅的下一步,就是不同商业模式的选择,发展路线开始分化。
“分化之后大家不再这么‘卷’,从这个角度,三年内可能真的会有好公司诞生。”李志飞认为,商业模式的摸索取决于选择相信什么,这直接导向了商业层面的“非共识”,“在一项新兴科技浪潮兴起之初,人们往往会顺着自己的惯性思维去思考”。
李志飞对语音助手的前景持悲观态度,在AI硬件业务时期,出门问问曾做过对语音助手的尝试,他觉得,即便今天技术进步了,需求仍然没有被满足,用户就不会买账。
李志飞也对端侧智能持怀疑态度。在他看来,端侧智能就是“行业的倒退”,无论从用户体验还是隐私保护角度来看,云端才是未来的方向。
当然,依旧有一些共识存在。李志飞认为,技术层面的共识并没有发生摇摆,尽管自己相对悲观,但依旧相信当前这一拨AI相较于前一拨将更加通用,能够通向所谓的AGI(通用人工智能)。
“在当前众多的AI系统和应用中,2022年以前的代码可能已经一行都没有了。在两年时间里,以往做了10年的东西,可能80%都没用了。”李志飞说,这表明这一波技术具有替代性,它更加高效、通用,能提供更好的智能,并且从长期来看会越来越智能。
人工智能的巨浪轮番拍打上岸,变化从以年为单位,缩短到以周甚至以天为单位发生,在创业的第12年,李志飞不再愿意谈宏大的技术理想。
“如果我是去年第一次创业,我肯定是做大模型,因为那个最刺激。”2012年,初次创业,李志飞同样投身当时最为刺激的“语音助手”赛道。现在回头看,他坦言,语音助手不是一个创业公司能做的事情,一方面,当时技术极度不成熟;另一方面,用户需求没有出现,也没有商业案例可作参考。时至今日,即使是“Siri”(苹果公司开发的语音助手),如果作为一个独立的商业模式,同样不可能生存。
投身于语音交互赛道创业时,李志飞的愿景是重新定义下一代人机交互方式,即自然语言交互,在当时,这也是整个科技界的愿景。但直到今天,尽管随着技术的迭代,语音交互在发生变化,但自然语言交互依旧没有实现。
“山姆•奥特曼(OpenAI CEO)每次都说AGI马上实现了,10年前我是会信的,但是今天我不信了。”“理想有时是基于无知而产生的,事实上就是这样。”李志飞觉得,创业之初对商业、竞争对手既没有经验也没有体感,而今天已经很难有当时的心境。
尽管如此,李志飞在言语间仍透露着对科技的热爱,他那想用科技改变生活的愿望仍然在。“我希望科技能让人类(生活)变得更好,对工程师来说,还是希望做的东西是有人用的。”
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。