每经北京3月16日电(记者 李宇彤)3月16日,月之暗面Kimi发布技术报告,对大模型的核心结构残差连接行重新设计,使每一层能够选择性地关注此前各层输出,而非统一求和,48B模型训练效率提升1.25倍。该报告的发布被行业解读为提前预告了下一代模型的关键模块。
《每日经济新闻》记者注意到,报告结尾处显示,月之暗面三位联合创始人杨植麟、吴育昕、周昕宇带领数十名研究员完成了这项研究。报告发布后,马斯克评价Kimi的研究令人印象深刻(Impressive work from Kimi),OpenAI的“推理模型之父”、前OpenAI研究副总裁Jerry Tworek则表示“深度学习2.0要来了”。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。