每经编辑 毕陆名
10月28日,传智教育涨停,豆神教育、电广传媒、思美传媒此前涨停,凌云光、华策影视、创业黑马、首都在线等涨超5%。
消息面上,中国独角兽企业智谱AI抢先上线了AI助理工具。智谱技术团队最近推出了一个基于GLM技术团队研究成果的新产品——AutoGLM,这是一个智能体(Agent),能够模拟人类操作手机,执行各种任务。AutoGLM的推出标志着人工智能在“Phone Use”领域的进步,使得AI的应用更加贴近人们的日常生活。
据GLM大模型日前消息,26日,基于GLM技术团队在语言模型、多模态模型和工具使用方面的努力和研究成果,智谱技术团队推出GLM第一个产品化的智能体(Agent)——AutoGLM,只需接收简单的文字/语音指令,它就可以模拟人类操作手机:
在微信上「给老板的朋友圈点赞并写评论」……
在淘宝上「购买某一款历史订单产品」……
在12306上购买火车票……
在美团上点个外卖……
AutoGLM的应用场景还远不止于此。
理论上,通过对GUI的深刻理解,AutoGLM可以完成人类在可视化电子设备(电脑,手机,平板……)上能做的任何事。
它不受限于简单的任务场景或API调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似,真正做到在日常生活、工作中辅助人类。
AI的「phone use」时刻,让我们在通往通用人工智能(AGI)的道路上,再次向前迈了一小步。
AutoGLM基于智谱自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习框架」,克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等智能体研究和应用难题,加之自适应学习策略,能够在迭代过程中不断改进、持续稳定地提高自身性能。就像一个人,在成长过程中,不断获取新技能。
当地时间10月22号,OpenAI竞争对手、AI初创公司Anthropic发布了Claude 3.5模型家族的更新:新模型Claude 3.5 Haiku发布,同时现有模型Claude 3.5 Sonnet获得了升级。
此次备受关注的是,Anthropic同时推出了一个公开测试的革命性功能“computer use”,像人类一样操作电脑。具体来说,Claude能够通过观看屏幕截图,实现移动光标、点击按钮、使用虚拟键盘输入文本等操作,真正模拟人类与计算机交互的方式。
“这对于AI模型来说是一项全新的能力。”Anthropic开发者关系负责人亚历克斯·艾伯特(Alex Albert)在X平台上写道,“我们不是为单个任务开发定制工具,而是向Claude传授基本的计算机技能,让它能够自然地使用人们日常使用的相同软件和工具。”未来,开发者可以借此解放一些枯燥的重复性流程任务,甚至进行开放式任务,如研究。
官方同时提到,当前这一功能仍处于实验阶段,在操作计算机时速度较慢,并且经常会出现错误。一些简单的操作——比如滚动、拖动、缩放,看似人类一挥手就能搞定的事儿,对Claude来说依然是个不小的挑战。而之所以提前发布这项功能,是为了获取开发者的反馈,预计这功能随着时间会逐渐有所改进。
浙商证券表示,近期,国产多模态AI应用的使用情况呈现爆发态势——8月底Minimax推出文生视频模型abab-video-1并应用于海螺AI以来,使用生态呈现加速增长,据“AI产品榜”统计,9月海螺AI网页版访问量环比增长860%;而similarweb数据显示,7月快手“可灵”视频生成大模型上线以来,9月单月web端访问量超1600万次。
该机构认为,AI助理应用的爆发反映出国产多模态AI大模型能力的显著提升,国产多模态AI应用使用情况爆发式增长,为AI助理应用奠定良好基础。
华泰证券表示,AI助理是通往AGI的核心基础,AI助理落地带来多个层次的产业机遇,其中,Agent+终端有望推动人机交互变革,除了在终端销售量价方面的变化外,可能对终端应用的商业模式产生更加深远的影响。
德邦证券认为,由于建立在大模型底层平台上,AI助理在应用场景实现规模化推广以及高频响应后将催生巨大的推理算力需求,推理侧或成为未来算力需求长期蓝海。
每日经济新闻综合GLM大模型、公开信息
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
封面图片来源:视频截图
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。