每经AI快讯,据腾讯官微,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,在大模型的训练和使用过程中,需要大量异构算力的支持,对网络速度与稳定性要求也很高,加上GPU服务器比一般服务器稳定性更低一些,服务器的运维、问题的排查更频繁,整体运维的难度与工作量会高很多。在训练集群中,一旦网络有波动,训练的速度就会受到很大的影响;只要一台服务器过热宕机,整个集群都可能要停下来,然后训练任务要重启,这些问题会使得训练时间大大增加,投入在大模型的成本也会飙升。(每日经济新闻)
上一篇
广西南宁拟定降低收费、延时免费等措施优化停车管理
下一篇
广州地铁3号线要“上市”?最新回应:不实 未纳入基础设施REITs
每日经济新闻客户端
National Business Daily Mobile Version
保费收入涨了,净利润却大跌超40%!非上市财险一季度“增收不增利”背后:超七成险企综合成本率改善,12家投资收益率为负
伊朗公布与美谈判先决条件;英国将向霍尔木兹海峡派战机及军舰;国际油价大涨,美股芯片股跳水;马斯克、库克随特朗普访华丨每经早参
从逾5.8亿元合作到对簿公堂!华东重机子公司诉讼一审判决,捷佳伟创需返还超4.1亿元货款