每日经济新闻

    中国天眼用AI寻找脉冲星背后:天文工作被重新定义 AI服务边界在不断拓宽

    每日经济新闻 2021-07-13 15:01

    ◎脉冲星是宇宙中较为暗淡的星体,肉眼不可见,信号暗弱,且容易被人造电磁波干扰。之前,天文学家们每天需要从FAST拍摄的海量信号图中,肉眼识别出脉冲星。

    ◎而借助AI+云计算的技术能力,3天就可以处理完原来需要人工用1年才能完成的数据工作量,照此计算,AI的数据处理效率比人工提升了120倍。

    ◎AI在天文领域的应用的确是基础,有了AI的能力,脉冲星数据预处理和信号的发现效率会越来越高,准确率也会不断提高。

    每经记者 刘玲    每经编辑 文多    

    3月27日,工作人员在“中国天眼”总控室内。图片来源:新华社

    7月10日,2021世界人工智能大会(WAIC)在上海落下帷幕。在经历过三次潮起潮落后,人工智能已然褪去了神秘的外衣,这届大会似乎也更加“务实”了。正如华为轮值董事长胡厚崑逛完展览后的最大感受:“酷炫”的技术少了,实际落地的AI应用多了。

    比如在开幕式上,李彦宏分享了AI在共享无人车、智慧助老领域的落地——计划未来2~3年将共享无人车服务推广到30个城市,同时会推出“更像机器人“的汽车;又如董明珠提到的AI对制造业带来的颠覆性革命,可帮助打造“黑灯工厂”等等。

    而腾讯则把AI的目光放到了137亿光年外,与国家天文台联合启动“探星计划”,帮助中国天眼FAST寻找脉冲星。AI行业人士表示,经过多年的发展,AI技术的服务边界不断在拓宽,已从“脚踏实地”发展到“仰望星空”,越来越多行业将被重新定义。

    大会结束后,《每日经济新闻》记者采访了中国科学院国家天文台研究员、FAST首席科学家李菂,腾讯云副总裁、腾讯优图实验室总经理吴运声,腾讯优图实验室副总经理黄飞跃,深入探讨了AI在天文探索中的应用和难题,以及如何拓宽AI服务边界。

    天文工作被AI重新定义

    FAST的全称为“500米口径球面射电望远镜”(Five-hundred-meter Aperture Spherical radio Telescope),是世界上最大的射电天文望远镜,也是中国有史以来最大的天文工程,工程的核心目标在于搜寻与发现射电脉冲星。

    据了解,脉冲星会周期性发射电磁波,被称作宇宙中的灯塔,是研究宇宙演化的理想天体。然而如何发现和确定脉冲星的存在,一直是天文领域难度较高的研究:脉冲星是宇宙中较为暗淡的星体,肉眼不可见,信号暗弱,且容易被人造电磁波干扰。

    图片来源:腾讯提供

    上图是“中国天眼”FAST捕捉到的一张“脉冲星”信号图,普通人很难从信号图中看到星星的痕迹。李菂告诉《每日经济新闻》记者,天文学家们每天需要从FAST拍摄的海量信号图中,肉眼识别出脉冲星。

    肉眼识别的工作量有多大呢?吴运声表示,FAST每天将会产生500TB的数据,它在一周内产生的脉冲星观测数据,大约是3000多万张信号图,如果完全由人工肉眼处理,即使不吃不喝,1秒一张审核,也需要一年时间才能才能处理完。

    “数据是对电磁场的高速采量,在这上面做信号处理和频谱分析,得到一个视频动态谱。一个维度是时间,一秒钟700转,有1万个点;另一个维度是频率,1秒钟1万谱。”李菂说道,“人眼是没办法处理的,因为太快了,(所以)我们处理的大多数情况是照片,把它截出来。但截出来以后可能量还是太大了,所以要做进一步地信息提取。”

    如此巨大的数据量困扰着天文学家们。在距离FSAT一千多公里的深圳,腾讯优图实验室的研究员们也在进行头脑风暴,试图寻找更多AI落地的场景。

    黄飞跃向记者回忆道,今年初,腾讯优图实验室的几位天文爱好者提出,可以将计算机视觉技术用于天文学中对脉冲星的搜索。于是,腾讯优图实验室便联系了国家天文台,双方一拍即合,达成了合作意向。

    “我们是一个很小的行业,虽然目前也有运用机器学习和人工智能技术,但我们缺乏一线的,在底层做开发的能力,这就是为什么我们愿意跟有专业背景和架构的单位合作,这种合作产生的效益也比较快。”李菂表示。

    据吴运声透露,借助AI+云计算的技术能力,3天就可以处理完原来需要人工用1年才能完成的数据工作量,照此计算,AI的数据处理效率比人工提升了120倍。黄飞跃表示,AI在天文领域的应用的确是基础,有了AI的能力,脉冲星数据预处理和信号的发现效率会越来越高,准确率也会不断提高。

    3月29日,晚霞中的“中国天眼”全景。图片来源:新华社

    AI探索脉冲星难在哪?

    虽然AI的加入,让脉冲星的探索效率大幅提升。但是黄飞跃告诉《每日经济新闻》记者,利用人工智能探星并没有那么容易,还有几大难点需要克服。

    首先,AI需要进行深度学习训练,其核心需求便是:拥有海量已标注的数据作为训练数据,用它们来调整优化算法模型。但天文研究里,带有标注的训练数据相对偏少,会给模型训练带来困难。

    其次,同样的天体信号,用不同望远镜、不同的观测设备,得到的数据和展现形式并不相同。“缺少标注的数据,我们可以用自监督的学习方法。不同设备得到的数据,我们可以用跨域学习的方式来训练模型。”黄飞跃表示。

    双方合作后,腾讯优图实验室第一步便是对FAST采集的数据进行预处理。黄飞跃介绍,FAST一天采集到的数据大约有500T,如何将这500T数据转换成更有效的数据呢?实际上就是要做一系列的原始信号处理,处理后就能够大幅加速筛选的效率。

    “另外,对信号我们会用机器学习的方式来寻找疑似样本,再交给专业的人员看是不是真正发现了信号。后续我们的新算法将会进一步提高准确率,降低后期专业人士的人为筛选的工作量。”黄飞跃表示。

    据了解,除了脉冲星,腾讯还将通过AI重点辅助搜索辐射模式更特殊、天体运动更复杂的天文现象,例如“近密双脉冲星”和“快速射电暴”等。其中,“近密双脉冲星”是特殊的天体系统,由于其复杂的运动模式很难被现有算法发现。

    探索难度大、AI投入高,腾讯与国家天文台“探星计划”能不能实现商业化呢?对此,吴运声坦言,此次合作并没有考虑收益点,“不管是优图还是腾讯,我们不是每件事情都要考虑它的经济价值,从之前的AI寻人到这次的探星计划,跟实际的经济收入都没有什么关系,都是促进社会的可持续发展”。

    应用于智能美育的作画机器人 图片来源:每经记者 夏冰 摄

    AI服务边界不断拓宽

    过去几年间,在技术进步和规模化应用的推动下,AI芯片算力成本不断下降:TOPS(每秒可进行一万亿次运算)的成本从千元降到了几百元。而进入2020年,AI芯片算力成本更是步入100元级。

    在AI芯片算力成本降低的同时,算法的效率却大幅提升。在应用层面上,龙头企业在近几年商业落地的过程中,不断积累了大量的行业know-how,也大大开拓了AI的智能化应用场景和边界。

    在2021世界人工智能大会现场,可以看到坐拥130000词条的“云上辞海”、可以体验探知AIWIN赛事前世今生的AR眼镜、也可以观摩技艺娴熟的调酒机器人,人工智能的应用场景已经渗透到我们生活的方方面面。

    正如李彦宏在演讲中提到,人工智能将会是影响未来40年人类发展的变革力量。这个力量今天正在不断地积蓄,在交通、金融、工业、能源、媒体等各行各业,人工智能技术的应用,都给出了行业数字化升级的新思路和新解法。甚至,它已经开始重塑整个行业的面貌,进而影响人类社会的未来。

    不管是百度推出的新一代共享无人车Apollo moon,还是格力的“黑灯工厂”,抑或是腾讯与国家天文台的“探星计划”,实质上都是在不断拓宽AI的服务边界。

    胡厚崑也在演讲中提出,“大胆运用技术手段去突破当前AI普惠的瓶颈”。不过,在他看来,当前的瓶颈不是在技术和应用的需求上,而是在开发的效率上,“现在AI开发的效率太低,严重阻碍了技术和需求的结合,现在的模式还是比较传统的手工作坊的模式”。

    对此,吴运声称,AI落地的前提是要深入行业。不同的行业信息化程度不同,因此解决方案也需要调整。例如,金融客户的信息化水平较高,无需提供完全的解决方案,而一些传统的工业企业由于信息化能力较弱,则需要直接解决问题的方案。“各个行业的阶段不太一样。我们要在不同行业洞察其适用AI的特点。”吴运声说道。

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    蓝帆医疗:公司刚获得注册的Biofreedom支架和未来将要上市的DCB、瓣膜等多个系列产品,预计都将显著获利于通过集采获得的销售网络

    下一篇

    上证指数收盘上涨0.53%,北上资金当日净流入25.79亿元



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验