让超算从阳春白雪到百花齐放!超算互联网将破解“算力荒”

如何弥补人工智能热带来的算力缺口,是5月22日2023大湾区科学论坛上讨论的热点。

国家高性能计算机工程技术研究中心副主任曹振南当天在论坛期间接受第一财经记者采访时表示,国家正在发展超算互联网平台,希望让超算(超级计算)从阳春白雪到百花齐放,服务个人用户、企业用户、政府用户和科研用户。


【资料图】

人工智能的兴起,为各行业带来海量AI算力需求,但AI算力在不同区域、行业分布不平均。国家超算互联网平台的建设目标之一,就是解决算力不均衡的问题,实现超算资源的互联互通、资源共享。

曹振南说,依托集算力、应用、数据、社区等一体的运营模式,实现包括AI算力在内的全国算力资源统筹与调度。当行业用户在研发AI应用时,无需投入海量硬件,依托超算互联网平台就可完成AI大模型训练等复杂计算任务。

2023年4月,国家超算互联网正式启动,22家单位成立超算互联网联合体,今后参与单位将更多。曹振南说,首先建设一个超算互联网平台;其次建立应用商城,使供需方快速对接;第三建立需求发布、项目协同、业务交流的超算社区,最后形成超算互联网技术标准。

在算力中心入网方面,连接国家超算中心,以及其他超算中心和算力中心,各中心以资源池为单位提供算力服务。在应用商城管理方面,提供应用软件、应用平台等应用服务,支持软件开发商、个人开发者,进行应用开发、应用封装、版本提供、测试、应用发布,面向特定用户的需求场景提供专业应用平台及SAAS服务。

目前发展超算互联网平台,面临一些新挑战。如,算力呈现多样化的趋势;硬件超前、软件相对短板,关键软件对外依赖高;超算自主应用软件用户数量少、产品化弱、运营推广不足;算力设施分布不均、接口不统一;不同超算中心、业务实体之间尚未建立共赢模式。

曹振南认为,要逐步破解。现在各大高校、企业,算力比较复杂,人才培养了不少。国家近年对应用软件的支持也很多,关键是如何用。超算互联网要构建大的应用场景,快速对接需求,用互联网的思维,让用户更好地用软件。应用软件越用越好,不用就发展不起来。

“国家超算互联网平台,不仅要连接超算中心,还要连接人,连接应用和服务。”曹振南说,粤港澳大湾区的科研团队多,对算力需求也多。希望把这里的规模化企业、初创企业、研发团队,甚至个人,都纳入国家超算互联网的用户群,促进应用发展、软硬件协同。

如今的科研创新、技术创新,都离不开计算的算力和其他科技结合,有的对超算依赖很大。曹振南举例说,比如,汽车的研发,要用仿真技术,就需大量计算。又如,一旦算力更便宜、更易得,将会使人工智能计算的精度提高。

“超算最早是阳春白雪,今后将是百花齐放、百家争鸣。”曹振南说,超算对产业的助力作用,首先是对国家一些重大的科研项目,进行算力支援;其次是服务于各行业的发展,如,汽车、石油、生物制药等;此外,是服务于人们的日常生活,像气象预报。

“我们希望不仅服务于国家重大工程、重大创新,同时服务于企业(包含中小企业)的发展,甚至还服务于个人。”在曹振南看来,如今还有大量的个人开发者,这块也是非常重要的。国家超算互联网平台,把用户分为几类,包括个人用户、企业用户、政府用户和科研用户。无论大企业、中小企业,还是个人,今后可能花一点点钱就能享受超算互联网的算力。

曹振南预计,未来算力的成本将快速下降。某个超算中心会有使用周期,如何实现超算中心的可持续发展?答案是,把超算中心连起来。一个超算中心会面临机器下一代升级的问题,或者会有新机器好用、老机器不好用的问题,但是老超算中心的客户、服务团队成熟,而新超算中心会面临客户、团队培养的问题,所以连起来,可以优势互补、资源共享。

“超算互联网不仅是一个科学和技术问题,也是一个工程问题,还是一个商业模式问题。”曹振南说,国家超算互联网平台的商业模式,是要让大家实现共赢。

关键词: