日前,2024数字基础设施高质量发展大会在深圳成功召开,中国信通院云大所总工程师郭亮应邀发表《智算发展现状与趋势》的主题报告;中国算力平台在会议现场同步设置演示展区,围绕算力生态开展宣介活动。
近日,IEEE《2025年及以后的技术影响》的评选中,AI当之无愧得到了最多的票数,被认为是2025年最重要的技术,且将在安全、教育、健康、能源等方面发挥重要的赋能作用。斯坦福大学的《全球人工智能实力排行榜》,从8个方面42个维度对全球36个国家的人工智能实力进行了评估,美国加权指数总分位居第一;中国在研发、经济和基础设施方面表现突出,位居全球第二。据公开信息,我国2024年发布招投标信息的200多个智算中心分布于全国26个省市自治区的100多个地市,有遍地开花之势;截止2024年11月,我国备案的大模型达到252个。
郭亮认为,集群是智算用得好的首要关键。只要Scaling Law继续生效,大规模算力就具有其独特的优势。另外,大集群对基础设施带来了巨大的挑战,液冷已经在xAI的10万卡集群中得到了规模部署;亚马逊、微软等开始加大对小型核反应堆的关注。近日,ODCC(开放数据中心委员会)启动聚焦百万量级GPU集群的MegaScaleOut项目,是网络领域的很好应对。
边缘是智算用得好的关键之二。推理是训练之外的第二大场景,Nvidia表示,2023年其数据中心部门收入有超过40%的业务是有关部署AI模型(推理)。Intel和AMD在积极使用其CPU应用于推理场景,取得了不错的效果。2024“华彩杯”算力大赛中,中国电信 “基于通用算力的网络大模型泛在推理能力研发与创新实践”得到了评审的一致认可,获得了总决赛的一等奖。
生态是智算用得好的关键之三。从企业来看,Nvidia在多年的积累中,形成了GPU+NVlink+IB+CUDA的一整套生态体系,取得了巨大的成功;从产业来看,算力+算法+数据构成了智算生态的三驾马车,美国在这三方面都具有较大优势。而我国面临着30+以上的AI芯片及多种技术路线的混战,任重而道远。
市场是智算用得好的关键之四。智算的供给侧旺盛,中国算力平台的匹配系统(阅读原文可直接访问)仍是智算供需对接的不二选择。通过整合全国算力资源,优化算力基础设施、网络、资源匹配等监测能力,实现算力资源优化配置和共享,推进全国供给方、需求方和服务方三位一体的整体架构的形成,助力算存运资源统一化、常态化、便捷化建设管理运营。
赋能是智算用得好的关键第五。市场对接完成之后,算力的最终使命是去赋能。近年来,各行业的数字化转型如火如荼,但是如何让大家更好的使用算力、如何让算力发挥更大的效用,是智算及IT从业者当前阶段需要重点处理的任务,让算力真正成为社会经济发展的新引擎,为新质生产力添砖加瓦。