近一年以来,随着基于大模型技术的新一轮人工智能技术浪潮崛起,如何有效应对AI部署带来的功耗和成本挑战?如何构建可持续的算力系统?AI PC能改善消费电子需求减弱的现状吗?一系列的问题,成为整个科技行业的热门议题。
近日,新浪科技《科创100人》采访了英特尔研究院副总裁、英特尔中国研究院院长宋继强。对话中,宋继强指出,“应对大模型部署的功耗和成本挑战,可以从芯片制程、系统架构、异构算力以及数据中心规划设计等多维度入手。”
作为最为底层的芯片算力企业,英特尔和国内外众多云厂商、电信厂商已有超过十年的合作,其间作为顾问去帮这些企业成立数据中心,做架构优化,过程中积累了大量的经验。谈及国内该如何构建可持续的算力系统时,宋继强强调,“在新建数据中心的时候,一定要严卡能效比。”
在宋继强看来,AI PC概念的提出,类似于之前在计算机上加上WiFi功能一样的变革。因为体积和算力的原因,电脑可以把多种算力架构组合进去,支持更多的生成式AI创新。
“与手机相比,PC能支持更多生成式AI创新”
近一年以来,随着生成式AI技术的快速发展,越来越多的PC和消费电子厂商纷纷围绕AI技术展开创新,AI PC的概念也随之出现。作为个人电脑领域最为底层的芯片算力提供商,英特尔如何看待这一轮AI浪潮对于PC等消费电子行业的影响呢?
宋继强表示,AI PC这一波新的技术增长或应用增长拐点,就像当年把WiFi做到笔记本上一样,因为他突然给传统的 PC或笔记本增加了一些AI能力,这会导致交互方式发生很大的变化,如果PC再去结合诸如边缘智能设备进行工作,这将带来很多生产力上的改变,催生出一些新兴的应用。
“这些被催生出的新兴应用都跟终端设备有关,但目前在手机上的挑战可能要比在 PC上更大。”宋继强表示。
在宋继强看来,由于手机体积较小能够支撑的算力有限,而笔记本或者台式机则可以把多种架构组合起来去实现更多的功能,因此也将能够支撑更多的硬件创新。
“应对AI大模型部署挑战,要从三方面下手”
在部署大模型的过程中,AI工作负载带来的功耗和成本挑战,是目前业界迫切希望解决的。在宋继强看来,AI工作的功耗问题,实际上可以从四方面分别进行解读。
第一,芯片本身是否来自高能效比的工艺节点。如果我们想让AI性能和能效提高,就要选用更具有高能效比的工艺节点去生产。比如,英特尔现在4年5个节点往前推进,从Intel 7、Intel 4、Intel 3,到2024年上半年和下半年分别会大批量生产的Intel 20A和Intel 18A,这些节点每代都会比前一代有两位数性能提升。
“这些都是相对绝对的,因为它是半导体制程所带来,能定义出一个晶体管的能效比、漏电情况、计算次数等,这是最底层的,也是芯片级的。”宋继强表示。
第二,架构设计是否能够跟工作负载特点吻合。有了基础的晶体管制造工艺后,上面就是架构层的事,是如何组织晶体管并让它去形成技术。这里会涉及CPU、GPU、NPU以及DPU等不同的架构,这些架构由于工作模式不同,所以对于自己擅长那部分的工作负载能效比就挺好。比如在模型部署应用里,有一些是属于前期的数据清洗和处理分析,包括数据结构的优化等,这些通过传统CPU加上一些内存架构优化,其实就挺好。如果后面涉及大模型,再引入GPU或者一些专门的AI加速器,性价比会更好。
在宋继强看来,现在的大模型所面临的其实不是计算式主瓶颈,而是内存的带宽和容量是一个很大的瓶颈,所以整个系统的架构里面是不是把这部分专门进行优化,也是它最后效率高低的一个差别。因为只要你负载没运行完,这些都在耗电,不管它是在空转地等数据,还是其他的都在耗电。同时,一些复杂的工作也可以用更具突破性的架构去实现,比如说类脑计算芯片,做同一类任务,你用类脑芯片去实现和用这个传统的CPU+GPU实现,他们的能效比、能耗能相差到千倍以上。
上层系统是否从网络到软件都进行了优化。以数据中心服务器是否用最先进的绿色计算方案为例,在整个服务器数据中心里,要知道怎么给它供电、散热,怎么去减少空调的功率。因为在数据中心里边,除了数据中心计算消耗的电量外,它产生了热,空调就要去对它进行冷却,所以空调的电量也是能耗的一部分。
当然,宋继强也看到,对于想要提高AI能效比的企业而言,想要很好地兼顾好这些不同层面的技术因素,难度也是非常大的。在数智化需求侧期待快速提升时,有什么基于现在技术更灵活、快速的方案呢?据他介绍,在芯片制造、处理器架构以及整个计算系统构成环节,英特尔IDM2.0所提供的系统级代工服务,能够给客户提供全栈式的优化计算方案。此外,英特尔还可以通过专用软件工具或合作客户解决方案,去帮客户优化并构造解决相应的AI能耗和成本问题。
“建数据中心,生态不统一最让人头疼”
据宋继强介绍,在数据中心能耗优化和算网融合的能效比优化方面,英特尔和国内外支持的众多云厂商、电信厂商,已有超过十年的合作历史,英特尔通常会作为顾问去帮这些企业成立数据中心,并做整个架构的优化,过程中也积累了大量的经验。
在宋继强看来,在推动可持续的算力生态建设过程中,一定要严卡能效比。毕竟,现在国内数据中心上量太快了,各个城市都在建设。因此,一定要通过数智驱动等手段,把能效真正地降下来。比如,通过加上传感器做运维辅助,让整个IT系统在运行工作负载的时候能够节能;又或者通过优化空调用电,做到非IT系统的节能。
他结合英特尔绿色数据中心技术框架2.0分享表示,在建数据中心时鼓励要更多地采用稍微先进一些的数据中心架构模式。“因为,一旦数据中心建成并成为基础设施,都是朝着使用10—15年去的,如果中间再去替换的话,成本都非常高”。因此,在做实施时,尽量找有前瞻性的企业或顾问团来做方案,也是非常重要的。
宋继强表示,国内现在在建一些新的计算中心时,有时候也会找英特尔去做咨询。会发现,他们遇到的一些问题是,之前采用的一些异构算力或者技术供应商,经历一年两年以后都消失了,又得重新迭代。“所以现在国内建计算中心的时候也是很头疼的,而且大家的生态都不统一,在这上面开发应用是很大的一个投资风险。”
据他介绍,目前英特尔也会参与国内一些智能算力中心的硬件能效比或计算能力评测中,去定制一些行业标准,去比较不同芯片或不同架构组合对于解决问题的能力,做类似于基准测试的定义,进而促进行业的规范发展。