首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 头条资讯 >> 正文

关于未来大模型跨群跨域跨云面临挑战的思考与建议

2024年4月10日 11:08  CCTIME飞象网  

飞象网讯(易欢)在今天“2024年云网智联大会”上,中国电信科技委主任韦乐平分享了为未来大模型跨群跨域跨云面临挑战的思考与建议。

韦乐平指出,由于单站资源受限,未来可能需要在园区、AZ乃至更大范围内由多个物理集群构成一个超级逻辑集群进行联合训练才能支撑超大模型的训练。推理本身与具体业务场景相关,更可能需要跨域跨云实施。

“挑战也随着而来,其中,距离增大导致时延变大,高频次通信的效率将降低,导致网络吞吐量降低,影响GPU利用率。此外,故障概率也将增大。“

对此,韦乐平也给出了应对策略,解决不同集群间参数的传递和同步以及大量数据跨群跨域跨云传输的不同时延导致的训练速度减慢的问题。一是训练任务被拆分到不同集群上实行并行训练,根据不同的训练任务和场景,采用数据并行、流水线并行、张量并行等多种不同策略。二是采用空芯光纤从物理层上直接降低数据传递时延(降33%)。

与此同时,韦乐平强调,单站单园区集中训练是首选,跨群跨域跨云的训练依然充满挑战!

编 辑:路金娣
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
陈忠岳:中国联通正在开展6G技术指标制定等工作
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像