首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

Meta发布首批Llama 4大模型,谷歌CEO:AI世界永不无聊

2025年4月7日 07:25  第一财经  

当地时间4月5日,Meta公司发布了最新的开源人工智能软件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。这也是该公司迄今为止最强大的两款AI大型语言模型(LLM)。

不过Meta表示,更强大的一款被命名为Llama 4 Behemoth的大模型仍在训练中,该模型将在Meta的混合专家模型(MoE)架构中充当“新模型的老师”。

这也是Meta基于Llama软件首次采用的MoE模型架构。在MoE模型中,单个token仅激活总参数的一部分。Meta表示,MoE架构在训练和推理时计算效率更高,在固定训练FLOPs预算下,相比密集模型提供更高的质量。

以Llama 4 Maverick模型为例,该模型拥有170亿激活参数和4000亿总参数。Meta采用交替的密集层和混合专家(MoE)层来提高推理效率。在这种方式下,尽管所有参数都存储在内存中,但在服务这些模型时,只有总参数的一部分被激活。

Meta最新大模型的发布也意味着科技巨头在生成式人工智能大潮中的投资竞赛进一步升级。此前有报道称,Meta推迟了大模型最新版本的发布,因为在开发过程中,Llama 4 在技术基准方面没有达到Meta的期望,特别是在推理和数学任务方面。

“我们的目标是打造世界领先的人工智能,将其开源,并使其普遍可用,让世界上的每个人都能从中受益。”Meta公司创始人CEO马克·扎克伯格在Instagtam上的一段视频中说道,“我认为开源人工智能软件将构建出领先的模型,而随着Llama 4的出现,这种情况开始发生了。”

谷歌CEO桑达尔·皮查伊(Sundar Pichai)也在社交媒体上就Llama最新模型的发布表示祝贺。他说道:“人工智能的世界永远不会无聊!祝贺Llama团队,继续前进!”

此外,Meta将于4月29日举办首届LlamaCon AI大会。该公司预计还将在今年第二季度推出Meta AI聊天机器人的独立应用程序。

Meta公司首席产品官Chris Cox上个月表示,Llama 4将推动AI智能体(AI Agent)的发展,使其具备更高水平的推理和行动能力。这些AI智能体将能上网并处理大量对消费者和企业有用的任务。

与此同时,Meta正在对AI基础设施进行大量投入。该公司计划今年斥资650亿美元扩建AI基础设施,其中可能包括一个耗资近10亿美元在美国威斯康星州中部建立的数据中心项目。

不过,就在Meta新模型发布之前,该公司人工智能研究主管乔尔·皮诺(Joelle Pineau)上周宣布离职。皮诺是Meta公司的顶尖人工智能研究人员之一,自2023年以来一直领导该公司的基础人工智能研究部门(FAIR),负责公司的前沿计算机科学相关研究,包括Meta的开源Llama系列AI模型和其他技术。

编 辑:高靖宇
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中兴通讯董事长李自学:算力筑基、 AI 启智,共迎数智化新纪元
精彩专题
通信产业2024年业绩盘点
3·15权益日 | 共筑满意消费 守护信息通信安全防线
聚焦2025全国两会
2025年世界移动通信大会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像