首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展

首页 >> 人工智能 >> 正文

Meta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑，被指针对性优化

2025年4月7日 09:04 IT之家作者：远洋

Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型，并在 LM Arena 测试中取得了第二名的成绩。然而，这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出，Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。

Meta 在其公告中明确提到，参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。而根据官方 Llama 网站上公布的信息，Meta 在 LM Arena 的测试中所使用的实际上是“针对对话性优化的 Llama 4 Maverick”。这表明，该版本经过了专门的优化调整，以适应 LM Arena 的测试环境和评分标准。

然而，LM Arena 作为一项测试工具，其可靠性本身就存在一定的争议。尽管如此，以往 AI 公司通常不会对模型进行专门的定制或微调，以在 LM Arena 上获得更高的分数，至少没有公开承认过这种做法。

这种对模型进行针对性优化，然后只发布一个“普通版”的行为，给开发者带来了诸多困扰。因为这使得开发者难以准确预测该模型在特定场景下的实际表现。此外，这种行为也具有一定的误导性。理想情况下，尽管现有的基准测试存在诸多不足，但它们至少能够为人们提供一个关于单一模型在多种任务中优缺点的概览。

事实上，研究人员在 X 上已经观察到了公开可下载的 Maverick 版本与 LM Arena 上托管的模型之间存在显著的行为差异。例如，LM Arena 版本似乎更倾向于使用大量的表情符号，并且给出的答案往往冗长且拖沓。

截至IT之家发稿，Meta 公司以及负责维护 LM Arena 的 Chatbot Arena 组织暂未对此做出回应。

编辑：章芳

飞象网版权及免责声明:
1.本网刊载内容，凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有，未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载，请必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和飞象网来源。
2.凡注明“来源：XXXX”的作品，均转载自其它媒体，在于传播更多行业信息，并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题，请在相关作品刊发之日起30日内与本网联系，我们将第一时间予以处理。
本站联系电话为86-010-87765777，邮件后缀为cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

相关新闻

·中国信通院李海花：“物联网+标识”赋能低空经济一体化..	·雷军沉默的72小时：逝去的生命与春日的樱花
·Meta发布首批Llama 4大模型，谷歌CEO：AI世界永不无聊	·AI推理时代即将到来
·中国联通与腾讯首批智算集群在宁夏交付使用	·退税季谨防网络诈骗！中国电信“安全管家”三重防护守..
·泡沫会破，技术革命生生不息	·“双足机器人要大行其道?我不看好”
·算法的钥匙，打开AI魔法之门	·Omdia：人工智能催生强劲需求 2024年半导体市场收入激..
·江小涓：AI发展方向的评判核心标准是什么	·朱啸虎：AI应用创业者要勇于承认自己没有壁垒
·AI全面重塑商业经营，快手找到增长新钥匙	·中国移动发布数字乡村升级行动

人物

中兴通讯董事长李自学：算力筑基、 AI 启智，共迎数智化新纪元

·英伟达推进AI原生6G网络，电信大..

·高通首席运营官：AI与5G融合发展..

·MWC2025 | 联想杨元庆：混合式人..

·MWC25丨中国移动副总经理张冬：智..

·GTI国际产业大会丨中国移动总经理..

·华为李鹏：5G持续演进，跃升AI时..

精彩专题

通信产业2024年业绩盘点

3·15权益日 | 共筑满意消费守护信息通信安全防线

聚焦2025全国两会

2025年世界移动通信大会

CCTIME推荐

·全面拥抱智能化时代：打造以AI为..

·中天海缆举办成立20周年“新技术..

·中国民企500强榜单，亨通位次再攀..

·初心如炬十年路奋楫笃行启新程

·成都大唐线缆公司中标国铁沈白高..

·崔根良受邀参加庆祝中华人民共和..

·连接数字化美好未来 | 和中国信科..

·勇追光，向新行 | 通鼎集团连续8..

·西古光通打造5G+智慧工厂，开启光..

·2024财富500强榜单透视：崛起之路..

·上半年电信业务收入累计完成8941..

·固定宽带接入用户总数达6.54亿户 ..

·6月户均移动互联网接入流量超18GB..

·三家基础电信企业发展蜂窝物联网..

·中国移动用户总数突破10亿户

关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图

CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1 电信与信息服务业务经营许可证080234号京公网安备110105000771号
公司名称：北京飞象互动文化传媒有限公司
未经书面许可，禁止转载、摘编、复制、镜像