首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展

首页 >> 人工智能 >> 正文

阿里通义Qwen2成斯坦福大模型榜单最强开源模型

2024年6月20日 15:37 环球网科技

6月20日消息，斯坦福大学的大模型测评榜单HELM MMLU发布最新结果，斯坦福大学基础模型研究中心主任Percy Liang发文表示，阿里通义千问Qwen2-72B模型成为排名最高的开源大模型，性能超越Llama3-70B模型。

MMLU（Massive Multitask Language Understanding，大规模多任务语言理解）是业界最有影响力的大模型测评基准之一，涵盖了基础数学、计算机科学、法律、历史等57项任务，用以测试大模型的世界知识和问题解决能力。但在现实测评中，不同参评模型的测评结果有时缺乏一致性、可比性，原因包括使用非标准提示词技术、没有统一采用开源评价框架等等。

斯坦福大学基础模型研究中心（CRFM，Center for Research on Foundation Models）提出的基础模型评估框架HELM（A holistic framework for evaluating foundation models），旨在创造一种透明、可复现的评估方法。该方法基于HELM框架，对不同模型在MMLU上的评估结果进行标准化和透明化处理，从而克服现有MMLU评估中存在的问题。比如，针对所有参评模型，都采用相同的提示词；针对每项测试主题，都给模型提供同样的5个示例进行情境学习，等等。

日前，斯坦福大学基础模型研究中心主任Percy Liang在社交平台发布了HELM MMLU最新榜单，阿里巴巴的通义千问开源模型Qwen2-72B排名第5，仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4，是排名第一的开源大模型，也是排名最高的中国大模型。

据悉，通义千问Qwen2于6月初开源，包含5个尺寸的预训练和指令微调模型，目前Qwen系列模型下载量已经突破1600万。

编辑：章芳

声明：刊载本文目的在于传播更多行业信息，本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容。本站联系电话为86-010-87765777，邮件后缀为#cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

相关新闻

·OPPO小布助手改版升级 AI体验更近一步	·发展新质生产力共享可持续未来——中国移动发布《2023..
·2024一季度国内AR/VR出货量同比下降37.8%	·低价或难挽救！最懂苹果分析师：据观察Vision Pro用几..
·Orange正在向巴黎奥运广播商推介部署私有5G网络	·生成式AI将在今年帮助Verizon挽留10万用户
·英伟达正开拓新业务，和戴尔等AI服务器制造商“抢饭吃”	·马斯克：OpenAI的名字是我起的创建它为了对抗谷歌
·5G-A首个版本标准冻结相关商用版图正式展开	·中国电信发布全球首个单体稠密万亿参数语义模型Tele-FL..
·财政部、工信部进一步支持专精特新中小企业高质量发展	·关于传送网升级扩容节奏，韦乐平这样说
·第一名！中信科移动中标	·再创历史新高！英伟达成为全球市值最高上市企业

人物

邬贺铨：大模型下沉到手机将激活万亿元规模手机产业

·刘庆峰：讯飞星火V4.0将提供多项G..

·中国移动设计院原副院长刘涛：6G..

·中国信通院胡坚波：头部领先、以..

·中国铁塔赵敬宝：筑牢数字基础，..

·中国联通傅强：推动移动通信高质..

·中国移动邱宝华：续航5G+计划拥..

精彩专题

CES 2024国际消费电子展

2023年信息通信产业盘点暨颁奖礼

飞象网2023年手机评选

第24届中国国际光电博览会

CCTIME推荐

·财政部、工信部进一步支持专精特..

·火“荔”全开背后的5G新“荔”量

·小折叠“不香了”都要放弃？赵明..

·烽火通信与中铁十一局签订战略合..

·NTT Docomo推进从平流层提供5G，..

·苹果公司计划下个月在马来西亚开..

·AT&T正在推进一项广泛的ORAN战略

·T-Mobile美国宣布计划以44亿美元..

·英特尔GTC科技体验中心开幕，一站..

·助燃新质生产力，江苏移动启动“A..

·中国石油与中国移动、华为公司、..

·1－4月我国软件业务收入3.8万亿元..

·当棉纺业遇上5G！有经典味道，更..

·“人工智能+”行动，中国移动怎么..

·中国移动研究院“6G通感算智融合..

关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图

CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1 电信与信息服务业务经营许可证080234号京公网安备110105000771号
公司名称：北京飞象互动文化传媒有限公司
未经书面许可，禁止转载、摘编、复制、镜像