首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

媒体爆料:发现新一代大模型”没有那么大飞跃“,OpenAI已经改变策略

2024年11月11日 07:03  华尔街见闻  

OpenAI下一个旗舰模型“Orion”,其进步幅度远不如前两代旗舰模型,这直接挑战了人工智能领域一直奉行的“缩放定律”。业界正在将精力转向在初始训练之后改进模型。

随着ChatGPT和其他人工智能产品的用户数量不断攀升,支撑这些产品的核心技术——大型语言模型(LLM)的进步速度却似乎放缓了。

据科技媒体The Information报道,OpenAI开发的下一个旗舰模型“Orion”,目前已经完成20%的训练。尽管表现已接近现有的GPT-4,但进步幅度却远不如前两代旗舰模型之间的飞跃。

该媒体还援引OpenAI 的一名员工称,Orion在语言任务上表现更好,但在编码等任务上可能不会优于以前的模型。另一位知情人士表示,与最近发布的其他模型相比,OpenAI在其数据中心运行 Orion 的成本可能更高。

质量进展放缓,扩展法面临挑战

在过去几年中,LLM使用来自网站、书籍和其他来源的公开文本和其他数据进行预训练过程,这种方法虽然能在一定程度上缓解数据匮乏,但带来的质量提升有限。

OpenAI的员工表示,Orion部分接受了人工智能生成的数据训练,这些数据由其他OpenAI模型生成,包括GPT-4和最近发布的推理模型。然而,这种合成数据导致了一个新问题,即Orion最终可能会在某些方面与那些旧模型相似。

与此类似,其他一些AI公司也面临类似的问题。Meta创始人马克·扎克伯格和Databricks公司创始人Ion Stoica都指出,尽管AI技术在编码、复杂任务解决等方面继续取得进展,但在常识判断和通用任务能力上,性能提升已趋于缓慢。

Orion的进展放缓直接挑战了人工智能领域一直奉行的“缩放定律”,即在数据量和计算资源不断增加的前提下,模型性能将持续大幅度提升。

为了应对GPT改进放缓给基于训练的缩放定律带来的挑战,业界似乎正在将精力转向在初始训练之后改进模型,从而可能产生不同类型的缩放定律。由于高质量训练数据的减少以及计算成本的增加,OpenAI的研究人员不得不开始探讨是否有其他改进模型性能的方法。

例如,OpenAI正在将更多代码编写功能嵌入其模型中,并试图开发一种软件,可以接管个人计算机,通过执行点击、 光标移动等执行其他操作, 完成网络浏览器活动或应用程序的任务。

OpenAI还成立了一个专门团队,由之前负责预训练的Nick Ryder领导,负责探索如何优化有限的训练数据和调整扩展法的应用,以保持模型改进的稳定性。

团队通过训练模型解决大量数学和编码问题,让模型在后期强化过程中逐步提高对这些任务的解答能力。此外,人工评估员还会对模型在不同任务上的表现进行评分,以帮助模型在复杂问题上提供更准确的答案。

巨大计算成本带来的财务负担

然而,随着模型复杂度的增加,训练和运行这些AI模型的成本也在急剧上升。例如,o1模型的推理成本是普通模型的六倍。

即便如此,扎克伯格、Sam Altman等人都曾表示,他们还没有达到传统扩展法的极限。

这也许就是为什么OpenAI等公司依然在投资数十亿美元建设数据中心,希望通过增加计算能力,从预训练模型中获得更多的性能提升。

但OpenAI研究员Noam Brown在TEDAI大会上警告,开发更为先进的模型可能将面临数百亿美元的高昂费用,成为财务上的巨大负担。

“毕竟,我们真的要训练花费数千亿美元或数万亿美元的模型吗?在某些时候,扩展范式会崩溃。”

或许在未来,OpenAI和其他AI公司都需要继续在训练数据和计算资源之间寻求平衡,探索如何在不增加巨大财务负担的前提下,进一步优化模型性能。

编 辑:高靖宇
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
爱立信中国区总裁方迎:新质网络创造新质价值
精彩专题
2024中国算力大会
2024年国际信息通信展
中国信科亮相2024年国际信息通信展
第25届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像