首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

ChatGPT 更聪明了!OpenAI 推出 GPT-4 大型语言模型:在诸多测试中表现比人类都好

2023年3月15日 09:29  IT之家  作 者:问舟

Open-AI 刚刚公布了其大型语言模型的最新版本 ——GPT-4(API 候补申请点此)。

GPT-4 可以更准确地解决你的难题,多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈(当前公开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所猜测的那样,微软 New Bing 的聊天功能确实基于 GPT-4。

此外,该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力(注:Be My Eyes 是一款即将推出的智能手机 App,可以识别场景并对其进行描述,类似于大家常见的 AI 识图的加强版)。

除了介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论文,以及详细描述其局限性的系统模型 Card。

OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4 的文本功能支持,但目前还需要等待。IT之家这里需要提醒一下,GPT4 目前仅 ChatGPT plus 账号可用,可选 GPT4 模式进行对话,每 4 小时限制发送 100 条消息。

收费方面,大约 750 个单词的提示收取约 3 美分的费用,约 750 个单词的响应则收取 6 美分(就是问和答的区别)。

据介绍,GPT-4 比以前的版本“更大”,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。

就任务而言,GPT-4 的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达 32768 个标记(约 25000 个文本单词),从而实现比前辈更长的内容创建或文本分析。

OpenAI 表示,GPT-4 错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。

例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,GPT-3.5 在律师考试中的得分一般都是倒数 10% 左右。当然,它们考个研究生还是没问题的。

当然,AI 毕竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多场景下的能力都不如人类。

据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏见、幻觉和对抗性提示。

编 辑:章芳
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像