首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展

首页 >> 人工智能 >> 正文

AI大模型的语言不平等：英语最便宜，其它语言要贵得多

2023年7月31日 09:00 IT之家作者：远洋

用户所使用的语言对于大型语言模型（LLM）的费用有很大的影响，可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示，由于 OpenAI 等服务所采用的的服务器成本衡量和计费的方式，英语输入和输出的费用要比其他语言低得多，其中简体中文的费用大约是英语的两倍，西班牙语是英语的 1.5 倍，而缅甸的掸语则是英语的 15 倍。

推特用户 Dylan Patel（@dlan522p）分享了一张照片，展示了牛津大学进行的一项研究，该研究发现，让一个 LLM 处理一句缅甸语句子需要 198 个词元（tokens），而同样的句子用英语写只需要 17 个词元。词元代表了通过 API（如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2）访问 LLM 所需的计算力成本，这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。

词元化模型（即人工智能公司将用户输入转换为计算成本的方式）意味着，除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构（无论是从语法还是字符数量上），导致它们需要更高的词元化率。例如，根据 OpenAI 的 GPT3 分词器，“你的爱意（your affection）”的词元，在英语中只需要两个词元，但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符（你的爱意），而英文有 14 个字符。

编辑：章芳

声明：刊载本文目的在于传播更多行业信息，本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容。本站联系电话为86-010-87765777，邮件后缀为#cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

相关新闻

·提速云端，引领创新 SAP赋能新型中国企业把握三大发展趋势	·中国广电2024年度工作会议:全面实施“1368N”计划
·电信运营商在生成式人工智能生态中的角色定位	·工信部：已推动超1.4亿台国产智能手机和智能电视适老化..
·机构：2024年小芯片市场规模将达44亿美元	·6G行业新标准再出优选布局场景是发展关键
·机构预测2024年5G智能手机市场：Top3格局不变，5G毫米..	·联想高管：三年内摩托罗拉成为全球TOP3手机厂商
·OPPO与诺基亚签署5G专利交叉许可协议双方将结束所有未..	·Canalys发布2024年全球科技行业十大趋势：中国将成为全..
·赋能千行百业工业互联网让数字化具象化	·我国蜂窝物联网用户已有23.32亿户占移动网终端连接数..
·2023年全国移动短信业务量下降0.3% 收入比上年下降0.7%	·全国移动互联网用户达15.17亿户 2023年全年净增6316万户

人物

工信部张云明：大部分国家新划分了中频段6G频谱资源

·信通院曹蓟光：下一代网络研究正..

·信通院张海懿：量子信息技术已进..

·信通院李文宇：医疗仍是脑机接口..

·信通院周兰：元宇宙尚处于早期的..

·中国信通院孟楠：新型内生安全技..

·栗蔚：算力互联互通体系让算力真..

精彩专题

专题丨“汛”速出动共筑信息保障堤坝

2023MWC上海世界移动通信大会

中国5G商用四周年

2023年中国国际信息通信展览会

CCTIME推荐

·崔巍出席省青年企业家助力高质量..

·2023中国企业信用500强发布中天..

·5G、AI等技术创新应用力度加大数..

·FTTR进入规模发展加速期

·400G将在今年实现规模商用

·喜迎开门红！中信科移动中标中国..

·聚焦开源、合作共建：openGauss打..

·中天科技紧急驰援甘肃灾区首批通..

·情暖陇原，共克时艰！亨通紧急驰..

·强基赋智 | 思特奇数据中台数智化..

·重磅！亨通成为全球“灯塔工厂”

·中信科移动积极参加2023全球6G发..

·数据筑基加速产业升级——思特奇..

·亨通量子“江苏省量子保密通信试..

·5G融合创新提档升级构筑产业新优势

关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图

CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1 电信与信息服务业务经营许可证080234号京公网安备110105000771号
公司名称：北京飞象互动文化传媒有限公司
未经书面许可，禁止转载、摘编、复制、镜像