首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

李开复披露大模型创业进展:开源、To C、超级应用方法论

2023年11月7日 07:32  第一财经  

11月6日,零一万物创始人及CEO李开复带队创办的AI 2.0公司零一万物,正式发布首款开源预训练大模型 Yi-34B。

截至目前,国内外大模型开源平台此起彼伏,如Meta大型语言模型LLama 2,阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。

对于大模型开源平台之间的同质化竞争问题,李开复对第一财经记者表示,有竞争才会有进步,如Hugging Face这样的开源社区,作为独立第三方进行测试,其测试结果会让外界产生自然的关注。但如果只是千家、万家公司每家都做一个没什么价值的开源模型,那这个社区就乱了。

通过竞争可以进行开放式的、公平的对比,让行业知道哪些开源模型是最好的。因此,李开复认为开源模型的发布就是一个验证开源社区与开源方法论的尝试。

Hugging Face作为AI领域的Github,提供大量开源模型与工具。根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B预训练模型取得多项SOTA国际最佳性能指标认可。

此次零一万物开源发布的Yi系列模型,包含34B和6B两个版本。其中开源的Yi-34B模型将发布全球最长、可支持200K 超长上下文窗口(context window)版本,可以处理约40万汉字超长文本输入。此前OpenAI的GPT-4上下文窗口只有32K,文字处理量约2.5万字。今年3月,硅谷 AI 2.0 创业公司Anthropic的Claude2-100K 将上下文窗口扩展到了100K规模。

对于优先选择34B训练及开源的原因,李开复表示,34B是一个黄金尺寸,虽然6B也可以做出在部分垂直领域应用的模型,但模型越大越好,当然也伴随着推理成本与训练成本增加所带来的GPU资源耗费。而34B作为一个黄金尺寸,不会小到没有涌现或涌现不够,又不会过大,允许高效率的单卡推理,且该类推理并不需要H或A级别显卡,甚至RTX4090或3090便足够。既满足精度要求,实现训练成本友好,又能达到涌现门槛,属于非常多商业应用均适配的程度。

对于大模型的具体落地商业化方向,李开复明确其为To C领域,他认为AI2.0时代最大的商机是创造超级应用 Super APP。李开复将超级应用定位为大部分人需要花大部分时间、每天必须用它才能得到价值体现或学到新技术的产品。同时如果将该应用内的大模型拿掉了,整个应用就不成立。

例如李开复虽然认为微软Copilot是很有价值的产品,但未来消费者所使用的office,一定不是在今天的office基础上去堆积功能,而是一个从零做起的东西。也就是说内容的创造不是由人来创造,再由AI来帮一点小忙,而应主要是由AI来创造,人来帮忙,这才是王道。

当然,李开复补充称,零一现阶段不可能自己便将所有的超级应用都做了,因为应用一定是一个简单的开始,再通过精益创业的方法不断迭代,就像抖音和微信的第一个版本并不是超级应用,而是捕捉到用户的需求,同时通过新平台的技术精髓来做一个大家都喜欢的简单应用,然后不断根据用户反馈进行调整,最终迭代成超级应用,这是零一万物做超级应用的方法论。

目前零一所发布版本以文字为主,但多模态仍是努力方向。李开复表示,零一万物目前在多模态方面已有超过十个人的团队,目前美国在多模态领域已进入白热化竞争状态,如DALL-E3、GPT-4V,还有即将推出的谷歌 Gemini,都将多模态作为两家公司最大的竞争关注领域,零一肯定也要参与这一竞赛。

至于大模型落地应用之后的商业化问题,在AI1.0时代投过许多AI创业公司的李开复总结认为,AI1.0的公司所面临的挑战,一是收入没有做好,二是收入没做到可持续,许多AI1.0时代的收入问题做不好的公司很早就被淘汰了。他仍旧以抖音与微信举例称,两款产品规模化与利润率以及收入质量都高于大部分做商业、做系统集成、做To B业务的公司,所以零一坚定不移走消费者端To C路径。

目前零一万物团队成员主要来自Google、微软、阿里巴巴、百度、字节跳动、腾讯等国内外企业,零一万物技术副总裁及AI Alignment负责人是 Google Bard/Assistant 早期核心成员,主导参与了从 Bert、LaMDA 到大模型在多轮对话、个人助理、AI Agent 等多个方向的研究和工程落地;首席架构师曾在Google Brain与Jeff Dean、Samy Bengio等合作,为TensorFlow的核心创始成员之一。

接下来,零一万物将基于Yi 基座模型,快节奏开源发布一系列量化版本、对话模型、数学模型、代码模型和多模态模型等,邀请开发者加入,培育新型“AI-first”创新生态体系。

编 辑:高靖宇
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像