智能时代的跨越之路：大模型能力提升与AI未来 -- 飞象网

飞象原创（孙迎新/文）很难想象，科学家的脑波兴奋点来得如此突然与猝不及防。今天（9月24日）凌晨，随着OpenAI新一代人工智能大模型o1的推出而变得异常活跃的首席执行官山姆奥特曼，破天荒发布长文《智能时代》，并兴奋地写道：深度学习生效了！

从对OpenAI新一代人工智能大模型的命名就可以看出山姆奥特曼难掩的兴奋。o1这简单的两个字符极有内涵、寓意深远。其中的o是orion猎户座，1代表从头开始，也意味着后续将诞生更多序列。至于猎户座，在科学家们的眼中是无比神圣的，这源于詹姆斯·韦伯太空望远镜在猎户座星云中发现了关键的碳分子甲基阳离子（CH3+），这是一种在星际空间中从未见过的重要碳化合物，除此之外还包括让天文学家们兴奋得手足无措的木星质量二元天体、原恒星、褐矮星等。

o1还有另一个外界比较熟悉的名字，就是此前OpenAI一直在高调宣传的草莓大模型。OpenAI没有延续使用此前的GPT序列，还有另一个重要原因就是其与传统预训练模型有新的变革性训练方法和功能。o1具备复杂推理能力，解决比目前专业的科学、代码和数学模型所能解决的更难的问题。但值得注意的是，相比GPT-4o等其他大模型，o1推理时间较长、使用成本更高，在不需要复杂推理的场景并没有明显优势，也意味着o1并非GPT-4o的替代品，两者将并存，未来不排除实现融合。

这或许也从另一个方面说明o1的问世极其不容易，就连Meta首席AI科学家杨立昆都在为山姆奥特曼捏着一把汗。杨立昆此前忧心忡忡地表示，尽管OpenAI在开始时成功的可能性被认为很低，但其目标是推进人工智能变革，并且应该乐观地发展人工智能。

在人工智能的浪潮中，大模型如同一艘巨轮，承载着人类对于智能未来的无限憧憬。随着技术的不断进步，我们正站在一个新的起点上，探索如何实现大模型的能力提升，走出一条AI跨越之路。

智能时代的跨越之路：大模型能力提升

在大模型的训练过程中，传统的路径是通过增加模型的参数量和数据量来提升模型的性能。这种方法虽然有效但非常暴力，因为随着模型规模的增大，所需的计算资源和数据量呈指数级增长，这不仅对硬件提出极高的要求，也带来巨大的能源消耗和成本问题。

诞生于中国上海的人工智能领先企业深兰科技的创始人陈海波就算过一笔账，结论就是大模型的训练相当费钱，这让公司在大模型的训练与做高性能的自动驾驶系统、手脉识别系统、DMS司机监控系统等之间只能二选一。为此，陈海波非常理智地表示，在大数据和云计算的推动下，人工智能将迎来前所未有的发展机遇，成为引领新一轮科技革命的战略性技术。

好在随着OpenAI的o1模型的推出，我们看到另一种新的训练方式——通过增加学习时间和推理时间来提升模型的能力。o1模型采用了大规模自我对弈强化学习的方法，让模型在不断的自我博弈中学习解决问题，这种方法类似于人类的学习过程，通过不断的尝试和纠错来掌握新技能。o1在数学、编码和科学领域的出色表现，证明了这种训练方式的有效性。

然而，增加参数量和数据量依然是提升大模型能力的重要途径。通过构建更加庞大的模型和使用更加海量的数据，可以使得模型在理解和生成文本、图像、音频等方面更加精准和多样化。例如，谷歌的“大脑团队”通过构建更大的模型，使得机器在视觉识别和自然语言处理等领域取得了突破性的进展。此外，商汤科技联合创始人、首席科学家王晓刚也认为，AI大模型的进化速度将一日千里，一旦AI收到用户的海量反馈，“智慧飞轮”会迅速转动。

同时针对让大多数人工智能企业闻风丧胆的大模型训练成本问题，腾讯采取的策略是投入大量资源构建基础模型，并将其应用到每一个业务线中，以推动产业实用化。

深度学习：AI向AGI迈进的桥梁

可以毫不夸张地说，深度学习是现代人工智能的基石，也是通往AGI（Artificial General Intelligence通用人工智能）的必由之路。它通过模拟人脑的神经网络结构，使得机器能够从数据中自动学习和提取特征，完成复杂的任务。随着深度学习技术的不断进步，大模型的能力才能得以不断提升。华为与科大讯飞合作打造基于深度学习的通用大模型底座，被视为中国在该领域的重要里程碑，也体现了双方在人工智能和信息技术基础设施上的深厚积累。

深度学习为大模型提供了至关重要的复杂推理能力。o1模型的推出，就展示出深度学习在复杂推理能力上的巨大潜力。它通过内置的思维链（CoT）和推理标记，使得模型能够在解决问题前进行深入的思考，并将推理过程外化，使得模型的决策过程更加透明和可解释。

深度学习的发展也推动了大模型在跨模态能力上的突破。例如，通过深度学习技术，大模型不仅能够理解和生成文本，还能够处理图像、音频等多种类型的数据，实现更加丰富和自然的人机交互。

算力提升：计算卡从万卡向十万卡演进

算力是推动大模型发展的核心动力。随着模型规模的增大和训练复杂度的提高，对算力的需求也在不断增长。对此，华为是深有体会，华为轮值董事长孟晚舟指出，算力的稀缺和昂贵是制约AI发展的核心因素，因此华为将改变传统的服务器堆叠模式，以系统架构创新的思路打造AI集群，实现算力提升。

作为智算集群的最小计算单元，人工智能计算卡从万卡到十万卡的演进，不仅仅是数量上的增加，更是对计算资源的优化和利用。通过构建更加高效的智算集群，可以更好地支持大模型的训练和推理，提升模型的性能和应用效果。然而这个过程时刻伴随着人工智能企业在成本与性能之间的痛苦摩擦，百度副总裁石清华就表示，人工智能已经从“散装”的上半场发展到了“通用”的下半场。只有让用户达到降本、提效、增收的目的，才是一个合格的人工智能。

AI基础设施的建设因此也成为了重中之重。为了支持AI的发展，需要建设足够的基础设施，包括数据中心、能源容量和传输、半导体制造等。这些基础设施的建设，将为大模型的训练和应用提供强大的支持，这一点作为“老牌”人工智能企业的微软看得尤其透彻。微软全球资深副总裁侯阳表示，微软坚信任何一家公司都需要具备驾驭算力底座支撑中国人工智能事业的发展。有了强大的AI基础设施，人工智能才能展现出巨大潜力，未来每个应用程序都将由人工智能驱动。

总而言之，在智能时代的跨越之路上，大模型的能力提升是我们探索的核心。通过革新训练方式、深化机器学习技术、提升算力，我们正逐步推动人工智能向通用人工智能迈进。这不仅是技术的突破，更是对人类智慧的一次伟大致敬。未来，随着技术的不断进步，我们有理由相信，人工智能将带来更多的惊喜和可能，开启一个全新的智能时代。

协同进化：大模型与小模型共绘AI融合之路

如果说人工智能是浩瀚的星河，那大模型与小模型就犹如两颗璀璨的星辰，各自散发着独特的光芒。人工智能大模型通常指拥有超大规模参数（如数十亿甚至数千亿个参数）和复杂计算结构的机器学习模型。这些模型通过深度学习和神经网络技术，能够处理大规模的数据集并完成各种复杂的任务，例如自然语言处理、图像识别等。相对而言，人工智能小模型是指参数数量较少、结构相对简单的机器学习模型。它们在设计和训练上更注重效率和实用性，适用于资源有限的环境中。

大模型与小模型：双星闪耀

在人工智能的世界里，大模型与小模型是两种截然不同的存在。大模型通常指的是参数众多、结构复杂、训练数据庞大的模型，它们在处理复杂任务、进行深度学习和理解时表现出色。而小模型则以其轻量级、快速响应、易于部署的特点，在多种应用场景中展现出独特的优势。例如，OpenAI的GPT系列模型，通过海量参数和数据的训练，展现出了令人惊叹的语言理解和生成能力。

中国在人工智能大模型领域奋起直追，虽然起步稍晚但进展神速。例如，百川智能发布了超千亿大模型Baichuan 3，尽管整体性能还需要追赶GPT-4，但假以时日性能差异将逐步缩小。百川智能的创始人兼CEO王小川表示，百川智能的目标是成为中国最好的大模型，并且正在按部就班地训练其大模型。此外，智谱AI总裁王绍兰也表示，智谱AI在技术追赶速度上与百川智能不相上下，智谱AI的GLM-130B在问世后就战胜了GPT-3。

小模型的应用：助力具身智能的发展

而人工智能小模型则以其小巧的体积和高效的运算速度，在资源受限的设备上展现出了巨大的应用潜力。它们易于部署，对硬件的要求较低，因此在移动设备、嵌入式系统等领域有着广泛的应用。例如，智能手机上的语音助手、智能家居控制等，都是小模型的典型应用。

此外，小模型在具身智能的发展中扮演着重要的角色。具身智能是指通过物理实体与环境交互，实现智能增长的智能系统。在这一领域，小模型以其轻量级和高效的特点，为智能一体机与人形机器人的发展提供了强大的动力。商汤科技联合创始人徐立就对具身智能表现出浓厚兴趣，希望能够跳出思维定势，不断创新尝试，激发更多可能性。

就连IT业元老联想也在人工智能领域分到了一杯羹。联想推出的智能体一体机，通过高度集成的软硬件设计，提供了大模型智能应用落地的最小单元。这种一体机通过最优算力适配，帮助用户快速落地智能体，打通了从概念到应用的关键环节。小模型在这里的应用，使得智能体能够快速响应，为用户提供实时的智能服务。

人形机器人是具身智能领域最吸引眼球的存在。在人形机器人上，小模型的应用同样至关重要。例如，达闼科技的人形机器人Cloud Ginger，通过小模型的应用，实现了迎宾接待、智能问询、航班查询等功能，为机场、酒店等场景提供了智能化的服务。小模型的轻量级和高效运算，使得人形机器人能够更加灵活地与环境交互，提供更加自然和人性化的服务，毕竟人们在这种场景下，需要的是灵活快速的服务响应，获得的是来自于科技的情绪满足价值，而并非是半天不响应，深思熟虑后的专家服务体验。

大模型独特的应用领域依然不可取代

与小模型相比，大模型在一些特定的应用领域具有独特的优势。这些领域通常需要模型具备强大的数据处理能力和深度学习能力。科大讯飞副总裁刘聪就指出，大模型在数据处理能力和智能表现上明显优于传统的小模型，应该重新审视人工智能的潜力与应用前景。

在科学研究领域，大模型能够处理和分析海量的科学数据，为科学家提供强大的辅助。例如，在生物信息学领域，大模型能够帮助科学家分析复杂的生物数据，加速药物研发和基因研究的进程。

在气候模拟领域，大模型能够处理和模拟全球气候系统的复杂变化，为气候变化研究提供重要的支持。通过分析历史气候数据和模拟未来气候变化，大模型能够帮助科学家更好地理解气候变化的规律，为应对气候变化提供科学依据。

在人工智能的发展道路上，大模型与小模型正如双星系统，相互补充、相互促进。小模型在具身智能领域的应用，为智能一体机与人形机器人的发展提供了强大的动力；而大模型则在科学研究、气候模拟等复杂领域展现出了独特的优势。未来，随着技术的不断进步，我们有理由相信，大模型与小模型将共同推动人工智能的发展，开启一个全新的智能时代。

AI创新的千面英雄：大模型赋能千行百业的应用之路

大模型正以其独特的魅力和力量，逐渐渗透到千行百业的每一个角落。它们不仅替代了众多脑力劳动，释放了人类的创新潜力，还催生了巨大的经济价值，推动了各行各业的智能化转型。大模型作为人工智能领域的集大成者，通过其强大的数据处理能力和深度学习能力，在多个领域展现出了无可比拟的优势。它们正在替代一部分脑力劳动，帮助人类释放更大的创新空间。

在科学研究领域，大模型能够处理和分析海量的数据，为科学家提供强大的辅助。例如，DeepMind的AlphaFold在蛋白质结构预测上的突破，极大地加速了生物医学研究的进程。在艺术创作领域，大模型能够生成独特的艺术作品，激发艺术家的创作灵感。

在法律、金融、医疗等行业，大模型通过自然语言处理和知识图谱技术，能够自动化处理大量的文档和数据，提高工作效率，减少人为错误。例如，法律行业中的合同分析、医疗行业中的病例诊断等，大模型的应用正在改变传统的工作方式。

大模型虹吸效应：创造更大的经济价值

随着大模型技术的不断发展和应用，一些头部公司凭借其技术优势和资源积累，正在形成显著的虹吸效应，创造出更大的经济价值。

技术优势的积累形成了虹吸效应中的势能。头部公司如谷歌、Facebook、百度等，通过持续的技术研发和创新，构建了强大的技术壁垒。它们开发的大模型在性能和应用上遥遥领先，吸引了大量的用户和合作伙伴，形成了正向的反馈循环。

而商业模式的创新则进一步助推了虹吸效应的形成。头部公司通过大模型技术，探索了新的商业模式和收入来源。例如，通过提供云服务、API接口、智能硬件等，将大模型技术转化为实际的商业价值。此外，大模型技术也为个性化服务和产品提供了可能，满足了市场的细分需求。

在这场由大模型驱动的智能转型盛宴中，各大科技企业纷纷显露身手。腾讯副总裁、AI lab院长姚星表示，尽管目前人工智能仍处于非常早期的阶段，但腾讯的战略包括打造通用AI、成立机器人实验室以及聚焦“AI+医疗”战略。腾讯的策略是投入大量资源构建基础模型，并将其应用到每一个业务线中，以推动产业实用化。

华为常务董事、华为云CEO张平安在世界人工智能大会（WAIC 2024）上表示，中国应追求在行业领域构筑大模型的领先地位。

阿里巴巴集团主席蔡崇信则强调了“开放”理念，助力各行业数字化转型，并发布了AI开源社区“魔搭”，汇聚了大量开发者和优质模型。

商汤科技联合创始人杨帆认为，新一轮AI浪潮带来了AI产业发展的新机遇，大模型并非单纯依赖于“暴力美学”，而是背后涉及大量的软件工程系统问题。未来要推动AI数据的基础设施化，使中国AI产业持续发挥优势，通过构建强大的人工智能基础设施，为AI所需要的算力、算法和数据提供更加规模化、高效率、低成本的基础支撑。

中国移动九天工业大模型：赋能千行百业

9月23日，中国移动以“AI领航，智造未来”为主题，发布了“中国移动九天·工业大模型”应用。中国移动九天工业大模型的发布，标志着大模型技术在工业领域的深度融合和应用，为各行各业的数字化转型提供了强有力的支持。

在行业应用的深度融合方面，九天工业大模型面向石化、电力、矿山、冶金、装备制造等重点行业，提供了AI+工业安监、质检、产业大脑、轻工厂、设备管理等一系列应用。这些应用通过大数据分析和智能算法，优化了生产流程，提高了生产效率和安全性。

作为数字化转型的加速器，九天工业大模型的发布，为工业企业的数字化转型提供了新的路径和工具。通过大模型技术，企业能够更好地理解市场和客户需求，优化产品设计和制造过程，实现个性化和柔性生产。

发布会上，安徽移动副总经理邢宏涛表示，在信息化领域，安徽移动持续推动新型信息服务体系建设，通过深度赋能千行百业，目前已落地超200个5G工业互联网重点项目，覆盖智慧工厂、智慧矿山、智慧冶金、智慧电力等众多行业，形成了工业视觉、AI视频监控、数据采集、标识体系、智能巡检等一批典型“5G+”“AI+”行业应用。

智能时代的畅想：我们看到的AI未来

大模型作为人工智能领域的千面英雄，正在以其独特的方式，改变着世界的面貌。它们在千行百业的广泛应用，不仅替代了众多脑力劳动，释放了人类的创新潜力，还催生了巨大的经济价值，推动了各行各业的智能化转型。随着技术的不断进步和应用的不断深入，我们有理由相信，大模型将在未来发挥更加重要的作用，成为推动社会进步的重要力量。

山姆奥特曼在其《智能时代》一文中描述了他想象的未来：“我相信未来将会如此光明，以至于没有人能够通过文字真正描述它的美好。智能时代的标志性特征将是巨大的繁荣，虽然进展会是渐进的，但一些惊人的成就——如解决气候问题、建立太空殖民地以及完成物理学的发现——最终将变得司空见惯。凭借近乎无限的智能和丰富的能源，产生伟大想法以及将这些想法付诸实现的能力，我们能够做的事情将远超现在的想象。”

是的。这也是我们的智能时代，我们共同的AI未来。

关于人工智能更多前沿新鲜资讯，敬请关注飞象网在2024PT展上的报道。