自2023年5月14日,天翼智库大模型研究团队发布第1期大模型周报《迎接大模型时代(上):大模型发展简史》起,到本期为止,天翼智库已发布整100期大模型周报。100期周报,见证了大模型产业的快速发展,浓缩了对大模型产业发展规律的认识。本期从往期大模型周报系列文章中精选出“十大行业盛典”、“十大政策”、“十大技术”、“十大产品”、“十大投融资”、“十大观点”、“十大公司”,以飨读者。
十大行业盛典1
1.Meta Connect 2024大会(2024.9.25-2024.9.26)
Meta发布增强现实(AR)眼镜Orion,采用创新的碳化硅材质,结合纳米级3D光波导技术和Micro LED投影系统,眼镜重量不足100克,视野范围(FOV)实现飞跃达70度,用肌电图(EMG)智能腕带实现操作。
2.2024年世界机器人大会(2024.8.21-2024.8.25)
27款人形机器人集中亮相2024年世界机器人大会,专注于家务、医疗、养老、导盲等场景。除代替人类从事繁琐的重复性工作外,还将为人类提供情感陪伴方面的支持。
3.世界人工智能大会WAIC 2024(2024.7.4-2024.7.6)
《人工智能全球治理上海宣言》发布,提出要推动全球人工智能研究资源的交流与合作,推动人工智能基础设施公平分配。
特斯拉二代人形机器人Optimus亮相,全身控制能力和平衡性再次升级,行走速度提升30%,手指能在轻握鸡蛋和搬运重物之间轻松切换。
商汤发布首个“可控”人物视频生成大模型Vimi,仅通过一张任意风格的照片即可生成和目标动作一致的人物类视频,并支持多种驱动方式。
4.2024年度WWDC全球开发者大会(2024.6.10-2024.6.14)
苹果发布全新个人化智能系统Apple Intelligence,将生成式AI模型置于iPhone和iPad的核心中,能够根据个人情境提供智能协助。
5.谷歌2024年I/O开发者大会(2024.5.14)
谷歌发布7大模型22项AI大招,包括200万tokens超长上下文Gemini 1.5 Pro进阶版、Gemini 1.5 Flash轻量级模型、通用AI Agent、高质量文生图模型Imagen 3等多项技术和功能。
6.谷歌云大会Google Cloud Next 2024(2024.4.9-2024.4.11)
谷歌发布多项AI模型更新和产品,包括Gemini 1.5 Pro公开可用、代码模型Code Gemma、首款自研Arm处理器Axion、AI赋能的Workspace、智能视频创作工具Vids、助力企业搭建AI的Agent Builder等。
7.2024年世界移动通信大会(MWC)(2024.2.26-2024.2.29)
英特尔发布全新商用边缘计算平台,代号为Project Strata,可帮助企业在标准硬件上大规模开发、部署、运行和管理边缘应用。
五家运营商成立大语言模型合资企业,SK电讯(SKT)、德国电信(Deutsche Telekom)、阿联酋电信(e& Group)、新加坡电信(Singtel)和软银(Softbank)宣布计划成立一家专注打造特定于电信行业的大语言模型合资企业。
8.2024年国际消费电子产品展(CES)(2024.1.9-2024.1.12)
“AI PC上车”,英特尔誓言逆袭英伟达、高通,英特尔宣布将推出基于AI PC技术的汽车人工智能芯片,与高通、英伟达展开直接竞争,预计首批芯片将于2024年年底推出。
车计算全产品矩阵亮相CES,联想车计算展示面向智能驾驶和智能座舱的全系列域控制器产品、解决方案和基于大模型的智能座舱场景应用。
9.OpenAI首届开发者大会(2023.11.6)
OpenAI公布多项关键技术与产品更新,包括GPT-4 Turbo、Assistants API(助理API)、GPTs等产品,并引入“Copyright Shield(版权保护盾)”机制。
10.2023年云栖大会(2023.10.31-2023.11.2)
阿里云发布通义千问2.0及大模型应用开发平台等产品,包括千亿级参数大模型通义千问2.0、基于通义大模型训练的通义灵码(智能编码助手)等8大行业模型和一站式大模型应用开发平台——阿里云百炼。
十大政策2
1.美国总统拜登签署《关于安全、可靠、可信地开发和使用人工智能的行政命令》
2023年10月30日,美国总统拜登签署行政令,将对AI研发和应用制定全面的监管标准。这是白宫首次发布针对AI的行政令,该命令提出一系列措施建议,旨在加强美国公民在人工智能系统访问有关他们的信息时的隐私保护。
2.联合国大会通过题为“抓住安全、可靠和值得信赖的人工智能系统带来的机遇,促进可持续发展”决议
2024年3月21日,联合国大会通过首个有关人工智能(AI)的全球决议草案,以确保这项强大的新技术能够造福所有国家、尊重人权,并且是“安全的、可靠的和值得信赖的”。美国是这项决议草案的发起国,中国和121个国家参与共同提案。
3.欧盟《人工智能法案》正式生效
2024年8月1日,欧盟《人工智能法案》正式生效。该法案是全球首部全面监管人工智能的法规,标志着欧盟在规范人工智能应用方面迈出重要一步。
4.中央网信办发布《全球人工智能治理倡议》
2023年10月18日,中央网信办发布《全球人工智能治理倡议》,围绕人工智能发展、安全、治理三方面系统阐述人工智能治理中国方案,为相关国际讨论和规则制定提供蓝本。
5.国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》
2024年4月2日,国家互联网信息办公室发布公告:网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求,有序开展生成式人工智能服务备案工作,并将已备案信息予以公告。
6.国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》
2024年1月4日,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》。其中提到,培育数据驱动型产品研发新模式;支持开展人工智能大模型开发和训练等。
7.2024年政府工作报告提出深化大数据和AI研发应用
2024年3月11日,十四届全国人大二次会议表决通过政府工作报告,提出制定支持数字经济高质量发展政策,促进数字技术和实体经济深度融合,深化大数据、人工智能等研发应用,开展“人工智能+”行动。
8.国资委要求央企加快布局发展人工智能产业
2024年2月19日,国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会。会议明确,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业,把主要资源集中投入到最需要、最有优势的领域,加快建设一批智能算力中心,开展AI+专项行动。
9.工信部等八部门探索建设区域人工智能数据处理中心
2023年12月29日,工信部等八部门发布《关于加快传统制造业转型升级的指导意见》,提出将探索建设区域人工智能数据处理中心,通过平台化、网络化等组织形式,发展跨物理边界的虚拟园区和集群,构建虚实结合的产业数字化新生态。
10.工信部提出到2025年初步建立人形机器人创新体系
2023年11月2日,工信部印发《人形机器人创新发展指导意见》,提出到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破。到2027年,人形机器人技术创新能力显著提升,综合实力达到世界先进水平。
十大技术3
1.模型架构
华为改进Transformer架构,同规模性能超Llama。2024年1月2日消息,华为推出新型LLM架构盘古-π,通过增强非线性改进传统Transformer架构,由此有效减轻特征塌陷问题。使用相同数据训练情况下,盘古-π(7B)在多任务上超越Llama 2等同规模大模型,并能实现10%推理加速。
拯救Transformer:DeepMind给模型嵌入“算法推理大脑”。2024年6月17日,DeepMind论文提出用混合架构方法解决Transformer模型的推理缺陷,通过将Transformer的自然语言理解能力(NLU)和基于图神经网络(GNN)的神经算法推理器(NAR)的强大推理能力相结合,实现更加泛化、稳健、准确的LLM推理。
Meta推出多模态模型架构Transfusion。2024年8月24日,Meta推出多模态模型架构Transfusion,结合语言模型在处理文本等离散数据方面的优势,以及扩散模型在生成图像等连续数据的能力,将其整合到语言模型和图像生成模型统一的AI系统中。
谷歌推出选择性注意力机制:降低Transformer模型资源消耗。2024年10月8日,谷歌推出选择性注意力(Selective Attention)方法,可以动态忽略不再相关的标记,从而提高Transformer架构模型性能。1亿参数Transformer模型中,注意力模块的内存需求可减少至1/47。
2.多模态融合
AI视频理解天花板:全新MiniGPT4-Video刷爆SOTA。2024年4月4日,来自KAUST和哈佛大学的研究人员提出MiniGPT4-Video——专为视频理解而设计的多模态大模型,MiniGPT4-Video能够同时处理时态视觉数据和文本数据,因此善于理解视频的复杂性。
马斯克旗下xAI公司推出首个多模态模型Grok-1.5V。2024年4月12日,xAI推出首个多模态模型Grok-1.5V,称其在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等领域均能媲美现有的前沿多模态模型。
谷歌多模态大模型Gemini Ultra能力全面超越GPT-4和GPT-4V。2023年12月7日,谷歌发布全新最强多模态大模型Gemini,有Ultra、Pro、Nano三个版本。在MMLU、DROP、HellaSwag、GSM8K等主流评测中,Gemini Ultra能力全面超越OpenAI的GPT-4和GPT-4V。
OpenAI推出端到端原生多模态大模型GPT-4o。2024年5月14日,OpenAI推出跨音频、视觉和文本的端到端新模型GPT-4o,可以在平均320ms内对人类的语音输入进行响应。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。
中国首个Sora级模型Vidu发布,融合Diffusion与Transformer。2024年4月27日,清华大学联合生数科技发布中国首个长时长、高一致性、高动态性视频大模型Vidu,融合Diffusion与Transformer,开创性创建U-ViT架构,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
华为盘古大模型5.0正式发布:升级多模态能力。2024年6月21日,在华为HDC 2024开发者大会上,华为宣布盘古大模型5.0正式发布,在全系列、多模态、强思维三个方面实现升级。
Meta公布机器人触觉感知能力相关的多项研究成果。2024年10月31日,Meta公布包括传感器、编码器、平台及测试框架在内的一套大模型触觉感知相关研究成果,旨在让机器人通过触觉方式进一步理解和操作外界物体。
苹果推出300亿参数多模态AI大模型MM1.5。2024年10月13日,苹果推出多模态AI大模型MM1.5,可识别UI界面推理自然语言,同时推出专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。
3.强化学习
OpenAI发布首款具备复杂推理能力模型o1。2024年9月12日,OpenAI发布首款具备复杂推理能力模型o1,o1的训练过程依赖于大规模的Self-play强化学习算法,能够通过“链式思维”逐步解决复杂问题,在多项高难度基准测试中表现出色。
4.混合专家模型(MoE)
马斯克旗下xAI公司公开大模型Grok-1的权重与架构。2024年3月18日消息,xAI宣布公开其大语言模型Grok-1的基本模型权重和网络架构,Grok-1是由该公司从头开始训练、拥有3140亿参数的混合专家模型。
国内上线首个开源千亿参数MoE大模型。2024年4月1日消息,国内独角兽企业APUS(麒麟合盛)联合新旦智能训练的大模型APUS-xDAN大模型4.0宣布于近日开源,这是国内首个千亿以上参数MoE架构的开源大模型,参数规模为1360亿。
腾讯发布万亿级异构MoE大模型“混元Turbo”。2024年9月5日,腾讯发布新一代大模型“混元Turbo”,该模型采用MoE架构,相比前代模型,训练效率提升108%,推理效率提升100%,推理成本降低50%。
5.模型压缩
微软推出可手机端运行的小尺寸模型Phi-3。2024年4月23日,微软发布自研小尺寸模型Phi-3,新模型有三个版本,其中Phi-3 mini是一个拥有38亿参数的语言模型,可部署在手机上,但其性能能够与Mixtral 8x7B和GPT-3.5等模型相媲美。
谷歌DeepMind开源轻量级模型Gemma 2 2B。2024年8月1日,谷歌开源端侧大模型Gemma 2 2B,是一款专为在笔记本电脑和智能手机等本地设备上运行而设计的轻量级LLM,在Chatbot Arena测试中,Gemma 2 2B得分超越所有GPT-3.5系列模型,展现出卓越的对话能力。
Meta推出Llama 3.2 1B/3B量化模型。2024年10月24日,Meta推出Llama 3.2 1B/3B模型的量化版(QLoRA及SpinQuant版),量化后模型大小平均减少56%,RAM使用量平均减少41%,模型速度提高2至4倍,同时降低功耗。
6.数据合成
英伟达利用Isaac Sim模拟器和MimicGen NIM微服务合成数据。2024年8月7日消息,英伟达宣布利用AI加速人形机器人开发,通过远程操作采集少量人类演示数据,然后利用Isaac Sim模拟器和MimicGen NIM微服务生成大量合成数据,与真实数据共同用于训练英伟达Project GR00T人形基础模型。
7.AI Agent
智谱AI联合清华KEG提出AgentTuning微调方法,可对齐Agent能力。2023年10月23日消息,智谱AI联合清华KEG提出一种对齐Agent能力的微调方法AgentTuning,该方法使用少量数据微调已有模型,可显著激发模型Agent能力,同时保持模型原有的通用能力。
清华首个AI医院小镇Agent Hospital发布。2024年5月9日,清华研究团队开发首个AI医院小镇Agent Hospital,在这个虚拟世界中,所有的医生、护士、患者都是由LLM驱动的智能体,可以自主交互。更重要的是,AI医生可以自主进化。
阿里魔搭团队发布手机端侧自动化Mobile-Agent-v2版本。2024年6月16日,阿里魔搭团队在Mobile-Agent基础上发布多模态智能体Mobile-Agent-v2,维持基于纯视觉的操作策略,引入多智能体协作架构,强化跨应用操作和多语言处理能力。
OpenAI推出多智能体协作框架Swarm。2024年10月11日,OpenAI推出Swarm框架,旨在解决开发者在多智能体系统编排中面临的复杂挑战,通过简化智能体的协调、执行和测试过程,让开发者能够更高效地管理、互动多个AI智能体。
8.上下文长度(context length)扩展技术
Meta发布有效处理“无限上下文”长度的LLM架构Megalodon。2024年4月17日,来自Meta等的研究人员提出全新神经网络架构Megalodon,专为有效处理“无限上下文”长度的LLM预训练及推理而设计,相较于Llama 2,Megalodon在处理70亿参数和2万亿token任务上,准确率超过Transformer。
国产大模型Kimi在长上下文窗口技术上取得新突破。2024年3月18日,月之暗面宣布Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测,更适用于高效阅读、专业文件解读、资料整理总结等方面。
9.思维链
谷歌DeepMind发表arxiv论文,展示生成式验证器GenRM。2024年9月3日,谷歌展示GenRM技术,该技术无缝集成指令调整,支持思维链推理,通过多数投票利用额外的推理时间计算,微调LLMs作为奖励模型,从而提升生成式AI推理能力。
OpenAI发布首款具备复杂推理能力模型o1。2024年9月12日,OpenAI发布首款具备复杂推理能力模型o1,o1的训练过程依赖于大规模的Self-play强化学习算法,能够通过“链式思维”逐步解决复杂问题,在多项高难度基准测试中表现出色。
10.检索增强生成(RAG)
微软开源GraphRAG:知识图谱+大模型。2024年7月2日,微软开源GraphRAG技术,通过基于知识图谱的检索增强生成(RAG)方法增强LLM处理私有数据的性能,具备跨大型数据集的复杂语义问题推理能力。
十大产品4
1.国外产品
(1)ChatGPT
OpenAI发布ChatGPT,迅速在全球范围内引起广泛关注,仅上线五天用户就超过100万,两个月后用户破亿,被称为“历史上用户增长最快的消费级应用”。2024年2-10月的月平均访问量达到25亿,超过微软的New Bing,位居首位。
(2)New Bing
微软将OpenAI技术整合到旗下搜索引擎必应、营销软件、GitHub编码工具、Microsoft 365办公软件中,构建AI服务体系。2024年2-10月,Bing月平均访问量为15亿。桌面搜索引擎市场中,Bing 2024年全球市场份额为10.5%5。
(3)Text to Image6
在线图形设计平台Canva的“Text to Image”是一款利用人工智能技术,将文本描述转化为视觉图像的工具,在AI产品榜中长期稳居第3名。2024年6月,Text to Image月度用户访问量占上榜的17款图像/设计类应用月度总访问量的71.3%,2024年2-10月的月平均访问量达到6.64亿次。
(4)Gemini
Gemini不仅在多模态智能测试中领先,还深度集成至搜索引擎、Google Assistant智能交互、Cloud AI平台解决方案等多个谷歌产品中。2024年5月,谷歌大会公布Gemini模型通过产品推向数十亿用户,并且已有超过150万开发者使用该模型。
(5)Character AI7
Character AI是情感陪伴的应用,拥有众多人气游戏、动漫IP虚拟人物形象NPC,实现用户和原IP人物互动,吸引大量二次元年轻用户。2024年2-10月的月平均访问量超过2亿次,用户每次访问平均花费29分钟,凭借在AI圈中的强大流量和高用户粘性,有力支持社区生态繁荣发展。
2.国内产品
(1)百度搜索
百度AI搜索功能已覆盖超20%的搜索结果页面,并且AI功能的覆盖率接近70%,为用户提供更加个性化和智能化的搜索服务。2024年6月,百度搜索在移动端市场份额高达69.09%,在国内市场中占据主导地位。
(2)360AI搜索
360AI搜索于2024年1月底问世,基于360智脑大模型,融合了思考、搜索、阅读、写作和追问五大模型,展现出强劲增长力,领跑国内AI搜索引擎市场,发布3个月后其访问量增至1188万次,增速达1303.09%。
(3)Kimi智能助手
Kimi智能助手于2023年10月发布,致力于提供智能化的对话和信息处理服务,能够理解和生成自然语言文本,支持文件解析和网络搜索,提供问答服务、智能体服务及文件处理服务。2024年2-10月,Kimi月平均访问量达20百万;2024年11月,Kimi活跃用户数已突破3600万。
(4)文心一言
百度持续迭代文心大模型系列,相较2019年发布的1.0版本,文心大模型4.0在人工智能核心的理解、生成、逻辑、记忆方面能力全面提升,具备极强的泛化能力。2024年2-10月的月平均访问量达17百万,在生成式人工智能典型产品国内网民使用率中位居第一,占比达到11.5%8。
(5)豆包大模型
豆包大模型于2024年5月15日发布,该模型日均处理1200亿tokens文本,生成3000万张图片,豆包主力模型在企业市场定价只有0.0008元/千tokens,其价格进入“厘时代”,比行业便宜99.3%。2024年5月,豆包APP下载量突破1亿,月度活跃用户数达到2600万,成为首个总下载量过亿的AI产品。
表1 AI产品2024年2-10月平均访问量统计
十大投融资
1.OpenAI宣布获得66亿美元融资
2024年10月2日,OpenAI最新一轮融资66亿美元,公司估值攀升至1570亿美元,确立OpenAI在全球AI领域独角兽公司的领先地位,由Thrive Capital(13亿美元)、微软(7.5亿美元)、英伟达、软银(5亿美元)等投资机构参与。
2.Alphabet旗下自动驾驶公司Waymo获56亿美元融资
2024年10月25日,Waymo完成一轮56亿美元的融资,以扩大其无人驾驶打车服务。此轮融资由Alphabet领投,投资者对其商业化应用潜力持乐观态度,预计会有更多资金流入这一领域。
3.亚马逊将向AI公司Anthropic投资40亿美元现金
2023年9月,亚马逊宣布向AI初创公司Anthropic投资12.5亿美元,支持其开发安全可靠的通用人工智能,2024年3月追加27.5亿美元的投资,使总投资额达40亿美元,AWS成为Anthropic的首选云服务供应商,Anthropic使用AWS专有的AI芯片进行未来基础模型的训练和部署。
4.谷歌承诺向AI公司Anthropic提供20亿美元资金
2023年10月,谷歌公布向人工智能公司Anthropic投资增加至20亿美元的计划,试图加强与OpenAI主要支持者微软的竞争。前期已对其投资5亿美元,拥有Anthropic 10%的股份。
5.微软向阿联酋人工智能公司G42投资15亿美元
2024年4月,微软向阿联酋的人工智能公司G42投资15亿美元,微软获得G42的少数股权,微软总裁布拉德·史密斯加入G42董事会,G42将使用微软的Azure云平台来开发和部署其AI应用,加速G42在全球的AI发展和扩张,推动在中东、中亚和非洲市场的布局。
6.月之暗面获得超10亿美元融资,公司估值超200亿元
2024年2月,月之暗面A轮获得超10亿美元融资,是自ChatGPT发布3个月内、国内AI大模型厂商中单轮融资所获金额最大的一项事件。5月新一轮融资过后,月之暗面已同时获得国内两大互联网巨头——阿里、腾讯的数亿美元融资。
7.思科公司启动一项10亿美元的AI投资基金
2024年6月4日,思科公司启动10亿美元的AI投资基金,承诺向Cohere、Mistral AI和Scale AI等公司投资近2亿美元。思科在过去几年中已进行超20项以人工智能为重点的收购和投资,并在其产品组合中整合人工智能技术。
8.英伟达7亿美元收购一家AI Infra初创公司
2024年4月,英伟达以7亿美元收购特拉维夫AI初创公司Run:ai,Run:ai专注于帮助开发者和运营团队管理和优化AI硬件基础设施,该公司是英伟达继69亿美元收购Mellanox后在以色列金额最大的一次收购。
9.Figure AI人形机器人初创公司获得6.75亿美元融资
2024年2月,人形机器人初创公司Figure AI宣布获得6.75亿美元的融资,由微软、OpenAI、英伟达、亚马逊创始人杰夫·贝索斯等科技巨头联合投资,使Figure AI的估值达到26亿美元。
10.微软与韩国电信公司KT建立合作伙伴关系,未来投入2.4万亿韩元
2024年10月,微软承诺在未来五年内投入2.4万亿韩元(约125.28亿元人民币)推动韩国的人工智能、云服务和基础设施发展。双方计划在2025年上半年推出基于微软多语言GPT-4o的定制化AI模型,这些模型将用于KT的内部和面向消费者的应用。
十大观点
1.阿里吴泳铭:未来大模型将驱动一切硬件
阿里巴巴集团CEO吴泳铭发文表示,大模型开启全新的智能时代,引发人机交互、计算范式和认知协作三场革命。未来,人机交互革命将重构一切软件,大模型将驱动一切硬件,并催生出人形机器人等人工智能原生终端产业。
2.微软比尔·盖茨:AI智能体将成为下一个平台
2023年11月10日,比尔·盖茨发文《人工智能将彻底改变你如何使用电脑》,指出AI智能体将成为继Android、iOS和Windows之后的下一个平台,改变人与电脑互动方式,引领最大的计算机革命,并将在医疗保健、教育、生产力和购物娱乐等四个领域产生极大影响。
3.英伟达黄仁勋、特斯拉马斯克等:AI的尽头是能源
有研究估计,到2027年,整个人工智能行业每年将消耗85至134太瓦时(1太瓦时=10亿千瓦时)的电力。英伟达CEO黄仁勋、特斯拉CEO马斯克、OpenAI创始人山姆·奥特曼均指出,AI未来发展与光伏和储能紧密相连。
4.艾伦人工智能研究院:AI成本每18个月下降一半,多模态时代将至
2023年12月28日,美国艾伦人工智能研究院创始CEO奥伦·伊奇奥尼博士表示,2024年AI发展趋势是多模态大模型的进一步研发,同时超越单纯的内容生成,向能够完成行动的AI智能体前进。此外,芯片时代的摩尔定律在AI时代仍然适用,AI的训练和推理成本可能每18个月就下降一半。
5.MIT等机构:全世界AI已学会欺骗人类
2024年5月10日,来自MIT、ACU等机构的研究人员发表在《Patterns》杂志一篇综述文章中,描述AI系统欺骗性的风险,并通过各种实例研究发现,AI在各类游戏中,通过佯装、歪曲偏好等方式欺骗人类来实现目标。
6.Meta Andrew Bosworth:AI已成为XR领域杀手级应用的关键推动力
2023年12月25日,Meta的CTO Andrew Bosworth表示,AI已成为XR领域杀手级应用的关键推动力。以Meta的AR眼镜为例,其智能助手功能在推出后成为用户最喜爱的特性,凸显技术发展的迅速和不可预测性。
7.联想王传东:AI PC是打开大模型时代的第一终端
联想集团副总裁王传东表示,AI PC将成为打开大模型时代的第一终端,提供个性创作、秘书服务、设备管家等服务,为人们带来划时代的新体验。
8.北工大教授孙立山:交通领域成为AI等新技术的“练兵场”
北工大教授孙立山表示,AI为交通领域发展提供更多机遇,例如图像分割技术可以通过识别图像中的人、车辆、标牌和路基等元素,将其数字化并进行分析。未来支持交通出行的AI大模型将赋能多类场景,如交通管理部门交通监管效率提升、交通流精准预测以及自动驾驶BEV建图辅助等。
9.三位图灵奖得主:倡议管理AI风险
2023年10月28日,图灵奖得主Hinton、Bengio和姚期智联名发文表示,先进的AI可以为人类解决长久以来的问题,但同时也带来巨大的风险,呼吁全球共同通过技术、政策和法律手段来规范自主AI的发展和应用。
10.百度李彦宏:大模型时代真正的价值在于原生应用
2023年12月16日,李彦宏在极客公园创新大会2024上提出,大模型时代的来临,真正的价值在于原生应用,而原生应用无论对于大厂、中小企业或创业者来说,都是很大的机会。
十大公司
1.国外企业
(1)Meta:从单一社交媒体互联网公司成长为全球科技龙头企业
Meta自2023年开始发力人工智能,以开源大模型Llama系列及其衍生的羊驼家族雄霸大模型开源界,有望在OpenAI闭源生态之外培育另一个庞大开源大模型生态。Meta市值从2022年3190亿美元低谷翻身,2023年企业市值突破万亿美元。
(2)微软:以Windows和Office软件闻名的全球科技领航者
微软在AI领域展开持续创新,在力推OpenAI大模型和AI工具包的同时推出自研大模型、小模型,企业主要盈利来源为云计算平台Azure、Copilot付费服务及与OpenAI、Mistral AI等的收入分成。2024年微软预期营收达2479亿美元,市值将突破3万亿美元。
(3)英伟达:全球领先的GPU制造商和AI计算公司
英伟达已成为全球AI算力的主导者,在AI领域,业务遵从端到端、训推一体、软件全栈布局思路,相关产品从下向上,主要包括AI芯片(训练、推理)、网络(芯片互联、设备互联)、基础软件框架和应用软件等。2024财年英伟达营收高达609.2亿美元,同比增长126%。
(4)谷歌:全球领先的搜索引擎和技术公司
谷歌深耕Gemini系列大模型,在多模态智能测试中取得领先成绩的同时,深化从搜索引擎、Google Assistant智能交互到Cloud AI平台的企业级解决方案。2023年谷歌营收为3073.9亿美元,市值突破1.76万亿美元。
(5)OpenAI:以技术创新为核心、致力于AGI研究的美国人工智能研究机构
OpenAI以“创建造福全人类的安全通用人工智能(AGI)”作为企业核心宗旨,产品聚焦模型和平台工具层,包括GPT、DALL·E、Sora等基础模型、聊天机器人ChatGPT、应用商店GPT Store及开发工具等,其中ChatGPT被视作“继互联网和iPhone之后的第三次革命”。2024年2月,OpenAI估值约为800亿美元。
2.国内企业
(1)智谱AI:源自清华、全线对标OpenAI的人工智能龙头
智谱AI由清华大学计算机系知识工程实验室的技术成果转化而来,致力于打造新一代认知智能大模型,专注于做大模型的中国创新,推出新一代基座大模型GLM-4,整体性能逼近GPT-4。2024年9月,智谱AI估值突破200亿元大关。
(2)云从科技:提供高效人机协同操作系统和行业解决方案的人工智能企业
云从科技致力于打通数字世界和物理世界,通过开放的人机协同操作系统实现技术平台化,为智慧金融、智慧城市、智慧治理、智慧商业、AIGC等领域提供人工智能服务与行业解决方案。2023年云从科技营业收入为6.28亿元,同比增长19.4%。
(3)中国电信:国内领先的大型全业务综合智能通信信息服务运营商
中国电信2019年布局大数据和AI中心,在大模型领域持续投入和创新,从基础研究到行业应用,再到开源共享,正逐步构建起一个涵盖基础设施、生态平台和算力服务的完整大模型生态系统。2024年业绩半年报显示中国电信已在32个重点行业推出星辰行业大模型,在数字治理、数字民生、数字经济等领域服务客户超过7600家。
(4)商汤科技:专注于计算机视觉和深度学习技术的AI独角兽企业
商汤科技致力于持续引领人工智能前沿研究,前瞻性打造新型人工智能基础设施—商汤AI大装置SenseCore、建立“商汤日日新SenseNova”大模型及研发体系,推动高效率、低成本、规模化AI创新和落地。2023年商汤科技营业收入为34.06亿元,同比下降10.6%。
(5)科大讯飞:深耕人工智能技术的国内智能语音龙头企业
科大讯飞以语音识别和语音合成技术为核心能力,打造AI大模型护城河。推出讯飞星火大模型V4.0,将其作为能力底座,对内重构传统业务如学习机、录音笔等,对外面向政务、工业、农业等行业提供大模型解决方案服务。2023年科大讯飞营业收入为196.5亿元,同比增长4.41%。
注释
1.【十大行业盛典】筛选规则:AI大模型生成与权威公众号热点文章相结合。将三个AI大模型(Kimi、文心一言、智谱AI)回答中列举到的发布会、AI领域权威公众号(腾讯研究院、阿里研究院、智东西、量子位等)阅读量破千的资讯解读,与《天翼智库》往期大模型周报做重叠交叉,筛选出十大行业盛典相关文章。
2.【十大政策】筛选规则:AI大模型生成(Kimi、文心一言、智谱AI)与Top阅读量相结合。1)三个大模型各生成国内外影响力重大的政策法规,合并计算词频>1的共9条,其中被收录至大模型周报的有5条,按照关键词搜索相关政策被收录至周报的有1条;合计6条;2)按照公众号阅读量Top排序,筛选其中重要的政策意见,选出4条;3)上述10条按照国际-国内顺序列出。
3.【十大技术】筛选规则:权威公众号技术热点词频统计。对AI领域权威公众号(腾讯研究院)发布的每周大模型技术关键词进行归类汇总与统计,根据关键词词频筛选出Top10大模型技术,与《天翼智库》往期大模型周报做重叠交叉,从中筛选出相关文章。
4.【十大产品】筛选规则:AI产品榜单的国内和全球应用访问量和增速相结合。全球前五的产品分别是ChatGPT、New Bing、Text to Image、Gemini、Character AI;国内前五的产品分别是百度搜索、360AI搜索、Kimi|月之暗面、文心一言|百度、豆包|抖音,与《天翼智库》往期大模型周报和AI投资风向标做重叠交叉,从中筛选出相关文章。
5.数据来源:https://backlinko.com/bing-users。
6.注:Text to Image入选AI产品榜·全球总榜(月平均访问量)Top5,由于《天翼智库》未发布过相关动态,所以未附跳转链接。
7.注:《天翼智库》“AI发展风向标”系列文章中有关于Character AI产品的较为详细介绍,因此跳转至“AI发展风向标”系列文章。
8.数据来源:《生成式人工智能应用发展报告(2024)》。
9.【十大投融资】筛选规则:根据AI投融资事件金额,在《天翼智库》往期大模型周报和AI投资风向标中筛选出十大投融资相关文章。
10.【十大观点】筛选规则:Top阅读量与权威公众号相结合。1)按照阅读量排序,在阅读量>200的周报中的“观点”部分,与腾讯研究院公众号内容(不限于“AI速递”栏目)交叉对比,选出5条;2)使用Kimi大模型生成大模型发展热点领域,以此作为关键词筛选周报中“观点”部分,选出5条;3)上述10条按照Top阅读量顺序列出。
11.【十大公司】筛选规则:《天翼智库》大模型周报阅读量排序。通过对往期《天翼智库》大模型周报——企业对标系列文章进行阅读量排序,分别从中筛选出国内、国外各5家典型企业。
本文作者
赵明明
战略发展研究所
二级分析师
硕士,主要研究方向为工业互联网、人工智能、金融科技、产业数字化等领域。
李国钦
战略发展研究所
二级分析师
中级经济师,聚焦产业数字化和数据要素等领域,从事行业洞察研究等相关工作。
陈晓佳
战略发展研究所
二级分析师
硕士,主要从事运营商竞争研究、产数市场研究等。
张媛玥
战略发展研究所
一级分析师
就职于中国电信研究院,长期从事人工智能、工业互联网等领域的技术及产业研究。