飞象网原创(高靖宇/文)数字科技的2024年,人工智能(AI)无疑是当之无愧的主角。这一年,AI的发展呈现出一系列令人瞩目的态势。
从技术演进来看,大模型在海量数据和强大算力的支撑下实现了从单任务到多任务智能的重大跨越,在语言处理、图像识别等多方面能力持续进化。在产业层面,AI成为推动各行各业变革的核心引擎,AI在各行业的赋能进入新阶段。
在2025中国信通院深度观察报告会上,人工智能再次成为焦点议题,各领域专家从不同的视角出发,就人工智能及大模型技术未来发展趋势展开了深度探讨与解读。
智能体引领终端革命
在2024年,智能体正逐步成为引领终端革命的重要力量。随着端侧大模型技术的迅猛发展,智能体不仅在技术上实现了突破,更在生活场景中展现出强大的应用潜力。
vivo推出的PhoneGPT,它不仅能够识别手机界面内容,还能在复杂的场景中自动完成订餐、订票等任务。OPPO 的ColorOS 15通过引入系统级的AI交互,拥有强大的屏幕内容识别与指令处理能力。例如,在小红书中,小布助手能识别屏幕内容,一键生成旅游路线。荣耀最新个人化全场景AI操作系统MagicOS 9.0,用户只需要简单一句话,语音助手YoYo就可以自动检查支付宝和微信的自动续费项目,一键关闭自动续费。
在大会上,中国工程院院士邬贺铨指出,端侧大模型与智能体的结合将引发通信终端模式的深刻变革。首先,终端形态将多样化,涵盖手机、PC、可穿戴设备、传感器、机器人和网联车等多种形式。其次,终端功能将智能化,从传统的智能终端发展为具备AI能力的智能体,支持离线使用。此外,人机交互方式将变得多模化,涵盖自然语言、触摸、手势等,APP的独立性将被削弱,转而作为系统的服务工具。
邬贺铨强调,这一变革将对网络技术产生重大影响,包括对上行能力的提升和云边端协同的需求。随着5G技术的普及,需采用大上行技术以适应更高的带宽需求。同时,云与端之间需要实现低时延、高可靠的传输,以支持模型参数的高效上传与更新。
中国信通院泰尔实验室副主任果敢表示,新一代智能终端呈现出新交互、新应用、新服务、新场景“四新”特征。新交互从“单一模态交互”走向“多模态交互”,新应用衍生出应用+AI、AI原生应用两类代表性应用,新服务由“以用户指令为驱动”转变为“以用户意图为导向”,新场景从“万物互联”进入“万物智联”。果敢强调,AI重构操作系统是未来趋势,生成式AI能力与操作系统融合将是下一阶段重点。
智能网联汽车开启下半场竞争
随着特斯拉在智能驾驶系统中率先开启“端到端大模型”架构演进,2024年“端到端大模型”成为几乎所有汽车厂商和自动驾驶解决方案提供商探索的焦点,蔚小理等主机厂以及华为、Momenta、商汤、元戎等供应商均在积极跟进。
对此,中国信通院技术与标准研究所主任葛雨明认为:“本质上来讲是自动驾驶研发由规则驱动向数据驱动的一次技术变革,但同时也对高质量数据和智算能力提出了更高需求。尽管企业对“端到端”研发范式形成共识,但在感知硬件选择方面,仍然存在“激光、毫米波雷达、视觉等多传感器融合”和“纯视觉”两种不同方案,一方面是考虑保障环境感知的可靠性和稳定性,另一方面是延续且充分利用既有车型数据,基于各自在算法、算力等方面的研究和基础资源。”
“在大力突破单车智能的基础上,要更好发挥网联赋能作用。” 葛雨明指出。截至2024年10月底,我国路侧通信基础设施(RSU)部署超过11000台,5G基站总数达414.1万个,依托车联网的通信连接能力,不仅可以将路端、云端等外界感知信息补充给车辆,还可将路端、云端的计算等资源用于单车业务需求,在自动驾驶算法训练、拓展自动驾驶功能运行范围、自动驾驶技术演进等方面发挥着必不可少的支撑和赋能作用。
葛雨明主任表示,汽车产业已经进入到了智能网联竞争的下半场。智能网联汽车与信息通信、交通运输等行业的深度融合是必然趋势。我国智能网联新能源汽车发展势头强劲,用户侧和数据侧的智能化水平不断提升。葛雨明强调,加快汽车智能网联应用的基础设施建设至关重要,需要政策法规、标准规范、基础资源的共同谋划布局。
人工智能为实现通用机器人打开大门
近两年来,产业界对机器人的关注热度高涨,具身智能和人形机器人这两个词汇出现的频率很高。谷歌、特斯拉、OpenAI等国外头部科技企业,以及国内企业银河通用、智元、小米、小鹏等都在积极布局人形机器人。
人形机器人需要具备高度的自主性和智能性,能够识别环境、理解指令、规划行动,并在执行任务时做出合理的决策。而人工智能技术的发展,正是实现这一目标的关键。
中国信通院副总工程师许志远认为,人工智能技术突破性发展,为实现通用机器人打开了大门,其核心是增强了机器人的认知与交互能力,并赋予机器人在物理世界中执行任务的强大泛化能力。
“人形机器人仍然不够成熟。”许志远指出,硬件方面,头部公司的人形机器人产品除手部以外,全身只有50多个自由度,如果在复杂的环境中行走需要更强大的运动控制能力。除硬件以外,软件其实是机器人落地的更大挑战。大模型的本质是数据驱动,只有基于庞大的数据量来训练,才能实现智能的涌现。而机器人大模型与这两年成熟的大语言模型不一样,语言模型的数据可以来自庞大的互联网,机器人还需要物理世界中高精度操作数据,这些数据是互联网没有的。只有解决了这些问题,机器人才能大规模走入我们的生活。