在无数科幻作品中,一个具有超级智慧的AI,通常和恒星际飞船、可控核聚变、太空电梯等技术狂想同时出现,似乎遥不可及。但最近两年生成式AI的“技术爆炸”,让人们看到了有生之年把HAL9000和Moss们(《2001太空漫游》和《流浪地球》中的AI)装进手机里的希望。
当人们意识到AI带来的便利,电视、智能音箱、扫地机器人、车、甚至门锁、摄像头等等无数设备,都对搭载AI有了更强的需求。尴尬的是,尽管各大消费电子厂商推出了不少AI产品——我最近装修的时候,甚至见识过AI马桶——其中大部分的AI能力,只能说聊胜于无。
这不是消费电子厂商的问题,而是背后大模型“可用性”的问题。有报告显示,中国整体生成式AI应用的平均每日使用时间,多数只有6-8分钟的“试试”程度,远远谈不上陪伴和服务。
对于消费者而言,我不期待下一代AI应用就有科幻级的水平,但AI助手至少要好用、能用可以吗?
就在前两天,我用了多年的华为Mate40收到了鸿蒙4.2的更新推送。这之后再召唤AI助手“小艺”,我发现它比以前又好用了不少:
比如,我可以直接说,“给我找一下去年在海边夕阳下的照片”,它真能“听人话”找出来;工作中让它帮忙概括一份全英文的美股季度财报,呼吸之间就能给把营收、利润、毛利等主要指标分析出来......
作为操作系统,除了手机,智慧屏、个人电脑乃至车等全生态9亿台设备都搭载了鸿蒙。随着鸿蒙AI能力的更新,这些设备“万物互联”的生态,也将越来越好用。
2024年6月,又一年华为HDC开发者大会如约而至,正式公布HarmonyOS NEXT(鸿蒙星河版)的 Beta版本 计划。这是鸿蒙NEXT的一大步,也是科技产业的一场壮丽日出:完全不同于IOS和安卓的AI原生操作系统,来了。
系统级AI,有多好用?
了解过最新的HarmonyOS NEXT操作系统,AI能力对于用户再也不是可有可无的“玩具”,而是一个直接决定用户体验的系统核心。
和小艺对话之后我发现,有了鸿蒙AI的支持,以后所有搭载鸿蒙的产品,基本上都可以告别说明书了。想看看产品具体有哪些功能?可以直接呼叫“小艺小艺”,即便不知道具体功能的名称,也可以用自然语言进行模糊对话,以接近真人问答互动的方式,去了解产品功能。
用户和小艺的交互,在方方面面都更加贴近真人了,能做到“可见即可问”,我甚至可直接对着屏幕内容向小艺提问,比如打开活动通知后,询问小艺怎么导航去活动位置、附近是否有停车场等等,在跨模态的上下文能力支持下,小艺可以丝滑地告诉我查询结果。
一些需要占用大量时间的重复性工作,也可以交给小艺,比如把长篇文档交给它,让它生成摘要、划重点。不需要用专门的提示词,顺着直觉用自然语言讲“大白话”,小艺就可以理解我要它做什么。在这个层面上看,鸿蒙AI具有了生产力工具的属性。
小艺还能做一些高度复杂的任务,自主进行任务规划和工具调用,一句话就能执行跨应用操作。比如,告诉小艺通知某人明天下午会议的地点,这个横跨日历、联系人、短信等多个应用、曾经难倒无数AI助手的“世纪难题”,在小艺这里可以完美解决,同时调动3个应用完成复杂指令。
即便是老人和残障人士,也可以借助AI体验到“技术的温度”。
不熟悉手机的老人,可以用方言和AI助手对话,比如让小艺“把我孙子的照片放到桌面上”,AI可以理解其含义,并把对应的照片设为壁纸;
对于视力障碍人士,借助“小艺看世界”,用户可以利用手机的摄像头,通过视觉大模型连接海量的知识,把图像视频信息转化为音频,让他们重新“看”到世界,例如,基于视觉大模型强大的识别、理解和推理能力,小艺可以帮助视障人群找到冰箱中的食物,并判断食物的新鲜程度。
提供更有个性化、更便捷的AI服务,鸿蒙的AI能力来源于更好的自研大模型:华为盘古拥有3万亿tokens、最大版本包含3万亿参数的L0大模型技术上,小艺针对终端用户的需要进行了精调,加入了普通用户经常面对的衣食住行等高频对话场景,在此基础上建立了L1层对话模型。
为了保证安全性和响应速度,鸿蒙AI很注重“端云协同”,端侧大模型和云侧大模型分工协作,端侧充分发挥响应快的优势,把用户的交互指令进行预处理,再去请求云侧处理,在提升生成质量的同时,有效地保护了用户的隐私数据。另外得益于纯净的鸿蒙生态,小艺对于各类系统权限的调用也相对较少,是一个更私密的AI助理。
鸿蒙AI的能力,也和HarmonyOS NEXT本身不同于其他操作系统的底层架构有关,这让它在底层芯片、推理框架等底层设计上就具备了很强的原生优势,在统一AI底座之上,鸿蒙AI其实是一个系统级原生智能。
从这个角度看,作为系统级AI,鸿蒙AI不仅仅是一个智能助手+AI工具的组合体,也是整个系统的核心而非一个功能模块。当收到用户的指令之后,鸿蒙AI负责“指挥”整个系统分配任务,决定调用大模型的自身能力给予回复,还是调用系统中的其他App或者搜索引擎。这是一种区别于其他操作系统完全不同的新模式。
在我看来,终端操作系统有没有好用的AI,对于用户而言已经是完全不一样的体验。而鸿蒙的另外一个优势在于,从手机到智慧屏、平板、车等终端都有布局,目前已经有9亿台设备接入鸿蒙,形成了一个完整的硬件生态。
一个标志性的事件是,根据研究机构Counterpoint Research发布的最新数据,HarmonyOS在中国的市场份额已由2023年一季度的8%上涨至2024年一季度的17%,超过IOS系统16%的份额,成为中国市场占有率第二大的操作系统。而越来越多的人选择鸿蒙,无疑与鸿蒙日益强大的AI能力是分不开的。
AI助力开发,加速鸿蒙大成
当我们把视角从消费者转移到开发者,可以发现鸿蒙AI对开发者的助力,不仅帮助产品在鸿蒙生态中获得新的机遇,更是加速了鸿蒙生态的“丰容”,原生鸿蒙生态仅用不到一年的时间,就有5000+应用启动开发,1500+应用完成上架。
在鸿蒙的开发者社区,AI一直都是开发者之间最热门的讨论话题之一,依托昇腾的算力和盘古大模型,HarmonyOS NEXT 拥有了系统级AI能力,三方应用将天然具备更加智能的体验。
开发者的野心也不止于,简单复刻已有的移动端产品,而是在一个AI原生的系统里借助鸿蒙的AI能力,为用户提供新的体验,同时尽可能地快速开发,抢占先机。
为了帮助为开发者减少“重复造轮子”的时间成本,原生鸿蒙把 AI 框架写入系统层,为开发者提供可直接调用的AI控件,比如实时朗读、智能荐图、自动填写、图文翻译、OCR服务识别推荐、主体抠图、人脸检测、卡证识别等等。开发者需要什么AI功能,直接把对应的控件拿来用就行了,从而实现“低代码”甚至零代码开发。
很多我们熟悉的App,到鸿蒙生态中都实现了产品在AI能力上升级。而这正是源自鸿蒙为开发者提供的AI模块支持,比如小红书在图片上,可以根据用户意图推荐图片,让博主不用再烦恼挑选配图;长按后可以抠图复制、分享或者进行搜索,抠图后还支持拖动和跨设备拖拽。借力鸿蒙AI,不仅是加快了开发速度,更能给到用户前所未有的AI体验。
这就是原生AI架构的带来的开发者红利。除了小红书,鸿蒙版的国泰君安App可以根据用户意图,实现对证件的推荐、自动提取出卡号等等;石墨文档和WPS,支持将图片中表格支持直接复制、粘贴成表格;平安好车主和同程旅行,可以根据历史输入表单、华为帐号个人信息、联系人等提供输入建议,做到数据多端自动同步、智能识别剪切板,一键填充、处处可填。
与此同时,大模型能更好地理解和匹配用户的高阶意图,结合意图框架做服务管理和分发,也帮助开发者通过小艺建议、小艺对话、智慧语音、智慧视觉、小艺搜索等多样化系统入口更精准地触达目标用户。
在鸿蒙AI帮助开发者降低研发的难度和成本之后,也就有更多的开发者愿意快速打造应用,持续加速鸿蒙应用生态的“丰容”。目前,鸿蒙已经实现了出行、社交、金融、办公、生活、娱乐等18大垂类领域全覆盖,千行百业的开发者,都可以在鸿蒙AI的支持下,借AI技术的融入带来新的商业模式、服务方式。
有人将开发者从安卓和iOS向鸿蒙的迁移,视作“中国互联网历史上最大规模的生态迁徙”。但在我看来,这不仅仅是简单的将应用从IOS和安卓迁移到鸿蒙,而是借力鸿蒙,用AI对产品进行改造升级,通过鸿蒙AI赋能的业务创新,让产品原来的旧业务焕然一新。
比如,美团的共享单车,在HarmonyOS NEXT中可以实现扫码直达、一键解锁,新增了锁屏实况窗口,可以在锁屏状态直接换车;钉钉借助小艺,可以实现快速语音入会;新浪新闻通过播控中心统一管理,让不同应用可获得一致的体验等等。
从这个角度看,对于开发者来说,在鸿蒙开发App,等于更好地帮助产品在智能时代找到AI转型的解决方案,更稳地拿到那张通往智能时代的船票。
AI时代,鸿蒙准备好了吗?
一个时代,有一个时代的操作系统。
AI时代来临之前,所有的操作系统——从IOS到Windows、安卓,本质上都是一个介于硬件设备和上层应用的中间层,要做的就是管理硬件、调度应用,想要开发一个操作系统,就要先看看在什么样的CPU、什么样的开发板环境下做开发。
但AI时代就不一样,一个AI原生操作系统在架构上更多地面向数据和模型,好比一个管理员在管理系统内的一系列AI实体,去调度他们和用户做好交互。这就要求操作系统在功能、机制和底层架构上都要做出改变。
另外在交互方式上,过去的交互方式都是偏精确的,比如通过鼠标键盘、触控板或屏幕这些设备,详细告诉计算机要做什么;而AI时代的交互方式将更为“模糊”,更加结合上下文逻辑,但这也是人类所习惯的自然语言方式。
进入AI时代,操作系统从底层架构到交互方式都要发生剧烈的变化,只有真正AI原生的架构,而不是在原有基础上的缝缝补补,才能给用户带来更好的体验、更好地赋能开发者、更好地构建智能生态。现有的行业格局,势必在AI浪潮之下重新洗牌。
这是摆在每一个想在AI时代有所作为的操作系统面前的机遇和挑战。前不久的WWDC2024上,苹果发布了新版本的IOS18,并带来了“苹果的AI”Apple Intelligence;稍早前的I/O大会上,谷歌也宣布Android 15将深度整合其Gemini大模型,为用户带来一系列前沿的AI功能。
操作系统与AI深度融合的“AI+”趋势,已经越发明显。当操作系统同行们开始向AI转向,鸿蒙向着AI的转型也将更为迅速、彻底,以AI为核心组织整个操作系统的架构,让AI成为操作系统的灵魂与头脑,来迎接操作系统向着AI智能化跃迁的浪潮。
纵观整个操作系统行业,半个多世纪前的1973年,中国第一款操作系统“150号机”问世,随后的几十年间,中国人多次希望建立属于自己的操作系统,但每一次失败,都是败在了生态上,败在了规模上。人们也逐渐意识到,研发一个操作系统的难度,远远低于构建一个操作系统软件生态的难度。
而从系统规模上看,对于拥有9亿台设备的鸿蒙来说,已经在真正的“纯血鸿蒙”正式到来之前,有了相当大的设备基数作为“种子用户;鸿蒙AI能力的增强,也将全面提升用户体验,让这批“种子”飘向远方、进一步扩大规模,还将通过对开发者的赋能,加速应用生态的进化。
中国的科技产业,曾经在世纪之交错过了桌面操作系统,也在十年前移动互联网转型之时错过了移动操作系统,但在AI时代到来之时,在操作系统向AI化跃迁和洗牌的前夜,鸿蒙拿出了一个IOS和安卓之外的新选择,一个摆在无数开发者面前的崭新产业机会。
而此前的数次“错过”,为中国的科技产业累积下的经验和教训,有望在新的时代成为机遇。正如中国曾在某种意义上错过卡片支付时代,却因此而以全球领先的效率进入数字支付时代一样,技术的更迭并不一定是线性的。早早奔赴AI的鸿蒙操作系统,正在和9亿台设备的主人一起,期待实现另一场弯道超车。
2008年上映的漫威电影《钢铁侠》系列中,主角斯塔克有个很靠谱的AI助手Jarvis(贾维斯),他可以像一个真正的管家和伙伴那样,对话时而幽默、时而深沉,还能帮助钢铁侠管理技术装备,甚至把日常生活也安排得明明白白。
时至今日,钢铁侠中的大多数黑科技仍然是遥不可及的幻想。但或许这次,Jarvis会出现在世界的东方。
文章来源:刺猬公社