首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 头条固定一 >> 正文

瞬间泪流满面,你听见了吗?开启新生命之旅的声音

2024年10月23日 14:41  CCTIME飞象网  作 者:孙迎新

飞象原创(孙迎新/文)

“突然感觉,我又有信心了,未来又有希望了!”

当儿童图书编辑,同时也是一名语障人士的崔珈瑜看到通过AI技术现场对声音进行修复的展示后,她兴奋与渴望的心情溢于言表,“我希望能够尽快地拥有它。”

语障人士 崔珈瑜(图中左二)

没人知道这一天的到来,让那些在寂静世界里蛰伏的人们期待了多久。当手机里传来清晰流畅的语音时,我们知道,听力障碍人士的世界已经悄然改变。他们的心声,那些曾经被沉默掩盖的渴望,如今正通过HarmonyOS NEXT的AI声音修复功能,清晰地传达给每一个人。这不仅是技术的突破,更是开启了一段全新的人生体验,让爱与温暖在无声的世界中流动。

这一刻,科技对障碍群体的深切关怀和承诺终于成为现实。对于听障人士来说,最触动心弦的,莫过于2022年冬残奥火炬手,同时也是一位患有先天性极重度耳聋的残障人士朱轶琳那句再普通不过的话:“希望社会大众能听见,听懂我们的声音。”这不仅是对清晰交流的渴望,更是对平等参与社会生活的向往。

听障人士朱轶琳(图中左二)

根据世界卫生组织的数据,全球有超过10亿人的生活因残障而不便,每7个人之中,就有1个人需要无障碍设备的帮助。在我国,有超1700万视障者、超2700万听障者、7000万读写障碍者,还有超过2亿的65周岁以上老年人。许多人因听力障碍而影响了语言学习能力,导致不同程度的言语障碍。这些数据背后,是一个个渴望沟通与理解的灵魂,他们面临着社交、信息获取、职场沟通等多重困境。

为了帮助障碍群体实现平等融入社会生活的愿望,发展AI技术成为大势所趋。华为终端发布的《华为终端可持续发展报告》(2023-2024)中显示,用技术创新推动可持续发展,让每个人都平等地融入数字世界。华为持续聚焦信息无障碍、教育与健康、绿色环保及社会责任四大可持续发展战略,并在终端可持续发展委员会的引领下,推动各项目标的落地。

重生之声:引领听障人士开启崭新的语言之旅

黑暗与寂静或许是这个世界上最难忍受的苦难。女诗人艾米莉·狄金森在孤独中埋头写诗三十年,饱受疾病与身体障碍的困扰,她的诗中充满了无助与失望,同时也成为障碍人士心态的真实写照。

我本可以忍受黑暗

如果我不曾见过太阳

可是那阳光,刺破了

我内心的荒凉

现实生活中,听障人士在沟通交流中面临着巨大的挑战。他们不仅在社交场合中难以融入,更在工作、教育等重要领域遭遇重重障碍。例如,听障人士在就医时无法流畅回答医生的询问,导致沟通效率低下,甚至耽误病情的诊疗;在购物或点餐时,他们无法与店员顺畅沟通,只能依赖文字或手势,增加了交流的复杂性和时间成本;工作场景中,听障人士因无法用正常的言语与工作伙伴有效沟通,面临职业发展的障碍,面试过程中因无法用言语清晰表达自己的能力和意愿而错失就业机会。

听障人士的语言表达也会遇到巨大的困难。由于听力障碍影响他们学习和使用语言的能力,他们的发音往往不准确,带有病理性腔调,普通人非常难于识别理解。这些人士在日常生活和工作中会遇到各种困难,包括社交、信息获取、面试、职场沟通等,其中约8成听障人士依靠口语沟通,他们的言语障碍表现为发音不准确,韵律、音调异常,这使得他们在交流中常常遭遇误解和歧视。

随着智能时代的到来,AI技术的介入,为听力残疾障碍人士的语音修复带来了革命性的改变。通过HarmonyOS NEXT全新的AI声音修复功能,可以对用户的语音进行实时分析、修复和优化,提升用户发音的可懂度和音色的相似性。这项技术主要针对四级和三级言语障碍人群设计,通过构建言语障碍人员专用的语音识别大模型,和业界领先的语音合成大模型能力,搭建端到端声音修复系统。无需文本输入,实现了直接修复前语音输入、修复后语音输出,并且尽可能地保留了用户音色。 

通过AI进行语音修复这项技术的问世来之不易,华为的研发团队在项目初期面临了巨大的挑战。由于缺乏前车之鉴和最基本的数据,方案无从下手。但团队凭借对无障碍用户的责任感,决定奋力一搏,冲击这一个业界首创项目。他们收集网上公开的言语障碍音视频,召集各地的言语障碍用户进行数据录制活动。针对病理性发音特征,华为在模型结构和方案上进行不断调整,同时使用万小时量级的高表现力说话人数据,最大程度地保留大模型的原始能力。 

鸿蒙之声:AI助力障碍人士跨越信息桎梏

在数字化时代,信息的自由流通是社会进步的基石。然而,对于障碍人士来说,这个世界的声音似乎总是遥不可及。但随着系列鸿蒙原生智能技术的诞生,这一群体的信息障碍正逐步被突破。

华为长期关注无障碍建设,致力于通过系统性的无障碍建设工作帮助障碍群体。当前,使用华为无障碍设备的用户规模接近800万。同时,华为还联合全国200多家聋盲协会,深入全国88个城市开展了220多项华为无障碍功能体验活动,在线下为障碍人士提供了14000小时的无障碍用机指导与体验服务。

华为的无障碍建设始于产品设计之初,要求研发人员将无障碍理念落实在设计和开发应用的过程中。自2017年起,华为为有沟通障碍的用户提供了AI字幕、小艺通话、智能问答等功能,让手机成为用户最贴心的助手,而他们的手机也从可用变成好用,再从好用到爱用。

在无障碍建设过程中,鸿蒙原生智能技术也在不断得到创新与完善。鸿蒙原生智能技术的核心在于AI声音修复功能,这是一项针对听力残疾障碍人士设计的创新技术。

从华为无障碍“黑科技”,我们也能看到科技以人为本的具体样子。AI声音修复功能利用人工智能技术对用户的语音进行实时分析、修复和优化,提升了用户发音的可懂度和音色的相似性;同时,在保持与个人音色相似的前提下,声音修复功能可以大大提升内容的可懂度和清晰度,使得言语障碍人士可以更自信地进行交流。

通过这些功能,鸿蒙原生智能技术为听障人士提供了一个全新的交流平台,让他们能够更加自信地与世界对话。随着技术的不断进步和完善,我们有理由相信,未来将有更多的障碍人士能够享受到科技带来的便利,真正实现信息的自由流通。

未来之声:HarmonyOS NEXT开创声音修复新纪元

信息的无障碍流通是构建智能世界的关键,HarmonyOS NEXT以其业界首创的声音修复功能,为听障人士打开了一扇通往清晰交流的大门。

在鸿蒙NEXT发布会上,华为终端业务首席执行官何刚强调了华为对于无障碍科技的长期承诺,并介绍了HarmonyOS NEXT在声音修复方面的突破。何刚表示,华为一直在努力通过AI技术解决听障人士的沟通问题,从AI字幕到小艺通话,再到现在的AI声音修复功能,华为不断推动技术的发展,以实现更自然、更清晰的交流体验。

华为终端业务首席执行官 何刚

HarmonyOS NEXT的声音修复功能是华为在信息无障碍领域的又一重大创新。这一功能主要针对四级和三级言语障碍人群设计,利用AI技术对用户的语音进行实时分析、修复和优化。通过构建言语障碍人员专用的语音识别大模型,HarmonyOS NEXT能够实时分析用户的语音,并对其进行修复和优化,提升发音的可懂度和音色的相似性。

无需文本输入是HarmonyOS NEXT声音修复功能的一大特点,与传统的语音转文字再合成的方法不同,HarmonyOS NEXT无需文本输入最大限度地方便了用户,实现了直接从语音输入到语音输出的端到端处理。

如果你对声音的品质有所要求,那保留用户音色则让新生的语音具有更多的亲和力。在提升语音可懂度的同时,HarmonyOS NEXT尽可能地保留了用户的原始音色,使得交流更加自然,减少了用户的陌生感。

语音的最大功能是传递信息,因此对语音含义的理解至关重要。HarmonyOS NEXT声音修复功能显著提升可懂度。据华为实验室数据显示,声音修复后可懂度最大提升80%以上,这对于言语障碍用户来说是一个巨大的进步。

在多场景适用性方面,无论是在生活还是工作中,HarmonyOS NEXT的声音修复功能都能帮助言语障碍人士更自信地进行面对面交流。

HarmonyOS NEXT的声音修复功能一经推出,便受到了业界的广泛关注和积极评价。科技评论家和行业分析师都对华为在无障碍科技领域的这一创新表示赞赏。他们认为,这不仅是技术上的突破,更是对听力残疾障碍人士社会参与权的一次重要提升。

同时,业界普遍认为,HarmonyOS NEXT的声音修复功能不仅为听力残疾障碍人士提供了更好的交流工具,也为整个社会创造了更多的包容性和可能性。这一功能的推出,也标志着华为在无障碍科技领域的领导地位,为其他科技公司树立了榜样。

共融之声:鸿蒙无障碍体验与生态建设的和谐交响

数字世界不该有人被遗忘,鸿蒙正在打造一个全新的充满温度的智能世界。

无障碍建设是华为的长期责任,但无障碍功能的好坏与体验却是由障碍用户说了算。华为秉持S.H.A.R.E理念,数字包容作为华为可持续发展的重大战略之一,号召更多人参与,积极履行自身职责,创建可持续、有温度的数字未来。

华为无障碍始于产品设计之初,开发规范明确要求研发人员将无障碍理念落实在设计和开发应用的过程中。华为也始终在更新,并且从未在更新版本中忘记障碍用户。

凭借在生态建设领域的有力进展,鸿蒙无障碍体验得到了障碍用户的高度认可。通过开展跨设备无障碍体验,华为将无障碍能力向手表、智能眼镜、笔记本、音箱等设备扩展,满足障碍用户多场景需求,实现了跨设备的无缝协作。

通过汇聚更多合作伙伴的广泛参与,华为与开发者、生态伙伴共同优化复杂动态页面,确保障碍用户的使用体验。例如,南方航空在鸿蒙系统上进行无障碍及适老化App页面设计,交通银行为长者用户打造了手机银行App“关爱版”,这些服务正在原生鸿蒙上进行适配。

在应用市场的无障碍适配方面,已有超1.5万个应用和元服务上架HarmonyOS NEXT应用市场,多家生态伙伴已适配无障碍和适老化功能,极大地丰富了鸿蒙生态的无障碍体验。

同时,华为还持续开展社区活动和教育,通过开展无障碍功能体验活动,提供无障碍用机指导与体验服务,发放《送给爸妈的手机使用指南》等方式,全方位提升适老化能力,构建有温度的智能世界。

障碍群体的心声,正在被世界听见,通过技术的持续创新,华为在信息无障碍领域持续深耕,用科技创新推动无障碍技术发展,致力于构建一个全新的充满温度的智能世界,让每个人都能平等、方便地享受科技发展带来的美好生活。华为终端业务首席执行官何刚的这些话如同荡漾起的阵阵涟漪,传导到更远的地方。

科技,不让任何一个人掉队。携手生态伙伴,共筑更温暖的数字未来。

编 辑:孙秀杰
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中国电信李峻:只有当人工智能成为公共基础设施,才能普惠大众
精彩专题
2024中国算力大会
2024年国际信息通信展
中国信科亮相2024年国际信息通信展
第25届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像