首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

讯飞会议耳机助力达沃斯科学峰会 开启语音交互新场景

2024年7月19日 17:59  CCTIME飞象网  

7月11日-12日,聚集了世界学术顶尖学者、科学精英、创新者和企业家的iCANX Davos Summit 达沃斯科学峰会在瑞士达沃斯圆满举办。同期,由iCANX Association主办、未来智能协办的“人工智能+:探索发展前沿与引领趋势,培育新质生产力论坛”,也邀请了全球范围内的人工智能交叉学科领域的科学家齐聚一堂,共同探讨人工智能的前沿和趋势。

未来智能董事长胡郁在论坛上发表了主题演讲,分享了他对AIoT时代人机交互方式的理解与展望——“经历了图形交互界面、触摸交互界面,下一个革命性的人机交互方式会是什么? ”

在漫长的人机交互历程中,人与实物如何产生最自然、最舒适的交互,一直是科学家和工程师们研究的重点,而近年来随着人工智能和物联网的兴起、深度学习和大数据技术的发展,人机交互也逐步从图形、触摸到语音不断进阶,到如今,人类最自然便捷的沟通方式——语音,早已成为人机交互的主流趋势。

在胡郁看来,“语音之所以厉害,是因为机器有显示屏,可以把文字、图片、音频和视频直接播放给人看。而人并没有显示屏,要将大脑里的想法告诉机器,除了跳舞、画画、写字、打手势,还有一个最直接的办法就是讲话,而这就需要机器刚好听得懂我们讲话。”

但事实上,要让机器听清、听懂人类语言并不是一件容易的事,在噪声干扰、多人语音混叠的情况下如何精准识别?在多语种情境下如何准确翻译?都是语音交互发展的关键瓶颈。

未来智能作为一家AI硬件公司,核心团队成员在AI语音领域已经深耕超10年,从智能语音助手到AI会议办公,讯飞会议耳机不仅可以在多人语音混叠的会议场景中智能识别出不同人物的声纹特性,实现说话人角色区分;还支持32种语言同传翻译,在多种语境下也可以实现面对面实时翻译以及同传听译。5月刚发布的讯飞会议耳机Pro 2全新升级“红点闪录”,无需连接App即可一键开启,为用户带来更便捷的录音使用体验。

更重要的是,讯飞会议耳机搭载的viaim AI,可一键生成摘要总结和待办事项,内置的“万姆”助理有问必答,通过对话形式了解用户需求,为其提供或有目的重点、或全面普适的方法与建议。

在本次达沃斯科学峰会上,胡郁就带领专家学者们一同体验了未来智能会议耳机的同传翻译功能,相关学者们也“现学现用”,迅速将耳机的“同传听译”和“摘要总结提取”功能用在了论坛的交流现场。

近年来,“大模型+语音”的发展模式,正在为智能语音技术和产业带来新一轮的革命性突破,在胡郁看来,对于人机交互场景而言,这还只是一个开始——“随着人工智能和机器人核心技术的发展,我们可以看到,以语音语言交互为主,以感知运动交互为辅的下一代人机交互系统的发展已经迫在眉睫。”胡郁说。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
尚冰:中国互联网应用蓬勃发展,多项关键指标位居全球第一
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像