一年来,很多大型会议都出现了讯飞听见的身影,正在进行的两会也采用讯飞听见进行实时中英字幕直播,一时风头无两。3.15日,讯飞听见上线了一款面向有专业转文字需求的C端用户的工具性软件——讯飞听见APP,服务采用科大讯飞XXX转写引擎。语音转文字服务发展至今,有入行多年的速录侠,此外去年9月份搜狗还推出了搜狗听见APP。高手对决,下面小编从以下几个角度带大家一起来测试一下,看看它们具体表现如何。
外观和界面
讯飞听见首页 搜狗听见首页 速录侠首页
三者在第一眼外观风格上还是有较大区别的,讯飞听见则比较清爽,科技商务风;搜狗听写是黑色系的炫酷风格,科技感很强;而速录侠绿色和黄色的撞色搭配很抢眼。三者都在首页放置功能入口,使用起来还是比较方便的。不同的是搜狗听写的首页除功能入口外还有历史转写列表,相同的功能,讯飞听见放置在右上角-我的<我的订单。速录侠则在功能中间隔插入运营位,说实话有点影响对功能使用的判断。总体来说,视觉外观各有所爱,界面设置上搜狗听写更为直接。
讯飞听见: ❤❤❤❤
搜狗听写: ❤❤❤❤❤
速录侠:❤❤❤
准确率体验
讯飞听见是付费软件,完整的转文字结果需要付费后才能得到,但我发现他们提供了录音过程中5分钟的实时结果预览和新用户注册赠送的2小时机器转写。搜狗听写是免费软件,完整的转文字结果可以实时获得。速录侠收费较高只提供人工转写。这里进行了两次结果对比,一是对比单人语音转文字结果,二是两人对话访谈场景下的转文字结果。
单人语音
录音环境:办公室周围较嘈杂,单人近距离对手机读文章。
讯飞听见结果 搜狗听写结果 速录侠结果
原文:C市商业银行是一家大型商业银行,总部位于C市,向周边地区辐射。银行在C市有上千个网点,业务做得非常红火。在业务方面,C市商业银行可以称得上是地区翘楚,但是其产品的设计水准却完全没有跟上,不仅形象陈旧,而且体验也停留在多年前的水平。为了更好地为现有客户服务,并吸引更多年轻客户,为银行本身的互联网转型做准备。C市商业银行希望能对自身多个电子渠道做体验改善和整合。
讯飞听见:C是商业银行是一家大型商业银行,总部位于C市,向周边地区辐射。银行在C市有上千个网点,业务做得非常红火。在业务方面,C是商业银行可以称得上是地区翘楚,但是其产品的设计水准却完全没有跟上,不仅形象成就,而且体验也停留在多年前的水平。为了更好地为现有客户服务,并吸引更多年轻客户,为银行本身的互联网转型做准备。C是商业银行希望能对自身多个电子渠道做体验改善和整合。
搜狗听写:虽是商业银行是一家大型商业银行,总部位于西式向周边地区辐射。银行再试一试,有上千个网点业务做得非常红火,在业务方面虽是商业银行可以称得上是地区翘楚。但是其产品的设计水准却完全没有跟上,不仅形象成就,而且体验也停留在多年前的水平。
为了更好地为现有客户服务,并吸引更多年轻客户为银行本身的互联网转型做准备。这是商业银行,希望能对自身多个电子渠道做体验改善和转。
速录侠:C市商业银行是一家大型商业银行,总部位于C市,像周边地区辐射。银行在C市有上千个网点,业务做得非常红火。在业务方面,C市商业银行可以称得上是地区翘楚,但是其产品的设计水准却完全没有跟上,不仅形象陈旧,而且体验也停留在多年前的水平。为了更好地为现有客户服务,并吸引更多年轻客户,为银行本身的互联网转型做准备。C市商业银行希望能对自身多个电子渠道做体验改善和整合。
在单人有嘈杂音的场景下,三家转文字结果都可读可理解,但综合来看讯飞听见在性价比性上还是有一定优势。
双人讨论
录音环境:办公室周围较嘈杂,双人坐在桌边交流,手机自然距离放置桌上。
讯飞听见结果 搜狗听写结果 速录侠结果
原文:朗读的形式,不真实懂吗?什么叫真实?讲话噢别在那里一句话都不讲,不讲就算了?你弄个话题给我讲。你要什么话题你跟我讲?我俩开黑吧。来开黑,来来来。打王者,你确定要打吗?
讯飞听见(机器):朗读的形式不真是懂吗?什么叫真实?讲话哦别在那一句的五讲讲,就算哦,你那个话题给我讲,你要什么话题,你跟我讲。我两开黑吧要开心,来来来。打王者。你确定要打吗?
搜狗听写:我的心是不真实的,什么叫真实讲话,别的那里一句话都不讲不讲就算了吗,你那么话题跟我讲你要什么话题,你跟我讲我俩。对了他看看打王者
速录侠:朗读的形势不真实懂吗?什么叫形势,讲话,[0:00:05]一句话不讲,不讲就算了,你弄个话题跟我讲,你要什么话题你就跟我讲。我讲开黑吧,来开黑,来来来,打王者。你确定要打吗?
在双人有嘈杂音的场景下,三家转文字结果错误明显增加,速录侠人工转写准确率相对较高。讯飞听见有个别语句理解困难。让人比较吃惊的是搜狗听写,整段对话几乎无法理解,小编为此前后单独试了三次,这里选取的是最为接近的结果。看来搜狗在复杂音频处理的技术上要好好努力了。
讯飞听见: ❤❤❤
搜狗听写: ❤
速录侠:❤❤❤❤
功能对比
功能入口
讯飞听见与速录侠更注重转写本身,将功能入口分为开始录音、导入音频,其中速录侠将导入音频入口按种类分为四项。搜狗听写则更深入使用场景,将功能入口分为记事写作、访谈录音。就目前而言,日常转文字需求搜狗会有一些贴心小功能如打标等更贴心,而另两者的导入音频功能则覆盖了更多的需求来源。
转写类型
讯飞听见下单 搜狗听写转写 速录侠下单
讯飞听见转写分为两大类:机器转写、人工转写,选择后界面内立刻开始上传音频。机器转写可填写订单名称、选择输入类型(只有文稿)、专业领域(7个)、是否短信通知进度等,人工转写比机器转写多了一种输出类型(分角色),另外还可填写关键词。讯飞听见在处理语音转文字上多年来积累的行业数据,让他们在专业性上明显更胜一筹,提供了更多解决方案和标准。
搜狗的出发点是深入场景,因此提供了实时转文字和先录音后转写的不同转写方式。
速录侠则是会议培训、字幕、方言、电话录音四个大类,可分别选择分角色或不区分角色。这样的功能设置应该基于他们的用户来源,比较实用。
讯飞听见: ❤❤❤❤❤
搜狗听写: ❤❤❤❤
速录侠:❤❤❤
总结
通过这次对比可以看到,日常中要求不高的转文字需求用搜狗比较合适(毕竞免费),但专业需求还是使用讯飞听见性价比更高。相比之下速录侠就显得比较鸡肋了,最高的价格并未带来最好的体验。曾几何时,小编整理领导的演讲稿熬过多少夜,现在随着技术发展变得越来越便捷,期待100%准确率的早日到来~
免责声明:本文来自于网络,转载目的在于传播更多行业信息,并不代表本站赞同其观点和对其相关内容的真实性负责,也不构成任何其它建议,请读者仅作参考。