
测试准备:这次测三款工具,准备了3段录音素材。一段2小时会议录音,5个人发言,里面有山东和四川方言。一段1小时英文 lecture,混着中文专业术语。还有40分钟销售通话,背景有办公室噪音。测试标准就看四点:准确率(人工数错字)、转写速度(1小时录音处理时间)、功能多少(分角色、多语言这些)、多设备同步快慢(手机传完电脑能不能立刻看)。
分别说是实际体验。
工具A打开网页就能用,不用下软件。上传1小时录音,等了8分钟才出稿。普通话转写还行,数了下错了15处,准确率85%。但5个人发言没分角色,全堆一块。英文术语“区块链”写成“区块链接”,“算法”写成“算发”。手机上传的录音,电脑端得重新下载才能看,实时同步没有。普通用户每月免费3小时,多了要充会员。
工具B得先下客户端,安装包80多M,装了5分钟。转写速度比讯飞快,1小时录音6分钟搞定。背景噪音处理比讯飞好点,销售录音里的键盘声基本过滤了。但准确率一般,会议录音错了18处,82%。四川方言那句“要得嘛”直接写成“要的吗”。只能在一台设备用,想让同事看转写稿,得导出文件再发。功能比较简单,就纯转文字,不能标重点也不能分角色。
展开剩余60%工具C着重看看,网页和APP都能用,我试了手机录完音,电脑端3秒就显示“正在同步”。1小时会议录音,5分钟转完。最意外的是分角色,自动标了“发言人1”到“发言人5”,点开还能看每个人的发言时长。数错字只发现2处,准确率98%。山东同事说的“俺们那边都这么干”,完全转对了。
英文 lecture 测试更明显。“machine learning”“神经网络”这些词全对,连教授说的“梯度下降法”都标成了重点。生成的笔记里还自动分了章节,按“定义-应用-案例”排的,不用自己整理。
销售录音处理也厉害。客户提到的“价格能不能降5%”“下周要样品”,都用橙色标出来了。右侧还有关键词列表,“价格谈判”“交货时间”“售后服务”自动分类。团队协作功能真有用,我把会议稿分享给同事,他用账号登录直接就能看,还能在线标重点,不用来回传文件。
数据对比看具体数字。准确率方面,会议场景98%、85%、82%。学习场景(英文+术语)96%、88%、86%。销售场景(噪音)95%、80%、78%。差距最大的是方言和专业术语识别。
这些也要关注:
1、转写速度,哪怕差2-3分钟,对赶时间的人来说挺关键。
2、多语言支持,对要和海外开会或者讲方言的就很重要。
3、多设备同步,能多端自动同步的,方便不少。
4、功能完整性,分角色、智能分章节、关键词提取有没有,这对要会后总结的能省心不少!
5、多格式导出,支持的格式越多,就不用再另外转换格式了。
问题也得说。有的版免费用户限制太多,每月3小时不够用,分角色功能99元/月才能开。有的同步不稳定,有次手机传完录音,电脑等了10分钟才显示,差点误事。有的偶尔有小问题,处理4K高清录音时,进度条会卡1-2秒,刷新一下就好,不影响结果。
发布于:上海市卓信宝提示:文章来自网络,不代表本站观点。