最近参加了幸福进化俱乐部的一些志愿者工作,和各行各业的人士呢能共同交流,是一件快乐的事,由于工作的原因还耽误一些进度,真的是过意不去。
概述
本次进行了10分钟左右的音频转录文字的工作,遇到了很多不足和一些问题,自己也有一些想法,在此写下来,供大家参考,以下是我遇到的问题及反省。
问题与反省
首先,本次大约10分钟音频转录工作,大约花了1.5个小时,效率非常低,这个还是使用了工具的前提下,不可想象没有工具的情况是什么样子的。
1. 遇到了之前都会出问题的情况是,每次有点小得意的话,这件事八九成会出现问题,哪怕只有自己知道的小得意也不行,这次对我提个醒,做事的时候还是踏踏实实的做好事,在心里有膨胀的期间能意识到自己情绪的波动,以前自己有训练的系统来帮助自己“意识到”,自己的训练系统最近正在重建中,希望能早些恢复帮助自己。
2. 时间超出预期30分钟左右,这个是之前准备不充分导致的,加上风险估计不足。这个准备工作做好之后应该可以减少一部分时间,至少网络下载部分可以分散到其它的时间进行,把任务进行分解,分给不同的时间片来处理。
3. 在做转录之前,自己在网上找方法的时候遇到一个以前就解决的思维定势:开始直接找到的是“如何把音频文件转为文字软件”,然后搜到了大部分不符合预期的软件,之后去掉了软件二字,找到了网友说的,用电脑和手机讯飞收入法结合使用,这个方法突然让我想到了之前的解决问题方法:直接不能达到目的地,那么有没有间接到达目的地的方法呢?自己把这些思维都忘得差不多了,也就证明了最近工作上出现了不动脑子的平淡期,自己需要考虑工作上进行调整了。
之前自己转录过程中工具分享
以下是一些分享,下面的一些工具我看到已经有人用过了,我就班门弄斧一下,不足之处还请大家多多包涵:
工具:电脑(qq影音)+手机(讯飞输入法+便签)
1. 没有找到合适的直接转换软件使用,所以使用了间接的方式,下面有两种可行的方法:
a) 使用电脑播放,使用讯飞输入法语音输入到便签中。
b) 自己读取内容,使用讯飞输入法语音输入到便签中。
2. 经过权衡(没有进行测试),音频文件的语速、清晰度,还有讯飞的识别率出错率,环境的噪音等综合考虑之后选择了b方案,自己的语速和清晰度都是可控的。
3. QQ影音设置的0.5倍速,加上键盘左右箭头调整播放的音频前进后退。
4. 然后就是带上耳机,播放音频,自己打开手机的便签和讯飞语音输入,这个怪异的姿势可以了。
注意点:讯飞输入法出现错误的频率大概在8%左右(比如,明明开着网络提示说离线识别,还有一会直接识别后不出字),识别正确率在95%左右。音频降速播放之后有些失真。
改进的一些思考
昨天测试了一下讯飞听写,效率让人赞叹。
1. 音频分段,每段大约也是10分钟,qq影音可以做到,大约截取10分钟的话花费30秒左右。
2. 使用讯飞听写,大约10分钟,在一分钟之内进行转录完成,识别率高于95%,剩下的进行校验就行了,每个人校验1遍大概在20-30分钟左右。
以上的时间缩短了1个小时,效率提升了3倍。
希望对大家有所帮助。