技术适应与工作流

| 分类 随笔 

最近接到一份上海话听写任务,某乙方公司的客户关系部门找甲方的部门负责人做访谈,最后给CEO提供一份报告。访谈会被录音,录音文件派给翻译公司进行文字转写。

这两个上海公司的员工,可能也是因为上海话比较亲切,选择使用上海话进行交流。现在上海话转录技术并不成熟,需要人工转录,但目前普通话的文字转写技术已经达到了很高的准确率,有讯飞听见、搜狗听写等服务,这样其实只要录音双方的声音比较清晰,是标准的普通话,基本上是不需要花费太多人力去做听写的。如果我是做客户关系的员工,为了使用语音转录技术,我肯定会选择和客户用普通话沟通,而不是上海话,并且在录制时确保双方的声音清晰。也就是说,我会根据现有的技术去改变我的工作流程,这样一来可以减少很多不必要的劳动。我把这叫做技术适应。技术适应的例子还有机器翻译译前编辑,翻译记忆等等。

我在听写时还发现一个现象是外企员工经常在中文中掺杂英文,机器转写这时同样不好使。而上海话中掺杂普通话就更常见了。这些给语音转录提出了挺大的挑战。在全自动转录尚不完善的时候,可能还是需要设计一个计算机辅助听写软件,可以将录音分为一个个语音片段,让用户按片段进行转写,并提供自动转录、调节音量、降噪等一系列功能。这是根据现有技术和实际需求编写相应的技术工具来进行辅助。

很多时候,我们在工作前都要先考虑需要运用什么技术,需要制作什么样的辅助工具。比如《暗黑2》是一款复杂的游戏,暴雪在开发时没有先开发好相关的工具链,结果使得开发周期延长。

程序员的工作就是让流程自动化,虽然程序员常常花了几个小时来自动化一个当前只需花几分钟时间的手动操作,但如果这一任务有长期需求,编写工具来优化工作流还是有必要的。

这里我想吐槽的一点是,很多Linux的软件都没有图形化的配置界面,折腾各种软件的配置要花上很多时间,而且不同软件、不同版本之间的标准可能还不统一。软件的标准化和易用性也是挺重要的事情,不然反而会使得流程变得复杂。


上一篇     下一篇