翻译与排版

| 分类 技术随笔  | 标签 CAT  出版 

翻译本来应该只是纯文字的工作,但是大多数情况下,文本内容和样式都是高度耦合的,我们在翻译时需要处理样式。我们在用CAT软件翻译word文档、网页等以标记语言格式存储的内容时,往往需要处理原文中的标签。CAT软件能够处理这些文件格式已经为排版提供了很大的帮助,如果不支持,往往需要手动进行替换。处理用InDesign排的几十页的图书还不算麻烦,关键是几百页的手册,还经常会进行更新,重新排版的工作会很繁琐。

我在出版社翻译图书,一般都是照着英文PDF进行翻译,将结果保存到Word里。如果要使用CAT软件,需要把文字转录下来。如果PDF的文字可复制还好,不可复制的话还要使用OCR软件进行识别。而即使可复制,也会存在空格、换行、内容不按原文顺序等问题。利用ABBYY FineReader或者Microsoft Word的PDFREFLOW功能可以将PDF转换为Word等格式文件,效果还可以。我自己基于pdfbox和tesseract写了pdf转txt的免费工具,可以将pdf的文字提取出来,并去掉多余的内容。提取出来后,还需要人工进行审校。

翻译完成后,我们要生成目标文件。如果没有用CAT软件,需要打开word、indesign等文件,手动进行文字替换。使用CAT软件一般可以直接生成目标文件,但也要检查是不是和原来的格式一致。有时候,替换成中文后还需要修改字体为中文字体,否则不显示中文。另外,译文和原文长度不一样,还要考虑会不会字体大小、会不会越界等问题。

我在的出版社一般请人完成翻译后,再把译文给美编进行排版。这样,翻译工作和排版工作相分离,也不失为一个好办法。


上一篇     下一篇