基于Slax构建译者专用Linux

| 分类 技术随笔  | 标签 CAT  启动 

针对译者的linux已经有tuxtrans了。它基于ubuntu打包了很多译者需要的软件。适合追求使用自由软件的用户使用。

现在我要基于Slax打造一个新的译者专用Linux。为什么的?主要是因为Slax的便捷性:

  1. 可以从U盘等移动介质Live启动,启动后对系统进行的修改可以保存。
  2. 模块化,可以方便地把软件打包,做进启动盘里。
  3. 轻量级,启动快。

在Slax下运行如下命令:

# savechanges out.sb

即可把启动后进行的修改打包成squashfs格式的sb文件,然后放入光盘的modules目录即可使用。

去年出的Slax 9是基于Debian的,有包管理系统,更适合小白进行操作。之前的版本基于slackware,安装软件要解决各种依赖关系,不过手动安装对于包的管控倒是比较清楚。

下面讲一下制作过程:

  1. 添加中文支持。

    安装文泉驿中文字体:

    # apt install fonts-wqy-microhei fonts-wqy-zenhei

    安装输入法:

    # apt install ibus ibus-pinyin ibus-qt4

    这里因为slax缺少一些组件,我们需要补充上,另外默认桌面不能用中文输入法,改使用xfce桌面管理器,用lightdm登录管理器。

    # apt install dbus-x11 task-xfce-desktop

    安装im-config,可以强制设定输入法。

    # apt install im-config zenity

  2. 安装常用CAT软件

    # apt install translate-utils

    然后OmegaT和Okapi需要手动安装,OmegaT自带安装脚本,运行即可。Rainbow可以参考OmegaT的脚本安装。主要是把它复制到/opt里,然后软连接执行文件到/usr/bin,并在/usr/share/applications里建立对应的desktop文件,把项目添加到系统的菜单里,把png图标放到/usr/share/icons/hicolor/32x32/apps里。

    还有heartsome translation studio是中国公司开发,后来开源的CAT软件,也是java写的,和rainbow的安装方法类似。

  3. 安装其它辅助工具

    # apt install gpicview okular libreoffice calibre tesseract default-jre openjfx xfce4-screenshooter

另外还可以安装visual studio code编辑器、scribus桌面出版软件等等。

这样,slax for translators就完成了。

不过这样的slax适合熟悉linux操作的用户使用,对于普通用户,易用性肯定是不佳的,就比如普通用户默认不支持fat32分区的写入。

还有就是linux下还是挺缺少软件的,有时候可能还得自己编写程序。比如我就给tesseract写了一个前端,可以把利用系统快捷键截取的图片进行OCR,并自动去掉多余的空行和回车。

这套系统的实用性还是有的,制作的过程也是充满乐趣。

这个网站整理了linux上可以使用的翻译软件:https://translateonlinux.org/。可以作为参考。

我这里再给常用软件做一个列表:

CAT工具:

  • OmegaT (全功能CAT)
  • Okapi (三大组件:Rainbow负责文件格式转换、术语抽取等,checkmate负责质量检查,Ratel负责分割规则)
  • Heartsome Translation Studio (还自带了TMX、TBX编辑器等工具)
  • Translation Toolkit (Python写的,支持PO、XLIFF等文件格式转换,亦有字数统计、术语抽取等功能)
  • Language Tool。语言质量检测工具,支持拼写、语法等问题的检查。

文字转录

  • tesseract Google开源的光学字符识别引擎,可以将图片转成文字
  • gImageReader,tesseract的一个图形化前端。
  • aegisub,做字幕的软件,可以辅助音频的文字转录

项目管理

这里想到Git,还可以顺便做版本控制。

办公软件:

  • LibreOffice
  • WPS for linux

桌面出版:

  • Scribus(最新的1.5版支持打开InDesign的IDML文件)
  • calibre,可以编辑和查看各种电子书格式
  • okular,支持查看chm、pdf、epub等格式文件

中文环境:

输入法:Fcitx、iBus。可以搭配Rime和搜狗拼音等后端。

中文字体:开源的思源黑体、文泉驿,以及免费的字体,比如方正书宋。

技术写作:

技术文档也常是要翻译的内容,比如dita、latex、docbook、restructuredText等格式也需要进行处理。根据具体需要可以自行安装,Linux的一个好处就是这些软件安装都比较方便。

  • dita open toolkit
  • docbook
  • texlive
  • sphinx
  • jekyll
  • ……

另外还需要一个好的编辑器,可以选用sublime text和visual studio code。当然emacs和vim也行。


上一篇     下一篇