闲话CAT(5):Déjà Vu——或许是最早的CAT支持下的MT+PE应用实例

Déjà Vu 有一个非常特殊的功能,就是能够把当前翻译项目中的每一个文件都导出为一种双语格式(Bilingual File),Déjà Vu X将其称作“外部视图”(External View)——这个名词其实比现在更流行的“双语格式”更易于理解。这种双语文件是以rtf格式保存的。rtf文件格式是Rich Text Format的缩写,即“富文本格式”。这是一种开放标准的文件格式,最典型的应用场景就是可以用Word等绝大多数文字处理软件将其打开并编辑。基于此特性,它往往用于不同的文字处理软件之间交流文件内容的一种形式,因为它几乎可以全面的再现绝大多数文字处理软件所呈现的版面格式等。

导出双语格式界面

RTF是Rich Text Format的缩写,意即多文本格式。这是一种类似DOC格式(Word文档)的文件,有很好的兼容性,使用Windows“附件”中的“写字板”就能打开并进行编辑。使用“写字板”打开一个RTF格式文件时,将看到文件的内容;如果要查看RTF格式文件的源代码,只要使用“记事本”将它打开就行了。这就是说,你完全可以像编辑HTML文件一样,使用“记事本”来编辑RTF格式文件。

Déjà Vu导出的这种双语格式是一种表格,主要分为五栏。第一栏是每一句话的ID,也就是它的编号;第二栏是Source Langue,也就是原文;第三栏是Target Language;第四栏是Comments,用于在里面书写一些评语,第五栏是表示翻译的状态。导出的双语文件可以用Word、WPS、Open Office等打开进行编辑。

Déjà Vu X3的双语文件导出对话框
Déjà Vu导出的双语文件格式

设计这种双语文件格式的导出和导入功能,最初的目的是为了让未使用Déjà Vu的用户也能够参与翻译项目的审校工作。当一个文件的初稿完成之后,译者可以将其导出为这种双语文件,发给审校人员。审校人员不需要专门去学习或者安装Déjà Vu就可以在电脑上使用任意一款支持rtf格式的文字编辑软件打开编辑。这样一来,就可以让没有学过,也来不及培训Déjà Vu应用的译审参与到翻译审校的流程中来。

在大约2005年前后,我开始注意到谷歌机器翻译已经有了根据它来做“译后编辑”(PE)应用价值。它所提供的译文虽然还很生硬,但是从里面已经能够采集到大量的可用语块,而且采集到的语块往往多于采用比较完善的术语库所能获得的文字数。这样一来,对于一个熟练的译员而言,在谷歌机器翻译的基础上进行编辑,稍加训练和适应,就能够获得比通过术语库所得的效率提升得更多的效率。

于是乎,我就开始尝试在谷歌机器翻译的基础上进行编译。但是,那个时候几乎任何一款CAT软件都尚不支持直接引用谷歌机器翻译的内容。怎么办呢?我开始从这种双语文件身上打主意,尝试能不能让谷歌翻译来处理这种文件。
最开始的思路,是把它上传到谷歌翻译工具包,用翻译工具包自动翻译。翻译完成的文件,原文列的内容已经变成了译文,把这一列的内容复制,重新粘贴到原始的、未经翻译的双语文件的译文列,这样就形成了原文和译文都有的双语文件。

利用谷歌翻译RTF双语文件

后来我又发现,如果使用谷歌的Chromo浏览器,可以直接将原文列复制粘贴到谷歌机器翻译页面,翻译完成之后复制译文,然后在双语文件当中选择对应的单元格并按粘贴快捷键——注意,这里需要严格对应,如我们选择的原文是从编号1到100的单元格,那么此时在粘贴之前也要选择对应目标语栏的1-100的单元格。然后按ctrl+V的粘贴快捷键,就能够把译文内容严丝合缝地粘贴进去。

另外一点要注意的就是,谷歌的Chrome浏览器,或者Safari浏览器,和Word配合起来才能产生这样的粘贴效果。如果使用IE浏览器直接粘贴,就会使每一个单元格内都粘贴上全部的译文。经过研究发现,如果使用IE浏览器可以先借到纯文本的编辑器,把它粘贴到文本编辑器里,然后重新复制再回过来粘贴,就可以实现和Chrome浏览器中复制再回Word粘贴一样的效果了。相应的,大家如果使用的文件编辑器和文字处理软件不是Microsoft Word,而是其他的比如WPS或者OpenOffice,可能也会有不同的特性,需要摸索掌握其规律。

不管怎样,通过这样的处理,我们就能够很顺利的把谷歌机器翻译结果粘贴到双语文件的译文区,粘贴保存完成后,把双语文件重新导入翻译项目,我们的翻译项目也就有了谷歌翻译的译文。

这个实验成功之后,我把这个处理的方法告诉了山东交通学院外语系的李庆庆老师。李庆庆老师对于软件的应用和编程都有一些独到之处。他就说,他可以研究一下Deja Vu的项目文件格式,看看能不能直接调用谷歌的API。他成功了——他发现能够用外部程序直接打开Déjà Vu的项目翻译文件这个数据库,然后调用谷歌的机器翻译API,为这个数据库里的译文区直接采集灌入谷歌的机器翻译。他写的这款小程序非常的精巧,有了这款小应用,我只需要把整个的翻译项目拖放进去,它就能够自动填入谷歌翻译的结果。不经意间,我和李庆庆老师的探索,几乎就成了最早的把机器翻译融入到应用计算机辅助翻译的社科图书翻译实践中的案例。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容