“工欲善其事,必先利其器”。济南雕龙医学翻译有限公司一直注重翻译技术和翻译工具的开发使用。自主开发了翻译质量检查 (QA, Quality Assurance) 机器人,可以精准地检查多种翻译错误,
其实业内已经存在多种专用的翻译 QA 工具,比较有名的有 Xbench、Verifika 和 QA Distaller 等。对于这些主流的 QA 工具,我们基本上都使用过,有的现在仍在使用,比如 Xbench 和 Verifika。另外,几乎每种主流的计算机辅助翻译 (CAT) 工具都会有自己的 QA 模块,可对双语数据进行实时 QA 或者批量QA。所有 QA 工具都可以生成 QA 报告,提示可能是翻译错误的语言点。这些错误例如数字错误、术语错误、格式错误、标点错误和重复字词等。但是,这些 QA 工具都普通存在着一些假报错过多的问题。往往在几十上百条提示中找不出真正的错误,逐条查看 QA 报告要要花费掉大量的时间,也容易忽略掉一些真正的报错。
在英汉翻译中,出现上述假报错最多的检查项是数字检查。这是因为,在英语中有两种数字:阿拉伯数字 (0-9) 和单词数字 (one, two, three... hundred, thousand, million... January, February, March... First, Second, Third...Tri-, bi-,);在汉语中有两种数字:阿拉伯数字和汉字数字(一、二、三...百、千、万...甲、乙、丙、丁...单、双、两等)。并且,这些阿拉伯数字与英文单词形式的在翻译为汉语时,也要根据汉语的习惯选择不同的表示方法。这就给数字翻译准确性检查带来了巨大的困难。往往出现在一两百条假报错中隐藏着一条真正错误的情况,特别容易遗漏。
基于这些 QA 痛点,我们独辟蹊径,开发了雕龙英汉医学翻译质量精准 QA 机器人。在分析归纳了多种翻译错误的特别特征的基础上,该机器人基于数百条正则表达式规则创建。可以确保数字翻译错误达到 100% 的检出率,且假报错率极低。同时,还可以检查诸多其他 QA 工具无法检出的翻译错误。比如:大写字母词的误用、汉语中英文单词的拼写错误、误输入的重复字词、英文单位格式错误以及汉语日期错误等。同时具有假报错极少和漏检率极低两种优势。自启动以后,在翻译实践中不断完善,已经成为我们离不开的 QA 神器。大大提高了翻译质量检查的准确性,降低了人工查错的成本。
同时,这项技术可以与 AI 机器翻译技术结合起来。随着技术进步,AI 机器翻译译文的流畅性和可读性越来越好,但是机器有一个致命的问题,就是它往往会犯一些低级的错误。对机器翻译结果中的低级错误,如果采用人工审校来查找这些错误,则需要花费很多的精力。其他 QA 工具假报错率太高,从其 QA 报告中找出真错误,同样需要花费很多精力。此时,使用我们的 QA 工具则可以在很大程度上解决这一问题。
所以,我们除了将这一技术应用于我们的翻译作业以后,还结合我们的机翻引擎提供一种低成本高质量的机器翻译加 QA 方案。即“雕龙机翻 + 雕龙精准 QA”,相比于纯机翻作业,以极低的成本即可快速获得更加接近于人工翻译质量的译文。