为机器翻译“立法”——构建可信赖机器翻译系统的七个原则

2021年09月16日

科技发展带来社会进步,此话不假。譬如,银行柜员人数的减少有赖ATM机;流水线基础劳动力的消失得益于生产机器的迭代升级;那么翻译呢?在智能化时代,各类层出不穷的翻译软件和系统促使高校翻译专业不得不去正视这样一个问题:机器翻译是否会取代人工翻译?

对此,来自西交利物浦大学人文社科学院翻译系张霄军博士在其近日发表在《外国语文》上的“构建可信赖机器翻译系统的基本原则——一种基于工程伦理的观点”一文中表示,当前探讨未来社会二选一的问题为时尚早,我们“应该尽快厘清的是机器翻译的工程伦理问题”。这是因为“讨论人工翻译能不能被机器所取代的基础是机器翻译的工程伦理,如果没有厘清机器翻译的技术和工程伦理的框架,任何与之相关的断言都是不可信的”。

所谓工程伦理问题,即机器翻译系统设计研发过程中所涉及的有关人类安全,人类隐私保护,与系统安全性能的问题,这包括:制度化建设问题、工程师责任和义务问题、及工程活动与社会政策问题。

机器翻译研发作为一项职业,什么样的职业行为才是社会所期待和信赖的呢?基于谷歌公司和欧盟委员会发布的工程伦理准则,张博士在文中提出了构建可信赖机器翻译系统的七个原则:人本性、鲁棒性、私密性、可解释性、公平性、可复现性、及可持续性。

张博士认为,人工翻译与机器翻译是互惠互助的关系而不是一方压倒性垄断。人工智能系统应该通过支持人的能动性和基本权利以实现公平社会而不是减少或限制人类自治。从这个角度出发,机器翻译的发展也不应脱离人类直接独立地实现语码自由转换。

技术鲁棒性要求算法足够安全、可靠和稳健,以克服人工智能系统所有生命周期阶段的错误或者不一致。在机器翻译的应用领域中,翻译系统一旦出现漏洞或被黑客攻击,其不准确的译文就可能会对人类生命安全带来影响。因此鲁棒性原则要求机器翻译应该通过人工译员的监管来评估、缓解和纠正潜在风险。

除了人机协同的方式,机器翻译系统本身的完善性也需加以保障,对数据集进行测试和处理的环节必不可少。他认为:“系统必须确保隐私和用户数据保护,同时,由特定机器翻译系统开发收集的数据中如若含有偏见及错误信息需要进行脱敏处理。”

“保护用户安全的同时也要做到数据完整可追溯,这就确保在译文产生争议时,机器翻译系统对翻译决策过程可以给出合理解释。” 可解释性就是要解释机器翻译系统的技术过程和相关的决策过程,技术可解释性则要求机器翻译所产生的译文是可以被人们所理解的。

关于机器翻译的“公平性”原则,张博士解释说,“在垂直领域,机器翻译系统可能是以用户为中心的,以一种允许所有人都平等地使用机器翻译产品和服务的方式,即无论年龄、性别、能力和其他特征,因此针对残障人士的辅助功能就显得格外重要,特别是在口语机器翻译系统研发中”。

“人机协同也要求相关专家能够准确表述系统行为和公开研发方法,方便其他研发者进行验证和再次实现。为了防止意外情况的发生,机器翻译系统必须是可复现且可靠的。”张博士说。国际通行的同行评审就包括对研究算法、数据和设计过程的评估,也包括对研究实验结果的复现。

最后张博士在文中指出,良好的机器翻译系统是兼具公平性与可持续性的。“人工智能系统研发中不仅应考虑人类能力技能要求等多个因素,做到兼顾不同类型的用户群,也要承担起增强可持续性生态环境的责任,促进社会变革带来积极影响。”

“身处现代科技蓬勃发展的时代,首先要做的是发展技术,其次是遏制技术。如何遏制?这就需要伦理学的规范和约束。”人工智能带来的伦理问题已经得到了学界、业界乃至全社会的关注,张博士的论文在机器翻译领域探讨了工程伦理的原则与问题,为机器翻译研发和应用“立法”开了先河。权威文摘《中国社会科学文摘》杂志于2021年第6期以“基于工程伦理的机器翻译系统基本原则”为题全文转载了张博士的论文中所提到的构建可信赖机器翻译系统的七个原则。

记者:姜影

2021年09月16日