基于受控语言的译前编辑对机器翻译的影响
时间:2017-09-19 14:42 来源:未知 作者:dl 点击:次
机器翻译在语言服务行业发挥着越来越重要的作用,如何提高机器翻译的准确度是急需解决的问题。除机器翻译技术本身的改进之外,人工参与是提高机器翻译质量的重要途径,这也是典型的人机交互翻译。针对机器翻译的交互而言,主要可分为两种:译前编辑与译后编辑。译前编辑是指在机器翻译之前对需要翻译的文本或文档进行有针对性的修改编辑以提高机器翻译产出的质量,译后编辑则是指对机器翻译的原始产出进行修改编辑的过程,目的也是为了通过人机结合提高机器翻译的最终质量。有效的译前编辑可以在很大程度上减少译后编辑者的工作量,所以业界有时也把译前编辑视为(广义)译后编辑的有机组成部分。一般而言,译前编辑与机器翻译的充分译后编辑密切相关,两者都是为了有效地传播信息,需要保证较高或可出版(publishable)的翻译质量。然而,如何进行译前编辑,什么样的文本适合进行译前编辑?有没有一定的规则可供遵循?是否可以运用受控语言(controlled language)的写作规则对文档进行译前编辑,基于受控语言的译前编辑对机器翻译质量的影响到底如何?基于实验与实例,本文尝试对这些问题进行解答,以探索受控语言在机器翻译的译前编辑方面的应用潜力。 如果原语文档使用受控语言写作,机器翻译的准确度便会大幅提高,尤其适用于多语发布的文档。胡清平曾指出,“翻译软件的研发和受控语言的推广是改进机器翻译质量的两个方向”,受控语言加机器翻译便是受控翻译(controlled translation),并提出了受控汉英翻译的设想与十点建议,对基于受控语言的译前编辑不无启示。当然,译前编辑并不能解决所有问题,因为很多机器翻译的错误是很难预知的,如果要达到较高的质量,还需要对机器翻译的产出进行译后编辑,刘毅就认为“无论机器多智能,也无论译者花了多长时间做译前编辑工作,未成功翻译的文本还是占有一定比例,我们不能完全依赖机器翻译,还需进行机器翻译后的编辑”。所以本文也会适当地讨论译后编辑,探讨如何通过基于受控语言的译前编辑以及对编辑过原文的机译产出进行译后编辑,以产生更高质量的译文。翻译自动化用户协会(TAUS)提供的译后编辑线上课程包括六个实践模块,其中之一便是译前编辑,这也一定程度上说明了译前编辑与译后编辑密不可分的关系。目前机器翻译主要应用于以下三个方面:(1)产生粗略的翻译,不需对原文或译文进行任何编辑,可称之为概要式或浏览式翻译;(2)对机器翻译的原始产出进行译后编辑以提高译文的质量(也包括译前编辑);(3)在某具体领域使用受控语言以生成较高质量的译文。通过初步实验,笔者认为,也完全可以把受控语言的写作原则应用到机器翻译的译前编辑之中,基于受控语言的译前编辑可以有效降低原文本身的复杂性与歧义性,提高机器翻译的可识别度(原文本身的可翻译性),从而减少(充分)译后编辑的工作量。 基于受控语言的译前编辑 目前已经有一百多种受控语言,广泛运用在大公司的技术文档写作中。通过采用语法和词汇的限制,受控语言提供更为清楚与直接的写作,减少词汇句法方面的歧义,提高了文档的可读性和可译性,使其更适合进行机器翻译,在大公司的科技文本系统中被广泛使用。受控语言采用受控词汇和受控语法,其中单词量和每个单词的意义都被严格控制以避免词法的歧义性,应用于机器翻译系统时是非常有利的。受控语法旨在强化清晰的风格,避免省略结构以及多重复合句的出现,把句法歧义(如介词短语结构、形容词修饰、回指短语等)降到最低程度。Mitamura 等和Nyberg 等提出了实施受控翻译的有利条件:翻译目的是为了传播信息,作者经过高水平训练,受控语言需经过检测者(软件)检验,应用领域为技术领域或特定领域。值得说明的是,受控翻译主要指文本写作时就使用受控语言以提高文本本身可理解性与可翻译性(针对机器翻译而言),基于受控语言的译前编辑主要是针对未使用受控语言的文本而言的。 机器翻译的译前编辑也可基于受控语言的写作规则进行规范,或者说对科技文本进行译前编辑也是受控翻译环境的组成部分。译者需要调整不同行业的文本使其适应受控语言写作指南,用来实现原语写作的连贯性以及提高这些文本的可译性。当描述语法和词性限制时,写作指南可在相关文献中轻易找到。Mitamura 等解释道,KANT机译系统所用的受控英语的词汇限制包括以下几个方面:尽量使用限定词等功能性词语;避免使用代词和连词,因为其容易增加句子歧义;在连词后面或简化关系从句中应该限制或减少使用分词形式(包括现在分词与过去分词),因此上述两个例子应改为:While you are driving the vehicle...和The directional stability that is caused by the wheel lock-up...。Mitamura 等(同上)还指出短语和句子限制的不同,在短语限制层面,要用单个动词替代动词短语(turn on应改为start),重复联合结构中的介词以避免歧义,如短语recorded memory of radio and each control unit是歧义的,因为它可以被解释为{recorded memory of radio} and {each control unit} 或 recorded memory {of radio and each control unit}。在句子限制层面,Mitamura 等(同上)指出有关并列句式(两部分应该处于同种形式),关系从句(应该由关系代词引入)以及省略结构(应尽量避免出现)的规则。Wojcik(1998)提供了波音所使用的受控语言的写作规则,指出:(1)诸如the,a,an,this和these这样的限定词应当合理使用;(2)在描述性写作中应该避免使用被动语态;(3)句子长度应该限定在25个单词以内;(4)应该避免超过三个单词的名词群;(5)不应该有超过两个形容词修饰一个名词或一个名词群;(6)现在分词的形式应该尽量避免;(7)动词后面的关联词that不能省略;(8)关系从句必须由关系代词引入;(9)并列结构中鼓励出现平行结构。这些受控语言的写作原则对机器翻译的译前编辑(英汉方向)基本上同样适用。 关于机器翻译的译前编辑,国内也略有探讨,个别学者也提出了受控语言在译前编辑中的作用。魏长宏探讨了几种译前编辑的方法,包括格式转换、拼写检查、句子调整、建立翻译记忆库、使用受控语言以及选择体裁和专业领域。魏长宏(同上)指出,受控语言是对原语的无限集进行一定的限制,这种限制分为自然限制和人为限制,自然限制指把研究对象局限于某一特殊领域内的子语言,人为限制指机器翻译系统附加上一个受控语言写作环境,让写作环境来提示作者写出满足机器翻译系统要求的句子,从而限制句型与句子的复杂度,保证系统处理的正确率。在魏长宏的研究中,采取受控语言只是译前编辑非常小的一部分,此部分的探讨远非充分与深入。吴慧颖以英国诺里奇市城堡博物馆荷兰画作的简介为例,研究了译前编辑与译后编辑分别使用机器翻译的对比。吴慧颖(同上)认为译前编辑所花费的时间和精力相对于译后编辑来说更长、更多,但其翻译效果并没有优于译后编辑。然而,这种观点有待商榷,针对可出版的机译质量而言,译前编辑与译后编辑更多的是一个整体,合理的译前编辑可以节省译后编辑的工作量,两者结合会比单纯的译后编辑节约精力。总之,“受控语言不仅可以提高技术文献的可读性和标准化程度,而且可以提高技术文献的可译性,是一种改进机器翻译质量比较有效的方法”。如果原文没有用受控语言写作的话,基于受控语言的译前编辑无疑也是提高机器翻译质量的有效途径。 案例研究 1.实验设计 机器翻译比较适合技术文档的翻译,技术翻译与技术写作共同构成了技术传播,受控语言在技术传播领域大有用武之地。本文以技术传播领域用户手册的翻译为例来探讨基于受控语言的译前编辑对机器翻译的影响,选择苹果公司iPhone5系列的用户手册作为原文(英语)。用户手册比其他各种科技文本更简洁易懂,方便对应用与不应用译前编辑的机译产出进行对比。此外,苹果手机销售到全球各地,用户手册的使用非常广泛,势必会被译为多种语言,所以很容易找到苹果手机用户手册的不同语言版本作为参考译文。在中国,苹果公司及其官方用户手册都具有高知名度和权威性;每个语言版本的用户手册都是由专家团队设计,确保了准确性;英语原文和汉语标准译文都很容易从网上获取。所以笔者认为苹果手机的用户手册是测试基于受控语言的译前编辑对谷歌翻译影响的上乘选择之一。 首先,将原文输入到谷歌翻译引擎中,得到第一组译文。然后,使用AST评估标准,参照标准译文分析第一组译文的质量。接着,将经过译前编辑的英文原文输入到谷歌翻译中,得到第二组译文,同样依照AST评估标准与标准译文,评价第二组译文的质量。最后,将两组的评估得分进行对比,观察第二组译文质量是否有所提高。笔者邀请五位专业译员对于两组译文进行评估,并将对两组译文的得分进行回归分析,以说明译前编辑效果是否显著。此外,为了生成更好的译文,作者还对译文进行了译后编辑,以弥补译前编辑的不足。由于本文案例工作量不大,笔者没有采用机器自动评估方法。人工评估以其操作简便评价准确的优点更受青睐。在各种人工评估方法中,笔者选取了语言学数据联盟首先提出的Adequacy Scale Task(充分性目标)标准。AST使用了许多不同的指标评价机器翻译,其中常用的是从充分性(adequacy)和连贯性(fluency)两方面打分。充分性指的是译文传达原文信息的量,连贯性或流畅性则不考虑句义传达是否准确,注重的是翻译的结构与格式,读起来是否规范、流畅。 译前编辑策略参考受控语言的写作原则,主要从词汇、词组和句子三个层面进行限制,如Cardey 等就是采用这种分类。仿照受控语言写作原则,结合汉英语言差异,通过反复调整和修改原文,观察相对应译文的改进,最终得出译前编辑的技巧与方法。 世联翻译-让世界自由沟通!专业的全球语言翻译供应商,上海翻译公司专业品牌。丝路沿线56种语言一站式翻译与技术解决方案,专业英语翻译、日语翻译等文档翻译、同传口译、视频翻译、出国外派服务,加速您的全球交付。 世联翻译公司在北京、上海、深圳等国际交往城市设有翻译基地,业务覆盖全国城市。每天有近百万字节的信息和贸易通过世联走向全球!积累了大量政商用户数据,翻译人才库数据,多语种语料库大数据。世联品牌和服务品质已得到政务防务和国际组织、跨国公司和大中型企业等近万用户的认可。 |