学生机器翻译实践报告

学生机器翻译实践报告

摘要:人工智能的迅猛发展带动了机器翻译的普及和兴盛。各种免费的在线翻译网站投入使用,为语言学习者特别是学生译者带来了便捷。本研究根据翻译专业二年级学生译者提交的机器翻译实践报告,分析以谷歌翻译为代表的国内外六大免费在线翻译网站在处理和生成非文学翻译文本方便取得的进步以及存在的局限。本研究论证在学生译者工具子能力培养方面,翻译教学可以有效地引导学生译者合理使用机器翻译以实现人机翻译的目的。

关键词:机器翻译;在线翻译网站;工具子能力培养;学生译者

1人工智能时代的机器翻译

机器翻译自1946年开始产生,经历了五个时期,即萌芽期、创立期、冷冻期、兴盛期复兴期和兴盛期。学者们普遍认同从90年代开始,机器翻译从基于规则的方法向基于语料库的方法发展。基于语料库的方法包含实例和统计两种形式,后者更趋主导。机器翻译研发团队将基于统计的方法作为核心规则。2006年谷歌公司推出的谷歌翻译(GoogleTranslate)在线翻译网站,其免费的翻译服务为众多用户带来便捷。谷歌翻译网站的运行标志着数据驱动的统计机器翻译活动成为商务机器翻译系统的主流(赵应吉,2019:113)。2016年以来,谷歌翻译的新一代端对端神经翻译系统研究技术突飞猛进发展,成为行业标杆,其翻译的准确性和高效性远远超过统计机器翻译。国内的几大商用在线机器翻译网站紧跟时代潮流,以神经机器翻译为核心技术,研发出符合中国人使用习惯的在线翻译网站,提供便捷的机器翻译服务。国内较为知名并在业界占领重要地位的机器翻译网站如百度翻译、搜狗翻译、360翻译和有道翻译等。国际上除了谷歌翻译占据显著的地位,微软研发的必应翻译也获得较好的口碑。

2机器翻译与学生译者工具子能力培养的关联研究

国际上针对工具子能力培养研究较为突出的是西班牙PACTE研究小组的翻译能力培养理论和奥地利学者提出的“翻译能力发展”(TransComp)项目。PACTE小组有关于工具子能力的定义是如何使用一些翻译资源更好地为翻译服务的能力,包括查询词典和使用网络搜索引擎等能力。TransComp项目总结为工具和研究能力,类似前者的工具子能力,是译者使用纸质和电子参考工具的能力,但也注重译者的研究能力的提升。(朱玉彬,2015:34)马会娟(2013)提到翻译能力培养中,工具能力培养特别是译者工具查询能力的培养尤为重要,针对职业译者而言,学生译者是区别于职业译者的一类特殊人群,未来计划从事具体的翻译工作,比如口笔译方向,活跃在文学或是非文学翻译领域的翻译。对于高校中翻译专业、英语专业翻译方向和翻译硕士等群体都是学生译者的培养群体。纵观机器翻译的发展,机器翻译分为全自动机器翻译、机助人译或计算机辅助翻译(ComputerAidedTranslation)、人助机译三类。就国内本科阶段和研究生阶段,学生译者培养过程中,翻译能力培养的子策略之一——工具子能力的培养来看,国内大多数的院校开设了计算机辅助翻译课程,简称CAT。学者对于机器翻译和翻译教学的研究多聚焦在CAT领域。所以机器翻译在进入第五个翻译阶段即兴盛期时,仍无法脱离人工翻译的审核和纠正,完全实现自动化,并将人工翻译取而代之。人工智能时代的到来,机器翻译的发展越发成熟,作为学生译者,特别是未来有志于从事翻译职业化工作的学生来说,学习必要的机辅技术、翻译工具,学会使用在线翻译网站和相关翻译软件,尤为重要。

3翻译专业学生机器翻译体验报告的生成及分析

本研究以某高校翻译专业二年级两个班级共57位同学提交的机器翻译实践报告为材料,汇总、分析学生译者体验国内外六大在线翻译网站的评价。学生译者根据不同翻译网站生成的译本,并结合自己对语篇的理解和翻译,探讨在人工智能高速发展的今天,机器翻译特别是免费的在线翻译网站免费在译文生成的时效、译文质量以及译文存在的不足等重要问题方面展开讨论。根据纽马克对文本类型的划分,非文学作品属于信息型文本(informativetext)主要用于传递信息或者客观描述事实,采取直接的表达方式而不通过具体描写形容的方法来呈现风格问题,但往往有其固定表达方式,一般较少涉及审美的活动。本次提交的学生译者机器翻译实践报告均选用非文学文本,可以是科技翻译、新闻翻译、法律翻译、旅游翻译和政宣翻译等文本材料,不少于300字以英译汉作为实践形式。学生译者可以使用由教师推荐的国内外六大在线翻译网站,即谷歌翻译、微软必应翻译、百度翻译、搜狗翻译、360翻译、网易有道翻译。均是国内外知名的、免费的在线翻译网站。73%的同学选择科技类文本进行机器翻译实践。翻译科技类文章,需要先了解科技文体的类型和受众群体。科技文体包括科技专著、科学论文、科普读物等,涉及自然科学、生物、物理技术等专业题材。其中,以科学论文和科普读物来说,科学论文要求专业、严谨和精确、科普读物的主要目的在于向大众读者传递有效的科学信息,译者以普及科学知识为目的,语言表达上尽可能化繁为简,但又不能任意删减,使信息缺失。一定要做到逻辑上严密,语言表述上精准。本次机器翻译实践报告共57位学生译者参与体验,男女生比例为9:48。教师建议学生译者在实践报告中加上自己的翻译部分,加深对原作的理解,对照机器翻译的几个译本。自我完成作品的时候可以使用相应的翻译工具,比如英汉词典。对于当代的语言学习者,对于纸质工具书的使用率呈下降趋势,过分依赖网络在线查词或APP查词软件。纸质工具书查阅能力、在线查词能力和APP词典使用能力等都是工具子能力培养的范畴。有些学生译者只是简单寻求词义,而非将词汇、短语等表达带入具体的语境中,进而研究词或短语的具体含义。在网络连接时,一些较好的在线词典或者是查词软件还是具有强大的词库功能,提供的例句释义非常适合翻译专业学生学习,掌握具体的词汇或是短语在句型中的表达含义。

4学生译者工具子能力培养和机器翻译使用反馈

基于统计的机器翻译以短语为翻译的基本单位,神经为基础的机器翻译则以句子为翻译的基本单位,大大提高了翻译的准确度,对于句子翻译的整体把握比之前的机器翻译跃升了一个新台阶。有研究表明,当句子中单词超过40词时,长句翻译情况不容乐观。主要原因之一在于翻译模型在解码时,搜索算法更倾向于选择短句生成最终翻译。句子为翻译单位有其局限性,尽管当代翻译学理论普遍认可句子作为翻译活动的基本单位,但不少翻译家提出了应当以语篇为翻译的基本单位,保证上下文理解的合理性、完整性、准确性和流畅性。目前的机器翻译技术达不到以语篇翻译为基本单位的标准。在学生译者提交的机器翻译实践报告中,85%的学生提到机器翻译在长句翻译方面问题将较为严重,主要体现在句型语义理解错误、语法结构失误等。从提交的57份机器翻译实践报告中得到评价,就机器翻译而言,反馈最好的几点内容如下:1)在线翻译网站最便捷之处在于词汇方面的完成情况,特别针对专业术语、专有名词的处理非常迅速。2)机器翻译因其强大的数据库和语料库等检索功能为支撑,能较好地完成翻译的初稿。3)机器翻译速度非常快,从文本复制进入对话框,到文本生成基本1-2秒瞬间完成。这是人工翻译无法比拟的。4)就非文学翻译文本完成情况来看,总体正确率在70—80%左右。读者满意度较高。5)专有名词的处理,大多数完成情况较好,省时省力。从提交的57份机器翻译实践报告中总结存在要存在的问题如下:1)长句翻译问题最大。如英文原文本中的定语从句和状语从句,在翻译过程中,机器翻译处理得过于冗长,晦涩难懂,逻辑不清。2)无法结合上下文语境,灵活地翻译某些词汇的意义。词汇在语境中的意义发生转移,没有考虑语境意义,产生错误。大多数直接使用常用语义。忽略熟词生义。3)译文缺少一些相关的连词连接,特别是表示逻辑关联的词语缺失。导致可读性差,也使读者理解产生偏差。4)遇到英文长难句的时候,没有适当添加标点符号,读者阅读困难。机器翻译并未关注标点符号等细节问题。5)逐字逐句翻译,主要采用直译的方法,生硬刻板,语义不通或者不符合表达习惯。6)漏译、误译等问题比比皆是。7)文本中缩写形式的处理,经常漏译,错译。相关科普类词汇翻译得牛头不对马嘴。

4.1长句翻译和机器翻译的处理

这是一篇研究激光的科技类文章,第一句是长句,在线翻译网站有两种翻译处理方法,第一是直接切分开,第二是置于句中做修饰语。有道翻译的译文:研究人员用一种可以从华盛顿特区延伸到巴尔的摩的光纤展示了有史以来最长的激光器。百度翻译的译文:研究人员用从华盛顿特区延伸到巴尔的摩的光纤展示了有史以来最长的激光器。这两种方法都存在不足,直接切分开,会使原文的逻辑结构断裂,而置于句中做修饰语,使得修饰语过长,不符合汉语的表达习惯,且阅读起来有一定的困难。

4.2语境意义表达不足和机器翻译的生搬硬套

在一篇和经济类新闻报告相关的应用文本中,对于原句里两次出现的斜体字Doingbusiness表达,谷歌翻译在译文中两次均处理为《营商环境报告》,这是准确的。其他的机器翻译也基本做到了至少一次的正确。只有360翻译,在语篇处理时,都翻译为“做生意”。在另一篇学生译者选择的有关信号传输的科技类文章中,出现了“duringthetrip”这一表达,由上下文可知,trip是指在信号传输的过程,而大多数网站都直译为“旅程”。同一文本另一处,“offerahugeimprovementforvoiceanddatatransmissionsoverlongdistance”。多数机器翻译处理为“该技术为远距离语音和数据传输提供巨大的改进”。生搬硬套,译文不符合中国读者阅读习惯。360翻译译为“该技术可以极大地改善语音和数据的远距离传输”。处理得较为得当。PRL,在某一科技类文章中,指的是《物理预告快报》(Phys⁃icsReviewletters)期刊,没有一个翻译网站处理得当,全部是直接写出缩写形式PRL。

4.3标点符号等细节问题在机器翻译中“不受重视”

百度翻译的译文:在加利福尼亚和夏威夷之间散落着漂浮着的飘飘绰号“太平洋大垃圾”补丁。有道翻译的译文:其中最大的一个位于加利福尼亚和夏威夷之间,到处都是漂浮物,被称为太平洋大垃圾补丁。谷歌翻译的译文:其中最大的一个位于加利福尼亚和夏威夷之间——因此散落着漂浮物,它被称为太平洋大垃圾补丁。搜狗翻译的译文:其中最大的位于中间加利福尼亚和夏威夷之间到处都是垃圾绰号“太平洋垃圾”补丁。360翻译的译文:其中最大的一个位于加利福尼亚和夏威夷之间一直都是垃圾绰号大太平洋垃圾补丁。五大网站的翻译对于指示代词these都没有翻译出来,可见以句子为翻译单位的机器翻译,无法联系上下文,实现篇章的完整分析。五个在线翻译网站对于该句中3个常见单词的语境意义把握失误,如patch都翻译成“补丁”,明显是错误的,应当理解为“pieceorareaofland”。另一处“nickname”直接翻译为“绰号”,不够准确,文中应理解为“becalled被称为”,有道翻译的处理较好。原句只有一处标点符号,即破折号,一般是对上一句的进一步说明,五大商用在线翻译网站处理不同,三个在线翻译网站生成的译本中没有任何标点,只有有道翻译划分意群,加上三处标点。另一处保留破折号。古代文献中多没有标点符号,后人为了方便阅读加上了标点符号。对于中国人阅读来看,标点符号的加入至关重要,特别对于长句断句、意群划分、方便阅读起到重要作用。以上的机器翻译完成情况不够理想。

5结束语

人工智能翻译还是比较难取代人工翻译,特别在文学翻译领域。有关艺术类,比如文学创作,绘画,音乐等,很难被取代。文学作品讲究真情实感,要求译者了解时代背景,更贴合作者内心感受。但是翻译人员可以充分利用AI技术的发展,提高自身的水平。机器翻译可以取代一些重复烦琐或科学性比较强的材料。谷歌翻译等在线翻译网站在翻译单个句子的时候,处理得较好,但是在长句处理时仍需火候。在翻译的工作中,起到的是“协助”的作用,而不能安全地取代人工翻译。机器翻译为译者提供了一个大概的译文框架,后期则需要译者不断地修订、润色以增加译文的可读性,促进信息的有效、正确传递。68%的学生译者对机器翻译的未来发展趋势做出了预测:随着科学技术的不断进步,AI行业的前景势必更加开阔。各类在线翻译网站目前还处于研发的中期阶段,相信未来几年会更加完善。但尽管如此,AI并不能完全取代翻译人员。82%的学生译者在翻译报告中,明确指明机器翻译的研发和发展为人类的进步和文明做出极大贡献,但无法代替人工翻译。最佳的方式是人机互译,机器翻译为辅,人工翻译为主。人工翻译建立在机器翻译完成初稿的基本上,在此版本上修订。学生译者在机器翻译报告书写时,保持清醒的头脑,做出明确的判断。这和机器翻译的时代,所处在的阶段是吻合的。

作者:许春翎 郭琦 单位:华侨大学