文本类型理论范例6篇

文本类型理论

文本类型理论范文1

关键词:文本类型 言内标准 言外标准 影片名 翻译

一、引言

电影是传播较广,具有国际性和大众性的一种艺术形式。电影的片名就像“名片”一样具有概括影片内容、揭示主题、传达文化内涵、激发观众审美愉悦和观看欲望等功能。好的电影片名能对电影的内容和主题起到画龙点睛的作用,因此电影片名的翻译好坏与否对电影文化的传播起着重要作用。本文结合赖斯的文本类型理论分析电影片名的文本类型,探讨电影片名在交际中所起到的作用及所表现出的功能。

二、赖斯文本理论概述

卡塔琳娜·赖斯从交际角度,按照功能主义翻译分析方法,创立了文本类型理论,并著有关于文本类型和语言功能的论著。赖斯指出:“文本类型决定翻译方法,在选择翻译策略时扮演着主要角色。不同文本有着不同的交际功能和翻译目的,翻译方法也应有所不同。译者应以交际功能为目的,采用适当的等值层次,即不同的翻译标准和策略。”赖斯将文本类型分为三种:以内容为中心、以形式为中心、以呼吁为中心,即信息型文本、表情型文本、操作型文本和视听型文本(杰里米·芒迪,2010)。其中,信息型文本是“单纯事实的交流,交际的焦点是内容或主题”;表情型文本是“创造性行文,使用了语言的美学特点”,注重文本形式;操作型文本是为“引起行为反应,呼吁或说服文本读者或接受者按某种方式行事,其焦点是吁请”;视听型文本则是对上述三种文本辅以视觉形象、音乐等。(杰里米·芒迪,2010)

文本类型区分的界限并非绝对,有些文本,如旅游手册、官方演说和操作说明同时具有两个或三个文本类型的特点。尽管存在这样的混合类型文本,赖斯认为原文的主要功能是否得到传递,是评判译文类型的决定性因素。她建议不同类型的文本采用不同的翻译方法。她指出信息类语篇的译文应该传递原语指示性或概念的内容,翻译时应直白无冗余,并根据需要使用明晰化技巧;表情类语篇的译文应该传递原语的审美性和艺术形式,翻译时使用“同一”策略,即译者应采用原语作者的观点;操作类语篇的译文应该是目的语接受者产生预期的反应,翻译应采用“顺应”策略,以期对译文读者产生同样的效果;视听类语篇需要采用“辅助”方法,给文字加上视像和音乐。(杰里米·芒迪,2010)

此外,赖斯还罗列了言内和言外的指导标准,以评估译文的充分性。译文的充分性包括:言内标准(intralinguistic criteria):语义、词汇、语法和风格上的特点;言外标准(extralinguistic criteria):情景、主题、时间、地点、接受者、发出者及“情感暗示(幽默、讽刺和情感等)”(杰里米·芒迪,2010)。尽管这些标准相互关联,但它们的重要性随着文本类型的不同而有所不同,如信息类语篇中翻译时更注重语义的传达,表情类文本翻译时更注重言外标准。

三、电影片名的特点及重要性

近年来的中国电影在海内外备受关注,这既是中国电影走向世界的标志,也是对外交流、传播中国文化的一种重要方式。随着中国电影行业的发展,目前我国的影片不论是否由名导演执导,为了影片的宣传和吸引观众,影片都有一个相应的英文名。

中国电影片名通常可以分为人物、地点、事件、事物和常用语等几类。这些电影名或揭示影片的主要人物,或揭示影片故事发生的背景和地点,或揭示影片的中心事件或主题,使观众能在不看影片内容的前提下对影片形成一个基本的认知,吸引观众进一步观看并了解影片内容。一个好的电影片名应具备以下特点:1.语言简洁明了,通俗易懂;2.须具备较强的感染力,以便抓住观众的眼球;3.应有一定的神秘感,以激起观众的好奇心;4.应有极强的广告效应和商业效应(熊杰,2008)。可见,影片片名的构思极为重要和复杂,它在很大程度上决定着影片是否被接受,是否产生经济效应和文化效应。因而,对于中国电影在国外的宣传和推广来说,影片片名的翻译至关重要。

四、中国电影片名的英译

以赖斯的文本类型理论为指导,2010年112部中国电影的片名,可以根据其内容、表达形式等分为信息型、表达型、操作型。

(一)信息型影片片名

以人物、地点、事物或事件为电影片名的属于信息型,交际中的焦点是内容或主题,能使观众对影片主题和内容有直观和清晰的了解。

以人物命名的影片的英译名可分为两类:

1.按照中文直译,传递中文指示性或概念性的内容。如下表所示:

中文影片名 英译名

《七小罗汉》 Seven Arhat

《刀客外传》 Legend of Swordsman

《未来警察》 Future X-Cops

《魔侠传之堂吉可德》 Don Quixote

《大兵小将》 Little Big Soldier

《朱丽叶》 Juliets

《老男孩》 Old Boy

2.中文影片名为人物名,英译名并非是人物名,而是适当地改译。如下表所示:

中文影片名 英译名

《80后》 Heaven Eternal, Earth Everlasting

《苏乞儿》 True Legend

《街角小王子》 In Case of Love

《赵氏孤儿》 Sacrifice

《锦衣卫》 14 Blades

《老那》 Addicted to Love

如上面表格所示,这些中文影片名的英译名都不是对中文的直译,而是对影片的内容和主题的提炼,关注影片内容,重在传递指示内容,这符合赖斯信息型文本的翻译方法,即用“直白语言,按需要明晰化”。

以地点命名的中国影片则主要采用对应的英译名。如下表所示:

中文片名 英译名

《外滩》 The Bund

《无人区》 No Man Land

《沙城》 Sandcastle

《虎厂》 The Tiger Factory

《观音山》 Buddha Mountain

《一页台北》 First Page Taipei

在112部中国影片中以地点命名的有8部,其中6部的英译名采用的是直译的方法。只有《维多利亚一号》和《迷城》是根据影片主题来译的,即Dream Home和Distant Thunder。前者表意直白,而后者则给观众留下神秘感和想象的空间。

(二)表情型影片片名

在2010年的中国电影中,属于表情型文本的主要以娱乐片、商业片和爱情片的片名为主。如下表所示:

中国电影片名 英译名

《为你钟情》 Frozen

《全城热恋》 Hot Summer Days

《花田喜事2010》 All’s Well Ends well

《大笑江湖》 Just Call Me Nobody

《寻欢作乐》 The High Life

《爱情36记》 Love tactics

以上这些影片的中文片名使用了一些语言技巧,或是醒目的短语,如《寻欢作乐》;或是改自其他公众熟悉的词语,如《爱情36记》《为你钟情》。具有一定的艺术性和审美性,比较注重语言形式,能抓住观众的眼球,其中英译名Frozen,在语言形式上一语双关,既可指天气寒冷,又可指一见钟情时人的心理状态和情感状态;All’s Well Ends well则模仿莎士比亚戏剧的All’s Well That Ends well,其语言形式具有一定艺术性以吸引国外观众;《爱情36记》的英译名Love tactics中“tactics”的使用,虽然是直译,但是能够使英译名和中文名表现出相同的效果,正如赖斯指出表情型文本应该使用“同一”策略,即译者应采用原语作者的观点,以便更好地实现表情型文本的功能。但是《全城热恋》的英译名Hot Summer Days只是对影片发生的一个环境的总结和体现,并没有突出影片的内容或主题,也没有表现出任何情感,显得过于普通,作为商业片,不能起到吸引观众的效果,与中文片名起到的效果相差甚远。

(三)操作型影片名

从本质上说,影片名需要实现的最大功能是说服或吸引观众观看影片,增加票房。影片中文名若能引起观众兴趣,则英译名也应达到和中文名同样的效果。赖斯建议采用“顺应”策略。在实际操作中,采用“顺应”策略可以达到和中文名同样的效果。如下表所示:

中文片名 英译名

《分手说爱你》 Break Up Club

《山楂树之恋》 Under the Howthorn Tree

《等着你回来》 The Haunting Lover

《越光宝盒》 Just another Pandora’s Box

《魔侠传之堂吉可德》 Don Quixote

《A面B面》 The Double Life

以上表格中《分手说爱你》《越光宝盒》《魔侠传之堂吉可德》等中文片名的英译名或以新鲜的字眼吸引人如Break Up Club,或模仿国外童话或名著的标题Just another Pandora’s Box,Don Quixote,能够起到“吁请”作用。《山楂树之恋》的英译名也模仿了The Desire Under the Elm Tree,但是并未能突出电影主题,与中文名所起的效果有一定差距。

五、中国电影片名英译名的充分性

尽管存在几种功能同时存在的文本,赖斯认为原文的主要功能是否得到传递,是判断译文类型的决定性因素。她罗列出的言内标准和言外标准对于评判译文充分性有很好的指导意义。

从上面表格可以观察出,以人物、地名、事件等命名的信息类标题的英译更注重语义、词汇、语法上的特点,力求和中文片名对等,以达到传达片名含义的目的,如《唐山大地震》的英译名Aftershock,其片名并未直译为Tangshan Earthquake,若仅从赖斯的言内标准来判断,Tangshan Earthquake的译法在语义上和中文对等,但是影片内涵却无法体现出来。《唐山大地震》讲述的方大强一家四口在唐山大地震中的遭遇,方大强被压在了废墟中不幸遇难,妻子被丈夫方大强甩到了废墟之外得以生还,而一对儿女却被压在了同一块水泥板下,面对只能救一个的艰难抉择母亲忍痛选择了儿子方达,而女儿方登在这次灾难中幸运地活了下来,被一对夫妇收养,之后的故事围绕地震后方达一家及方凳被收养后的生活展开,并强调地震对方达、方登及其母亲所造成的心灵的创伤。该影片并非单纯讲述唐山大地震发生的经过,而是对震后人物从地震带来的心灵创伤和精神伤害中恢复过来的过程进行了重点呈现,因此该影片的英译名Aftershock很好地体现了该影片的内涵,能够激起观众关于震后故事的好奇心,该英译名比Tangshan Earthquake的直白译法有更深含义的情感意义。

以短语、常用语命名的片名则更注重词汇和风格上的特点,力求反映中文标题的特色,尤以娱乐片、商业片的片名最为突出。从赖斯的言外标准的角度观察,这类标题更注重向观众传达某种幽默、搞笑、讽刺等情感意义。如《越光宝盒》的英译名Just another Pandora’s Box。该影片的主人公拿着越光宝盒从现代穿越回赤壁时代,故事情节荒诞离奇又搞怪。越光宝盒让人在时光中穿梭游走,就像潘多拉的盒子一样具有神奇的力量,二者在此有异曲同工之妙。将《越光宝盒》英译为Just another Pandora’s Box能起到和潘多拉盒子一样的效果,让好奇心驱使观众去观看影片。

又如影片《80后》的英译名《Heaven Eternal,Earth Everlasting》,该影片并没有兼顾片名语义,而是以该影片的主题命名,折射文化含义和情感内涵。该影片中男女主角经历了长达十五年的爱恨纠缠,不仅遭遇家庭变故、生离死别、爱恨情仇,还要面对他们自己内心深处的伤痕,透过这些,影片试图向观众表现“爱”“被爱”“永恒”的主题以及三者的关系。若该片译为The Generation Born in 1980s,则其情感色彩和主题意义大打折扣,而Heaven Eternal,Earth Everlasting是对影片主题和情感内涵的提炼,更引人注目。

因而,以人物、地点、事件命名的信息类文本的英译一方面注重语义、词汇、语法和风格上的特点;另一方面,情感、主题的表达也非常重要。总体上而言,其英译注重言内标准多过言外标准。相反,以短语类、常用语和小句类为影片名的英译更注重情感主题的表达和语言的风格,并且往往力求用西方文化中对等的名称去替换或创新,此时言外标准更为重要,以达到吸引观众眼球的视觉效果。因此,信息型影片名的英译需注重言内标准,而表达型和操作型影片名的英译需更注重言外标准,而两种标准在判断英译名是否充分时是不可分离的。

六、结语

赖斯的文本类型理论在指导中国影片名的英译时,起到了重要作用。在英译影片名的过程中,判断影片名的主要功能是否属于信息型、表情型、操作型或是其中两者或三者的结合,译者可以结合赖斯理论下各文本类型适合的翻译方法来进行翻译,并根据其提出的言内标准和言外标准来检验翻译的充分性,使英译片名在最大化地体现中文片名语义内涵的同时起到宣传影片的作用。

参考文献:

[1]杰里米·芒迪.翻译学导论——理论与实践[M].李德凤译.北京:

商务印书馆,2010.

[2]熊杰.国内影片片名翻译研究纵观及现状[J].新疆教育学院学报,

文本类型理论范文2

关键词:彼得・纽马克文本类型翻译理论;国际商业广告翻译;翻译原则;翻译策略;翻译方法

中图分类号:H159文献标识码:A文章编号:1005-5312(2011)11-0101-02

一、前言

经济全球化的过程早已开始,尤其是80年代,特别是90年代,世界经济全球化的进程大大加快了。进而,商品经济高度发展,国际商业广告已经通过各种媒体形式为千家万户所知,渗透到人们生活的方方面面。广告也已经成为商品能否立足的重要因素。因此,国际商业广告语翻译也愈加显得重要。作为一名优秀的广告语翻译工作者,不仅要清楚明了,准确表达商品的信息,而且要让国外消费者感受其中的文化底蕴,让商品畅销世界范围内。笔者结合英国著名翻译家彼得・纽马克的文本类型翻译理论,对国际商业广告翻译做一探讨。

二、彼得・纽马克的文本类型翻译理论

(一)表达功能型文本的翻译

在表达型文本中,如文学作品、私人信件、自传和散文等,其核心思想是表情达意。作者独特的语言形式和内容应视为同等重要。这样的文本强调原作者的权威,不会去考虑读者的反应。在翻译表达功能为主的文本时,要遵循“作者第一”的原则,既要忠实原作者要表达的思想内容,又要忠实原作者的语言风格。

(二)信息功能型文本的翻译

信息功能文本包括非文学作品、教科书、学术论文和报刊杂志文章等。文本强调的是“真实性”和语言外部现实,其核心是语言之外的现实世界。在翻译信息型文本时,应遵循“真实性第一”的原则。这种文本的核心是“真实性”,作者的语言是次要的。人们关心是作者说话的内容,而不是说话的方式。译者在语言运用上可以不以原作为标准,而以读者语言层次为标准,力求通顺易懂。

(三)呼唤功能型文本的翻译

以呼唤功能为主的文本,其核心是“号召读者去行动,去思考,去感受”。如产品说明书、通知、指示、宣传广告等都属于呼唤型文本,它强调以读者为中心。在翻译这类文本时,应遵循“读者第一”的原则。呼唤型文本的语言特别强调可读性,讲究通俗易懂。译者可以充分发挥译入语的优势,不拘泥原文的表达方式,使译文的语言尽量达到与原文的语言同样的效果。

三、彼得・纽马克的文本类型翻译理论对国际商业广告翻译的指导作用

根据彼得・纽马克的文本类型翻译理论,我们可以得知:任何一种文本,它可能同时含有表达、信息和呼唤中的一种、两种或三种功能,但它必定有它主要的一个方面,或以表达为主,或以信息为主,或以呼唤为主。针对不同的文本类型,应当采用不同的翻译策略。

商业广告是指商品经营者或服务提供者承担费用通过一定的媒介和形式直接或间接的介绍所推销的商品或提供的服务的广告。国际商业广告是人们为了利益而制作的广告,是为了宣传某种产品而让人们去喜爱购买它。其广告语的特点是简洁凝练、明白易懂、朗朗上口、新颖独特和富有情趣、主题突出。它的本质就体现在吸引性,可接受性和适应性。当消费看到或独到这种广告时就有一种美的感受,让人难以忘怀,就有想去购买的欲望。根据文本类型翻译理论和商业广告的特点和性质,可以看出,国际商业广告的主要功能是感染消费者,是号召消费者去购买它,从而使商品能够在世界各国立足。

翻译国际商业广告时,应遵循把读者放在首位的翻译原则。译者应根据译文所要实现的功能,使用符合译入语文化语言习惯的表达方式,使译文语言实现感染译入语读者的目的,而不应该拘泥原文的表达形式。为此,翻译工作者应该在不损害原意的基础上适当调整翻译策略,达到广告所要得到的号召效果。

四、国际商业广告的翻译策略和方法

彼得・纽马克的文本类型翻译理论告诉我们:国际商业广告是以呼唤功能为主的一种特殊的使用文本,它的主要目的是为了感染消费者,号召消费者,吸引消费者的眼球,让消费者有购买此产品的强烈欲望。因此,为了达到这种感染效果就要求译者应以归化翻译策略为主导,采取直译、音译等不同的翻译方法,注重通俗易懂,符合广告语所特有的特征形式。下面笔者将用一些大家熟悉的国际广告实例,同时运用文本类型翻译理论的精髓来具体分析下不同广告语在不同情况下所采用的不同翻译策略和具体的翻译方法。

(一)直译

有的词语在一定的语境和文化中可以照成某种联想气氛,产生特定的文化联想意义,它们在译语中的应用呈现出某种意想不到的效果和力量。对商品品牌名称、商标名称及广告主题句,在译入语中有完全对等信息的,多采用直译法。如:丰田旗下高端品牌LEXUC于2004年8月将品名由“凌志”更改为“雷克萨斯”,现译名更符合英文品牌名,音似程度高,但该译名的中文发音在受众心理激发不起对该商品的联想,对中国人来说,其广告效应还不如“凌志”,因为此译名能让消费者想起“古有凌云志,再上井冈山”,豪气冲天,更有高端品牌的地位。

又如:“月饼”这一商标在汉语中能让人想起美丽的爱情故事,温馨的传统佳节。因此,就应该直译为“MOON CAKE”,这样的翻译既体现我国古老的文化色彩,又很好地把“月饼”的相关的文化做了解说,消费者立刻就能够对月亮和蛋糕状食物产生联想。“白熊”商标,白熊生长在北极,英文名叫“Polar Bear”但Polar Bear在当今国际政治语言里有特殊的含义,所以为了避免其中的误会,应该直译为“White Bear”为好。

(二)音译

当商品名称或商标是姓氏、公司名称或新造的词语时,我们应当采用音译法较好。比如:Pierre Cardin就音译成皮尔・卡丹,对中国消费者来说,给人一种洋文化的感觉,显得这商品很有档次,很气派。Pilips就音译成飞利浦,还有我们中国的“李宁”商标,在国外就直接音译成“LI----NING”。还如:“Coca Cola”就直接音译为可口可乐,立刻给中国消费者一种清爽可口的美感,此翻译非常形象地把原广告的韵味给淋漓尽致地表现了出来,并且让消费者非常易懂和接受。

(三)改译

广告翻译还要考虑到在不同语言坏境中的语义差异。语义差异既包括字面意义也包括引申意义。可口可乐曾经推出一种“zero sugar”可乐,在刚进入中国市场时曾被译为“零糖可乐”,这本来是很形象的翻译,也凸显了商品的特色,但却忽视了它在中文语境下和“灵堂”是同样的发音。中国的消费者就很难把这种商品和饮料联系在一起了,却以为是一个为死者超度亡灵的地方了。所以,后来人们把它翻译成了“无糖可乐”,这样既能原广告想表达的意思,又不会误导中国的消费者。

又如:雷达牌驱虫剂的广告语:“蚊子杀杀杀”,若直译成“Mosquito Kill Kill Kill”的话,使国外消费者很自然想到要经过浴血奋战才能消灭蚊虫,可想而知,有哪个消费者会去买呢?结果把它翻译成“ Mosquito Bye Bye”,这样给人感觉就很轻松就能把蚊子赶走消灭了,非常符合国外消费者的心理。

(四)音意结合法

广告翻译的目的是为了“吸引顾客,让更多的人记住这个品牌,让更多的人来购买此产品”,所以广告切忌勿死译,硬译,有时不得不牺牲它的字面意思而借助音意结合法融入译语文化中。如:“Ho Yo Do”(电脑公司)翻译成“好又多”,“Johnson’s”(婴儿系列用品)译成“强生”,给中国消费者一种婴儿健康成长的联想,非常符合读者心理反应。若翻译成“约翰逊”的话是行不通的。

又如:“pizza”若只音译为“比萨”的话,中国人咋一看都不知道其为何物,更别说人们会购买它了,若翻译成“比萨饼”的话,中国消费者一看就知道是一种外国生产的饼,消费者自然也会去购买尝试下了。

(五)套译法

广告效果的好坏在很大程度上取决于广告本身所承载的文化潜质。在各民族语言中都有大量的脍炙人口的名言、警句、谚语等,这些语言形式给本国人留下了深刻的印象,难以忘怀,而广告的效应就在这。日本三菱汽车公司向美国市场推销其产品时创作了这样一则广告语“Not all cars are created equal”。美国消费者,若懂点美国历史的人的话就会自然而然地想起《美国独立宣言》中”All man are created equal”,它深刻地蕴含着美国争取民族独立,宣扬人人生来平等的丰富的文化底蕴。译者将“men”改为“cars”来突出广告主题,并将原来的肯定句改为否定句,显示出三菱汽车的独特之处,风驰电掣的超凡享受。

五、结束语

国际商业广告翻译是各国之间市场顺利沟通的重要手段,同时是市场竞争战略的极其重要的一个方面。广告语的翻译在某种程度上来说也是一种广告策划,所以翻译好广告语是非常重要的。在广告语翻译时切忌勿死译和硬译,它不仅是语言翻译,更是一种文化翻译。在我国传统的翻译理论中,人们总是一味地以忠实为己任,很少会考虑文本的类型,所以译者在翻译实践中也是以“信、达、雅”,“神似”论或“化境”论为准绳,这对翻译广告这种特殊的实用文本而言却没什么很好的帮助。然而,英国著名翻译家彼得・纽马克的文本类型翻译理论却给了我们很好的指导意义,它指明了广告是属于呼唤功能型的文本,对于此类文本,我们并没有唯一的翻译方法,但必须遵循“读者第一”的翻译原则,主要采用归化的翻译策略和多种不同的翻译方法将广告语翻译具有同等文化效果的结果。这对国际商业广告翻译有着十分积极的意义。

参考文献:

[1]Newmark,Peter,A Text Book of Translation .New York:prentice Hall International Ltd,1988.

[2]Newmark,Peter,Approaches to Translation.Oxford:Pergamon Press,1981.

[3]王宗炎.语言问题探索[M].上海:上海外语教育出版社,1985(2002重印).

[4]戚云方.广告与广告英语[M].浙江:浙江大学出版社,2003.

[5]汪滔.全球化思考,本土化行动――谈国际广告及其翻译[J].中国科技翻译.

[6]殷燕.文化与广告翻译[J].武汉科技大学学报,2001(6).

[7]孙晓丽.广告英语与实例[J].北京:中国广播电视台出版社,1995.

[8]孙葛佳.浅谈英汉广告翻译策略[J].经济研究导刊,2010.

文本类型理论范文3

    根据提供信息的不同方式,旅游景点解说系统可分为两大类:一类是以专业的导游人员向旅游者进行主动的、动态的信息传导为主要表达方式的导游解说系统,也称为向导式解说系统;另一类是以牌示解说、解说手册、导游图、语音解说、录像带、幻灯片等静态方式传递信息的自导式解说系统(王颖、吕和发,2006:126)。在大多数景区内,以牌示解说为主的自导式解说系统发挥着重要而不可或缺的作用,是旅游者到达景区之后进一步了解具体景点或进行自助游的重要且关键的信息来源。目前,在我国很多景区都可看到用汉语和英语两种语言甚至多种语言标示的牌示解说。各景区如此热情地欢迎各方游客,但遗憾的是不少景区的外国语译文常常低级错误不断。此外由于缺乏理论指导,译文也没有充分考虑其可接受性和读者的语言、文化、思维习惯,无法真正起到服务游客的作用。

    黄山地区的旅游产业是安徽旅游业的重要支柱,也是安徽走向世界的名片之一。因此,该地区的旅游景点配套的英文解说系统是外国游客了解中国自然和人文景观的重要途径之一。本文以黄山地区旅游景点内自导式解说系统中的牌示中英文解说词为研究文本,其中牌示解说包括:景点介绍牌示、警醒牌示和服务牌示,来探讨功能翻译理论在不同类型的牌示解说文本翻译中的运用。

    2 功能主义翻译理论简述

    起源于20世纪70年代的德国“功能主义”翻译理论(Functional Theories of Translation)最具代表性的人物及理论包括:莱思(K.REiss)的功能主义翻译批评理论,即文本类型理论(Text Typology);弗米尔(H.J.Vermeer)的目的论(Skopos Theory);霍斯·曼特瑞(Holz-Manttairi)的翻译行为理论(Theory of Translation Action)和诺德(C.Nord)的功能加忠诚理论(Function plus Loyalty Approach)(张美芳、钱宏,2006:66)。本研究以文本类型理论和目的论为主要理论依据,探讨“目的”准则指导下的文本类型理论在景区牌示自导式解说系统翻译中的灵活运用。

    2.1莱思(K.Reiss)的文本类型理论(Text Typology)

    莱思把文本类型分为信息型(informative)、表情型(expressive)、操作型(operative)和视听媒体(audio-medial)四种。视听媒体可以是电影、电视、音乐等视听媒介的混合性文本,但前三种则基本涵盖了普通的传统的文本类型,其各自的语言和功能特点可概括为:

    (1)信息型文本侧重文字内容,以交代事实、信息、知识等为目的,语言逻辑性强,如:参考书、报告、讲座、操作说明等;

    (2)表情型文本语言具有创造性和美学特点,强调的是作者或信息发出者本身以及他们所表达的内容,如:具有想象力的创造性的文学作品(诗歌、戏剧等)或作者的态度等;

    (3)操作型文本,又称诱导型,感染型(appellative)文本,目的在于使读者作出一定的反应,有劝说、劝阻、要求或诱导的功能,语言常有对话式的互动性质,如:广告、竞选演说等(李和庆等,2005:86-88)。

    请看以上三种基本文本类型在语言、功能特点、翻译方法等方面的对比:

    根据切斯特曼(Chesterman)对莱思文本类型的图解(见图1),旅游手册(tourist brochure)处于图示的中心位置但略偏向于信息型文本,因此可归为信息型为主,兼具表情和操作功能的文本类型,或是集信息、表情和操作功能为一体的多功能文本类型。

    2.2弗米尔(H.J.Mermeer)的目的论(Skopos Theory)

    目的论(Skopos Theory)中的“Skopos”来源于希腊语,意为“目的”。弗米尔指出,翻译行为的目的决定翻译过程中所采用的方法和策略,即“目的决定手段”(The end justifies the means.);而“决定翻译目的的最重要因素之一便是受众一译文的接受者,他们有自己的文化背景知识,对译文的期待以及交际需求”(转引自张美芳、钱宏,2006:90)。因此,为了说明译语文本(Target Text,TT)与源语文本(Source Text,ST)、译语文本(TT)与译语受众(TTusers)之间的关系,弗米尔又提出了从属于“目的”准则的两个次准则,即“篇际一致原则(fidelity rule)”和“篇内一致原则(coherence rule)”。篇际一致可以理解为译文对原文最大限度的忠实模仿;篇内一致指的是译文必须充分考虑译文受众的文化背景知识和所处的情境,使其最大限度地被受众理解和接受(转引自喻锋平,2006:396)。篇际一致原则解决了译文要尽量忠实原文的问题;而篇内一致原则要求译文符合受众的语言、文化、思维等方面的表达方式,并充分考虑两种语言文化的冲突、缺省等障碍,为译文受众提供可以接受的译文文本。用简单的图示表示这些术语之间的关系如下:

    3 功能主义翻译理论在景区牌示自导式解说系统翻译中的应用

    根据莱思的文本类型理论,在进行翻译活动的过程中,最重要的步骤之一是确定翻译目的和文本材料的类型(李和庆等,2005:89)。在翻译实践中,文本类型理论可以帮助译者确定文本的主要功能和类型,并在“目的”准则下进行翻译。那么,本研究所关注的景区自导式解说系统中的景点介绍牌示、警醒牌示和服务牌示文本该如何划分文本类型就成为首先需要弄清楚的问题。

    3.1文本类型的划分

    景点介绍可分为两种。一种情况是游客到达景区之前,以吸引游客为目的的旅游景点宣传文本,它不仅提供景点信息,而且语言讲究、富有感染力,以召唤游客参观为目的,此时可以归为操作型为主,兼具信息和表情功能的文本类型。另外一种情况是游客已经到达景区,位于景区内的景点解说牌文本也即本文的研究对象一景点介绍牌示文本,此时吸引游客已不是主要目的,按照推理,此类文本只需提供景点相关信息,为游客自助游提供方便即可,可以是只具单一功能的信息型文本。但由于英汉两种语言和文化的差异,此时英语版本的景点介绍可以做到语言平实,以提供实用的旅游信息为主;而汉语讲求句式、音韵美,即使吸引游客不再成为目的,往往在景区内的景点解说牌上,仍可见文采飞扬、词藻华丽的解说词。因此,不论是以吸引游客为目的的旅游景点宣传文本,抑或是景区内的景点解说牌文本,汉语的景点介绍牌示文本大都趋于集信息、表情和操作功能为一体的多功能文本,三种功能的重要性甚至难以排序。所以,在景区内的景点介绍牌示文本英译汉或汉译英的过程中,必须充分认识到中英差异,并采取一定的翻译策略和方法,让译文更加符合译文读者的语言和文化背景,注重译文的可接受性。

    警醒牌示有提醒游客注意,劝导、要求或劝阻游客行为等功能,目的在于引起游客的某种反应,通常情况下可归为操作型文本。但有时也告知发出警示的原因,此时可归为操作型为主、信息型为辅的文本类型。

    对于服务牌示,如咨询服务、救助服务、购票服务、餐饮住宿服务等,以告知游客服务内容、服务方式、服务时间和地点等方面信息为目的,大都可划为信息型文本。

    3.2翻译原则与策略

    莱思的文本类型理论针对各种文本类型的特点提出了翻译方法(如表1“翻译方法”所示):信息型文本的翻译采用“平铺直叙”的语言表达原文内容;表情型文本的翻译要尽量仿效原文作者的表达方式,传递形式和美学特点;操作型文本的翻译则可以灵活运用各种技巧,只要能够达到其诱导或感染的效果即可。这样的翻译方法显然有些笼统,因为在现实翻译活动中,译者可能经常遇到集多种功能为一体的文本,又可能由于翻译目的所限,或由于原文和译文两种语言文化的差异,出现译文文本与原文文本不再属于同一类型文本的情况。如汉语诗歌的英译,诗歌多以表情型文本为主,而汉诗英译时,译者很难将形式和音韵美完全用英语展现出来,此时也许只能将译文转换为以信息功能为主,同时具有表情功能的文本,用信息来弥补无法传递的表情功能。这种译文文本类型异于原文文本类型的情况,称之为文本类型的转换(Conversion of the text type)。

    王东风(2006:序6)指出:“德国功能观侧重语篇对目标文化的适应性,追求不同语篇类型的目的性,瞄准的是语篇的接受效果,可为意译或改写提供理论上的支持。”因此,根据“目的”准则,结合文本类型分析,在旅游景点牌示自导式解说系统翻译的过程中,译者可采用以归化为主的翻译策略,使译文语言符合译文读者的文化背景,确保译文的可接受性。必要之时,应将文本类型进行合理转换,例如将具有多元功能的原文文本转换为单一功能的译文文本等,目的在于使译文能够更加容易地被受众接受,同时体现“目的”原则为最高准则的精髓。需要译者注意的是,在保证篇内一致的同时,也要遵循篇际一致原则,不能把原文的信息和文化完全摒弃,否则翻译活动将失去其意义。

    4 实例分析

    “五岳归来不看山,黄山归来不看岳。”黄山以奇松、怪石、云海、温泉、冬雪“五绝”着称于世,美誉海内外。而黄山地区除人们所熟知的黄山风景区外,还有很多迷人的自然风光和人文景观也同样吸引着国内外游客,如:道教胜地齐云山、“皖南翡翠”太平湖、美丽神奇的芙蓉谷、被誉为“民间故宫”的世界文化遗产宏村、还有西方游客非常熟悉的电影《卧虎藏龙》的拍摄地之一的翡翠谷等等。

    下面以实例探讨功能翻译理论中的文本类型理论和目的论在景区自导式解说系统中的景点介绍牌示、警醒牌示和服务牌示文本翻译中的具体运用。

文本类型理论范文4

方法型、观点型、随笔型。教研论文,顾名思义,是以论证和阐述为主的。上述三种类型的公共管理类论文虽然都要求以论证和阐述为主,但在具体的写作程式上,却又有明显的区别。准确把握这种区别,有助于我们更快地写好论文,

也有助于读者阅读理解。那么,这些公共管理类论文各有什么重点和要求呢? 下面逐一分析。

一、方法型公共管理类论文

这是一种介绍具体公共管理类方法和经验的论文。在公共管理类实践中,我们通常会摸索出一种新颖而有效的操作方法,或者是探索出一些具有普遍意义的经验。应该说,任何一个有一定教龄的教师,只要稍微留意一下,就都会有自己的好方法和好经验。当这种方法和经验相对成熟时,我们就可以通过总结和提炼把它写成公共管理类论文。这种论文的标题,通常是用《……的尝试》(做法、应用、实践、探索),或者是一个具有操作性的句子。比如:《鼓励学生走生活作文之路的尝试》《“自学——质疑——释疑”的阅读公共管理类的应用》《用经典范读引领学生进入文本》等。方法型教育公共管理类论文的写作程式一般为——

1.阐述运用方法的依据

为什么要运用这种方法?依据是什么?任何一种新颖方法的运用,不可能凭空捏造,总会有一定的背景。背景通常有两种:现实背景和理论背景。现实背景是指当前公共管理类中的实际情况和客观存在;理论背景是指新的公共管理类理论和思想。方法介绍之前,应该把它扼要地写清楚。写清楚背景,有助于增强论文的现实针对性,有助于增强方法的实用性。如果这种方法所涉及的概念比较冷僻,还有必要对概念作些诠释, 以便让读者一读开头就能明白。

2.介绍方法的实施过程

这是公共管理类论文的重点部分,必须对方法作详细的叙述。介绍方法要根据具体情况,有的方法是渐进式的,有逻辑顺序,这就应该按逻辑顺序一步一步地介绍;有的方法是并列式的,没有严密的逻辑性,这就可以根据先主后次的顺序来介绍。在介绍时,小标题中不要用空洞的、玄乎的词语,也不要用表示结果的话来代替操作,要尽量用操作性的语言,直接写明怎么做。比“如每学期向学生推荐三篇时文美文”,如果换成“用时文美文陶冶学生情操”,那操作性就大大削弱了。介绍过程时,最好用小标题,分条列项。如果操作步骤较多,在小标题下还可以再分几个方面来说。总之,方法的介绍要有层次性,力求让读者读起来方便。

3.陈述方法实施的效果

一种科学而新颖的方法实施后,往往会取得理想的效果。作为方法型的公共管理类论文,有必要把效果陈述出来,以引起读者的关注。效果有显性和隐性两种,对显性的效果,能够用数据说明的,尽量用数据;对有些无法用数据说明的,可举例说明,选择一两个典型事例。陈述效果时,最忌讳的是光说些大而空的话,比如“提高了积极性,激发了兴趣”。用事实说话,让人心服口服,是这一部分的关键。当然,陈述的效果必须与实施的方法相关,不要把与本方法毫不相干的效果也统统扯上去。

4.陈述应注意的若干事项

某种方法在实施过程中,肯定会碰到一些想象不到的问题,比如本来以为某个环节很简单,实际上却非常复杂,或者本来以为学生很感兴趣,可实际上兴趣不大;有些方法在实施时,必须有充分的物质准备和心理准备。而这些,对没有经历过的人来说,可能不会注意。总之,某种方法在实施前、实施中、实施后要特别注意些什么,都要交代清楚,以免读者走弯路。这部分可简单些。

文本类型理论范文5

关键词:国家文化资本;研究框架;测量体系;布尔迪厄;文化软实力

中图分类号:G124 文献标志码:A 文章编号:1001-862X(2013)06-0132-005

在《国家文化资本论》的上篇中,我们在布尔迪厄文化资本社会学理论的基础上,重点探讨了国家文化资本的定义与分类,及其与国家文化资源及文化软实力的关系问题。本文以此为讨论的起点,聚焦国家文化资本的研究路径、总体框架、研究方法及其测量体系的构建,以期为国家文化资本的全球化及其跨文化传播提供新的研究视角和可供决策的、有效的数据支持。

一、 国家文化资本:研究总体框架与路径

国家文化资本研究的总体思路为:基于国家文化资本的学理及类型学研究,以及文化资本当前的研究现状,结合国家文化资本研究的总体目标(详见下图),从基础理论和应用对策两个层面对国家文化资本的构成要素、全球影响指数指标体系、影响国家文化资本的外部要素,以及国家文化资本与场域,国家文化资本与文化资源的区位、性别乃至人口分布等开展国家文化文化资本的内部和外部研究;并拟选取国家文化资本的典型亚类型如民族文化资本、企业文化资本、大学文化资本、世界物质与非物质文化遗产的国家文化资本等作为田野调查对象,通过科学的抽样调查、严密的数理逻辑和数据分析,构建国家文化资本测量的科学的指标体系,为国家文化资本的绿色积累及其跨文化传播,增强国家软实力和全球文化影响力提供具体可行的对策和政策建议。

由下图不难看出,国家文化资本研究的总体分为三大部分,即国家文化资本的内部研究、外部研究及应用对策研究。

所谓国家文化资本的内部研究,指的是按照国家文化资本的亚类型及构成要素,构建国家文化资本内部研究的体系,比如,可把国家文化资本的研究具体分拆为:民族文化资本研究、城市文化资本研究、教育(包括大学)文化资本研究、国家制度文化资本研究、意识形态文化资本研究、宗教文化资本研究等等。

而国家文化资本的外部研究则侧重于研究诸如区域环境、性别,乃至人口分布等可能对国家文化资本的形成直接产生影响的外部因素。该研究是对国家文化资本内部研究的一种有益且必要的补充,将国家文化资本的研究置于具体的语境和场域中,而非把国家文化资本作为一个独立和孤立于世界万物的现象来进行考察。

同时,国家文化资本的研究不应只停留于理论领域,对其应用及进行对策研究,尤其是研究国家文化资本的全球影响力(指数)及其跨文化传播的路径,显然既能对国家文化资本的理论进行实践检验,同时也体现出国家文化资本理论具有实际应用价值和推广的意义,并从一个新的角度对国家文化的国际传播和软实力作了新的解读,从而为国家和民族文化在全球化语境下的广泛传播,进一步增强国家和民族文化软实力提供具体的对策和建议。

二、国家文化资本:研究方法

国家文化资本研究依据不同的研究目标和内容可以采用不同的研究方法。总体而言,对其研究可采用定量与定性相结合的方法,探索将理论研究与实证分析相结合的科学研究路径。在具体的研究过程中,可视具体的国家文化资本的亚类型,分别或综合采用社会学、统计学、教育学、心理学、文化学、人类学等相关学科的方法和原理,从跨文化传播的视角对国家文化资本的各个层面进行深入系统的研究。典型的研究方法分述如下:

1.文献法:通过互联网、数据库、图书馆进行相关文献的查询和检索,广泛收集国内外相关研究文献,对有代表性和分析价值的资料进行分析研究,并不断跟踪与国家文化资本相关的最新研究动态,通过文献分析,找出国家文化资本研究的最新和最佳视角。

2.问卷调查法:按照研究需求,以国家文化资本所涉及的具体的亚类型,确定不同的问卷调查对象,并围绕亚类型国家文化资本所涉及的关键要素和指标,设计问卷,展开调查。

3.专家深度访谈:对国家文化资本亚类型所涉及的相关学界、企业或其他专家及人物,设计相关话题,尽可能进行深度访谈,

4.焦点小组座谈:选取与亚类型国家文化资本相关的单位、人物(管理层、研究/技术人员和普通人员)、专家等进行焦点小组座谈,以获得相关评价数据。

5.内容分析法:对田野调查收集到的各种信息按内容进行系统的定量及定性的分析。

6.个案研究:一方面选取各个亚类型的典型案例进行深入分析研究,以剖析该亚类型国家文化资本的指标体系情况;另一方面,积极寻找不同亚类型所具有的共性个案作为特别研究对象,剖析国家文化资本的主要构成因素及其形成性影响。

7.比较研究法:对国家文化资本的不同亚类型进行比较研究,以找出影响国家文化资源向国家文化资本转化的主要因素,为后期调查提供具体的对策和建议奠定必要的理论基础。

8.田野调查法:对所涉及的国家文化资本的亚类型进行实地考察,通过实地调研获取国家文化资本研究的第一手资料,为后期国家文化资本的全球影响指数的理论体系建构提供坚实的田野调查的基础。

9.模型建构法:对国家文化资本各个亚类型的调查结果进行统计学上的量化分析,建构可以具体测量国家文化资本及其亚类型的有效指标体系和可以量化的模型。

三、国家文化资本:测量体系的建构

国家文化资本作为一个崭新的理论建构,对其进行调查研究和应用无疑需要具体的指导性框架来确定其具体的数据。对国家文化资本的研究也不能仅仅停留在理论层面,而是要从实际操作的层面对其展开测量研究,质性研究与量化研究相结合才能为国家和民族文化资本研究提供具体可靠的数据和发展决策建议。

构建国家文化资本的测量体系,当然需要全面考虑其内部要素和外部要素,只有将其内部研究与其外部研究结合起来,我们才可以得到国家文化资本科学的指标体系。依据布尔迪厄的文化资本三分法,参考上述国家文化资本研究框架中提到的内部研究与外部研究,我们可以为国家文化资本建立如图1的指数模型。

需要说明的是,上述国家文化资本测量体系自三级指标开始均没有设计具体的内容,这是因为依据国家文化资本亚类型研究内容和对象的不同,该测量体系中无论是内部(要素)研究还是外部(要素)研究所涉及的三级及四级指标均会有所不同,甚至指标体系本身还视情况有可能延伸到更为细小的五级或六级指标,其目的就是为了能够具体量化上一级的指标,以期最终将国家文化资本的内部和外部要素均能量化,达到量化国家文化资本及其亚类型的终极目的。

当然,依据国家文化资本的不同分类法,我们也可以不采用布尔迪厄的三分法,而是将国家文化资本具体分为无形国家文化资本和有形国家文化资本,在此分类的基础上再将无形和有形国家文化资本细化成三级、四级或五级指标等,以达到最终量化的目的。这样的测量体系构建也是可行的,但需要合理选择有形和无形国家文化资本的三级、四级及五级的指标,不能挂一漏万。

虽然这种国家文化资本的二分法会导致国家文化资本研究的分野,但这种差异只是出现在内部要素的领域,对外部要素领域的影响几近无。有形国家文化资本vs无形国家文化资本的测量体系具体如图2。

值得注意的是,上述两种国家文化资本测量体系的建构并无实质上的区别,唯一的区别在于对国家文化资本构成要素的认识及对于国家文化资本分类标准的不同上。不论这种内部要素研究区别有多大,只要把握好分类的具体标准及下层级指标设计的科学合理性,那么其量化研究的结果差别应该不会是质性的,而是微小且可以忽略不计的。

四、国家文化资本研究:拟解决的问题

上文重点讨论了国家文化资本的研究框架、研究方法及测量体系的构建。本节则聚焦国家文化资本研究拟解决的具体问题和实际应用价值。总体而言,本文率先提出的国家文化资本论拟回答如下几个基本问题:

1)全球化语境下中国国家文化资本的现状如何?

2)中国(中华)国家文化资本作为一种软实力在全球具有什么样的影响力?如何衡量?

3)中国如何才能快速积累国家文化资本,其对外传播的有效路径是什么?

4)中国国家文化资本的输出与国家形象的提升有何关系?

要回答这些问题,就有必要对我国国家文化资本的构成要素进行剖析,建构中国国家文化资本的全球影响指数模型,并通过建设中国国家文化资本的全球影响动态数据库和案例库,结合国家文化资本影响指数模型进行实证效果对比分析,最终提出中国国家文化资本积累及全球化的有效路径,为实现中国的“文化强国”战略服务。

在此基础上展开的国家文化资本研究,通过社会学的田野调查法和国家文化资本全球动态数据库和案例库建设,在对所收集到的数据进行计量经济学和应用统计学分析的基础上,可以作出如下的分析报告:

1)中国国家驰名商标文化资本全球影响指数分析;2)中国国家世界物质文化遗产文化资本全球影响指数分析;3)中国国家世界非物质文化遗产文化资本全球影响指数分析;4)中国国家城市文化资本全球影响指数分析;5)中国国家企业文化资本全球影响指数分析;6)中国国家大学(教育)文化资本全球影响指数分析。

结 语

本文重点对国家文化资本的研究框架、研究方法,以及国家文化资本测量体系的构建进行了探讨,进一步丰富和完善了国家文化资本论的体系,以期为未来的国家文化资本论的实证研究奠定必要的理论基础。

值得注意的是,本文第三部分所建构的两种国家文化资本测量体系,无论其对国家文化资本要素的理解多么不同,最终的测量结果都是静态的和有时效性的;而由此得出的国家文化资本的全球影响指数也必然是静态和有时效性的,究其根本,这样的研究是结果导向的。要动态的计算国家文化资本在全球的影响指数,也可以采用过程导向研究,比如,重点研究国家文化资源是如何向国家文化资本转化的,而国家文化资本的跨文化传播(输入与输出)又是如何能够转化成国家软实力的一部分的。这样的过程性研究其实很有必要,也是对国家文化资本静态和结果导向研究的一种有益补充。限于篇幅,笔者拟另辟专文进行阐述,在此就不一一赘述了。即使上述的国家文化资本论仍然存在这样那样的不足之处,我们依然相信,一个清晰可见、可行、又具有可操作性的国家文化资本理论、研究框架及测量体系对于进一步推动我国的文化软实力建设和跨文化传播必将起到良好的推动作用,也必将能为我国的“文化强国”的国家战略服务。

参考文献:

[1]布尔迪厄.文化资本与社会炼金术[M].包亚明,译.上海:上海人民出版社:,1997:193.

[2]薛晓源,曹荣湘.全球化与文化资本[M].北京: 社会科学文献出版社, 2005.

文本类型理论范文6

关键词:Web评论;情感极性分类;非负矩阵分解;支持向量机

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)18-0167-04

Sentiment Classifier Based on NMF for Web Comments

REN Jing,LIU Li-bo

(College of Information Engineering Ningxia University, Yinchuan 750021, China)

Abstract: The research technique of Web review, the sentiment analysis is regarded as a classification process for review's emotional polarity. A support vector machine (NMF-SVM) classification algorithm based on NMF has been put forward, for which combine NMF(nonnegative matrix decomposition) and SVM(support vector machine). The algorithm using NMF for initial word-document vector matrix to reduce the dimension effectively, and to extract the latent semantic, finally using support vector machine to emotion classification that word-document vector model has reconstructed. The experimental results show that the accuracy of the classification algorithm is superior to the traditional SVM algorithm.

Key words: web comments; emotional polarity classification; nonnegative matrix decomposition; support vector machine

随着Web2.0时代的到来,为人们提供更加直观的意见沟通、情感交流的平台,它的出现不但打破传统行业运作模式,而且在用户体验式思维有很大的冲击。因此,越来越多的用户喜欢在互联网 (如博客和论坛)上,发表自己的观点和分享自己的经验,直接表达自己的各种情感,如喜怒哀乐支持和反对等。Web上用户的评论信息在不断增长,分布在网络上的海量信息成为了潜在用户计划消费前不可缺少的信息参考和指导。例如,在各大门户网站和论坛上出现某产品的评价和意见信息,直接影响潜在消费顾客的购买行为,也影响经营者、厂商了解用户真实需求、自身产品、服务方面的不足。面对海量的网络评论信息,仅靠纯手工统计、分析、挖掘,根本不切合实际,因此,利用计算机帮助用户快速完全地获取和整理这些相关的评价信息是当务之急。

中文文本情感分析也称意见挖掘,是对具有情感色彩的主观性文本信息,进行识别、分析、处理、归纳等一系列过程。其价值体现在从大量文本信息中分析得到总结性的结论。目前对于Web评论的研究方面,Wei等人[1]分析产品评论征的提取和情感词提取的方法。曹斌[2]通过数据挖掘算法,提取包含情感特征词的旅游评论句子,判断这些句子的情感倾向性,为用户提供有价值的意见。肖芬[3]针对Web站点中的评论文本,通过产品属性词和评价词的提取,挖掘出用户对产品意见的极性。周城[4]利用文本分类技术和情感词典技术两种分析方法对中文Web评论进行情感倾向性分析。孙莹[5]利用Web文本数据爬取的酒店评论信息,进行文本的数据挖掘,构建情感分类模型,最终对口碑进行情感分类,挖掘其中的商业价值。黄胜[6]从细粒度角度进行原始数据抽取、目标评价、词典构建、倾向词联合等四个方面挖掘出Web评论文本的主观性意见。彭浩等人[7]提出一种基于比较句的Web评论情感倾向性分析方法,实验验证,该方法能对对用户情感倾向性做出有效判断。徐凯[8]针对产品特征提取方面细致研究,有效识别用户情感倾向,为用户消费、厂商、企业提供有价值的信息。以上研究在Web评论文本的情感分类准确率有很大程度的提高,但是对文本特征空间较大、数据稀疏、有效特征较少问题上仍存在不足。

因此,本文基于传统文本情感分类的研究方法,利用非负矩阵分解算法对原始数据进行数据降维,提取有效特征,即体现了语义特征,又对大规模的Web评论分类的效率和精度都有所提高,将情感词集与待分类文档的在语义上关联起来,通过NMF重新构造的“词-文档”语义距离作为支持向量机(SVM)分类器的特征向量。实验结果表明,本文提出的方法相比于传统的SVM方法在分类准确度上有所提高。

1 相关理论

1.1 特征向量空间

目前SVM的文本分类,是根据文本内容将它们分类到目标类型的集合中,再利用初始文档的“词-文档”向量空间模型作为分类器的输入,通过标识好的训练样本集进行模型构建,最后输入测试样本集数据,获取测试数据的分类结果。运用文本分类的方法对文本进行情感分类过程中,文本分类特征的选择直接影响分类结果的好坏。

文本情感分析研究中,特征词与文档的间关系一般用向量空间模型(Vector Space Model,VSM)来表示,将数据向量化利于问题的后续处理。文本情感分类中最常见的特征向量空间模型是“词-文档”关系矩阵,关系矩阵中的特征值的好坏某种程度上决定了分类器的性能。特征值一般情况下对应特征词在对应文档中出现的次数,常见的特征提取方法有DF(文档频率)、信息增益(IG)和互信息(MI)等[9],将“词-文档”之间的关系表示为向量空间。TF-IDF(词频-逆向文档频率)方法是最常见的词频统计方法之一,TF-IDF计算公式如下[9]:

利用词-文档逆向频率方法,将每篇文档表示成基于tf-idf权重向量,构建所有特征词的向量空间,初始化“词-文档”向量空间模型。

1.2 NMF原理

NMF是近年来一种新型的基于语义的矩阵分解算法,它将一个大的非负矩阵分解为左右两个小非负矩阵,使得分解后的两个小矩阵相乘可还原得到大矩阵。由于分解前后的矩阵中元素都是非负值,因此原矩阵中的列向量可以解释为对左矩阵中所有列向量(称基向量)的加权和,而权重系数为右矩阵中对应列向量中的元素。一般情况下,构造文档的“词-文档”关系矩阵,具有高维且稀疏的数据特性,而NMF算法不但可以降低矩阵维度,并且能够挖掘出潜在的语义相关信息,很好地表达信息间局部相关性,具有更加直观的语义解释。另外,基于简单迭代计算的NMF方法具有收敛速度快、左右非负矩阵存储空间小、语义解释性强的特点,适用于处理大规模数据、文本。

设为任意一个非负矩阵,NMF算法就是寻找两个非负矩阵和,使X可以近似分解成两个矩阵的乘积。即有:

2 基于NMF的情感倾向分类方法

基于NMF的情感倾向性分类方法的系统结构图如下,总体上可以分为训练过程和测试分类过程。

1)文本预处理:使用现有的分词系统,对参加训练的评论文本数据进行中文分词、去除停用词等预处理工作;

2)选取特征词集:通过对文档征情感的词筛选确定,特征词的选取对分类器分类的准确性有一定的影响;

3)向量空间表示:利用“词-文档”关系矩阵,将文本数据进行数据量化。一般使用TF-IDF(文档-逆向文档频率)方法,将各个文本集都转换成对应的空间向量,构建出“词-文档”向量空间模型;

4)NMF特征变换:将初始“词-文档”向量空间模型进行特征转换,构造出“词-文档”的向量空间模型;

5)训练SVM分类器:根据已标注好的训练样本集对SVM进行训练,得到分类器模型参数,构造最佳的分类器。

2.1 情感特征词集的选取

本文的情感特征词集选取过程,依据中文分词系统,将评论文本中的词性进行标注,具有情感表象的词语一般都是句子中的名词、副词、形容词等,将这类词语作为情感特征词的候选词集,具体选择步骤如下:

1)将评论文本集分词后所有标注的形容词、副词和名词词语构成候选特征词集。

2)结合知网情感分析常用词语集词典,对候选特征词集进行筛选过滤,若候选特征词包含在情感分析词语集词典中,则保留,否则,剔除该候选特征词。

3)对过滤后的候选特征词集,对DF值(文档频率)设置一定的阈值,过滤小于阈值部分的情感词,筛选出具有很大信息量的特征情感词集。词DF值表示包含该词的文档总数。公式如下:

4)按照式(5)的计算方式,统计全部候选特征词的DF值,筛选DF值大于某一预先设定值的词,重新组建情感特征词集。

情感特征词集的选取过程中,既有效表示文档的情感倾向特征,又在一定程度上降低数据稀疏问题。

2.2 基于NMF-SVM情感倾向性分类过程

由图1中描述的NMF-SVM算法结构,整体分为两部分:第一部分是利用已知样本数据对SVM模型进行训练;第二部分根据建立的模型进行测试数据分类,具体算法如下:

算法模型中,输出参数为交叉验证参数、惩罚因子参数和核函数参数。

算法中k值表示潜在语义维度,步骤1中,利用分词工具和程序对中文文本进行分词进行预处理,步骤2中,情感特征词集利用2.1节中介绍的方法选取。步骤4中,通过TF-IDF(文档-逆频率)演算公式,计算出初始“词-文档”向量空间模型,用步骤5中的矩阵X表示。步骤7中,利用NMF方法将特征向量空间向低维语义空间映射,得到重塑的“词-文档”向量空间模型,步骤8是SVM分类器模型参数确定过程。

算法2 NMF-SVM模型分类算法

输入:分类测试文本集

输出:值

K为NMF过程中选取的潜在语义维度,Tab(d)为文本类别标识函数。步骤1中,利用分词工具和程序对中文文本进行分词进行预处理。步骤3通过TF-IDF(文档-逆频率)演算公式,计算情感特征词在每个测试文档中的TF-IDF值。步骤4中,构建情感特征词与测试分类文本的“词-文档”的向量空间模型。步骤6中,利用NMF方法将特征向量空间向低维语义空间映射,得到重塑的“词-文档”向量空间模型。步骤7是利用训练好的SVM模型分类器进行文本分类,得到测试文本集的情感分类结果。

3 实验及分析

3.1 实验环境及评价指标

在实验中,运用Java语言编程,使用中科院谭松波老师整理的1000篇关于酒店类的论坛评论作为实验语料,采用中科院的ICTC-LAS中文分词系统,SVM分类器采用台湾大学林智仁老师的lib-svm Java版本。不同研究领域的情感特征词集不同,文中的酒店评论情感特征词集按照3.1节的方法获取,其中C(ti)值选取为3。酒店类论坛评论的情感词集共选取了40个情感特征词如表1所示。

本实验采用准确率、召回率、F值最为衡量Web评论文本分类算法的性能指标。

准确率(),也称查准率,主要反映了情感分类器的准确度。它主要是指经过分类实验之后,被正确分类的文本数目与返回结果的文本数目的比值,计算公式如下:

召回率(),也称查全率,主要反映情感分类器的分析完全性。它主要是指经过分类实验后,被正确分类的文本数目所占应该被判别为该类别的文本数目的比重,具体如公式所示:

由上述计算公式可以看出,准确率()和召回率()从两个角度反映出分类效果,为准确评价文本分类的效果,将两者综合考虑,即构建F值对实验结果进行评价,具体公式如下所示:

3.2 实验结果分析

在对传统的SVM情感分类方法和NMF-SVM情感分类方法进行对比实验中,将1000篇酒店评论文档(正负各为500篇)语料,随机分成3份,其中2份作为样本训练集,另外1份作为测试数据,重复试验3次,最终取3组平均值作为结果。

验证过程采用统一试验数据集,设SVM分类器的参数:c=1,g=1/k,其中k为情感特征词集,k=40。本文基于NMF-SVM算法模型所得到参数:c=0.1,g=0.0768,基于NMF-SVM算法的Web评论文本情感分类的数据分析结果如表2所示。

本实验中潜在语义维K值取10。从实验结果表2分析可知,本文提出的NMF-SVM方法的分类比传统SVM方法的准确率平均提高2.86%,最高准确率达到82.15%,最高召回率达到88.49%。通过同一数据集下的文本实验对比分析,应用NMF算法对文本特征矩阵进行降维,重新构造潜在语义空间模型后,其分类效果比传统的SVM方法更具优势,更有广泛应用价值。

4 结束语

本文基于传统文本情感分类的研究理论,对Web中文评论情感特征矩阵存在的数据高维和稀疏性问题,提出一种基于NMF的Web评论情感分类算法。算法通过文本情感特征词集的筛选并与评论文本集间语义的关联,以“词-文档”关系矩阵作为SVM分类器的输入向量,这一过程中既解决机器学习中存在的数据稀疏问题,又有效地保留了特征词的语义信息。实验结果表明,这种方法在Web评论情感分类的准确率较传统的SVM方法有一定的提高,但非负矩阵分解(NMF)过程中k值选取,即语义维度的确定对分类效果可能会有一定影响,后续将会展开研究。

参考文献:

[1] Wei Wei, Liu Hongyan, He Jun, et al. Extractiong Feature and Opinion Words Effectively from Chinese Product Reviews[C].In:Proceedings of the fifth International Conference on Fuzzy Systems and Knowledge Discovery(FSKD,2008).

[2] 曹斌. 互联网上旅游评论的情感分析及其有用性研究[D]. 哈尔滨:哈尔滨工业大学,2008.

[3] 肖芬. 面向Web文本的产品意见挖掘算法研究[D]. 北京:北京邮电大学,2009.

[4] 周城. 面向中文Web评论的情感分析技术研究[D]. 长沙:国防科学技术大学,2011.

[5] 孙莹. 基于Web文本挖掘在企业口碑情感分类模型研究[D]. 武汉:华中师范大学,2013.

[6] 黄胜. Web评论文本的细粒度意见挖掘技术[D]. 北京:北京理工大学,2014.

[7] 彭浩,徐健,肖卓. 基于比较句的网络用户评论情感分析[J]. 现在图书情报技术,2015(12):48-56..