指出下列短语的结构范例6篇

指出下列短语的结构

指出下列短语的结构范文1

关键词: 认知语法并列结构结构式意象认知域

1.引言

并列结构是各种语言中都有的一种语言表达形式,也是人类语言中最简单原始的一种结构。以往对并列结构只是从结构形式上加以界定,以至于一些形式上类似于并列结构的语言单位被混同于并列结构。笔者以认知语法的语义描写为理论依据,从结构式、意象及认知域三方面对并列结构进行进一步研究。

2.并列结构的结构式类型

认知语法将语法结构叫做结构式,是指由两个以上语言单位组成的大小不同、复杂程度不同的语言象征单位。认知语法不是用SNP+VP等固定的规则来描述构件及其复合结构之间的关系,而是用构件之间的对应来描述,这种对应不是词语上的,而是概念上的。在结构式中,如果一个构件A使另一构件B的一部分由抽象实现具体,构件A就叫做概念自主的,构件B就叫做概念依赖的,概念依赖的述义依靠概念自主的述义实现其语义。(赵艳芳,2005)

汉语传统语法把短语分成主谓、述宾、述补、偏正、联合、连谓结构,这是按照组成短语的各成分之间的关系来划分的,但接下来又有方位短语、量词短语、介词短语、助词短语的划分,和前面的标准完全不同。(黄伯荣、廖序东,2002)

英语中的词组分为名词词组、动词词组、形容词词组、副词词组和介词词组。(夸克,1989)这种划分方法统一明了,但并没有说明词组内部构成成分之间的关系,而且汉语词性并不像英语这样界限分明,若要采取同样的方法,也一样会带来混乱。

Langacker抛弃了传统语法中的十大词类划分方法,将词汇分为两大类:事体(Thing)和关系(Relation)。传统语法中所划分出的名词、代词、冠词、指示词、数量词等,主要凸显事体性;动词、形容词、副词、和介词主要凸显各种不同的关系性(包括动作、过程、性质、状态、关系等)。

按照认知语法对词性的划分和有关结构式的定义,我们可对短语进行如下分类:“事体+事体”、“关系+关系”、“事体+关系”和“关系+事体”,结构式各构件之间形成独立或依赖关系。并列结构应该属于“事体+事体”、“关系+关系”的类型,并且各构件之间是相互独立的。如下列例句:

住宿生多半家境贫寒,能保证学费和简单的一日三餐的开销,对很多家庭来说已以很不容易了。(1)

我至今不知自己是如何飞快而奇迹地攀到崖顶抓住那朵花的,雨天中石壁很滑,可我居然熟稔沉着地爬了上去,并且摘到了那朵花。(2)

这样质朴亲切的叙述风格和文中所提到的那些已故的文学大师,不知怎的忽然让我想起已故的林予老师以及珍藏于我手中的他生前的几册藏书。(3)

(1)中的短语属于“事体+事体”类,构成的短语的各项之间相互独立,没有依赖关系。

(2)中“飞快而奇迹”和“熟稔沉着”是两个副词构成的短语,分别说明“攀”和“爬”的状况,属于“关系+关系”型结构式,各项之间也是相互独立的。这两个短语都属于并列结构。

(3)中“叙述风格”中的“叙述”本来是动词,在这里用作名词,这个短语应归入“事体+事体”型结构式,然而“叙述”这时应该指“风格的一种”,说明“风格”的性质,其语义要通过“风格”来实现,句中使“我”想起林予老师的是“风格”而不是“叙述”,“风格”是概念自主的,“叙述”是概念依赖的,因此这个短语并不构成并列结构。

因此,并列结构应属于“事体+事体”或“关系+关系”类型,且各项之间相互独立,不存在依赖关系。

3.并列结构形成的意象

意象是认知心理学的术语,指对事物的感知在大脑中形成的表征,比如大脑中会出现你见过的事物、情景,听过的声音,走、拿、打等动作也会在大脑中形成运动意象。但这种表征不是丰富的形象,而是删除具体细节的有组织的结构,是客体或事件在大脑里的一种抽象类比物。

并列结构各构件应该形成各自独立的意象。我们来看英语短语“bread and butter”,“bread”和“butter”是两个典型的“事体性”的词,而且两者之间由“and”连接,从形式上看是并列的,但是当听到或看到这个词时,人们头脑中出现的却并不是“bread”和“butter”各自独立两种事物的意象,而是一个整体事物的意象――“涂黄油的面包”,显然这时我们再把它当作并列结构的短语就不合适了。再如“牛和羊”,两个事体性的词表明两种动物,形成两种意象,而“牛羊成群”中的“牛羊”虽然结构上各自独立,但是形成的意象却和“牛和羊”不同,我们在看到“牛羊成群”这个短语的时候,大脑中并不会出现“牛”和“羊”两种截然分开的动物群体,不会形成两种动物的意象,而是一个由牛和羊组成的整体,也不排除还有其它种类的牲畜,但是却不能再扩展,不能说“牛羊马成群”,这时的“牛”和“羊”具有物质性,“牛羊”这个时候不能算是并列结构,而是指一群牲畜的一个词。

同样汉语中的“直来直去”、“一板一眼”、“你一句我一句”等,从形式上看各构件之间都是独立的,没有依赖关系,然而它们又是不可分割的,因为它们的组合形成了一个整体的意象,如果把短语分开来说成“直来”、“直去”、“一板”、“一眼”,“你一句”、“我一句”,其语义就很难以理解了。

因此,并列结构还要在语义上满足各并列项形成各自的意象这一条件。

4.并列结构的认知域

认知域是描写语义结构时所涉及的概念域,它可以是一个简单的知觉或概念,也可以是一个复杂的知识系统。对语义结构的描写即是相对于这些认知域。各种概念和知识系统构成一个具有层次的认知域网络,构成我们的百科知识体系,对高层次的概念的描述依赖于对低层次概念的认知操作,我们对每一事物的认知都是以认知域为背景或基体的。(赵艳芳,2005)比如一个“圆”是相对于二维空间而言的,这时,“圆”为图形或侧面,二维空间为背景或基体。但“弧”是以“圆”为背景的。这时,“圆”成为“弧”的直接认知域,称为初级认知域。也就是说,对“弧”的定义比对“圆”的定义更复杂。任何一个认知单位当它作为认识另一个更具体的认知单位的背景时,也称为认知域,可见认知域分为不同层次,有大小、复杂程度和基本的认知域和非基本的认知域之分。

语言中的每个表达式都有一个对应的认知域,其管辖的范围有大有小,也就是说人们在理解一个事体时所涉及的辖域有大有小,这就形成了辖域的级阶。例如:arm>hand>finger>knuckle,这里arm的概念提供了hand的空间范围,hand的概念提供了finger的空间范围,依次可推。对于knuckle来说,finger作为它的辖域就比arm作为辖域的级阶要低,那么在认知的过程中付出的努力就相对较少,“A forefinger has 3 knuckles”就比“An arm has 14 knuckles”的认知过程简单,前者是被人接受的句子,而后者则会让人费解,这是因为“knuckles”和“forefinger”的认知距离比和“arm”的认知距离要近。

The youngsters went off to the dance and the equator is equidistant from the two poles.(4)

(4)中的两个分句在结构上是各自独立的,且各分句形成各自的意象和命题,可是当这样两个结构被以并列的形式放在一起的时候,人们很难通过一般的认知模式对这句话形成概念并获取有用信息,从而体现话语的功能,这是因为这两个分句的直接辖域相差太远。

篮子里有香蕉、苹果和水果。(5)

句中“香蕉”、“苹果”和“水果”直接辖域接近,但以并列结构的形式出现仍不被接受,这是因为“香蕉、苹果”的直接辖域比“水果”低一个级阶,后者的直接辖域管辖前者的直接辖域,所以并列结构各并列项应该具有属于同一级阶的直接辖域。

5.结语

通过以上分析,我们可以总结出英汉语并列结构三方面的特点:

(1)并列结构应属于“事体+事体”或“关系+关系”结构式类型,且各项之间相互独立,不存在依赖关系。

(2)在语义上并列结构各并列项应分别形成各自的意象。

(3)并列结构各并列项直接辖域相差越远,就越难被人们接受,且各并列项应该具有属于同一级阶的直接辖域。

参考文献:

[1]黄伯荣,廖序东.现代汉语[M].北京:高等教育出版社,2002.

[2]伦道夫・夸克.英语语法大全[M].上海:华东师范大学出版社,1989.

[3]沈家煊.R.W.Langacker的认知语法[J].国外语言学,1995,1.

[4]石毓智.语法的概念基础[M].上海:上海外语教育出版社,2006.

[5]王寅.认知语法概论[M].上海:上海外语教育出版社,2006.

[6]张敏.认知语言学与汉语名词短语[M].北京:中国社会科学出版社,1998.

[7]赵艳芳.认知语言学概论[M].上海:上海外语教育出版社,2005.

指出下列短语的结构范文2

关键词: 英语 并列结构 动词短语省略

省略是自然语言中存在的一种普遍现象。过去数十年来,省略一直是理论语言学和计算语言学研究的主要论题,其中,动词短语的省略是他们研究的焦点。自从Ross于1967年涉及此领域,学者们便就动词短语省略产生的允准条件展开了一场争论。

省略是一个语法分析术语,指一个句子出于经济、强调或风格的原因省去结构的一部分,省去的部分在仔细考察语境后可以恢复。使用“省略”结构是英语日常会话和书面用语的一个重要特征,但支配这类结构使用的规则还缺乏深入的研究。对省略产生的条件,语言学界存在两种研究方法:一种是解释方法(interpretive approach),认为省略的部分在句法表层结构以空成分呈现,而又在深层结构通过复写给出释义;另一种是删除方法(deletion approach),这种方法认为省略的部分先作为一个完整语类产生,然后删除与先行语相同的部分。上述两种方法虽然研究着眼点不同,但都是从句法限制分析省略存在的合法性的。不论使用何种方法探寻其存在的允准条件,通过对英语中的各种省略现象的对比得出省略都具有两种基本属性:(一)省略是一个句法成分;(二)删除部分的先行语管辖着省略(Fiengo & May,1990)。语言学者们是试图对动词短语省略的研究建立一个完善的“允准”理论体系,所谓“允准”在这里指动词短语省略的局部条件。然而,由于多种因素的限制,句法省略理论都不能完全适应英语中各种省略现象。

一、省略与并列结构

我查阅了大量英语语法书籍和相关文献资料,发现英语并列应用极其广泛,形式多样。而省略,尤其动词短语省略在并列结构中非常常见。一般说来,在后一并列句中凡是与上文相同的成分通常都会被省略,这使得语言简练流畅,层次清楚。但并非所有的英语并列结构都能采取省略形式,什么时候该省,什么时候不该省,省略与否是有原则的。因此,正确认识英语并列结构中的动词短语的省略问题,对于正确理解或准确表达这类结构是非常重要的。

并列句中存在着多种多样的省略现象,其中可以省略的成分有:主语、整个谓语或谓语的主要部分、谓语的一部分、表语、动词宾语、状语等。在这里,简单地提及并列句省略的前三种情况,以下例句中的小括号代表省略的内容。例如:

(一)省略主语

在由and,or或but连接的并列分句中如有相同的主语,可以省略,使语言结构更简练。[1]如:

1.She went to the supermarket and(she)bought some food.她去了超市,买了点食物。

2.You can do the housework by yourself or(you)can ask your sister for help.你可以自己做家务或者叫你的妹妹来帮忙。

3.She cut her knee badly,but(she)didn’t cry.她弄伤了膝盖,但是并没有哭。[2]

但是并不是在所有的并列句中,有相同的主语都可以省略。如复合从句中的并列从句中有相同的主语,不可以省略。

4.*He asked to be transferred, because he was unhappy and because saw no prospect of promotion.[3]

例4是由because引导的复合从句并列句,其中第二个because后的主语虽与前一主语相同,但不能省略;倘若把它省去,那后一相同的主语he就可以省略。因此,正确的句子形式应是“He asked to be transferred,because he was unhappy and saw no prospect of promotion.他请求调动工作,因为他感到不愉快,又看不到提升的希望。”。

(二)省略谓语或谓语的主要部分

在并列分句中,凡是相同的谓语一般都可以省略。英语中,有时会把相同的整个谓语全省略,有时省略谓语的主要构成部分。如下:

5.Alice will go shopping today and May will(go shopping today).

6.Lisa will dance in the party but Jane won’t(dance in the party).

7.Steam may be changed into water and water(may be changed)into ice.[4]

8.The boy was given a big apple and the girl(was given)a little one.

很明显在上述例句中,例5和例6省略了谓语的主要部分,而保留了助动词;例7和例8则省略了整个谓语。在这一省略的形式中,有时,除状语以外的整个谓语会连同主语一起省略掉,[5]这一点这里就不详加论述。

(三)省略谓语的一部分

在并列分句中,有时省去的是助动词,有时省去的仅是实义动词。如:

9.Jack is watching TV and his mom(is)preparing the supper.杰克正看电视,他的妈妈在准备晚餐。

10.Susan will have graduated from the university by the end of next year and Jessie(will have)given a birth to a baby then.明年年底时,苏珊将已从大学毕业了,而杰西那时已生孩子了。

例9和例10使用时,分别省略了助动词is和will have.常见的省去的实义动词如:

11.John played football and Bob(played)basketball.

12.Many girl students like romantic movies but boy students(like)action movies.

13.The son works in a company and the father(works)in a school.

二、省略的表层特征

并列结构中动词短语的省略都具有一个表层特征即句子结构内部某些成分不显现而被省略。有的是整个动词短语成分都被省略掉,如例14a,并列从句中love rice没有出现,很显然,此句的完整意义是I love rice,and my son loves rice too.同样,stay up late在例14b中被省略。有的则是仅仅省略一个动词,如空缺结构(gapping structure),如例15,went在并列小句中“缺位”。还有的是另外一种的伪空缺结构(pseudogapping strucuture)中的动词也被省略,像例16仅仅省略掉excuse,而没省略her mother。

14.a.I love rice,and my son does too.

b.Lori often stays up late,but his wife doesn’t.

15.The boy went to the park,and the girl to the zoo.

16.Ann did not excuse his father,but she will her mother.[6]

三、省略的条件

对于动词短语省略存在的条件,学者们普遍地认为可以用删除方法(deletion approach)来阐释,即省略部分是未删除部分的句法再现。这一方法主要着眼于句法省略,要求省略的动词短语完全等同于先行语,这样省略才可以发生。与删除方法相对应的另一则研究方法是语义限制,也叫语义同一条件(semantic identity condition),要求允准动词短语省略的条件与管辖省略的代词的语义条件相同。

17.Max went to the store,and Oscar did(?摇 ?摇),too.

18.Max saw his mother,and Oscar did(?摇 ?摇),too.

19.Max said he saw his mother,and Oscar did(?摇 ?摇),too.

20.Tom saw him yesterday,and Mary did(?摇 ?摇),too.

我们不难理解上述例17中省略的内容是“went to the store”,这一省略能够被句法省略―删除方法允许,删除了跟其先行语句法结构及意义完全相同的部分。而对于例18来说,省略的内容就会有两种解释:一种是“saw Max’s mother”,另一种是“saw Oscar’s mother”。句法省略能够完全允准第一种省略存在,而对第二种却是无效的,因为正像以上所阐述的,句法省略要求删除的部分无论在句法结构上还是意义上都完全等同于允许其存在的先行语。同样的情况也会发生在例19、例20两句,类似这样的句子就有可能存在两种甚至两种以上的解释,完全从句法省略解释其存在的合法性是说不通的。

鉴于以上的情况,要求从句法和语义两方面着手研究这类结构存在的允准条件。例如18句的两种释法分别可以用严格意义(strict reading)和松散意义(slopping reading)理解,分别为:“Max saw Max’s mother,and Oscar saw Max’s mother,too.”及“Max saw Max’s mother,and Oscar saw Oscar’s mother,too.”但是如用这种方法来检测例19句,就会有多种理解,给读者阅读带来障碍。

四、省略的代形式

由于句法省略不能完全允准并列结构动词短语省略,语言学者继而提出省略的动词短语实质上是一种代形式(proform),继承了Hardt提出的代动词理论(proverb theory)。此观点通常被视为允准动词短语省略的语义限制,又称之为语义同一条件(semantic identity condition),它允许了动词短语省略的存在。

省略句中,允准动词短语省略的条件与管辖省略的代词的条件相同。允准代词省略的基本条件是代词语义上要与其先行词保持同一,这表明了省略的代词与其先行词所指代个体相同,省略的动词短语同样也与其先行语具有相同的属性。一个动词短语的意义通常储存在一定的语篇模式中。又进一步推论出一个动词短语是一个非限定词(indefinite),省略的动词短语是一个限定词(definite)。那么,一个动词短语首先在语篇模式中储存着一定的动态属性(dynamic property),省略的动词短语再从中抽取、选择这一属性。

五、结语

动词短语的省略广泛存在于自然语言,那么它们存在的允准条件和隐含的句法结构势必是理论语言学要探讨的问题。并列句中动词短语省略的形式多样化,可以省略谓语或谓语的主要部分,也可以省略助动词或仅仅一个实义动词。由于句法省略不能完全允准动词短语省略的存在,从而从语义上阐释了省略的动词短语实质上是一个代形式,允准省略的代词要与先行词保持语义上的一致,这样就保证了删除动词短语的合法性。

参考文献:

[1]黄关福.英语中的省略[M].北京:商务印书馆,1983:77.

[2]牛津高阶英汉双解词典[M].北京:商务印书馆,2002:185.

[3]黄关福.英语中的省略[M].北京:商务印书馆,1983:78.

[4]陈运玲.试析英语中的并列结构[J].河东学刊,1998,(4):55.

[5]章振邦.新编英语语法[M].上海:上海译文出版社,1983:651.

指出下列短语的结构范文3

摘 要:介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。

关键词 :介词短语 条件随机场 识别

一、引言

专利文献在国家经济发展和科技交流中发挥着十分重要的作用。近年来,中国专利的申请数量涨速飞快。面向专利领域的文本信息处理(如专利文本机器翻译)逐渐成为自然语言处理的重要应用领域之一,并引起了学术界和业界的广泛关注。

为了满足专利文本特定的表述需要,介词短语作为一种重要的短语类型,在汉语专利文本中分布广泛。据统计,在随机抽取的500句汉语专利语料中,包含介词短语的句子有226句,占到了样本总量的45.2%。[1]可见介词短语的出现比例非常高。汉语介词短语的自动识别具有较大的难度,主要表现在以下几点:

1.介词短语的内部构成相当复杂。介词短语可以由介词与其他词语和短语(动宾短语、名词短语、方位短语、时间短语等)构成,甚至可以由整个句子构成。复杂的内部结构很容易形成远距离的搭配关系。

2.兼类介词的存在。在一定的语境下,介词还可以兼做名词、量词、形容词、连词和动词等,必须结合上下文语境才能判断具体词性。

3.在同一个句子中经常会出现多个并列的介词短语,或者会出现复杂的嵌套介词短语。

下面是一个包含介词短语的真实专利语句示例:

(1)本发明【在条件允许的情况下】【通过[为一个宏块中的不同区域]提供不同的预测信息】而提出了许多更加准确的结果。

从例句可以明显地看出,专利文本中的介词短语通常具有更多的字数和更为复杂的结构。例句中用括号标示出了两个并列的介词短语结构,其中一个的内部还有另外一个介词短语,属于嵌套结构的介词短语。正确识别这些短语就比较困难了。

在句子S=W1,W2,W3……Wn中,假设字符串Wi,Wi+1……Wj为待识别的介词短语,介词短语识别的主要任务就是分别将Wi和Wj识别为该介词短语的左右边界。由于左边界就是介词本身,因此关键问题在于确定右边界位置。介词Wi通常称为前界,右边界Wj称为后界,紧邻右边界的词语Wj+1一般称为后词。

考虑到介词短语分布的广泛性和对专利文本处理的影响,本文尝试利用条件随机场模型(Conditional Random Field,即CRF),主要对大规模专利语料中位于同一分句内部的介词短语进行自动识别研究,希望能做出一些有益的探索。

二、相关研究

针对汉语介词短语识别的难点,国内外学者做了大量研究工作,提出了一些有效的方法,主要包括规则方法,统计方法和将二者相结合的混合方法。梁猛杰等(2013)通过考察介词规则库的处理特点,依据规则的覆盖程度从低到高进行分类,重新调整了规则的前后排序方案,同时对排序的规则进行优选,在保证时间复杂度较低的情况下提高了介词用法自动识别的准确率[2](P152~155)。朱筠(2013)、胡韧奋(2015)等在概念层次网络理论(Hierarchical Network of Concepts,HNC)[3]的指导下,面向汉语专利领域的文本,专门构建了较大规模的汉语专利语料知识库,在利用规则方法开展汉英专利机器翻译研究的过程中探索了介词短语的识别方法和思想[4][5]。于俊涛(2006)釆用基于最大熵模型的方法,通过获取有效的特征集合完成了介词短语识别的任务。奚建清(2007)引入机器学习方法,提出了基于隐马尔可夫模型(HMM)的汉语介词短语边界确定方法。首先基于HMM自动识别介词短语,然后利用依存语法错误校正方法对识别结果进行修正,取得了不错的识别准确率[7](P172~182)。胡思磊(2008)、宋贵哲(2011)、张杰(2013)利用CRF模型对介词短语进行识别,取得了较好的效果。于俊伟(2005)采用了规则和统计相结合的介词短语识别方法,提出了利用搭配模板获取可信搭配关系以及基于词性的三元统计模型和规则相结合的方法识别介词短语[11](P17~23)。昝红英等(2013)在已有工作的基础上,提出了一种规则与CRF模型相结合的介词用法自动识别算法。通过将人工书写的规则与CRF在宏观层面和微观层面进行有机的结合,根据介词的具体特点,选择合适的识别方法,使最终的识别准确率达到了80%左右[12](P2152~2157)。

三、CRF模型介绍

作为一种基于统计的判别式学习模型,CRF模型最早由Lafferty等人在2001年提出。该模型来源于最大熵模型。CRF通过计算和统计已知元素推理计算未知元素的条件概率。与隐马尔可夫模型不同,CRF可以利用上下文信息,而不需要严格的独立性假设,因此在序列标注问题中表现出很好的性能。此外,CRFs还解决了最大熵马尔可夫模型(MEMM)中的标注偏置问题。CRFs被广泛应用于自然语言处理领域的句法分析、命名实体识、词性标注等方面,并取得了很好的效果。CRFs是一种以给定的输入序列X为条件来预测输出序列Y概率的无向图(undirected graphical)结构模型。(X,Y)就是一个以观察序列为条件的随机域。概率计算可以通过如下公式得到:

四、基于CRF的介词短语识别

国外学者已经开发了完整的CRF模型工具包,利用工具包可以快速地训练模型并得到相应的结果。在本文中,将使用CRF++0.53版本的工具包①对中国专利信息中心提供的专利语料进行训练。

(一)序列标注

很多基于CRF模型的语块识别任务通常可以转化为序列标注问题。在识别介词短语的过程中,首先对包含介词短语的句子进行分词处理,然后对每个词语进行标注,确定介词短语的边界。我们采用{B, I, E, O}标记集进行标记。其中B表示介词短语的前界,I表示介词短语的内部成分,E表示介词短语的后界,O表示不属于介词短语的部分。

(2)本发明通过采用有效的方法提高汽车产量。

对于这个例句,可以做出如下标记:

本发明O通过B采用I有效的I方法E提高O汽车O产量O。O

将其反映到序列标注问题上,则可以认为:

输入序列X={本发明 通过 采用 有效的 方法 提高 汽车 产量 。}

相应地,输出标注序列Y={O B I I E O O O O }

(二)特征选择

特征是训练CRF模型必需的。在CRF中,特征选择是一个非常重要的问题,选择合适的特征对模型训练和测试都将十分有益。尽管可以不加限制地定义标记序列的特征,但不代表特征越多就越好。通过考察大规模语料中介词短语的特点,初步确定了以下五个特征及其属性值:

1.词特征。词作为句子的基本构成单元,是最基本的特征,模型可以通过词之间的差异性来寻找词本身的内部特征。

2.词性特征。通过分析发现,词性特征对边界的识别具有很大的提示作用。因此需要标记序列中词语的词性。本文采用北京大学《现代汉语语法信息词典》中的词性标记集进行标记。

3.候选前界特征。从当前词位置开始向前查找,查找位于同一分句中的介词。如果该介词存在,则该特征值为介词本身;否则特征值为“N”。

4.候选后界特征。如果认为当前词语可以作为介词短语的后界,则特征值记为“Y”,否则记为“N”。

5.候选后词特征。后词对介词短语的正确识别也起到了很大的提示作用,判断当前词是否是候选后词也能减小后界的选择范围。如果认为当前词语可以作为介词短语的后词,则特征值记为“Y”,否则记为“N”。

下表是例句2的标注实例:

将以上五个特征分为五列,对分词处理后含有介词短语的每一句语料进行标注,同时在最后一列加入{B, I, E, O}标记集,以确定介词短语的边界,以此形成训练语料和测试语料。

(三)特征模板

对于CRFs模型而言,根据选择的特征设计出不同的特征模板,根据特征模板系统生成不同的特征函数,会影响系统的性能。因此,特征模板选择的好坏将直接影响CRFs模型的效果。所以,特征模板的选择也是CRFs模型在介词短语识别中的重要问题之一。

CRFs模型的特征模板一般包括原子特征模板和复合特征模板。单独使用原子特征模板,只能表现出单个位置的特征信息,容易造成期望值和实际结果的偏差较大,导致参数的估计不准确。可以对原子特征进行组合,构成复合特征模板,通过定义各特征的窗口来描述标注单元和上下文之间的关系。本文将窗口大小定义为2。即分别考虑当前词、当前词前面两个词及后面两个词的五项特征。

当完成了序列特征标注任务,就可以利用CRF工具包对模型进行训练并识别介词短语了。

五、实验及分析

(一)实验结果

在这一部分,设计实验测试CRF模型识别介词短语的效果。从中国专利信息中心提供的专利语料中随机选择了1000句含有介词短语的句子作为测试集进行序列标注。实验采用四倍交叉验证方法,即将测试集按照数量均分为4等份,其中的3份语料作为训练语料,另一份作为测试语料,共进行四次实验,分别计算实验的三个评价指标:准确率(P)、召回率(R)和F1值,并将实验的平均值作为最终的参考结果。评价指标计算公式如下:

其中,“N”代表每次实验的测试集(250句)中介词短语的数量,“N1”代表模型识别介词短语的数量,“N2”代表正确识别的数量。

(二)实验分析

从上表可以看出,实验的整体评价指标都达到了90%以上,表明CRF模型对于识别介词短语的有效性。

通过分析识别错误的结果,初步认为分析错误的原因可能有以下几点:

1.有的介词在训练集中出现次数很少或者几乎没有出现,因此CRF模型无法有效学习到这些介词的特征,当它们出现在测试集中,模型就难以正确识别。

2.有些介词短语具有歧义,模型不容易判断短语的右边界位置。例如:通过墨水着色剂可以有效地使染布上色。这句话中,两个名词“墨水”和“着色剂”挨在一起,不确定二者是否可以组成复合名词,不容易判断到底哪个名词才是介词短语真正的右边界。

3.CRF模型对于序列的标注特征比较敏感。在人工标注的过程中一些难以避免的标注失误或错误也会导致识别错误的现象。

六、结语

本文利用条件随机场模型尝试对汉语专利语料中的介词短语进行了识别研究。在分析大规模语料的基础上,选择了合适的特征,对语料进行序列标注,同时利用CRF工具包训练了识别短语的模型,最后设计了实验检验识别效果。实验整体的准确率达到了90%以上,表明提出的方法对于识别介词短语是有效的。

未来将加强对歧义介词短语的研究,考察更多语料,争取发现更多有效的特征,同时扩大测试规模,希望进一步提高识别的效果与性能。

(本文得到了“国家高技术研究发展计划”[863课题,项目编号2012AA011104],中央高校基本科研业务专项资金以及中国博士后科学基金资助项目的资助,特此表示感谢!)

注释:

①http://crfpp.googlecode.com/

参考文献:

[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering

Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.

[2]梁猛杰,宋玉,韩英杰等.基于规则排序的介词用法自动识别研

究[J].河南师范大学学报(自然科学版),2013,41(3).

[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版

社,1998.

[4]朱筠.基本句群处理及其在汉英专利机器翻译中的应用[D].北

京:北京师范大学汉语文化学院博士学位论文,2013.

[5]胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].

语言文字应用,2015,1.

[6]于浚涛.基于最大熵的汉语介词短语自动识别[D].大连:大连理

工大学硕士学位论文,2006.

[7]奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算

机工程,2007,33(2).

[8]胡思磊.基于CRF模型的汉语介词短语识别[D].大连:大连理工大

学硕士学位论文,2008.

[9]宋贵哲.汉语介词短语识别研究[D].大连:大连理工大学硕士学

位论文,2011.

[10]张杰.基于多层CRFs的汉语介词短语识别研究[D].大连:大连

理工大学硕士学位论文,2013.

[11]干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学

报,2005,(4).

[12]昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动

识别研究[J].计算机工程与设计,2013,(6).

[13]Lafferty J.,Mccallum A.,Pereira F.Conditional

指出下列短语的结构范文4

一、偏正短语的分类

偏正短语按语法功能,可以分为三大类,即:名词性偏正短语、动词性偏正短语、形容词性偏正短语。

1.名词性偏正短语,其构成形式为:定语+中心语(名词)。定语是名词性中心语的修饰语,对中心语起描写或限制作用。例如,“晶莹的露珠”“雪白的背心”两个短语中,定语“晶莹”和“雪白”,主要起描写作用;“钢筋结构”“呢子外衣”,两个短语中定语“钢筋”“呢子”,主要起限制作用。此类短语根据定语的类型和数量又可分为以下几种情况:

指示代词、数词、量词或其中两项的组合作定语。例如:

那一年冬天/一双手/这位朋友/那天晚上

名词、动词、形容词、代词作定语。例如:

作家的宠物/天空的薄云/大自然的语言/变化的规律/歌唱的音调/黑黝黝的大山/结实的小伙子/光荣的传统、我的父亲/大家的东西

这类短语的特征是:两部分之间有时用结构助词“的”连接。

短语作定语。其特征是:这类偏正短语的定语以“的”字短语最常见。例如:

(冻得发紫的)嘴唇/(黑暗潮湿的)山路/(十分破旧的)衣裤/(不动脑筋的)人/(我朋友的)的房间/(二十年以前的)事

名词短语的前面有多个定语,一层一层地递加在名词前面。例如:

(一根)(又粗又直的)(木头)棒子

这类短语的特征:多个定语的排列顺序往往是,离中心语最近的是不用结构助词“的”连接的形容词或非领属性名词;次近的是动词或以动词为中心的短语;再次的是方位词或方位结构;最远的是表示领属关系的名词或代词。例如:

①(一个)(拿着枪在华北战场上同日本侵略者周旋了整整十年的)(老)战士

②(我们的)(一位)(有多年教学经验的)(优秀的)(语文)老师

2.动词性偏正短语,其构成形式为:状语+中心语(动词)。状语表示动作行为的方式、情态、时间、处所、对象等。例如:

轻轻地飘/完全赞成/立刻出发/笑眯眯地说/积极响应/从北门出去/天亮之前到达

这类短语的特征:表示时间、处所、对象的状语往往由介词短语充当。

状语和中心语(动词)之间有时用结构助词“地”(也可用“的”)连接。

动词前面可以只有一个状语,也可以有几个递加的状语。例如“[曾经][感激地][对她]说”中,这个短语的动词“说”有三个状语:“曾经”“感激”“对她”,它们依次递加在“说”前面。

请同学们注意的是,多项状语的排列顺序不大固定,有时位置不同,意义有别。哪个位置在前,哪个位置在后,取决于谓语内部的逻辑关系和表意的需要。

3.形容词性偏正短语,其构成形式为:状语+中心语(形容词)。根据状语的成分和语法功能可分为两种情况:

状语由副词、代词充当,对中心语起修饰作用,说明事物的性质、状态和程度。例如:

非常灵敏/十分清楚/那样鲜美/这样善良

状语通常由介宾短语充当,表示比较的对象。例如:

[和雪一样]白/[比昨天]冷

二、偏正短语同其他类型短语的区分

1.偏正短语与动补短语的区分。这两类短语均由“中心语”“修饰、限制或补充”成分构成,即都有“偏”和“正”两部分。偏正短语,起修饰限制作用的状语位于中心语的前面;动补短语,起补充说明作用的补语位于中心语的后面。偏正短语的中心语可以是名词、动词或形容词,两部分之间有时用“的”“地”连接;动补短语的中心语只能是动词(作为补充式短语有时可是形容词),两部分之间有时用“得”连接。例如:

(工人住的)房子:偏+正,偏正式/剪得〈整整齐齐〉,正+偏,动补式

2.偏正短语与并列短语的区分。并列短语两部分之间是并列关系,调换位置,意思不变。如“勇敢而坚强”亦可说成“坚强而勇敢”。偏正短语两部分之间是修饰限制关系,“偏”修饰限制“正”,二者位置不能调换。如“非常清楚”不能说成“清楚非常”。并列短语两部分之间常用连词“和”“而”“又”等连接。如“党和国家”“今天或明天”“天真而聪明”“又红又专”等;偏正短语两部分之间常用助词“的”“地”连接。

最后特别指出的是,运用偏正短语要注意修饰词与中心语的合理搭配,否则就会表达错误。如“山那边传来了一支歌声”中,“一支”与“歌声”搭配不当,应改为“一阵歌声”。

三、跟踪训练

1.下列课文标题都是偏正短语的一项是()

A.《北京立交桥》《最后一课》《愚公移山》

B.《天上的街市》《谈骨气》《曹刿论战》

C.《七根火柴》《苏州园林》《雄伟的人民大会堂》

D.《听潮》《驿路梨花》《谁是最可爱的人》

2.下列课文标题按短语结构分类,不含偏正短语的一项是()

①《最后一课》②《同志的信任》③《回忆我的母亲》④《人民英雄永垂不朽》⑤《中国石拱桥》⑥《竞选州长》⑦《范进中举》⑧《济南的冬天》

A.③④⑥⑦B.①③⑥⑦

C.①④⑥⑦⑧D.②⑦⑥⑧

3.“上面的雨直砸着他的头和臂”一句中的黑体字部分是()

A.定语偏正短语

B.补语 动补短语

C.谓语 主谓短语

D.宾语 偏正短语

4.下列词语可自由组合成多少个偏正短语(可加助词“的”“地”)?请一一写出。

①学习②面容③清瘦④站着⑤人们⑥精神⑦勤劳⑧西山⑨忧郁⑩静静

参考答案

指出下列短语的结构范文5

关键词:联合关系 组合关系 结合关系

一、引言

早在一百多年前,马建忠编著的《马氏文通》就开始了英汉对比研究,近二十多年来,国内对英汉对比的研究成果颇丰,大大推进了学科建设。英汉研究主要是从三个层面上展开的:一是语法层面上的对比研究、语义层面上的对比研究和语用层面上的对比研究(李甲桥,2003)。但对于词和词之间关系的研究主要是针对同一种语言,英汉对比的研究比较少。

吕叔湘(1990:18)在对汉语词的研究中,发现词和词的相遇,会形成种种关系,主要由联合关系、组合关系、结合关系。这种现象不仅仅出现在汉语中,在英语中也很常见。汉英语词的配合既有其共性,也有其个性,本文将对两者进行对比分析,旨在为汉英两种语言的研究提供参考。

二、词与词之间的关系及原因探究

(一)词和词之间的关系

1.联合关系

联合关系就是将“两个同类的词联系起来”(吕叔湘,1990:18)。构成联合关系的短语我们称之为联合短语。联合短语的定义有很多,例如黄伯荣、廖序东(1991)认为联合短语由语法地位平等的两个或几个部分组成,其间是联合关系,可细分为并列、递进、选择等关系。例如:

递进关系:审核并通过吗,投入产出

并列关系:欢声笑语,上海和北京

选择关系:今天或明天

邓云华(2004)将汉语联合短语的主要特性进行了归纳:联合短语表示项之间的联合关系,联合短语的直接成分处于平等的地位,其间不存在修饰或限制等关系。同时,他认为汉语联合短语的直接成分之间可以按照一定的逻辑要求排列顺序,并形成三种关系:递进关系、并列关系和选择关系。表示递进关系的联合短语一般不能改变直接成分之间的顺序,表示并列或选择关系的联合短语可以改变直接成分之间的顺序,不会影响联合短语的结构关系和语法功能,但意义上会发生细微变化。(邓云华,2004)

从上面的例子可以看到,递进的直接成分是按照一定逻辑顺序排列的,审核并通过,必须是先审核然后才能通过,不能随意调换。而并列关系和选择关系的直接成分可以调换。但还需要考虑到平时的语用习惯,例如“欢声笑语”,虽说“欢声”和“笑语”是可以互换的,但互换后,与平时的语用习惯是有差异的。

Temperley(2005)将由两个或两个以上的要素组成,通过连接词构成的短语称为联合短语(coordinate phrase)。英语联合短语的主要特性是联合短语表示项之间的联合关系。与汉语联合短语不同的是,英语联合短语的直接成分可以处于平等的地位,也可以处于不平等的地位。

处于平等地位的短语很多。例如:

并列关系:a nod and a beck,act and deed,aid and abet

选择关系:true or false,early or late,to be or not to be,fight or flight

承接关系:a word and a blow,bear and forbear

处于不平等地位的短语也是存在的。例如:

bread and butter(涂黄油的面包),fruit and cream(加奶油的水果)

从上面的例子可以看出,英语联合短语的两个直接成分可以是处于平等地位的,但也有处于不平等地位的,结合后形成一种修饰关系。

英汉语联合词语的两个直接成分主要是名词、形容词、动词。

名词联合:a nod and a beck,act and deed,aid and abet,姐妹,男生和女生,压力与紧张

形容词联合:true or false,early or late,古朴典雅,坚强勇敢,勇敢与高贵

动词联合:fight or flight,说笑,玩闹

从上面的例子可以看出,在构成方面英汉语没有很大差异。

汉语的联合短语的标记手段分为两种:无标匹配和有标匹配(邓云华,2004)。无标匹配指的是联合短语没有用连接词连接,有标匹配指的是联合短语通过连接词将两部分连接。通常,汉语联合短语的连接词主要有:和、并、而、或、且等。根据上面的例子,汉语联合短语的连接词,如“欢声笑语”,这个并列关系的联合短语省略了“和”,显得简洁明了。汉语联合短语的标记很多情况下是隐去的,是根据表达的又是符合汉语的语法规则的,体现了汉语语法是柔性的特征。(潘文国,1997:114)

而相对于汉语的柔性,英语的刚性(潘文国,1997:114)在联合词语上也体现出来了。英语联合词语通常由“and,or”等词连接,而这些词对联合短语的构成是不可缺少的,否则,这个短语就无法成立。因此,与汉语的较灵活的标记手段相比,英语的联合短语是有标匹配,缺乏灵活性。

2.组合关系

组合关系是指两个词里面有一个是主体,一个是附加上去的(吕叔湘,1990:19)。其中,主体词称为“端语”,附加词称为“加语”(吕叔湘,1990:20)。组合关系的词语在英汉语中是极为普遍的。首先,我们可以从词语的构成词性方面对两者进行比较。

汉语中,组合关系可以分成两类:

(1)端语是名词,加语是形容词、动词或名词。

汉语在这种情况下又可以粗略地分为以下三类:

1)形容词加名词:炎热的夏天、香味、层次的斑驳的黑影(朱自清)、体会最细微最神妙的春信(徐志摩)

2)动词加名词:商量的办法、流水

指出下列短语的结构范文6

关键词:高考英语;书面表达;反思

中图分类号:G427 文献标识码:A文章编号:1992-7711(2012)06-071-1

高考书面表达新评分标准在语言的运用上对考生提出了更高的要求,即在考察考生语言准确性的基础上,进一步强调了用词的得体性、表达方式的多样性以及语言的连贯性。本文拟就从以下几方面谈一谈增强书面表达效果所采用的几种有效手段。

一、连接手段

连接手段是实现书面表达语言连贯性最常用的方法。合理地使用连接手段可以使整篇文章结构紧凑,前后连贯,逻辑性强,从而增强表达的效果。

1.合理使用连接词。如:

Mary prefers to read books.John prefers to play football.(碎句)Mary likes to read books while John prefers to play football.(并列连词)

分析:原句用词重复,句式单调。合并后的句子由于使用了表达对比关系的并列连词while,使得前后对比分明,效果明显增强。

2.适当使用承上启下的过渡性词语。过渡词语如as a result,besides,instead,what is more,after all,in a word,meanwhile等会使文章条理更加清晰,衔接更加自然。如:

He didnt go to the cinema that evening.Instead,he stayed at home watching TV.

注意:从一个意思转到另一个意思,一个场面转到另一个场面,需要使用一些“过渡句”,以避免文章生涩,不流畅。如:

...classes as well.Now I have more free time.I can follow my own interests such as reading books,visiting museums,and taking computer lessons.(2001年高考标准答案)

二、省略手段

省略就是将句子中重复或不必要的词语省去。其目的是避免写作中的冗言现象,使语言更加简洁,从而做到“长话短说”。

1.状语从句的省略。如:

When(it is)heated,water will change into vapour.(保留过去分词)

注:在条件状语从句中,有些用法已约定俗成,如if not,if so,if ever,if any等。

2.比较结构中的省略。如:

My brother is two years older than I(am).

注:注意比较结构中的一些固定表达法。如than ever,than before,as usual,as...as possible等。

三、替代手段

所谓替代就是用替代性词语(it,one〈s〉,so,not以及人称代词、物主代词、指示代词等)来替换上文出现的词、短语或句子。常见于下列几种情况:

1.名词性替代。即用替代词取代名词或名词词组。如:

The climate here is m uch colder than that in my hometown.(that指代上文的cli-m ate。此处不可用one)

2.动词性替代。即用替代词do来替代动词、动词词组。如:

John doesnt speak French,but Peter does.(=speaks French)

四、转换手段

掌握并合理地使用转换手段是实现书面表达灵活性与多样性的有效途径。

1.语态之间的转换。如:

People hope that all these wild animals will return to nature.(主动)Its hoped that all these wild animals will return to nature.(被动)

2.直接引语与间接引语之间的转换。如:

John said,“Im going to London with my father next week.”(陈述句)John said that he was going to London with his father the next week.(宾语从句)

3.简单句、并列句、复合句间的转换。

简单句短小精悍;并列句结构均衡,善于表达前后的并列、转折、对比、因果等逻辑关系;复合句通过使用不同含义的从属连词,使句子的主从关系更加明确。

①简单句与复合句间的转换。通常是将简单句中的某个词、短语或结构转换成复合句中的从句。如:

Our head teacher is a tall man with a pair of thick glasses on his nose.(with复合结构)Our head teacher is a tall man who wears a pair of thick glasses.(定语从句)

②简单句与并列句间的转换。通常是将简单句中的短语变为并列句中的一个分句。如:

The child was too young to go to school himself.(不定式短语)

The child couldnt go to school himself, for he was too young.(并列句)

The child was too young,so he couldnt go to school himself.(并列句)

五、强调手段

英语里强调手法很多,书面表达中常用的有以下几种:

1.调整词语在句子中的位置。我们可以把关键重要的词语放在句首或句尾,以达到强调的目的。如:

Li Bin is modest and hard woking and is a good student.(非强调式)

Modest and hardworking,Li Bin is a good student.(强调式/句首)

Li Bin is a good student,modest and hardworking.(强调式/句尾)

2.使用强调结构:1)使用助动词do(does,did)强调谓语动词。2)使用强调句型It is(was)+被强调部分+that...强调句子的其它成分。如:

Everyone does have his own weakness.(强调动词)

3.使用倒装结构。倒装的目的一是句子结构的需要,二是为了强调。如:

I havent met such a man before.Never have I met such a man before.