散文分类范例6篇

散文分类

散文分类范文1

一、考点梳理

(一)散文的基本特征

散文是以自由、优美的文笔记人、叙事、写景、状物,并借此抒发作者情感、表现作家个性的文章,其基本特征如下:

1.题材广泛,情感强烈。散文可以通过一人一事、一景一物来抒发感情,有时也不限于一人一事、一景一物。因此,散文在选材上就极为广泛、自由。而散文中所表达的情感.都充分地体现了作者的个性特征。

2.写真纪实,富于美感。散文创作强调“真实”,作家们真诚地讲述着他们的见闻,倾吐着他们的心声。不仅描写真人真事,而且抒发真情实感,表达真知灼见。

3.语言优美,文短韵长。散文的语言美首先表现为自然质朴,不事雕琢;其次表现在写入叙事或绘景状物时.能把内情和外物、心声与自然和谐地交融为一体.通过语言文字传达出作家独特的感受和情趣。散文虽然篇幅短小,但内涵深刻丰富。

(二)散文的主要表现手法

1.表达方式:记叙、描写、抒情、议论。

2.表现手法:写入:抑扬(先抑后扬、先扬后抑)、白描、烘托、反衬、对比。写景(描写角度):虚实、动静、远近、上下、明暗、色彩、声音、乐景、哀景、白描、渲染、多角度(视觉、听觉、嗅觉、触觉)、烘托、反衬、对比。写情(抒情角度):直抒胸臆、借景抒情、寓情于景、情景交融、以景结情。写事:用典、借古喻今、借古讽今、联想、想象。写物:象征、托物言志。

3.修辞手法:比喻、比拟(拟人、拟物)、借代、夸张、对偶、排比、反复。

4.篇章结构:开门见山、首尾呼应、卒章显志、伏笔照应、层层深入、过渡铺垫、设置线索;结构严密,完整匀称;设置悬念,制造波澜,起承转合,曲折有致。

5.语言特色:准确严密、生动形象、深入浅出、通俗易懂、简洁明了、言简意赅、富有感染力、节奏感强、委婉含蓄、意味深长、发人深省、寓意深刻、引发兴趣、说理透彻、有说服力。

其中,常考的表现手法有象征、对比、衬托、渲染、白描、抑扬、联想、想象、引用、托物言志、虚实结合、动静结合、点面结合、以小见大等。

二、答题方法

高考语文试卷中往往将散文的“文体基本特征”和“主要表现手法”结合起来考查,常见问题模式如下:1.在文章×××处,作者采用了哪些表现手法来写事物?表达了怎样的思想感情(或这样写有什么好处)?2.本文在构思上具有××的特点,请作具体说明,并分析其作用。3.请分析文中画线处对××描写的表达特色。

应对此类题目,要做好“一、二、三、五”项工作:“一”是一个网络:必须构建一个关于各类表现手法的名称、特征和表达效果以及实例的知识网络:“二”是两个结合:(1)解答表现手法题必须与文章的中心相结合。(2)和文中语言相结合;“三”是三个步骤:指明手法一简要分析一情感作用:“五”是五个切入,在叶旨明手法”时大致可以从表达方式、表现手法、修辞手法、结构技巧、语言特色等五个角度切入。

如:下段文字中通过主观感受来写壶口的黄河,运用了什么表现手法?这样写有什么好处?

等真正站在她的旁边,所有的人都惊呆了。地竟陷下一层,天也高了一尺,山谷形似壶嘴,水若浊酒,倾泻而下,一仰难尽的气势,充溢胸口,心跳得能蹦出来。耳朵渐渐聋了,只能看见对方开口,却听不见声音;眼也花了,弥漫着的皆是黄色的旋涡,像是从河里蒸腾地上升,又像是奋不顾身地下降。河底升起硝烟一样的股股黄雾,天宇间充涨着黄色带水的颗粒,碰撞在脸上,散发在天上。脑子里一片空白,什么也不敢想:只看着山被水层层劈开,天也被这股黄流斩断。水从天而降,拍打在谷底,响遏在云里。

――选自肖铁《壶口的黄河》

解题指导:第一步:指明手法.明确“运用了什么表现手法”。主观上写入的感受,实际上是为了表现出黄河的气势,这叫侧面烘托。第二步:简要分析,明确“某表现手法运用得怎么样”。作者从多个角度来写主观感受,如写心跳、耳聋、眼花、脑子一片空白等。尽管没有正面写壶口的黄河,而由人的主观感受却不难体会出壶口的黄河气势。第三步:情感或作用,明确“某表现手法运用后好在哪些方面”。侧面烘托能使作者将自己对表现对象的表达意图更明确地呈现在读者面前,从而增强文章的表现力。结合具体文段,就在于表现了壶口黄河的气势与生命力,增强了现场感,仿佛自己也置身于壶口的黄河。

参考答案:(1)主要是运用侧面烘托(或衬托)的手法。(2)此处通过渲染主观感受(如心跳、耳聋、眼花、脑子空白等)来写壶口的黄河.好处主要表现在两个方面:一是给人如临其境的现场感,二是从侧面烘托壶口黄河的气势与生命力。

【针对训练】

阅读下面的文字,按要求回答问题。

太朴山

许俊文

越是名山,越懒得去,委实是我的气场太小,又害怕喧闹,故而敬而远之。相反,一些名不见经传的山,倒像走亲戚似的,一去再去.

太朴山就是其一。

我不清楚山名的来历,太朴,也许就是大朴吧?大朴之物,必存大美焉,人工不可为,应是天造地设,又不曾被人染过指的。

太朴山好,不仅仅止于名字。山上山下,沟沟壑壑,我所见到的,无非是一些石头、树木、溪水。然而,当它们被我的目光和心灵摄取之后,觉得那石、那树、那水是太朴山所独有的;你若把它们换一个地方,哪怕稍微挪动一下,就不是原来的味道了。这使我想起城市里那些移栽的树,虽然它们还保持着树木的基本形态,但已然是另一层意义的树了。我就干过一件蠢事。三年前去太朴时,看中了一株紫色杜鹃,实在割舍不下,就将其挖回栽在花盆里.次年春天,花是开了,却显然没有它在山野开得那么浑朴自然,那么耐人寻味。个中原因我虽弄不清楚,但有一点是肯定的,我染指了。你想想,那株原生态的杜鹃,吐纳的是太朴山的浑沦之气,而当它一旦脱离了那样的气场,即使活着,那也是苟活。

我避名山而亲太朴,似与那里的石头有关。太朴山虽与江南佛教名山九华山粘粘连连,暗通气脉,但此山的石头却与九华山迥异,一个黑硬、粗粝、峥嵘,构成一座名山的体量和气质:一个圆融、苍润、拙朴,成全了太朴山的简淡与空灵。我说它简淡,是因为那些经岁月打磨的石头,已经熄灭了欲望,磨平了棱角,它们扁也好,圆也好,都遵循着大道从简、返璞归真的至理,虽栖居幽壑,这里几尊,那里几坨,或坐,或立,或倚,或躺,但姿态和表情都是安详、静谧的,仿佛阅尽云雨风霜的智者,只存一抹淡定在胸。石与石,有的则爱独处,长久地沉溺于冥思,仿如世外高人,任你千呼万唤,任你春光撩人,它一点都不为所动;有的则喜群聚,呼朋唤友,你倚我靠,甚至石上叠石,看上去亲密无间,却又谐者自谐,憨者自憨,不像我们人类,聚在一起总是彼此攻讦,相互挤兑,凭空生出许多是非来,想收拾都难。

多石的太朴山.对树木的生长是一种严酷的限定。然而,恰恰是这种限定,给了树木以意想不到的勇气。盘桓于太朴山中.我没有见到像模像样的大树.更不用说参天了,但你并不能因此而漠视那些树木的精神高度,它们的身躯可以不伟岸,可它们的根脉却表现出罕见的骁勇和顽强。

好山必有好水。太朴山的水是一种精灵的化身,有了它,一座山的气脉就被打通了。我曾缘着一条且歌且舞的溪流寻找过它的源头。那清溪,用九曲十八弯是难以言状的,它既像一条青蛇扭动着柔软的身躯,时而没入榛莽,时而又从石缝中蹿出:又似一道白色的闪电,从悬崖上跌落,迅疾划过细长的石槽……总之,要想目睹它的完整形态,那是不可能的。大自然就是这样,它会把一些细节隐藏起来,让你在寻寻觅觅中悟道参禅,还心灵一份安静。

想人生在世,杂色浊目,乱象迷心,变化着种种的感觉,究竟能在我们的记忆里保存多久,谁也无法把握。但是,眼过、心过、情过之后,总会有一些东西留下来,让我们慢慢品味。

譬如太朴山。

(选自《散文》2013年第1期《梦山记》)

1.文章写太朴山,为什么从名山写起?

答:___________________

2.文中写到哪些方面的对比?请简要分析这样写的好处。

答:__________________

3.请简要赏析第五自然段中画线的句子。

答:__________________

散文分类范文2

关键词: 特征选择; 信息增益; 类内离散度; 类间离散度; 权重协调因子

中图分类号:TP312 文献标志码:A 文章编号:1006-8228(2013)09-45-02

0 引言

信息科学技术和互联网技术每天都在更新,人们通过网络获得的信息资源越来越多,与此同时,就需要更多的人力和时间来整理网络里的各种信息,因此产生了文本分类技术。文本数据的特点就是高维性和稀疏性[1-2]。文本分类算法在分类的时间上,带来大量时间开销;特征过多又往往会出现“维数灾难”的问题,特征选择就此产生。常用的特征选择方法是:信息增益、互信息、χ2统计量、特征词频-文档频率等。很多人倾向于信息增益方法,因为它考虑了特征词条未发生的情况。实验证明这种贡献在多数情况下远远小于它带来的干扰。本文提出了一种新的特征选择方法,并通过实验证明了该方法能有效提高文本分类的精度。

1 信息增益特征选择方法

信息增益(Information Gain)[3]在机器学习领域被广泛使用,在信息论中,样本属性的信息增益越大,其包含的信息量也越大。对分类系统来说,计算信息增益是针对一个一个的特征项而言的,它通过统计某一个特征项t在类别ci中出现与否的文档数来计算特征项t对类别ci的信息增益,定义为考虑出现前后的信息熵之差,定义如公式⑴:

式⑴中,P(ci)表示ci类文档在语料中出现的概率,P(t)表示语料中包含t的文档的概率,P(ci|t)表示文档包含t时属于ci类文档的条件概率,表示语料中不包含特征词条t的文档概率,表示文档不包含特征词条t时属于ci类的条件概率,m表示文档类别数。

显然,某个特征项的信息增益值越大,表示其贡献越大,对分类也越重要。因此,在进行特征选择时,通常选取信息增益值大的若干个单词构造文本的特征向量。信息增益的优点在于,它考虑了词条未发生的情况,即虽然某个单词不出现也又可能对判断文本类别有贡献。但是实验证明,这种贡献往往远远小于考虑单词不出现情况所带来的干扰。

2 信息增益特征选择算法的改进

信息增益特征选择方法的不足之处是:忽视了类间、类内分布不平衡的问题[4];对特征项出现的频率考虑不全面。近些年,不少学者都在改进信息增益算法,来减小它带来的干扰,如利用语义联系改进信息增益算法[5];利用最大值与次大值之间的差作为最终的评价函数值[6];把频度、集中度、分散度都考虑上的算法[7];通过构造隶属度函数来改进[8]。本文引入类间集中度DIac(t)、类内分散度DIic(t)和权重协调因子ω来对原始的算法进行改进。

2.1 类间离散度

一般情况下,如果一个特征项在一个类别中大量出现,而在其他类别中较少出现,那么这个特征项对于类别判定的贡献度应该是比较大的,这种特征项相对于类别的倾斜特性使用类间离散度来衡量,即权衡一个特征相对于所有预定类别的分布均衡程度,分布越不均衡,那么这个特征对于类别判定的贡献度越大。类间离散度用来描述特征在类间的分布情况,特征项的类间离散度计算如公式⑵:

从公式⑵中可以看出,那些集中分布在个别类或者几个类别的特征项,其类间离散度的值比较大,这些特征项一般具有较强的类别区分能力,当特征词条t仅在一个类别中出现的时候,DIac取最大值1,此时的分类能力最强;当特征词条t在每个类别中都出现的时候,DIac取最小值0,其分类能力最弱。

2.2 类内离散度

在衡量了特征相对于类别的均衡程度后,还应该考虑特征在一个类别内的分布情况。如果一个特征在一个类别内的某个文本中大量出现,而其他文本出现很少或不出现,那么这个特征对于文本的分类贡献较少;反之,则特征对于类别区分的贡献度是比较大的。对于类别内的特征分布情况,我们可以使用类内离散度来衡量,即权衡一个特征相对于一个类别的分布均匀程度,分布越均衡,那么这个特征对于类别判定的贡献程度越大。类内离散度描述了特征项在某个类中的分布情况,特征项t在类ci中的类内离散度计算如公式⑶:

式⑶中,n代表ci类中的文档个数,fj(t)表示词条t在ci类的第j篇文档中的词频,表示词条t在类ci文档中的平均词频。其中的计算公式为:。

类内离散度越小,说明该词条越集中分布在该类中,其区分类别的能力越强。由公式⑶可以看出,当特征向量t在本类别中所有文档中都出现的时候,DIic取最小值0,此时的分类能力最强,可见DIic的值与其分类能力是成反比的。

2.3 权重协调因子

根据很多实例判断,特征词在语料库中出现次数多少并不能完全表征该特征词在分类中的重要程度,频率相同的特征词对分类的重要程度也是不同的,在各类别中分布越均匀,其对分类的重要性就越小,反之就越大。考虑到方差这一数学指标能够较好地体现数据分布是否均匀这一特征,进而通过方差除以该特征词在各类中的词频之和来得到权重协调因子的定义如公式⑷:

式⑷中,P(ci|t)表示文档包含t时属于ci类文档的条件概率,m表示文档类别数。

2.4 信息增益算法的改进

对于分类而言,如果一个特征项在某个类别中大量出现,在其他类别中较少出现,且该特征在大量出现的类别中分布比较均匀,那么显然这个特征对于分类是有利的,在类间、类内离散度上的表现为类间离散度较大,类内离散度较小。所以在衡量分类贡献度时,应将类间离散度和类内离散度综合考虑,另外加入了权重协调因子,来对信息增益的方法可以更进一步的提高它的计算精度。

利用公式⑷计算出特证词条t的权重协调因子ω,然后再对文档里所有的特征词出现的概率进行求和处理,利用公式⑵求出类间离散度DIac(t),利用公式⑶得出类内离散度DIic(t),加入到改进算法之内,使得新算法可以进一步提高计算精度。具体算法如公式⑸:

3 实验结果及分析

文本预处理阶段采用了汉语词法分析系统ICTCLAS对文本集合中的数据进行分词,用Lucene建立全文索引;在测试数据时,实验采用KNN(k-Nearest Neighbor)分类器(KNN算法是一种常用的,效果较好的文本分类算法)。

3.1 语料集

为了验证改进算法的有效性,尽可能地消除语料选取不当所带来的干扰。本实验搜集了中文文本分类语料库,选用了3000篇文本,其中包括计算机、军事、教育、经济、政治、体育6大类,其中采用1800篇文本作为训练集,其余1200篇文本作为测试集。

3.2 评估指标

⑴ 查全率

定义为正确分类的正例个数占实际正例个数的比例,表示为公式⑹:

⑵ 查准率

定义为正确分类的正例个数占分类为正例的实例个数的比例,表示为公式⑺:

⑶ F1评估值

在信息检索领域,查全率与查率是一对相互制约的指标。查准率和查全率反映了分类质量的两个不同方面,两者必须综合考虑。因此,列入了F1测试值作为评价指标,它是查全率与查准率的调和平均数,表示为公式⑻:

3.3 实验结果及分析

经典算法的分类结果如表1所示。

根据表1中的数据,得出平均的F1测试值为85.533%。

改进算法的分类结果如表2所示。

从表2中可以看出,各种类别的分类效果都很好,平均的F1测试值为86.786%,相比原来的算法,提高了信息增益的精度,效果还是令人满意的。

4 结束语

本文仔细分析了传统的信息增益算法的不足, 并针对其进行了广泛的研究,最终提出了一种改进的信息增益算法。实验证明,改进后的算法与传统算法相比,在分类准度和精度上都有了更好的表现。但是改进的算法增大了计算的难度,将会导致分析的时间变长。下一步工作将从缩短时间的角度来继续研究,深入分析对分类性能有影响的因素,完善新算法。

参考文献:

[1] Y. Li, D.F. Hsu, S.M. Chung, Combining multiple feature selection methods for text categorization by using rank-score characteristics[C]. IEEE 21st International Conference on Tools with Artificial Intelligence, Newark,NJ,USA,Nov.2009:508-517

[2] B. Yu, Z. Xu, C. Li.Latent semantic analysis for text categorization using neural network[J].Knowledge-Based Systems,2008.21(8):900-904

[3] 苗夺谦,卫志华.中文文本信息处理的原理与应用[M].清华大学出版社,2007.

[4] Harun Uguz.A two-stage feature selection method for text categorization by using information gain, principal component analysis and genetic algorithm[J]. Knowledge-Based Systems,2011.24(7):1024-1032

[5] 张浩.基于语义关联的文本分类研究[J].舍肥工业大学学报,2011.

散文分类范文3

一.初步阅读,边读边圈画,同时判断文章所属的类型

纵观高考散文,从内容上来分,大体有以下四种:一是写人叙事的散文,比如说《才子赵树理》(2011年湖北卷)、《何容何许人也》(2013年江苏卷),二是写景状物的散文,就像《一幅烟雨牛鹭图》(2006年江苏卷)、《乡村的瓦》(2006年四川卷),三是游记类的散文,比如《上善若水》(2009年江苏卷),四是议论类的散文,用来表达自己的感悟的,如《焰火的变奏》(2007年四川卷)。因为每类散文我们需要抓住的点是不一样的,所以在初步阅读后,就要自己判断一下它所属的类型。

边读边圈画,是让我们在阅读的时候圈画出重要的句子和词语。一方面加强我们对散文的内容的记忆,有利于节省后面做题的时间,另一方面也有助于我们对文章主旨的把握。

(一)文章的开头和结尾的句子。散文的开头十分重要和讲究,因为它通常要起到总领全文的作用,所以有些散文开头就是“文眼”,而散文的结尾往往是卒章显志。当然散文主旨句比较灵活,也有出现在中间的时候,只是开头和结尾,尤其是结尾出现频率更高。

(二)文章中的过渡句。过渡句一般在文章两个较大的层次之间,起承上启下的作用,这样的句子有助于我们理清文章的内容和层次。

文章中抒情、议论的句子。我们常说散文形散神不散,所以散文不是纯粹地写人、叙事、写景,而是以此为一个平台来抒发自己的情感或表达自己的一些感悟,所以多多少少都会在文中直接流露出来一些。因此这些句子也是帮助我们去理解作者写作意图的关键句。

二.深入阅读,整体把握文章内容

很多同学读一遍就去做题,甚至在没做题之前就先去看要答的题目,然后直接根据题目去文章找答案,这些都是错误的。读一遍文章只能是囫囵吞枣,对于文章的主要内容根本就没有弄清楚,如何去做题,而先看要答的题目,再去文章中找的话,就等于把文章完全肢解,也不是真正读懂了文章。我们常说:“磨刀不误砍柴工。”所以在初步阅读后,我们还需要经过二次、三次甚至多一点的阅读,读完后再问自己三个问题:1.文章写了什么?(即文章的内容);2.文章为什么这么写?(即文章的主旨);3.文章是怎么写的?(即文章采用的方法,按照上面思路来写的)。当这三个问题都能回答的时候,再去看题目,然后寻找答题的区间不仅不迟,反而会为我们节省很多时间。

那么,怎么去把握文章的内容呢?这就涉及到我们之前说的那个问题,要根据散文不同的类别来把握。

如果是写人叙事的散文,就要理清作者写了主人公几件事或几个片段,这些事情和片段能够体现主人公什么样的人品或性格,文章中哪些词语能够直接体现要圈画出来,没有的自己学会概括。作者对主人公持什么态度,肯定或否定这个人还是借助这个人赞扬、批评社会当中的某种现象。采用了什么方法来刻画主人公的,这类散文常用正面描写、侧面描写、对比、环境烘托等手法。

如果是写景状物的散文,就看看作者主要写了什么景,景物有什么特点,作者调动了哪些写景的方法,作者对景物什么态度,有没有情感上的变化。作者在文中所赋予物的象征意,借助这个物抒发了什么感情(意愿、人生观点、情感态度)。写景常用的方法有:1.写景的层次:远近、高低、上下等;2.多角度描绘:触觉、嗅觉、视觉、听觉等;3.表现手法:动静结合、虚实结合、点面结合、白描、对比等。

如果是游记类的散文,就要理清散文的游踪,看看作者是站在什么样的立足点和观察点,又是如何移步换景的,写了哪些景,由眼前的景作者又想到了什么,为什么作者会想到这些,写这些,作者是仅仅为了介绍人文景观还是要借助联想的内容表达自己的什么感悟。这类的散文常常用移步换景,虚实结合、对比等方法。

如果是感悟类的散文,就先抓住作者的“动情点”,即作者情感的出发点,它一般在文章的开头,看看到底是什么人、景、物、事等等触动了作者,然后找找作者由此感悟出来的内容,最后看看作者在这些感悟的基础上表达自我的一种什么样的认识与体会。因此这类散文的思路常是:动情点――过渡点――思考点――升华点。

散文分类范文4

关键词:网络市场 畅销书 价格离散寻价成本

文献综述

网络的出现降低了买方的信息搜寻成本,使得消费者更容易比较价格。但有过网络购物经历的人不难发现,同一种商品在不同购物网站中的价格并不完全相同,甚至存在较大差异,即网络市场上存在着价格离散现象。价格离散是指在某一时间点上,同一种产品在不同销售者中的价格分布情况。

传统的理论一般用交易成本和产品的差异性来解释价格的离散。其中交易成本是指价格搜寻成本和鉴别产品质量的成本。产品差异性是指,网络零售商提供的并不仅仅是产品本身,而是产品和一系列服务,譬如快捷和人性化的网络界面、对顾客信息的保密、及时和完整的送货服务、退货和换货服务、相关产品的推荐等等。本文选取“畅销书”作为研究对象,是因为这些畅销书具有以下特点,自然消除了一些变量的影响:出售的网站较多,便于比较;同一种畅销书在一段时间内一般只有一家出版社出版,同质性高;销量较大,且消费者可以通过电视、报刊、好友等多种渠道对该书有较多的了解,对图书的质量信息掌握较多。WWW.133229.COM

本文的“畅销书”是定义为各大图书销售网站和门户网站图书排行榜中的上榜图书,并选择图书作为研究对象还基于以下的理由——为网上交易效率评价提供一个参考的基准:传统市场交易的价格离散程度。在传统市场的交易中,除了少数的书店予以折扣外,图书的零售价一般按定价售出。所以,传统市场交易中,图书的价格离散程度很低,几乎认为趋近于零。当然,其他的特殊情况不再探讨之列,比如:具有收藏价值的书籍;旧书因经济发展水平、物价上涨等因素导致以高于原定价格很多销售等。

本文调查了6家网站的100种畅销书。通过数据分析表明,产品的差异性(包含网站信誉和知名度)并不能很好的解释价格的离散,更好的服务并不一定意味着更高的价格。在先前的研究中,许多学者的研究都支持网络销售中存在甚至广泛存在价格离散现象这一事实。brynjolfsson 和smith(2000)通过对网上和传统的书籍、cd 市场的价格研究显示,无论是否将税收、运费、购物费包含在价格里,网络市场中的价格都比传统零售中的价格低9%—16%,不同的网络零售商出售的相同书籍和cd 的价格差高达50 %,书籍的平均价格差别为33 % ,cd 为25 %。

pan、ratchford和shankar(2001)则系统分析了网络市场价格离散的原因,他们把影响同一类产品网络价格离散的原因分为市场特征和网络企业特征。所谓市场特征是指:竞争对手数量、消费者参与度、产品普及率。网络企业的特征则包含了企业购物的便利性、信誉、知名度和品牌忠诚度等特征。

值得注意的是,赵冬梅对网络价格离散问题进行了深入的探讨。通过对9大类共6316种商品的网络售价分析,她认为网络价格离散现象在中国的电子商务领域是广泛存在的,并且主要是由于价格搜寻引发的信息不完全在其中起到了重要作用。

数据的搜集与分析

(一)数据的搜集

在研究中,本文从当当网、卓越亚马逊、蔚蓝网、中国图书网、2688 网上书店、d1便利网六家国内主要销售图书音像制品的购物网站搜寻到了100种畅销书的价格信息。

为保证信息的时效性,我们将数据搜集的任务集中在一天(2008年5月4日)中完成。为了使得调查样本具有一定的代表性,所调查的畅销书包含了外语考试、时尚美容、奇幻文学、教辅资料、经管图书、烹饪食谱、励志图书七类销量较大的图书。我们通过isbn编码和出版社名称来确定所考察的是否为同一本畅销书。

(二)研究的主要假设

考虑到不同网站的知名度、拥有产品种类、稳定顾客群等条件的不同,本文将六家网站分为一线品牌(卓越亚马逊和当当网两家网站)和二线品牌(另外四家网站)。应当说,这个假设对于后面的数据分析与假说的提出是至关重要的。

消费者在网上购物时,各种决策,包括网络操作等都是由本人独立完成的,不存在委托关系。如,家庭主妇对互联网掌握程度较低,只好由子女代其购买,现实中是存在的,但我们不予考虑。

(三)数据的分析

市场价格离散度模型设定为:

设市场m有家销售同质商品q的商店,在某个特定时刻(或时期),他们对商品q的售价分别为p1,p2,…,pn,设售价为pi的商店数为ti,(i=1,2,…,n),显然,t1+t2+…+ti=m,这样令

称为q在市场m中即定时刻(时期)的平均市场价格(期望),这个价格的标准差为:

本文还分别计算了一线品牌离散度和二线品牌离散度。对于前者,m=2 ,即p1代表当当网的售价,p2代表卓越亚马逊的售价。对于后者,m≤4,即p3,…pn的范围仅限于蔚蓝网、中国图书网、2688 网上书店、d1便利网四家网站的售价。

通过数据分析,可以得出以下结论:单个图书的离散度差异较大,如:《美容大王》(时尚美容类)的离散度高达49.15%,而《大嘴吃四方》(烹饪类)的离散度只有2.62%。各类别图书的离散度也不尽相同,甚至差别较大。其中烹饪类的离散度最高,达到22.86%,外语考试类图书离散度最小,只有11.06%。一线品牌离散度在所有调查类别中均低于二线品牌。其中一线品牌的离散度只有2.27%,二线品牌离散度则达到9.84%。

在所有调查的图书中,有50.5%的图书最低价出现在当当网,47.2%的最低价出现在卓越亚马逊,总体上有78.6%(一部分图书二者报价相同)的最低报价出现在一线品牌。

(四)分析中发现的问题

不同类别的图书离散度不尽相同,甚至差别很大。可以认为不同类别的消费人群所关注的书籍类型和对互联网的掌握程度(以及由此所导致的寻价成本)是不同的。譬如,可以认为学生对互联网掌握程度高,且会较多地选购英语和教学辅导书,类似的,家庭主妇对互联网掌握程度较低,其倾向于购买烹饪和美容类图书。这样就可以假设外语和教学辅导书的价格离散度比烹饪和美容类图书的价格离散度低。由此可见,不同类型图书的价格离散程度的差异,很可能是由于消费群体对互联网掌握程度的差异所导致的寻价成本不同造成。

卓越亚马逊和当当网两个品牌知名度和销量相近的一线品牌之间仍然存在一定的价格离散。即使二者所提供的服务存在一定的差别,那么二者的报价应当存在稳定的差异(即在所调查的图书中当当网的报价全部或绝大部分比卓越要高或者低)。然而,二者的报价则呈现出在一个较小的范围内以接近“随机”的形式上下波动现象,即一些图书当当网报价较低,一些图书卓越报价较低,另外一些二者相同。

最值得关注的是,大部分图书的最低报价是由知名度、信誉相对较高的一线品牌给出的。这些甚至是与产品差异理论在一定程度上是冲突的。因为先前的理论认为:之所以在寻价成本很低的时候仍然存在价格离散,是因为不同网站拥有的信誉,品牌知名度,所提供的售中、售后服务是有区别的。信誉较好、知名度较高、服务较好的网站可以索取较高的价格;反之,在信誉、知名度、服务方面较差的网络零售商只能以较低的价格吸引消费者。从现实的经验来看,网民在购物后的及时跟帖对购物的评价与分享、信誉评分等级、积分点数等可以看作网络交易的正外部性,这些实施机制理应奖励信誉好的厂家,惩罚信誉差的厂家;从理论研究来看,如shapiro(1983)证明了当物品质量不能被观察到时,信誉好的企业能够享受到价格的溢价,并且这一溢价能够促使企业在长期内维持信誉。周黎安、张维迎等人(2007)的实证研究也支持上述结论。根据这个理论,在品牌上具有劣势的二线品牌的定价应当比一线品牌低,然而本文的观察结论并不支持这一观点。

结论

在回顾了国内和国外对于网络价格离散问题研究的基础上,本文集中讨论了“畅销书”的网络售价的离散现象。在引入了“一线品牌”和“二线品牌”的概念后,通过对八大类100种图书的售价的分析,研究了在一线品牌和二线品牌的不同类型图书的价格离散程度。

本文通过数据比较发现,一线品牌和二线品牌之间、不同类型的图书之间的价格离散程度均存在较大差异,且一种图书的最低报价最有可能出现在一线品牌而不是二线品牌,亦即较好的服务与信誉并不意味着较高的价格。本文认为当前流行的产品差异和寻价成本理论均不能很好的对上述现象给予解释。

参考文献:

1.黄敏学,朱华伟,肖莉.国外网络价格研究成果评介[j].外国经济与管理,2003(6)

2.马庆国,王毅达.网络市场效率与价格离散研究[j].浙江大学学报(人文社会科学版),2006(4)

3.赵冬梅.电子商务市场价格离散问题研究[d].中国农业大学经济管理学院,2005

4.bakos,yannis.reducing buyer search costs:implications for electronic marketplaces[j]. management science,1997

5.bryniolfsson and michael smith.frictionless commerce?a comparison of internet and conventional retailers [j]. management science,2000a,46(4)

散文分类范文5

关键词:数据挖掘;lazy方法;数量型关联分类;关联规则;K近邻

中图分类号: TP311;TP18

文献标志码:A

0 引言

现在,运用数据挖掘[1]方法从海量数据中获取有价值的决策信息已经受到越来越多的重视,在众多领域得到应用,如电子商务推荐、银行贷款风险分析等。关联分类[2]作为一种基于类关联规则的新分类方法,与现有的分类方法如决策树方法[3]、神经网络方法[4]、贝叶斯分类法[5-6]、支持向量机分类法[7]和K近邻方法[8]相比,能发现多种且比较全面的规则来提高分类精度,是数据挖掘的分类领域中的一个重要且有价值的分支方向。

根据构建分类器的时机,关联分类分为两类:一类是显式关联分类法,把数据集分为训练样例集D和测试样例集T,当对T中的每个样例Ti进行分类时,直接使用已从数据集D训练得到的分类器,现有的算法主要包括CBA(Classification Based on Associations)[9]、CMAR(Classification based on Multiple ClassAssociation Rules)[10]、CPAR(Classification based on Predictive Association Rules)[11]等;另一类是lazy关联分类法,它为T中的每个测试样例Ti均构造一个分类器用于分类,即把分类器的构造放到分类阶段,故称为lazy型关联分类,现有算法包括L3(Live and Let Live)算法[12]和由Veloso等[13]提出的基于属性投影的lazy型关联分类算法。

L3算法将规则分为有用规则、备用规则和有害规则,使用lazy剪枝策略,将备用规则保留到分类阶段;分类时,首先使用可用规则进行分类,如无法分类,则使用备用规则进行分类。

基于属性投影的lazy型关联分类算法[13]则通过在原始训练数据集对测试样例进行基于属性的投影,得到一个去除冗余属性、规模更小、准确度更高的新训练数据集,并在这个新的训练数据集上挖掘类关联规则,以减小挖掘代价,提高分类效率。

另一方面,显示关联分类算法和lazy关联分类算法都基于这样一个前提:当所挖掘的数据具有数量型属性时,需要采用各种方法对数量型属性进行离散化处理。然而这类“先离散,再学习”的处理思想对于分类样本而言,存在一定的盲目性。以表1所示的数据集为例。

由规则集可知,年龄为“20”的值因没有合适的区间而无法匹配规则。针对现实数据多为连续型这一事实和离散化的盲目性问题,本文通过运用lazy方法,结合近邻思想和Kmeans聚类方法,对数量型关联分类进行研究,提出了基于lazy方法的数量型关联分类,以使关联分类更好地应用于现实数据中。

1 避免离散盲目化方法

离散盲目化是传统关联分类中“先离散,再学习”的处理方式带来的,同时Lazy方法是通过测试样例在原始数据集上的“投影”获得构造分类器的训练数据集。本文利用lazy方法这一特点,通过对“投影”后得到的包括测试样例的数据集进行离散化,使测试样例的每个属性值都能够匹配到离散后的区间,进而确保其不会因为找不到区间影响规则的匹配。简单地以上述离散盲目化问题为例,考虑测试样例离散化后的挖掘的规则集如下所示:

3 实验分析

3.1 实验设置

1)验证方法。由于训练模型对数据的过分特化,使训练数据导出的分类法可能会导致过于乐观的评估,本文的实验均采用10折交叉验证法,将数据集随机分割成10个部分,每个部分依次轮流被旁置用于测试,其余90%的数据则作为训练数据。这样,共进行10次实验,每次使用不同的训练数据集产生分类器和不同的测试集检验分类准确率。

2)实验数据。本文选用了18个常用的UCI数据集中的7个数量型数据集进行实验,数据集的描述如表3所示。

4 结语

为了更好地把关联分类应用于数量型属性,提高关联分类的实用性,本文将lazy思想应用到数量型关联分类中,提出了一种新的基于lazy方法的数量型关联分类,避免了传统关联分类方法处理数量型数据时“先离散,后学习”的步骤使新测试样例的属性值可能无法找到匹配的区间的问题。通过在UCI数据集上的实验结果,验证了本方法的有效性。另外,由于lazy方法针对每个测试样例构造一个分类器,这对其在大数据集的应用造成一定影响,虽然本文运用多线程和缓冲等技术使该问题得到一定的缓解,但实验中发现,测试样例的分类器存在重合部分,所以下一步可以研究其在大数据集上的应用,以提高该方法的实用性。

参考文献:

[1]HAN JW, MIEHELINE K. Data mining concepts and techniques [M]. Burlington: Morgan Kaufmann Publishers, 2000.

[2]THABTAH F. A review of associative classification mining [J]. Knowledge Engineering Review, 2007, 22(1):37-65.

[3]SAFAVIAN S, LANDGREBE D. A survey of decision tree classifier methodology [J]. IEEE Transactions on Systems, Man and Cybernetics, 1991,21(3):660-674.

[4]ZHANG G P. Neural network for classification: a survey [J]. IEEE Transactions on Systems, Man and Cybernetics. 2000, 30(4): 451-462.

[5]NEAPOLITAN R. Learning Bayesian networks [M]. Upper Saddle River: Prentice Hall, 2003.

[6]FRIEDMAN N, GEIGER D, GOLDSZMIDT M. Bayesian network classifier [J]. Machine Learning, 1997, 29(1):131-163.

[7]CRISTIANINI N, SHAWE TAYLOR J. An introduction to support vector machines [M]. Cambridge: Cambridge University Press, 2000.

[8]COVER T M, HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967, 13(2): 21-27.

[9]LIU B, HSU W, MA Y. Integrating classification and association rule mining [C]// KDD98: Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining. New York: ACM, 1998:80-86.

[10]LI W, HAN J, PEI J. CMAR: accurate and efficient classification based on multiple classassociation rules [C]// ICDM01: Proceedings of 2001 IEEE International Conference on Data Mining. Piscataway: IEEE, 2001: 369-376.

[11]YIN X, HAN J. CPAR: classification based on predictive association rules [C]// SDM03: Proceedings of 2003 SIAM International Conference on Data Mining. San Francisco: SIAM, 2003: 331-335.

[12]BARALIS E, GARZA P. A lazy approach to pruning classification rules [C]// ICDM 02: Proceedings of 2002 IEEE International Conference on Data Mining. Piscataway: IEEE, 2002: 35-42.

[13]VELOSO A, MEIRA W, ZAKI M J. Lazy association classification [C]// ICDM06: Proceedings of 2006 IEEE International Conference on Data Mining. Piscataway: IEEE, 2006: 645-654.

[14]吉根林,孙志挥.挖掘支持度和兴趣度最优的数量关联规则[J].小型微型计算机系统, 2004,25(2),225-228.

[15]杨善林,李永森,胡笑旋,等.Kmeans算法中的K值优化问题研究[J]. 系统工程理论与实践,2006,26(2),97-101.

散文分类范文6

摘 要:在教育快速发展的今天,初中语文教育得到了高度关注。在教育改革过程中,初中教育是重点部分。现如今的初中语文教学比较关注散文阅读教学,希望提升学生的语言表达和理解能力。就初中语文散文阅读教学展开讨论,并提出合理化建议。

关键词:初中;语文;散文;阅读;教学

与以往教学工作有所不同,初中语文散文阅读教学的难度较大。散文阅读本身在叙述结构和表达方式上较为多元化,并追求“形散神不散”的理念。如果学生对散文没有正确的理解,不仅在答题上容易错误,后续的理解也会有障碍。

一、了解散文的基本分类和特点

在初中散文读教学开展的过程中,无法让学生在短时间内迅速接受,也无法帮助学生取得最好的成绩。只能从基础的教学内容展开,重点把握散文的分类、特点,然后针对性地攻破学习难点,增加散文阅读量。在开展答题的过程中,才能达到行云流水的特点。例如,在日常的教学过程中,可以先跳脱书本的束缚,让学生多去书店或者网上寻找素材,以便在班级分享。这是从学生理解的角度出发,观察学生对散文的态度和掌握程度(如下表所示)。接着,教师要结合学生的散文阅读能力,逐步纠正其错误的想法。最后,教师要让学生与自己挑选的文章进行对比,掌握好散文的分类、特点等等。再接下来,就是让学生开展散文写作的锻炼,以作者的身份去感悟散文的特点和类型,从而进一步提升散文的掌握程度。

二、重视朗读

在初中语文散文阅读教学中,有些教师仅仅在理论上开展大量分析,而忽视了朗读的重要性,以至于教学成果并不十分明显。从主观角度分析,语文教学本身就有着“书读百遍,其义自见”的效果。因此,散文朗读教学是一项必要性的内容。例如,在起始阶段,可以让学生学习一些短篇散文,并要求背诵,可有效提升学生的记忆能力。接着,延长散文篇幅,增加内容,。但重点是要求学生不断朗读:可以早自修放声朗读,也可以课余时间轻读。只有读出来,才能对散文的核心思想做出详尽理解,而不是表现为冥思

苦想。

三、品味散文的语言美

散文本身就是一种较有魅力的文体。在学习过程中,应该不断地去品味散文的语言美。例如,教师可以先着眼于散文的语句,让学生了解散文本身的语句和段落构成,减少一些错误的语句表达方式,掌握“形散神不散”的基本意境。而后将自己读过的,或者是文学网站上比较流行的散文,进行模拟训练。按照作者的思路学习,体会散文语言的画面美和意境美,促使学生能够在理解的基础上更上一层楼,减少对散文的排斥。当学生掌握上述几项学习后,就需要开展散文点评。教师可安排几堂散文点评课,从报纸、网站、书本等媒介,挑选散文进行点评分析,从而提高散文的语段阅读成绩。

四、引导学生体会文章的意境

散文的意境体会是一个非常重要的部分。上述几个方面仅仅是在表面上机械开展散文阅读,并无法有效提升散文意境的正确把握。从散文的描写来看,大多都是跟随作者的想法完成作品,在语言和表达方式上并没有太多拘束。只有提升自身的阅读理解能力,充分体会散文的意境,才有可能从真正意义上去掌控散文。比如,老舍先生的写景散文《济南的冬天》,就通过情景交融的景物描写创设出优美的意境,同时融入自己对冬天济南的喜爱和赞美之情。教师可以让学生从作者描绘的美景中细细玩味和欣赏,

透过种种意象去感悟作者的情感表达,感受济南冬天的“和谐

之美”。

本文对初中语文散文阅读教学的有效方法展开讨论,现如今的散文教学开展,整体上表现出一定的进步,各项工作的开展均体现为大幅度提升。日后,应该从多元化的角度出发,运用健全的教学体系来开展,从学生的角度,增加教学过程中的交流,确保在教育水平上得到更大的提高。

参考文献:

[1]杨霞.新课标视野下古代散文阅读教学的三种方法:以苏教版初中语文教材中的相关篇目为例[J].现代语文(学术综合版),2017(1):105-107.

上一篇农村经济发展

下一篇若隐若显