性格心理测试题范例6篇

性格心理测试题

性格心理测试题范文1

1 引言

MBTI(Myers-Briggs Type Indicator)是代表Jung心理类型理论的测量工具之一,编制的目的是通过测量内外倾、感觉—直觉、对事—对人、认知—判断等四种人格维度的量,以了解人格类型的偏好倾向。MBTI经过50多年使用和完善,证明其是具有很好信、效度的人格量表,已经发展成为具有广泛影响和应用前景的国际著名人格量表,并已广泛应用于职业指导、人事咨询、管理人员评估及团体动力学分析等方面,其测验题仅有97道,简便易行。1994年,我们与美国东卡罗莱纳大学合作,对MBTI-G量表进行系统的翻译和修订,经过近六年的工作,基本完成了中文版MBTI人格测验量表的修订工作。

2 研究方法

2.1 量表项目的翻译定稿和问卷(试测版)的拟定

原始问卷由美国东卡罗莱纳大学提供美国1987年版MBTI Form G量表(Myers,1987)。量表项目的翻译和定稿过程如下:由两名心理学家、一名语言学家和一名心理学专业的研究生分别翻译原量表的项目;对比以上四份译稿,形成问卷(初稿);由于跨文化的差异,预使MBTI适合中国人使用,在保持原量表的完整性和基本结构的基础上,请两名心理学家对初稿进行修订,将难以理解的词对转变成句子,使语言基本符合中国人的文化背景和语言习惯而生成问卷(二稿);请一名心理学和一名管理学专家对各条目与相对应的人格维度的匹配度作分析,对匹配不好的条目逐条提出修改意见;邀请一名语言学专家审定条目英译文的准确性、条目的可读性和中文表达的流畅性,并逐条提出修改意见。根据专家的意见,修订形成问卷(试测版)。

2.2 最终定稿与取样测试

2.2.1 最终定稿

利用试测版问卷及其他人格问卷对西安市大学生施测,依据测验的结果,先后三次邀请14名心理学专家、管理学专家和语言学专家对MBTI量表评定。专家审议总修改率达49.4%。经过不断的修订,最后形成中文版MBTI—G人格类型量表。修订后的量表共97题,由意思表达完整的83个短句和14对意思清晰的词对组成。短句包括题干和2至4个强迫选择条目;词对为意义相斥的两个形容词。

该量表分4个维度,8个因子:外倾-内倾(EI),感觉-直觉(SN),对事-对人(TF),判断-认知(JP)。每一维度上两个因子的得分呈负相关。为研究方便,我们仅取每个维度的前一因子的测试结果作统计。

2.2.2 实测样本

西安市大学一至四年级本科生和专科生2123名,平均21·3岁,男1611名,女512名,包括医疗、中文、外语、理工、计算机、财经和军事等专业。

数据的统计分析工作采用SPSS for Windows完成。

3 结果与分析

3.1 信度检验

重测信度的样本为医疗本科二年级367名学生,18—22岁,男291名,女76名。完成中文版MBTI测验,8周后完成第二次测试,两次测验结果相关分析均达极为显著性相关(p

3.2 效度检验

3.2.1 内容效度 被试为军医大学五年制三年级本科学生

291名,年龄20—23岁,男性232名,女性59名。全部学生有较好的英语阅读和理解能力,100%通过国家英语4级考试,57·7%通过国家英语6级考试,完成英文版MBTI—G测验30天后完成中文版MBTI测验。两项测验全部8项指标两两相关均达极为显著水平(P

3.2.2 MBTI效标关联效度分析

测验包括16PF人格测验(华东师范大学戴忠恒修订);EPQ人格测验(湖南医科大学龚耀先修订);PHI心理健康量表(中科院心理所在MMPI人格测验基础上修订)。参加MBTI和16PF量表测试的被试为:西安地区6所大学二至四年级本科生329名,平均21·4岁,其中男197名,女132名;参加MBTI和EPQ量表测试的被试为:大学二年级本科生320名,平均19·7岁,男性252名,女性68名;参加MBTI和PHI量表测试的被试为:工科二年级本科生280名,平均20·0岁,全部男性。将929名被试MBTI中EI分量表的测验结果分别与EPQ、16PF和PHI3项人格量表各因素测试结果作相关分析,其中将相关系数P

表1中所示,MBTI测验的EI维度与乐群性(A)、恃强性(E)、兴奋性(F)、敢为性(H)、内外向(E)等因素呈正相关关系;与忧虑性(O)、独立性(Q2)、紧张性(Q4)、神经质(N)、焦虑(ANX)、疑心(HYP)和脱离现实(UNR)等因素呈负相关关系。将MBTI中SN分量表测验结果分别与EPQ、16PF和PHI人格量表各因素测试结果作相关分析,将相关系数P

表2中所示,MBTI测验的SN维度仅与忧虑性(O)呈正相关;与恃强性(E)、兴奋性(F)、敢为性(H)、幻想性(M)、内外向(E)、病态人格(PSD)、兴奋状态(HMA)等因素呈负相关。将MBTI中TF分量表测验结果分别与EPQ、16PF和PHI人格量表各因素测试结果作相关分析,将相关系数P

表3中所示,MBTI测验的TF维度与稳定性(C)、恃强性(E)、有恒性(G)、敢为性(H)、实验性(Q1)、独立性(Q2)、自律性(Q3)等因素呈正相关;与忧虑性(O)、紧张性(Q4)、神经质(N)、焦虑(ANX)、疑心(HYP)和脱离现实(UNR)等因素呈负相关。将MBTI中JP分量表测验结果分别与EPQ、16PF和PHI人格量表各因素测试结果作相关分析,将相关系数P

表4中所示,MBTI测验的JP维度仅与社会性(L)和有恒性(G)呈正相关;也仅与精神质(P)和脱离现实(UNR)呈负相关。

3.2.3 MBTI结构效度分析 被试为军校大学本科一至四年级448名学生,均为男性。采用主成份分析提取公因子,采用斜交旋转法经20次迭代收敛,选择因子数为4,结果累积解释方差为22.9%。E-I、S-N、T-F、J-P4个维度各题目最大负荷值落在主因素上分别占93.75%,80.76%,72.72%和84.00%;次级负荷值落在主因素上分别为6.25%,11.52%,9.00%和16.00%;在主因素上无高负荷的题目共6项,即31,46,59,63,75和91题,集中在SN和TF维度上,仅占总题数的6.17%。其中5项是本研究将原词对题目转换成的短语题目,1项为词对题目。这6项问题的共同特点是有较低的内部一致性系数,分别为0.333,0.241,0.353,0.444,0.318和0.323。

性格心理测试题范文2

[关键词] 人格测验;效度;答题时间;正反向题目

人格测验作为鉴别人格差异的工具应用越来越广泛,尤其在人才选拔、健康人格的培养以及心理辅导等方面发挥了积极的作用。在人格测验中反向陈述题目(negatively―w0rdeditem)最初是为了减少默认反应偏差(指不区分题目内容而随意做出同意反应的倾向)和不认真行为而得到应用的。为了减少由于反应倾向造成的系统误差,多数人格测验平衡使用了正反向题目进行设计。但随着研究的深入,一些测量学家对这种混合题目形式提出了质疑,指出正反向题目测量的不是同一种特质,在同一量表中使用正向和反向陈述题目将导致因素结构复杂化。随着项目反应理论(IRT)研究的进展,一些研究也表明题目陈述方式的不同对题目的参数也有影响。还有研究者认为题目的陈述方式对测验信效度也有影响。而作答时间作为较客观的指标在人格测验的研究中也逐渐受到人们的重视,可以反映出被试作答的认真程度,进而作为人格测验的效度指标。本研究通过分析人格测验中正反向题目的时间效应来对正反向题目测验效度进行分析,探讨题目陈述方式对测验质量的影响,为测验编制及研究提供参考。

1 对象与方法

1.1 对象 某部士兵1230名,平均年龄19.3岁,标准差1.4岁。全部被试均为男性,初中以上受教育程度。

1.2 方法

1.2.1 实验工具 采用计算机呈现的艾森克人格问卷(EPQ)进行测量,测试过程中计算机自动记录每题的反应时间。艾森克人格问卷采用龚耀先修订的版本,共3个维度和一个测谎维度,88个题目。

1.2.2 将全部作答反应及其时间录入SPSS 11.5软件进行分析。

2 结 果

2.1 正反向题目平均时间对比将正向计分题和反向计分题的平均时间进行配对t检验,发现反向计分题的平均时间显著高于正向计分题平均时间,结果见表1。

2.2 正反向得分题目平均时间对比将反向题目进行转换。计算正反向得分题目的平均用时,并进行配对t检验,发现正向得分题目平均时间显著高于反向得分题目平均用时,结果见表2。

2.3 正反向未得分题目平均时间对比将正反向未得分的题目所用平均时间进行配对t检验,发现反向未得分题平均时间显著高于正向未得分题所用平均时间,结果见表3。

3 讨论

人格测验是心理测量的重要工具,其信效度的保证也是测量学家要研究的重要课题。反应时间是指机体从接受刺激到作出反应,包括感知、认知、反应选择和反应执行所需要的时间。它是实验心理学的常用指标,主要有二种用途:一是作为某种作业熟练程度的指标。二是作为某一行动产生以前所进行的心理活动复杂性的指标。在人格测验中反应时间可以间接反映被试作答是心理活动的复杂性,也可以表明被试完成测验时所投入的认知资源。本研究通过对比完成正向题目与反向题目被试所用的反应时间来探讨两种测题陈述方式对被试的影响。

3.1 正反向题目总体对比 由表1可知被试在完成反向题目时平均用时要长于正向题目,可能是由于完成反向题目需要先对题目的意义进行转换,然后再与自己的实际情况进行对比。而完成正向题目不需要语义转换,因此投入的认知资源相对较少,所用时间略短。

3.2 正反向得分题目平均时间对比 由表2可以看出正向得分题目的用时要略长于反向得分题目,与正反向题目用时的整体情况不同。可能是由于两种陈述方式对被试作出肯定回答造成了影响。在正向得分题目中被试完成的是肯定一句话的任务,而在反向得分题目中被试完成的是否定一句话的任务。两者的应答机制不同最终表现在了被试反应时间的改变上了。

性格心理测试题范文3

【关键词】 UPI;SCL90;新兵;心理测验

大学生人格问卷(University Personality Inventory,UPI)是一种为了早期发现并主动干预有心理问题的学生而编制的精神健康调查量表,通过被测试对象对阳性症状的主观评价能够提供三级筛选,在我国应用十分普遍。症状自评量表(Symptom Check List 90,SCL90)也是我国普遍应用于各类人群,并通过被测试群体的自我评价来反映其心理不良症状严重程度的一个量表。本文就这两个量表在某警卫部队新兵中的应用效果进行了比较分析,为完善两个量表在实际工作中的应用提供依据。

1 对象与方法

1.1 对象

样本选自某警卫部队2005年12月入伍的1579名新兵,剔除填写资料或答题不完整的问卷,排除有严重躯体症状的个体后获得有效问卷1515份(95.95%)。测试对象均为男性,年龄16 a~24 a,平均18.29±0.83) a;初中文化277名(18.28%),高中1187名(78.35%),大专以上学历51名(3.36%)。

1.2 方法

以新兵连为单位,采用UPI和SCL90对被测试者进行集体测评,测试前由同一心理咨询师用相同的指导语向受测者讲解测试的目的和方法,并要求受试者根据自己1 w以来的实际情况对每一项内容做出独立的评定。

1.2.1 UPI调查

采用中国心理卫生协会大学生心理咨询专业委员会组织修订的中文版UPI[1]。由两部分组成,第一部分是了解新兵的基本情况,包括他们是否单亲家庭、是否独生子女以及是否主动要求心理咨询等;第二部分由60个项目组成。UPI可以按一定的标准将新兵划分为一、二、三类。本调查采用的标准是:第一类,可能存在严重心理问题,需要尽快邀请咨询的新兵。筛选标准:总分≥25,第25题(想轻生)做肯定回答。第二类,可能有某种心理问题,但不甚严重,应引起咨询机构注意的新兵。筛选标准:总分≥20分。第三类:暂时没有心理问题的新兵,一般不作为咨询机构重点注意的对象。筛选标准:总分<20。

1.2.2 SCL90[2] 调查

该问卷由90个项目组成,每一个项目均采取1~5分5级评分制。90个项目被划分为9个因子,分别代表躯体化、强迫、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执以及精神病性。因为此次调查中UPI的筛查阳性标准是针对可能存在较为严重心理问题的新兵而制定的,因此SCL90采用的筛选标准定为:总均分≥3分或任一因子分≥3分,提示这部分新兵可能存在中等程度以上的不良心理反应乃至精神疾患。

1.2.3 约请咨询

对于UPI和SCL90筛查出来的阳性被测试者,在测评后的1 w内由心理咨询师约请他们前来进行心理咨询和精神疾患检查。

1.2.4 可信度测试

测查后20 d,随机选50名进行重测,前后两次UPI测试均分的相关系数为0.82,SCL90的总均分相关系数为0.78,9项因子分的相关系数在0.62~0.84之间。表明本次测试有较好的可信度。

1.2.5 统计方法

测试完成后,剔除漏填项目、重复填写等问卷64份,获得有效问卷1515份。全部资料应用北京大学研制的Psykey心理学测试软件统计,并用SPSS 10.0统计软件处理,并进行相关性检验及t检验。

2 结果

2.1 SCL90筛查结果

以SCL90作为筛选工具,有中度以上心理卫生问题的新兵检出率为2.97%(45/1515)。被测试者主要的心理卫生问题排序依次为:强迫、人际关系敏感、偏执、敌对、其它、躯体化、抑郁、焦虑、精神病性、恐怖,见表1。 表1 SCL90测试结果(n=1515)项目(略)

2.2 UPI筛查结果

利用UPI对新兵进行心理健康状况筛查,可能存在严重心理问题、需要尽快约请咨询的第一类新兵检出率为2.4%(37/1515);可能有某种心理问题,但不甚严重,应引起咨询机构注意的第二类新兵检出率为3.4%(52/1515);暂时没有心理问题,一般不作为咨询机构重点注意的第三类新兵检出率为94.2%(1426/1515)。

2.3 SCL90与UPI筛查结果比较

利用SCL90和UPI进行筛选,可能存在严重心理问题新兵的阳性检出率无显著性差异(t =0.1789,P>0.05)。在约请前来做心理咨询和精神检查的52名新兵中,确有心理问题或精神疾患的有16名,属于A类新兵。其中,有10名是UPI和SCL90共同筛选出来的。这10名被测试者占SCL90筛查阳性人数的22.2%,占UPI筛查阳性人数的27.0%。

2.4 SCL90与UPI筛查结果的相关性分析

利用Pearson相关分析法对SCL90与UPI测试结果进行相关性分析,显示两个测试所得到的结果有较高相关性(r =0.767)。

3 讨论

我们根据文献检索,选择了国内应用最为普遍的SCL90和UPI对新兵进行心理问题筛查,目的是对于这两个量表在应用中的筛查阳性结果进行相互检验和比较。警卫部队新兵是一个特殊的群体,其工作具有高风险性、不确定性和信息缺乏等特点[3]。国内外的调查显示,警卫部队新兵所承受的压力要明显高于普通人群[4]。本调查显示,SCL90筛查,新兵中度以上心理卫生问题检出率为2.97%,主要心理问题依次为强迫、人际关系敏感、偏执、敌对、其它、躯体化、抑郁、焦虑、精神病性、恐怖。UPI筛查,可能存在严重心理问题、需要尽快约请咨询的第一类新兵检出率为2.4%;可能有某种心理问题,但不甚严重,应引起咨询机构注意的第二类新兵检出率为3.4%;暂时没有心理问题,一般不作为咨询机构重点注意的第三类新兵检出率为94.2%。UPI和SCL90两者的阳性检出率无显著性差异,两量表测试结果经Pearson相关分析有较高相关性。因此笔者认为,在一定的筛选标准下,这两个量表在对被测人群进行心理健康调查与精神疾患筛选方面的作用基本相当,两者中的任何一种方法均可以用来评定被测人群的心理健康状况。但二者又各有优势。具体而言,UPI只有60个问题,每道题均以“是与否”作答,方法简单,易于筛查;SCL90有常模存在,数据比较客观,便于进行对比分析和长期跟踪调查,而且测试结果包含有9个因子分,还可以在一定程度上指导我们对于筛查阳性者有针对性的进行心理学干预。

参考文献

[1]樊富珉.大学生人格问卷UPI[M].北京:清华大学出版社,1994:32

[2]王征宇.症状自评量表(SCL90)[J].上海精神医学,1984,2:68

性格心理测试题范文4

关键词 结构化面试;情境面试;行为面试;预测效度;构念效度

分类号 B849:C93;B841

1 引言

以情境面试(situational interview,SI)和行为模式描述面试(也简称为行为面试或行为描述面试,patterned behavioral description interview,PBI,BDI)为主要形式的结构化面试(Campion,Palmer,&Campion,1997;Harris,1989)自产生以来,其效标关联效度、绩效预测效度(Huffcutt,2011)受到了广泛关注和研究,涉及的研究对象包括管理者(Krajewski,Goffin,McCarthy,Rothstein,&Johnston,2006)、工头(Latham,Saari,Pursell,&Campion,1980)、参与面试培训的毕业生(Klehe,KSnig,Richter,Kleinmann,& Melchers,2008)、研究生(Day&Carroll,2003)、销售部门人员(Orpen,1985;Weekley&Gier,1987;Banki&Latham,2010)和金融业行政人员(Robertson,Oratton,&Rout,1990)等,这些研究结果显示结构化面试有良好的绩效预测效度,其预测效度在0.28~0.48之间,元分析研究结果表明结构化面试(SI和PBDI)的效标关联效度在0.5左右(Latham&Sue-Chan,1999;Taylor&Small,2002)。

结构化面试研究的另一个焦点是比较情境面试(SI)和行为面试(PBI或BDI)的绩效预测能力差异(Jelf,1999),情境问题(situational questions)在预测低复杂或中等复杂的任务上并不比行为问题差(Taylor&Small,2002),而二者对高水平、高复杂任务或职位的预测能力似乎存在差异,Klehe和Latham(2005)的研究表明SI和PBDI都能很好地预测团队扮演行为(teamplaying behavior),而其他很多研究表明只有行为面试能够预测高复杂、高水平任务或职位的表现(Huffcutt,Conway,Roth,&Klehe,2004;Huffcutt,Weekley,Wiesner,Degroot,&Jones,2001;Krajewski,et al.,2006;Pulakos&Schmitt,1995)。

为什么SI和PBDI在高级职位上会出现预测效度差异呢?关于这种差异,Huffcutt,Weekley,Wiesner,Degroot和Jones(2001)曾经提出了四种可能性解释。第一种解释是SI问题对较高水平岗位来讲过于简单,但被SI问题的标准差略大于PBDI问题的标准差(Pulakos&Schmitt,1995)这一事实否定:第二种可能性的解释为较高水平岗位的SI问题的回答很难评价,这种解释被评分者一致性信度数据否定;第三种解释是PBDI捕捉到了工作绩效,但是这种解释并没有得到数据的支持:第四种解释是SI和PBDI在高级职位上测量的构念不一样。目前普遍认为,SI和PBDI测量的构念不一致,而探索要SI和PBDI测量的构念被看作是结构化面试研究中的一大方向(Huffcutt,Weekley,et al.,2001;Klehe&Latham,2005;Pulakos&Schmitt,1995)。

学者在满怀期待地探索情境面试和行为面试构念的过程中,并没有获得太多令人兴奋的结果,反而一些研究表明情境面试和行为面试并没有测量到实质的构念。多特质-多方法(MTMM)分析经常被用于判定测量工具的构念,如果同特质不同测量工具间的相关显著高于同测量工具不同特质间的相关,即聚合效度显著高于区分效度,则可以认为该测量工具测量到了某一构念。针对同样的维度开发出来的情境面试和行为面试工具在测量高级岗位人员时,并未表现出聚合效度显著高于区分效度(conway et al.,1999;Motowidlo et al.,1992),意味着情境面试和行为面试测量的构念并不相同,而针对同样的维度开发出的两个行为面试工具在测量高级岗位人员时,也没有表现出聚合效度显著高于区分效度(Van Iddekinge et al.,2004),这可能意味着PBDI并没有测量出所谓的构念,或者测量到了多种构念,而各种构念所占比重都相对较少。

如果情境面试和行为面试没有测量到构念,那是什么因素贡献了情境面试和行为面试的预测效度?我们认为结构化面试的预测效度很可能受到非构念成分和构念成分的共同影响,非构念成分主要是指面试的结构化程度或结构性,构念成分包括应聘者的印象管理行为、动机、人格、能力等,这些因素都有可能对结构化面试的预测效度做出贡献,本研究从结构化面试的结构性、应聘者的印象管理和个人特质三个方面展开讨论,论述他们对SI和PBDI预测效度的贡献,并对SI和PBDI预测高级岗位的能力差异这一问题作以解释。

2 结构化面试的结构性对面试效度的贡献

2.1 结构化面试的结构性及其对信、效度的影响

在已有的面试研究中,研究者对结构化面试的理解有较大差异,有些将面试二分为结构化和非结构化,有些强调结构性的具体成分以对面试的属性做出解释,有些用情境的、行为的来表示,这种命名和认识的混乱会误导对研究结果的解释,也会阻碍面试结构性研究的进步(Macan,2009)。针对这样的现状,多个研究者提出了面试结构性的划分方法,最受关注的当属Dipboye,Wooten和Halverson(2004)提出的三维模型,此模型对应了整个面试过程(面试的开发、实施、面试数据的使用),确定了面试的三个结构性因素:(1)面试内容要与工作相关;(2)面试的过程要标准化;(3)以结构化的方式,综合运用数据及其蕴含的关键因素来评价候选人。结构化面试在整个实施过程中需要包含这三个因素。

赋予面试结构化因素能够增强面试的信度和效度。基于工作分析的结构化面试比其他类型的结构化面试产生更高的面试信度,由面试组成员对应聘者回答统一讨论作出共同决策的评价方式好于统计性综合各个面试官的独立评分,前者产生更高的信度(Wiesner&Cronshaw,1988)。让所有候选人回答相同的工作相关问题,而且使用特定的锚定评价量表对他们的回答进行评价,这种面试可能产生比其他类型面试更高的效度水平(Pulakos&Schmitt,1995,),而且已获得了研究的支持:行为锚定评分表可以增强评价的准确性(Melchers,Lienhardt,Von Aarburg,&Kleinmann,2011)和评分者一致性信度(Maurer,2002)。是否按照结构化面试要求进行面试直接影响面试的预测效度。Latham和Saari(1984)以人职员工为对象研究了情境面试的预测效度,发现情境面试结果和后来的绩效考核结果的相关仅为0.14,小于其之前类似研究(Lat_ham et al.,1980)的0.30,后续检验发现面试官没有正确使用情境面试,没有按照评分表分别对应聘者在每一个问题上的回答及时进行评价,而是在面试结束后参照评分表给出了一个总的评价。

2.2 面试的结构性影响结构化面试预测效度的内在机制

面试的结构性影响结构化面试预测效度的内在机制可能是通过改善结构化面试的信度而实现的,面试的结构化带来了比较高的面试信度,进而提高了结构化面试的效度。

Wiesner和Cronshaw(1988)开展了面试形式与结构化程度影响面试效度的元分析研究,他们发现结构化面试的信度与非结构化面试的信度存在显著差异,结构化面试的效度也显著高于非结构化面试的效度,这种共变现象说明面试信度至少解释了部分效度变异,而面试信度与面试预测效度0.48的相关程度,说明面试信度可以解释面试预测效度23%的变异。

结构化面试的三个结构性因素使得结构化面试具有了较高的信度。情境面试以行为锚定评分表、基于工作分析、对每个应聘者问及同样问题和在每个问题之后及时做出评价等(Latham et al.,1980;Campion et al.,1997;Latham&Sue-Chan.1999)为特征,行为面试以使用关键事件法提取面试问题、使用评定量表、用事先准备的相同问题问及每位应聘者(Janz,1982;Orpen,1985)等为特征,都具备三个结构化因素,使得二者具有比较好的面试信度,进而为其预测效度做出了贡献。

3 印象管理行为对结构化面试预测效

度的贡献

3.1 印象管理行为对面试的影响

印象管理是指在社会交往中,试图控制他人对自己人格特定方面的印象(Schenkler,1980)。研究者曾经认为结构化面试不受应聘者印象管理行为的影响(campion et al.,1997,),但是众多研究表明应聘者在结构化面试中使用而且成功使用了印象管理行为(Ellis,West,Ryan,&DeShon,2002;Stevens&Kristof,1995)。

印象管理行为包括言语行为和非言语行为,他们都能在结构化面试中对面试官的评价和决策产生影响。

3.1.1 印象管理言语行为对面试的影响

印象管理的言语行为经常被划分为进取和防御。进取性印象管理行为用于获得受他人喜欢的印象,包括自我关注(如自我宣传等)和关注他人(如奉承等)两种(Tedeschi&Norman。1984)。自我关注策略在于唤醒胜任归因,应聘者试图让面试官相信他们拥有工作需要的资格,如告诉面试官自己很有智慧、工作努力、有很多出色的工作经历等;关注他人策略在于唤醒人际喜爱,如吹捧面试官或强调与面试官的相似性等(Wayne&Kacmar,1991)。防御性印象管理行为主要是用于修复或保护个人形象(Proost,Schreurs,De Witte,&Derous,2010;Schenkler,1980,),最主要的方式是借口和辩护,借口用于降低个人在一项消极结果中的责任,辩护则是个体承认自己对某种消极行为或结果的责任,但对这些行为给出良好的理由。

应聘者在结构化面试中更多地使用了进取性印象管理行为,在行为面试中主要使用自我提升策略(Ellis et al.,2002;Kleinmann&Klehe.2010;Peeters&Lievens,2006,),在情境面试中主要使用奉承策略(Ellis et al.,2002;Peeters&Lievens.2006)。印象管理行为也促进面试成功,进取性印象管理行为(奉承和自我提升)与面试得分有正相关(Ellis et al.,2002;Kleinmann&Klehe,2010),并在脆弱性(大五人格中神经质因素的一个子成分)对面试结果的影响中起中介作用(VanIddekinge,McFarland,&Raymark,2007)。

3.1.2 印象管理非言语行为对面试的影响

非言语印象管理行为包括微笑、眼神接触、手势、点头等。

在普通面试中,微笑和直接的眼神接触都会产生更多的成功面试,而其它行为如注视躲避则会导致更多的失败面试(Harris,1989)。而虚假的微笑与真实的微笑相比获得的评价相对较低(Woodzicka,2008)。握手的质量也能预测基于面试的雇佣建议,高质量的握手(大面积接触、有力、持久、伴随眼神接触等)能够带来高岗位匹配性的评价(stewart,Dustin,Barrick,&Damold,2008)。

同样,在结构化面试中,非言语行为也会促使面试官给予积极评价。微笑、手势、眼神接触和点头等非言语行为与面试评价呈正相关(DeGroot &Gooty,2009;Peeters&Lievens,2006),而且与进取性印象管理行为呈正相关(Peeters & Lievens,2006)。

印象管理行为不容易受指导语的影响,被激励使用印象管理的情境与正常面试情境并未表现出印象管理行为的差异(Peeters & Lievens,2006),这意味着在选拔情境中印象管理较少能被有意识地控制(Ellis,West,Ryan,& DeShon,2002;Peeters& Lievens,2006),而且很难消除,或许是一种稳定的特质,对面试成功有积极的贡献。

3.2 印象管理行为是一种稳定的特质

多项研究表明,印象管理与人格特质有关联。自我关注行为与尽责性(Kleinmann & Klehe,2010)、宜人性(Peeters & Lievens,2006)有正相关,关注他人行为与自控(Peeters & Lievens,2006)、宜人性中利他成分(Kleinmann & Klehe,2010)有正相关,在以上人格特征中得分高的个体更多地表现出进取性印象管理行为。

印象管理行为是一种稳定的行为风格或特质被研究者以多特质-多方法分析予以了确认。Kleinman和Klehe(2010)的多特质-多方法(multitrait-multimethod,简称MTMM)分析表明印象管理行为的同特质不同方法间的相关显著高于不同特质同方法间的相关,即聚合效度高于区分效度,这说明印象管理行为的确显示出了构念相关效度,意味着印象管理不仅仅是在面试中使用的策略,而且是一种稳定的构念,可能被结构化面试测量到了。

3.3 印象管理影响结构化面试效度的机制

印象管理行为既能影响结构化面试成绩,又能影响绩效评价成绩,作为二者的共有因素将结构化面试成绩与绩效成绩联系了起来,解释了结构化面试的预测效度。

进取性印象管理行为能预测结构化面试成绩,已被诸多研究所证明(Ellis et al.,2002;Kleinmann&Klehe,2010,),其中的自我宣传策略被普遍认为能够积极预测结构化面试成绩(Kleinmann&Klehe,2010;Swider,Barrick,Harris,&Stoverink,2011;Schneider,2012,),二者的相关系数在0.2~0.5之间,而奉承策略需要在被他人知觉到的情况下发挥作用,因为只有他人评定的奉承才能预测结构化面试成绩,而自我评定的奉承不能预测结构化面试成绩(Schneider,2012)。

员工的印象管理行为也积极地影响绩效评定成绩,印象管理行为与绩效成绩的相关大约是0.15左右(Barrick,Shaffer,& DeGrassi,2009),虽然小于印象管理行为与结构化面试之间的相关,但是进一步说明了印象管理行为能同时影响面试评价和绩效评价。

进取性印象管理行为在结构化面试对典型行为、最佳行为之间的预测作用中可能起着中介的角色。Kleinman和Klehe(2010)检验了进取性印象管理行为、面试表现分别与典型行为评价和最佳行为评价之间的关系,结果发现自我宣传策略和面试表现共同解释9%的最佳行为评价变异和7%的典型行为评价变异,而在面试表现的基础上输入自我宣传策略这一变量后,面试表现对典型行为和最佳行为的相关就不再显著了,可能意味着自我宣传策略在二者之间起着中介变量的作用,即面试成绩对绩效评价的预测可能是通过印象管理策略的运用实现的。

这些证据表明,在面试过程中,应聘者的印象管理影响着面试官的评价,而且影响绩效评价的结果(Kleinmann&Klehe,2010),印象管理行为作为面试评价和绩效评价的共同影响成分,能够解释面试评价和绩效评价之间的相关,意味着印象管理行为是结构化面试预测效度的影响因素之一,印象管理行为在结构化面试对绩效的预测中有可能发挥着中介变量的作用,能够解释面试预测效度的部分变异。进一步研究可以关注印象管理行为对结构化面试预测效度的解释率,以及更多地验证印象管理行为在结构化面试与绩效评定之间的中介作用。

4 心理特质对结构化面试预测效度的贡献

学者一直在为结构化面试的预测效度寻找理论解释,探寻结构化面试测量了什么样的心理特质,以利于建立起结构化面试的理论基础。目前。探索结构化面试测量的心理成分主要集中在动机、人格特征和认知能力。

回到行为面试和情境面试对比研究中存在的长期争议:行为面试与情境面试相比谁更能预测个体在复杂程度、高级岗位上的绩效?如果简单地比较行为面试与情境面试与绩效的相关系数,而不考察二者在具体岗位上测量到的心理成分差异,就不能真正地看到二者的区别,也不利于认识到结构化面试的构念效度,因为行为面试和情境面试与具体岗位的能力、人格、动机特征可能存在不一致的关联,因此比较两种面试形式在具体岗位水平上测量到的心理特质程度差异有助于认识二者预测效度差异的真相。

4.1 结构化面试测量到的动机成分

动机和能力被看作是能够影响员工绩效的两个主要因素,如果结构化面试能够测量到动机成分,将会增强结构化面试的理论基石。目前结构化面试测量到的动机成分研究主要集中在验证结构化面试是否测量到了动机以及明确结构化面试测量到了哪种动机,已有成果表明结构化面试确实测量到了应聘者的动机,而且测量到的动机类别有任务相关动机、总体动机和一般自我效能感。

第一次测量到结构化面试与动机之间的关系是用间接方式获得的。这种方式并没有直接建立结构化面试成绩和动机水平之间的相关,而是建立了结构化面试与分别反映动机和能力的行为之间的关系,即典型表现(typical performance)和最佳表现(maximum performance)(Sackett&Larson,1990)。典型表现是个体发生在日常工作情境中的正常行为,努力的程度和持久性并没有限制,因此它反映个体的选择,是个体动机水平的函数,而在需要最佳表现的情境中,所有个体的动机都很高,即个体在此情景中都保持高动机水平,动机差异很小,因此个体在最佳表现上的差异体现的主要是能力差异(Sackett et al.,1988)。Klehe和Latham(2006)首次以这种方式证明了情境面试和行为面试都测量到了动机。他们以MBA学生的团队扮演(teamplaying)行为为研究对象,测量了他们的典型表现水平和最佳表现水平,并使用根据关键事件法建构的等同的情境面试题目和行为面试题目对被试进行评价,结果发现两种面试形式与典型表现成绩都有显著相关,而且显著高于两种面试与最佳表现成绩的相关,表明两种面试都测量到了团队扮演所需要的动机。

Klehe和Latham(2008)又用结构方程模型证明了结构化面试和任务相关动机之间的关系。他们检验了任务相关动机和任务相关能力在预测最佳绩效和典型绩效上的差异,将动机和能力看作是潜变量,将测量动机的结构化面试(由等量的情境面试题目和行为面试题目共同组成)看作是外显变量,同时也将最佳绩效和典型绩效看作是外显变量,动机和能力对典型绩效的预测作用以及能力对最佳绩效的预测作用得到了验证,结构方程模型拟合度检验数据表明结构化面试能够准确地测量任务相关动机这一构念。

虽然已用间接的方式证明了结构化面试工具能够测量应聘者的动机,但动机与结构化面试的直接关系更受期待。Guarnaccia(2008)用总体人格特征问卷(GPI)中的动机量表测量被试的动机水平,用规范的方式开发出行为面试工具,以领导人员为被试,建立了动机与行为面试(BDI)之间的直接关系,研究结果表明结构化面试与总体动机之间有显著的相关(r=0.19),而且结构化面试与动机的三个成分(成就动机、能量水平、主动性)也都有显著的相关,相关系数分别是0.18、0.15、0.17,这些研究成果第一次清晰地描绘了结构化面试与动机之间的关系,为结构化面试能够测量到动机成分提供了直接证据。

个体表现出积极主动行为受两种动机因素的驱动:行动的理由(the reason to do)和感知到的做成的能力(can do attitude,percieved capability ofsucceeding)(Parker, Bindl,&Strauss,2010)。感知到的做成的能力就是Bandura(1997)认为的自我效能感。自我效能感已被证明能够预测员工的诸多表现,如创造(Liao,Liu,& Loi,2010)、积极的客服行为(Raub&Liao,2012)等。理论上讲,自我效能感能够对应聘者的面试行为或成绩产生影响,自我效能感高的个体将在结构化面试中获得更好的成绩,如果此观点能得到验证,就可以说明自我效能感对面试和绩效都能产生作用,可以作为二者相关的一种解释。Shantz和Latham(2012)研究了培训对结构化面试成绩的影响,研究结果表明自我指导书这种方式可以提高个体的面试表现,但是这种效果是通过自我效能感这一中介变量发挥作用的,培训的效果在于提高了个体的自我效能感,自我效能感和结构化面试成绩的相关系数为0.61(p

综合结构化面试与动机关系的研究成果,我们可以发现情境面试和行为面试都测量到了个体的动机,具体包括成就动机、主动性、能量水平、任务相关动机和一般自我效能感,而这些特质既影响面试成绩得分,也影响绩效评价得分,能够解释结构化面试预测效度的部分变异,可能是结构化面试测量到的一类心理特质。这些成果对认识两种结构化面试形式测量到的构念非常有价值,明晰了结构化面试的结构。

4.2 结构化面试测量出的人格成分

无论是经理人还是研究者对面试评价反映的人格特征都很有兴趣,而且对于结构化面试中是否测量到了人格成分大致有三种看法。一种看法是面试可能捕捉到了人格变量(Hurtz&Donovan,2000)。第二种看法没有明确地说明面试捕捉到的人格成分程度,但是认为包含在重要构念中的人格能够被面试测量到(Caldwell&Burger,1998;Cortina,Goldstein,Payne,Davison,&Gilliland,2000;Huffcutt,Conway,Roth,&Stone,2001;Schmidt&Radar,1999)。最后一种看法是大多数结构化面试中很少能测量到人格成分(Hough&Funlham,2003)。但是以上三种看法都较少地得到实证研究的支持(Roth,Iddekinge,Huffcutt,Eidson Jr,&Schmit,2005)。

Cortina等人(2002)的元分析研究综合了9项研究,结果发现结构化面试与尽责性(conscientiousness)的平均相关为0.26。Huffcutt,Conway等人(2001)的元分析研究以现任经理为对象,检验了人格和行为面试的关系,只有外倾性(extraversion)和行为面试相关,相关系数为0.30。

实证研究结果表明:结构化面试或许只与人格成分有很低的相关(Van Iddekinge,Raymark,Eidson Jr,&Attenweiler,2004;Krajewski et al.,2006)。Pulakos和Schmitt(1996)以联邦政府的调查人员为对象,发现行为面试总分与大五人格中的责任心有显著弱相关,相关系数为0.12。VanIddekinge等人(2004)使用两种行为描述面试工具测量了客服经理应聘者的表现,并计算了客服经理应聘者面试成绩与大五人格测验各个分测验的相关,发现行为描述面试只与外倾性中的野心有微弱正相关,相关系数为0.16,而与其他几个分测验无相关。Roth等人(2005)以服装零售公司的销售助理为研究对象,使用情境面试和行为面试两种工具测量了他们的表现,并将面试结果与销售助理的自陈式大五人格问卷得分作相关,结果发现情境面试与大五人格的任何一成分都无显著相关,而行为面试与大五人格中的责任心、外倾性有微弱正相关,相关系数都是0.12。Krajewski等人(2006)考察了在管理者岗位上情境面试和行为面试与人格特征的关系,发现情境面试与成就导向和控制人格特征没有相关,而行为面试与这两项人格特征都有显著弱相关,相关系数分别是0.22和0.26。

在探索结构化面试的构念效度过程中,结构化面试与人格关系的实证研究虽然不能给我们带来太大的兴奋,未能发现人格与结构化面试的高度相关,但是对于我们理解情境面试和行为面试的构念差异提供了证据,虽然还需要更多的研究证据来支持情境面试和行为面试的构念差异,但从以上研究中可以得出基本结论:情境面试不能测量到人格成分,而行为面试能轻微地测量到责任心和外倾性等人格成分。

4.3 结构化面试测量出的认知能力

认知能力已被广泛证明能够准确地预测多种岗位的工作绩效(Huffcutt,Roth,&McDaniel,1996),诸多研究也试图证明情境面试和行为面试与认知能力有相关(campion et al.,1988;Krajewski et al.,2006;Huffcutt et al.,1996;Christina & Latham,2004),进而提供结构化面试能够预测绩效的理论解释,部分研究结果显示面试与认知能力测验的相关随着结构化程度的提高而降低(Berry,Sacker,& Landers,2007),另外的一些成果主要集中在结构化面试与一般认知能力、具体能力(specific abihty)和实践智力(practical intelligence)的联系上。

结构化面试与一般认知能力的关系被多项元分析研究反复检验(Huffcutt et al.,1996;Salgado&Moscoso,2002;Bevy et al.,2007,),两种结构化面试形式都与一般认知能力有关,情境面试与一般认知能力的相关系数在0.21~0.34之间,行为面试与一般认知能力的相关系数在0.18~0.19之间。

实践智力是成功智力理论的一个成分,它是基于经验的技能、性情、显性知识和隐性知识累积的集合体,同时包括解决日常问题的能力(Baum,Bird,& Singh,2011),被认为能使个体在绩效上获得成功(Bledow&Frese,2009;Joseoh,Ang,Chang,&Slaughter,2010;Razali&Trevelyan,2008)。实践智力能否对结构化面试与绩效之间的预测关系做出一些解释呢?虽然结构化面试与实践智力之间关系的研究相对较少,但是Klehe和Latham(2008)研究的一项成果,给出了令人兴奋的结论。Klehe和Latham(2008)使用实践智力测验作为实践智力的测量,使用情境面试问题和行为面试问题组成结构化面试工具,结果发现实践智力与情境面试问题有显著相关,相关系数为0.42,而与行为面试问题的相关不显著。这或许意味着情境面试更能测量到与工作相关的实践智力,但需要更多的证据支持。

以上研究成果为我们认识结构化面试与认知能力之间的关系提供了清晰的数据,但还不能辨别两种结构化面试形式测量到的认知能力差异,分析情境面试和行为面试在不同水平岗位上测量到的认知能力差异,会有利于认识到二者预测不同水平岗位的绩效能力差异。

在低水平岗位上,情境面试和行为面试都能测量到认知能力。低水平岗位上的情境面试与数学能力测验(简单地加减乘除运算,限时15分钟)、机械知识测验(识别各种各样的常见工具)、跟随口头指导测验(跟随口语指导能力)、阅读刻度测验(阅读标准化刻度或规则的能力)的显著相关分别是0.27、0.54、0.37、0.50(Campion et al-1988)。行为面试与认知能力的相关为0.61(Campion et al.,1994)。

在高水平岗位上,情境面试和行为面试与认知能力的相关差异较大。高水平岗位的情境面试与言语推理和数字推理的相关系数分别是0.14、O.15,高水平岗位的行为面试与言语理解、言语推理和数字推理的相关系数分别是0.18、0.20、0.20,而进一步的回归分析结果表明认知能力(言语理解、言语推理和数字推理)能解释行为面试7%的变异,而不能解释情境面试的变异(Kraiewski etal.,2006)。

同人格成分与结构化面试的关系类似,认知能力与结构化面试的实证研究结果并没有表现出二者的高相关,但对于区分情境面试和行为面试的构念差异非常有帮助,情境面试和行为面试都能测量到低水平岗位的认知能力,而在高水平岗位上,行为面试比情境面试能更好地测量到高级认知能力,结构化面试形式与岗位水平在测量到的认知能力上是否存在交互作用,需要更多的证明,此外二者测量到的实践智力的差异还需要更多研究予以补充。

5 讨论及未来研究方向展望

本研究对结构化面试预测效度贡献因素的分析对于全面认识结构化面试有所帮助,面试的结构化程度这一非构念成分提高了结构化面试的信度,间接地提高了面试的效度,并在结构化面试的预测效度中占据了相当的分量。传统的心理特质被结构化面试测量到的有动机、人格特征和认知能力,而已有研究结果表明,认知能力和人格特征都只能是被轻微地测量到。不可忽视的是应聘者的印象管理行为,它对面试结构的影响超过了我们的传统认识。而且作为一种类似于人格的稳定构念,有可能也被结构化面试测量到了,而这种构念可能隶属于更为宽泛的一种构念,如人际技能。

在绩效方面的研究成果,或许能给我们认识情境面试和行为面试的构念带来新的曙光。Rotundo和Sackett(2002)回顾和整合了有关工作绩效维度的观点,把任务绩效、公民绩效、反生产工作绩效看作是工作绩效的三个主要来源。将感兴趣的效标与相应的预测源匹配起来是效标维度研究的新观念,这种匹配也关系到选拔系统的成功(sackett&Lievens,2008)。已有研究(Christina&Latham,2004)表明,情境面试与传统的认知能力测验都与绩效评价呈现显著正相关,但情境面试与认知能力测验的相关并不显著,这可能是因为二者预测了绩效的不同方面,即情境面试可能预测到了绩效中关系绩效成分,而认知能力测验预测到绩效中的任务绩效成分。任务绩效和关系绩效由不同的预测源来预测,很有可能认知能力等更容易预测任务绩效,而人际关系、政治技能(Jawahar,Meurs,Ferris,&Hochwarter,2008)、印象管理行为和部分人格特征更能预测关系绩效,由于之前的结构化面试构念效度研究没有将关系绩效和任务绩效予以区分,因此没有把握住与结构化面试构念最为相似的心理特质,建议今后研究将绩效分为关系绩效(公民绩效)、任务绩效、反生产工作绩效,分别检验两种结构化面试形式对不同绩效的预测效度,这样做至少有两方面的意义,一是建构起更能说明结构化面试预测能力的关系模式,二是有助于认识到结构化面试测量到的构念。

如果结构化面试与关系绩效的相关更为显著,那么结构化面试有可能测量到了员工的应用性社会技能,Huffuctt,Conway等人(2001)认为结构化面试比非结构化面试更能反映出个体的应用性社会技能和人格特征。结合以上谈到的印象管理行为对结构化面试预测效度的贡献,人格特征、印象管理行为可能都汇集在应聘者的人际技能这一构念中,继而对面试结果产生影响,而人际技能又能影响到绩效评估,属于面试评价和绩效评估的共同影响因素,进而对结构化面试的预测效度做出解释。因此,进一步研究可以检验结构化面试是否测量到了人际技能或是社会技能,并在岗位水平、面试类型上加以比较。

性格心理测试题范文5

关键词 IR7;猜测现象;睡眠现象;四参数Logistic模型

分类号 B841.7

1 测验中的猜测现象和睡眠现象(非0下渐近线现象和非1上渐近线现象)

按测验对象的内容来分,心理与教育测验可以分为智力测验、能力倾向测验、教育成就测验、人格测验等,而智力测验、能力倾向测验、教育成就测验都是最佳行为测验,可以统称为能力测验。在能力测验中,低能力被试靠猜测或者其他原因答对了高难度试题,这种现象叫做猜测现象(guesser,or guessing phenomenon),猜测现象在能力测验中比较常见。在能力测验中还存在另一种现象,即高能力被试答错容易试题的现象,Wright(1977)将其称为“睡眠现象”(sleeper,orsleeping phenomenon),比如一些学习成绩较好的学生都可能有过这样的体验:在测验时有些试题比较容易,但由于某些原因做错了。在计算机自适应测验(Computerized AdaptiveTest,CAT)测验中,高能力被试可能会由于一些原因而答错容易试题,Rulison和Loken(2009)概述了高能力被试答错容易试题的几种原因:焦虑、测试不良环境导致的被试分心、不熟悉计算机(在CA7时)、粗心、误解了题意等等,由于这些原因导致了被试答错相对容易的试题。此外测验动机过强、家长期望压力过大也往往会造成高能力被试没有考好,答错了对于他们来说较为容易的试题,对于猜测现象,在项目反应理论模型中用c参数(thelower asymptote)来反映,使用三参数Logistic模型来分析存在猜测现象的测验数据。对于睡眠现象,Barton和Lord(1981)提出用丫参数(thcupperasymptote)来反映,即在三参数Logistic模型的基础上增加r参数,使用四参数Logistic模型来分析同时存在猜测现象和睡眠现象的测验数据。

以上论述了在能力测验中的被试猜测现象和睡眠现象,相应的,在人格测验中存在被试作答的“作假”现象(Faking)。被试作假行为也有多种,包括被试期望反应行为、掩饰行为、趋中反应和随机化行为等等。随机化行为,往往是被试对人格测验不予以配合时发生的,这种情况可以通过指导语等方式取得被试的配合。对于趋中反应,可以通过营造一个良好的测验环境,使用指导语鼓励被试按实际情况作答来避免。在人格测验中,这里将主要论述对测验结果影响较大的被试期望反应行为和掩饰行为这两种主要的作假现象,在人格测验中,被试往往会受到社会期望压力、焦虑、掩饰等因素的影响,会产生两类作答反应倾向:一是由于社会期望压力、焦虑或其他因素,被试在试题上表现出入格特征维度高水平方向的倾向性作答(例如在社会期望反应方向为正向记分时),使得被试在这一人格特征维度上的总分偏高,本文将这种现象称为非0下渐近线现象(non-zero lower asymeptote),可以用c参数来反映(Rouse,Finger,&Butcher,1 999;Reise&Waller,2003);二是由于被试掩饰、说谎等原因,在试题上表现出入格特征维度低水平方向的倾向性作答(例如人格病理方向为正向记分方向),使得被试在这一人格特征维度上的总分偏低,本文将这种现象称为非1上渐近线现象(non-one upoerasymeptote),可以用r参数来反映(Reise&Waller,2003)。非0下渐近线现象和非1上渐近线现象是在人格测验中常见的两种作假现象。非0下渐近线现象和非1上渐近线现象,造成被试得分不准确,导致人格测量的偏差。相对于能力测验而言,在人格测验中被试很容易作假,这在职业选拔、人才测评的人格测验中尤为突出,Reise和Waller(2003)在分析人格测验MMPI-2时,发现了测验中的试题既存在着下渐近线,同时也发现一些试题存在着上渐进线,认为非1上渐近线现象也是试题的一个属性,这时可以用四参数Logistic模型来反映并拟合测验数据。

能力测验中的猜测现象和睡眠现象,人格测验中的非0下渐近线现象和非1上渐近线现象,本文统称为被试作答异常现象。这些被试作答异常现象会导致测验总分偏高或偏低,导致测量偏差。心理与教育测量的研究主要目标之一就是减小测量误差,提高测量的准确性,如何来克服这些被试作答异常现象对测量的影响?在经典测量理论下,如果高能力被试(人格特征高分被试)答错了容易试题,被试将失去该道试题的分值,从而使得被试得分偏低;如果低能力被试(人格特征低分被试)答对了高难度试题,被试将得到该题的分值,使得被试得分偏高。因此,在经典测量理论下计算被试总分时,往往难以对被试的作答异常现象(猜测现象和睡眠现象,非0下渐近线现象和非1上渐近线现象)进行有效纠正,而在项目反应理论下,当被试作答异常现象时,被试能力估计或人格特征估计情况是怎样的呢?在四参数模型中c参数反映了猜测现象门10下渐近线现象),r参数反映了睡眠现象(非1上渐近线现象),那么c、Y参数是否有助于心理与教育测验的准确测量?下面就以上两个问题,从能力测验和人格测验两个方面进行论述。

2 在能力测验中对被试作答猜测现象和睡眠现象纠正的研究情况

2.1 对被试作答猜测现象和睡眠现象纠正的早期研究情况

在早期IRT研究中,许多著名的IR7研究者(Wright,1977;Wainer&Wright,1980;Barton&Lord,1981;Mislevy&Bock,1982)都对测验中的猜测现象和睡眠现象进行了分析,并提出多种纠正方法,以下按研究的时间顺序进行论述。

最早对测验中猜测现象、睡眠现象进行研究的是Waller和Wright。Waller(1974)认为,如果要调整被试作答情况的权重以消除猜测现象的影响时,应该考虑被试能力与项目难度之间的距离来进行调整。Wright(1977)论述了Rasch模型应用中的问题,其中包括了被试作答的猜测现象、睡眠现象、迟钝现象、缓慢现象等,但Wright认为不必分析每一个被试是否存在这些现象,只有当这些现象会影响被试能力估计而产生偏差

时,可以采用删除该被试的有关作答情况的方法来纠正。

Wainer和Wright(1980)在Rasch模型下探讨了猜测现象和睡眠现象时对能力估计的影响,使用了5种方法进行对比:①纯Rasch模型,②传统的纠正猜测现象方法,⑧使用Jackknife方法④使用AMT-Robustified Jackknife方法,⑤WIM方法(此方法是检验被试作答模式是否奇异,如果统计值大于,值的临界值,则删除被试在该试题上的作答情况,再进行能力估计)。Wainer和Wright在比较分析后,认为AMT-RobustifiedJackknife方法在出现猜测现象和其他作答情况时都有较好的纠正作用;WIM方法只有当低能力被试靠猜测答对试题时,能提高能力估计的准确性;传统的纠正猜测现象方法只有当猜测现象的比例比较大,测验较长,而且被试为低能力被试时才体现了较好的纠正作用;而在测验长度比较短时,Jackknife方法纠正被试能力高估或低估现象都比较好。

Barton和Lord(1981)对SATVerbal、SATMath、GRE Verbal、AP Calculus四批测验数据进行分析,其研究目的是:(1)在三参数Logistic模型下,分析高能力被试的能力估计值是否会被低估;(2)在三参数Logistic模型的基础上增加v参数后,分析被试能力估计值的变化情况。通过四参数Logistic模型与三参数Logistic模型的结果比较,Barton和Lord认为:在三参数模型增加7参数后,测验极大似然值没有显著增加;在被试整体上比较分析,被试能力估计值没有显著的变化,此外,四参数模型增加了计算的复杂性,因而Barton和Lord认为不提倡使用四参数模型,这里要特别指出的是,Barton和Lord(1981)对四参数模型的观点也不是完全否定的。在该研究报告的最后一段话认为,如果高能力被试答错容易试题时,在正态肩形模型(单、两参数正态肩形模型)下不予以“原谅”,则可以使用Y参数为0.98或0.99的四参数模型作为特例(strong case)来特殊处理,可以纠正高能力被试答错容易试题时的能力估计“惩罚过大”的现象。可见Barton和Lord也部分肯定了在高能力答错容易试题时,四参数模型能够纠正被试能力低估现象。

Mislevy和Bock(1982)在单、两参数Logistic模型下,探讨了低能力被试依靠猜测答对了高难度试题(猜测现象)和高能力被试因为疏忽而答错了容易试题(睡眠现象)的情况,这时被试的能力估计值往往显得偏离过大,即高估或低估了被试能力。对于被试作答时存在的猜测现象和睡眠现象,Mislevy和Bock提出了逐步调整被试作答情况权重的方法,即被试所作答试题的难度b与被试自身能力估计值0之间的距离来给予被试作答情况不同的权重:(1)当b与0的距离较近时,给予被试作答情况较大的权重,当b与0的距离较远一些时,则给予被试作答情况较小的权重;(2)如果b与0的距离很远并超过一定范围时,则删除被试在该试题上的作答情况再进行能力估计,以减小能力估计的偏差。

2.2 对被试作答猜测现象和睡眠现象纠正的近期研究情况

从1980年代中期至2000年,对被试能力高估或低估现象的研究沉寂了一段时间。至2000年,美国高等教育年鉴报道,ETS曾经让参加CAT-GRE测试的大约0.5%的考生免费重考(Carlson,2000),许多研究者由此又开始关注被试能力高估或低估现象,认为E7S让考生免费重考可能是这些考生能力被严重低估而导致不可信,许多研究者已经对此问题进行了探讨,包括从改进选题策略、使用四参数模型的角度进行了研究分析。

2.2.1 改进选题策略的方法

改进选题策略的方法是主要是由Chang和Ying(1999,2002)提出。Chang和Ying(2002)认为2000年ETS的GRE CAT测验中被试能力低估,主要是CAT的选题策略存在设计误区。因为在使用传统的Fisher最大信息量的选题方法时,在测验的开始阶段往往就选择项目信息量最大的试题(即区分度较大的试题)给被试作答,这往往造成被试能力估计不稳定,被试能力估计值摆动幅度过大。Chang和Ying通过公式推导,发现初始估计不稳定表现在两个方面:一是,如果被试在测验开始答错了几道试题(开始测试时一般是中等难度试题),传统的最大项目信息量方法可能会将被试能力估计值向负方向推很远。即使被试在后面的试题回答正确,往往也很难在测验结束前将分数爬回到高分区,从而使得被试能力被低估:二是,如果被试在测验开始连续答对几道试题,传统的最大项目信息量方法可能会将被试能力估计值向正方向推很远。即使考生在后面的试题中答错了若干道试题,也有可能获得高分,被试能力被高估,Chang和Ying认为使用a分层最大信息量方法,在测验开始时,选择区分度较小的试题,就可以避免在测验开始时,被试发挥不佳而导致能力估计值摆动幅度较大的现象,从而避免被试能力被低估,Chang和Ying(2008)在2002年的研究基础上进一步论述了a分层最大项目信息量选题策略,并使用CAT模拟的方法进行分析,发现在CAT测验开始阶段使用项目信息量较小的试题的选题策略,可以减小被试能力估计值摆动的幅度,减小在初始阶段被试能力估计的均方误差RMSE和偏差Bias。此外,Rulison和Loken(2009)的研究也进一步论证了Chang和Ying的a分层选题策略的观点,Rulison和Loken的研究结果显示,当高能力被试作答出现答错相对容易试题时,a分层选题策略可以在一定程度上帮助被试能力估计值回到CAT模拟初值。在一定程度上减小被试能力低估现象的幅度,但是同时也发现,a分层选题策略的纠正作用远不及四参数模型的纠正作用。

2.2.2 使用四参数模型的方法

已有多个研究提出了使用四参数模型方法来纠正被试能力高估现象和低估现象。(1)戴海崎和简小珠(2005)分析了当被试答错相对容易试题(即存在睡眠现象),或被试答对相对高难度试题(即存在猜测现象)时,会导致被试能力的低估或高估现象;并提出四参数模型方法,以纠正被试能力低估或高估现象。(2)简小珠(2006),以及简小珠、戴海崎和彭春妹(2007)的研究中,在纸笔测验的形式下设计安排中等能力被试作答不同难度的试题(包括设计安排被试作答的猜测现象和睡眠现象)。在单、两参数Logistic模型下,发现被试能力估计值存在着第一未契合现象(其本质是被试答对高难度试题时被试能力被高估的现象)和第二未契合现象(其本质是被试答错容易试题时被试能力被低估的现象)。在四参数Logistic

模型下,c、Y参数可以有效纠正第一、第二未契合现象,也就是说,能有效纠正被试能力高估或低估现象。此外,r参数在0.70至0.98之间能有效的纠正高能力被试答错容易试题时能力被低估现象,如果Y参数进一步增大到0.999或0.9999Y参数的纠正作用将逐渐消失;c参数在0.30至0,01之间能有效的纠正低能力被试答对高难度试题时能力被高估现象,如果c参数进一步减小到0,001或0,0001,c参数的纠正作用将逐渐消失。(3)Rulison和Loken(2009)使用CAT模拟方法模拟了被试测试过程。在测验长度为30和45题时,(a)在二参数Logistic模型下,在测试开始阶段额外增加两道中等难度的试题并让被试答对,这时低能力被试和高能力被试的最终能力估计值受到的影响较小,然而,如果在测试开始阶段额外增加两道中等难度的试题并让被试答错,这时低能力被试的最终能力估计值受到的影响较小,而高能力被试的能力估计值在CA了的过程一直受到答错试题的影响,而且测验的最后能力估计值显著低于模拟初值;(b)在四参数Logistic模型下,在测试开始阶段额外增加两道中等难度的试题并让被试答错,这时高能力被试的最后能力估计值能顺利到达模拟初值,也就是说,高能力被试的最后能力估计值不再受到答错容易试题的影响,通过一系列的CAT模拟和比较分析,Rulison和Loken认为四参数模型下,能较好的纠正高能力被试答错容易试题时的能力低估现象,同时也能较好的纠正低能力被试答对高难度试题时的能力高估现象,因此建议在CAT研究与应用时使用四参数Logistic模型。

2.3 被试作答猜测现象和睡眠现象的纠正方法比较分析

由以上研究可知,针对猜测现象和睡眠现象(被试能力高估和低估现象),许多研究者提出了许多纠正方法,包括删除被试作答情况的方法、传统的纠正猜测现象方法、Jackknife方法、AMT-Robustified Jackknife方法、逐步调整被试作答情况权重的方法和使用四参数Logistic模型的方法等等。在这些方法中,哪些方法值得优先选择呢?本文认为使用四参数Logistic模型的方法是较优的方法,因为:(1)对被试作答情况进行删除或调整的方法(包括传统的纠正猜测方法,Jackknife方法,AMT-Robustified Jackknife方法,删除被试作答情况方法,逐步调整被试作答情况权重的方法),是针对被试作答的猜测现象或睡眠现象(被试能力高估或低估现象)采用的补救方法,这些补救方法往往会改变被试作答情况的原始信息,或者删除了被试作答情况的原始信息,也就是说,没有“尊重”被试原始作答信息,(2)改进CAT选题策略的方法(Chang&Ying,2002),仅是在一定程度上纠正CA7测试中的被试能力高估或低估现象,其纠正作用不及四参数模型,而且该方法仅适合在CAT测试,不适合纸笔测验:(3)使用四参数Logistic模型的方法,四参数模型中的c参数反映猜测现象,r参数反映睡眠现象,因而能适合被试作答的猜测现象和睡眠现象,能够从数学模型内部来有效纠正被试能力高估或低估现象,而不需要调整或删除被试作答的原始信息,使用四参数Logistic模型方法,可以有效纠正被试能力高估或低估现象,因而值得优先选择。

2.4 被试作答猜测现象和睡眠现象纠正的研究趋势分析

由以上研究,还可以归纳出以下三个研究趋势:(1)从研究分析的测验形式来看,从纸笔测验形式发展到CAT模拟测验形式,在早期,多数研究者都从纸笔测验形式的角度来分析的;近年来,出现了使用CAT模拟测验的方法来分析(Chang&Ying,2002;Chang&Ying。2008;Rulison&Loken,2009);(2)从研究对象的角度来看,从整体分析被试在测验上的作答情况,发展到单独额外增加猜测现象或睡眠现象的方法来进行研究。在早期,多数研究者是从纸笔测验整体角度来分析被试猜测现象或睡眠现象,猜测现象和睡眠现象混合在测验的整体作答情况之中,研究者往往只是从测验整体上进行大致的分析研究。而最近两个研究(简小珠等,2006;Rulison&Loken,2009)通过研究设计,额外安排被试答对高难度试题的现象(猜测现象),或安排被试答错容易试题的现象(睡眠现象),使得对猜测现象或睡眠现象的研究分析更具有针对性。由这两个研究的结果可知,猜测现象肯定会导致被试能力高估现象,睡眠现象肯定会导致被试能力低估现象,而在早期研究者从测验整体分析时,只是模糊的认为猜测现象或睡眠现象会影响被试能力估计,没有得出肯定的结论;(3)从纠正方法的角度来看,从调整或删除被试作答情况的方法,发展到使用数学模型的方法来拟合被试作答情况,早期研究者往往是提出调整被试作答情况权重的方法,或采用删除被试作答情况的方法,来纠正被试能力高估现象或低估现象。而最近研究者提出使用四参数模型宋分析被试作答时的猜测现象或睡眠现象,从数学模型内部来纠正被试能力高估或低估现象,此外,已有的这些研究都只分析了两级记分模型下被试能力高估和低估现象,而在多级记分模型下是否存在被试能力高估或低估现象?以及如何进行纠正?这有待于研究者进一步探讨分析。

3 人格测验中非0下渐近线现象和非1上渐近线现象及其纠正研究情况

人格测验有多种类型,这里仅论述常用的、测查人格病理倾向、在人格维度分量表上累加记分的人格测验,比如MMPI-2,艾森克人格问卷,16PF人格测验等一些常用人格量表。许多研究者都对人格测验的作假现象进行了研究,骆方和张厚粲(2007)概述了以往对人格测验作假现象控制和识别的研究情况,并概括了预防控制、识别作假现象的6种方法:采用迫选式量表、使用警告语、使用假渠道技术这三种方法是事前控制技术;社会称许性量表(作假识别量表)、IRT识别技术、反应时技术是事后识别技术。然而,(1)采用迫选式量表、使用警告语、使用假渠道技术存在以下不足:在测验采用迫选方式会改变正常的测验情境,而使用警告语或者测谎技术,很容易影响被试作答的情境(骆方,张厚粲,2007);被试在人格测验的许多作假行为有时往往是无意识的,自己都无法意识到,那么警告语和使用假渠道技术是无法完全预防被试作答的作假现象。(2)社会称许性量表(作假识别量表)、反应时技术,用于作为识别被试作假行为,往往只注重识别被试的作假情况;通过这些方法识别出来后的被试,其作答问卷可能会删除,或要求被试重测。通过IR了识别技术,通过统计检验方法,也只能识别到了一部分作假比较严重的被试,而一些被试无意识中在一部分试题的作假行为可能无法识别,也无法纠

正。近年来,已经有研究使用IRT中的三参数Logistic模型和四参数Logistic模型来分析和纠正被试作假现象,这些方法在骆方等的论文没有涉及,下面将具体论述。

Rouse,Finger和Butcher(1999)在分析MMPI-2量表时中发现,在攻击性量表和负性情绪量表上的c参数估计值较小,小于0.10;而在精神质、强迫症、积极情绪量表的c参数估计值较高,而都在0.10至0.25,部分试题的c参数在0.30以上。Rouse等对以上现象进行进一步对测验数据的数据分析,认为主要是社会期望导致测验中被试作答存在非0下渐近线现象。

Reise和Waller(2003)使用单、两、三参数Logistic模型来分析MMPI-2的测验数据,发现使用这些模型都不能很好的拟合测验数据,而且发现有些项目存在非1上渐近线现象,但由于当时没有的四参数Logistic模型数据分析程序,Reise和Waller使用转换被试人格特征性质方向的方法即三参数模型的转换形式来分析测验中存在上渐近线的项目的拟合情况。在该论文中的应用意义部分,Reise和Waller认为在四参数模型能较好拟合被试作答的非。下渐近线现象和非1上渐近线现象,因而四参数Logistic模型可能成为未来研究的一个热点方向。在最新的WINS了EPS软件说明书中(Linaere,2009a),四参数模型项目参数估计程序引用的例子即是Reise等的研究论文。

2009年,多位研究者的合作编著《以数学模型为基础的心理测量新方向》即将出版,其中的一章内容是Waller和Reise将四参数模型应用于MMPI-2的研究报告(Waller&Reise,in press),该研究论文认为Ba~on等对四参数模型的研究方法不当,论据不够充分。而且Waller等概述了IRT方法在人格测量的应用,并论述了四参数模型近年来在人格测验中的研究情况,该研究报告是对Reise等的研究的继续发展,Wailer等应用四参数模型来分析MMPI一2测验数据,发现能较好地拟合存在上渐近线现象的测验项目,Waller等将四参数模型与三参数模型进行比较:(1)在估计被试人格特征方面,三参数模型下高人格特征被试的人格特征值容易被低估,而四参数模型下则不会被低估,(2)在测验精度方面。四参数模型的测验信息量在低分段(即能力区间1-4,0])要高于三参数模型,测验精度略好于三参数模型。最后,作者还进一步论述了c、Y参数在人格测验中的必要性:一是人格测验项目存在着极端性(即存在非。下渐近线现象和非Ⅱ上渐近线现象);二是人格测验项目上存在的“非对称的项目特征模糊性”(non-symmetric item ambiguity),即人格测验在人格特征维度上的一端测量可以模糊,而在人格特征维度的另一端的测量要求精确(not ambiguous),这时需要c或丫参数来反映,以得到更精确的测量。

以上人格测验的研究中,都使用了三参数模型和四参数模型分析测验数据,并拟合和纠正被试“作假”现象(包括非0下渐近线和非1上渐近线现象),以实现较为准确的测量。当然四参数模型作为一种拟合和纠正被试作假现象的方法,与目前其他被试作假现象的控制识别方法一样,也还在不断完善中,有待于进一步探讨和发展。

4 被试作答异常现象纠正的实践意义与研究进展

4.1 在能力测验中纠正被试作答猜测现象和睡眠现象影响的实践竟义

2000年ETS曾经让参加GRE测试大约0.5%的考生免费重考(Carlson,2000),许多研究者认为很可能是被试能力被严重低估而导致不可信,2002年,ETS再次被报道在CAT-GMA7测验中,有将近1000人的考生的分数估计不准确(能力被低估),这将影响这些考生被一流MBA学院录用的机会(Merritt,2003)。Rulison和Loken(2009)在四参数模型下进行CA了模拟研究,在初始阶段安排高能力被试答错两道相对容易的试题后(被试作答睡眠现象),发现被试能够在后面的试题作答中使得被试分数能够“爬回来”,达到高分区,从而达到模拟初值,能够纠正被试能力低估现象,Rulison和Loken的CA了模拟研究为解决CAT测验中存在能力低估的问题,提供一个很好的思路与解决方案。

而对于在传统的纸笔测验中存在着被试作答的猜测现象和睡眠现象,这时可以应用四参数模型宋纠正被试能力高估或低估现象的方法进行纠正,以得到更为准确的测量分析。

4.2 在人格测验中纠正非0下渐近线现象和非1

上渐近线现象影响的测量义

人格测验所测量内容往往涉及被试个人敏感的问题,而又不存在正确的答案,所以被试很容易对人格测验作假。被试在有意识或无意识中隐瞒自己真实情况或者按照社会期望的要求来回答,以及一些其他原因导致了被试作假现象,由于被试作假现象的存在,严重影响了人格测验的有效性,甚至导致人们有时怀疑人格测验的有效性,对测验作假现象的预防控制、识别、拟合、纠正,是每一个人格测验在编制、施测、分析测验数据和报告研究结果时都必须考虑的。而近二三十年来在许多研究者的共同努力下,已经发展了多种方法来预防、控制、识别被试作假现象(骆方,张厚粲,2007)。而IR7中四参数模型方法是近年来逐渐被关注和发展出来的方法,可以用来拟合和纠正人格测验中的非0下渐近线现象和非1上渐近线现象,是人格测验中拟合和纠正被试作答异常现象的新方法,Waller和Reise(in press)认为,四参数模型能较好拟合和纠正人格测验中的非0下渐近线现象和非]上渐近线现象,因而使用四参数模型可以提高人格测量的精度。

4.3 近年来四参数模型的研究进展情况

四参数模型在1981年提出来后(Barton&Lord,1981,),很长一段时间里(]981-2003年)都被研究者所忽视;而在最近几年(1003~2009年),四参数模型的研究较为活跃,重新被研究者关注(Wailer&Reise,in press)。除了本文前面所论述有关四参数模型的研究之外,还有以下研究者对四参数模型也进行了探讨。

Linacre(2004)从被试作答的潜在特质似然比的角度,论述区分度、猜测现象、疏忽现象都是试题的属性,并探讨c参数、v参数的初步估计公式。

Hessen(2004)在分析Logistic模型分类时,以四参数Logistic模型为基础,认为三、两、单参数Logistic模型是四参数Logistic模型的一个特例。而且通过分析被试作答的潜在特质似然比,从数学公式和理论上分析了c参数、Y参数的有关性质。Hessen(2005)进一步探讨了c’0时的

四参数Logistic模型,即三参数Logistic模型丫型的形式,而且把四参数Logistic模型进行改写成一个非参数IR7模型的形式,并对该非参数模型的一些数学性质等进行了探讨,以及应用于项目功能差异(DIF)的分析。

Emons。Siitsma和Mei5cr(2005)论述单、两、三、四参数模型的一致性,认为单、两、三参数模型是四参数模型的一个特例,并分析测验项目拟合情况时,同时也发现测验中的许多试题存在着非l上渐近线现象。遗憾的是,Emons等没有对此测验现象进一步的探讨。或许是由于当时没有四参数模型的项目参数估计软件,因而Emons等(2005)没有进一步分析。

2006年,Loken和Rulison使用贝叶斯估计方法实现了对四参数模型的参数估计方法(Loken&Rulison。2006:引自Waller&Reise",io press)。而Waller和Reise(in press)则使用蒙特卡洛马尔可夫链方法(MCMC方法),即Gibbs sampler方法应用于BRUGS(Thomas,2006),实现了对四参数模型的项目参数估计。

最新的IR7软件WINS7EPS(Linacre,2009a)包含了四参数Logistic模型的项目参数估计模块,可以登陆其网站下载试用版本(Linacre,2009b)。W1NSTEPS可以处理的最大值为10,000,000被试30,000试题,255得分等级。对于心理与教育测量中的几百人被试,几十道试题的测验数据,可以WINSTEPS在几分钟内完成四参数模型下的参数估计。所以,有了四参数模型的项目参数估计软件后,过去四参数模型应用的主要障碍(项目参数估计的运算复杂性和费时)就不再存在了,

由此可见,四参数模型的研究在近年来较为活跃。多位研究者对四参数模型的性质进行了探讨,进行了项目参数估计的研究,并且出版了用于分析测验数据的软件WINS7EPS。为四参数模型的广泛应用提供了坚实的基础。

5 小结

在能力测验中,被试作答的猜测现象会导致被试能力高估现象,被试作答的睡眠现象会导致被试能力低估现象。对于测验中的被试能力高估或低估现象,研究者已经提出了多种方法来纠正。四参数模型能适合被试的各种作答情况(包括被试作答时的猜测现象和睡眠现象),不需要调整或删除被试作答的原始信息,从数学模型内部能有效纠正被试能力高估和低估现象,因此在能力测验的研究分析中,可以使用四参数Logistic模型的方法宋纠正被试能力高估或低估现象。

性格心理测试题范文6

【关键词】 公路工程 试验检测 现状分析 对策措施

通过试验检测能够直观的反应工程项目整体质量状况并能及时发现存在的问题及缺陷,以采取有效方案措施及时解决。但从目前来看,我国公路试验检测存在着诸多问题,具体表现在以下几个方面。

1 试验检测状况及存在的问题

公路工程试验检测是一项复杂的系统工作,从试验检测的人员状况、仪器设备、试验检测环境、资料档案等软硬件都有严格的要求,但从实际工作中来看来均存在着不同程度的问题:(1)试验检测人员匮乏,无相应的资格证书。工地试验室未按要求配备检测人员,无论从人员数量和素质上都达不到要求。许多检测人员、抽检人员都是随机上岗、临时聘用,有的甚至是刚从院校毕业的学生,既无从业经验更无相应的资格证书,也没经过试验检测培训,工作态度不够严谨,对试验检测不够认真,没有按规程要求对原材料一步一步进行,抽取的样品并不具备代表性,造成试验数据不够准确,有的检验报告还未出来,施工单位已进行了下一道工序,失去了检验的意义。(2)试验检测设备相对落后、陈旧、参差不全。施工单位未按合同规定配备试验设备或为节约资金,降低成本订购或租用价格低廉不符合要求的设备,其检测设备相对落后、陈旧、参差不全。从数量、质量或精度上满足不了试验检测规程的要求, 也未进行标定和校准,检测出的数据没有指导性可言。(3)试验室场地建设不符合要求。有些试验室整体布局和功能室分区不合理,面积不满足要求,阴暗、潮湿、采光不足,影响仪器精度,未按规定将不同的试验项目的仪器设备分别摆放。没有建立一套完整的试验检测管理体系。(4)存在一定的安全隐患。试验检测人员安全操作缺乏,存在危险的地方没有明显的警示标识,各种易燃易爆、有毒的化学制剂没有分类摆放也未隔离,常违规操作,无安全使用管理措施及突发事故应急措施。(5)相关的资料档案建立不完整。试验检测台账、原始记录不完善、随意涂改不规范。试验记录、报告、台帐相互不对应,存在弄虚作假的现象;试验报告中签字与原始记录中的试验人员不符。

2 原因分析

(1)工地试验检测与现代施工水平不相适应。当前我国正处于公路大发展时期,机械化程度提高,工期紧进度快,而试验检测方法仍处于传统的检测手段,检测效率低下,不能满足进度的要求,在新形势下利用新技术新检测设备如目前较先进的无损检测技术,提高检测效率,提高试验精度以避面试验检测人员因工作量大,劳动强度高而编造数据。(2)试验检测专业技术人才缺乏。当前公路工程试验检测行业有经验的常年从事检测工作的检测师少、持证人员少,二者都具备的试验检测师尤其短缺。持证人员“挂证”现象突出“有证的不在岗,在岗的没有证”。(3)对试验检测工作的重要性认识匮乏。一些项目负责人对试验检测工作的重要性认识匮乏,由于利益的驱使和经验主义忽略了试验检测对控制工程质量和指导施工的重要性,建立工地试验室成为履约、应付检查,成为工程交验出具“合格”数据的手段。(3)片面追求经济利益、力求效益最大化。个别项目负责人由于过多地追求经济利润减少成本,认为试验检测是花钱找麻烦的,不是挣钱的。往往在试验仪器设备配备、场地建设方面投入不足,不按规定定期做好仪器的计量、标定校验工作,另一方面,现在的抽检频率是否合理也值的思考,很多试验室仅仅去做“资料”这一项,就是一份繁重的工作,为了满足“数据”的数量,根本没有时间去进行真正的试验,加重了个别不诚信的检测机构为降低成本而少做甚至不做试验就出具报告的现象。(4)检测单位内部管理体制不规范。一些检测单位管理松散,内部管理制度不健全,分工不明确,技术投入不足,致使检测人员没责任心、责任心不强,没有很好地履行自已的职责,造成各种资料档案不完善、不真实。

3 需采取的措施及建议

针对当前试验检测工作中出现的问题,提出一下几点解决措施:(1)加强合同管理落实合同要求。一是招标文件中明确规定项目实施必须配备的试验监测人员的数量、素质及对试验环境的要求;二是将项目的试验检测费用单独列出来和施工安全投入费一样作为评标的重要依据;三是加强施工进场管理,试验室配制不符合合同要求的坚决不让入场。(2)明确职责,强化试验检测管理。交通部《公路水运工程试验检测管理办法》的颁布,对我国公路工程试验检测管理工作起到了极大的推动作用,贯彻落实该办法做到职责明确,工作有目标、有计划,有组织,有检查,有反馈使整个试验检测管理工作形成系统高效的机制。(3)合理确定工地试验检测频率,适应公路建设市场发展。目前,随着社会发展科技进步,施工机械化程度较高、质量均匀性较好,现有规范规定的试验检测频率确实偏高,大量的试验检测工作难以完成、频繁的破损检测对项目使用性能不容忽视。(4)建立健全试验检测制度及程序。施工单位应建立健全试验检测制度程序,并遵照执行。制度及程序一定要在相关的标准基础上建立,并根据工程的实际情况有目标的制定,发挥制度的有效可执行性。(5)完善试验检测师考证制度。当前试验师考证制度只重视理论考试,忽略了实际操作的重要性,可对当前试验检测考证制度进行相应改革,要求参考人员必须具有试验检测培训证,当前的培训班基本都是以快速考证为目的,以理论培训为主,对实际操作基本没有涉及,质检部门可举办一些实用性强,以实际操作为主的试验检测培训班,培训合格并取的培训证的人员才能参加检测师考试,这样能大大提高检测人员的实际操作能力,使理论和实际不至脱节。(6)推行第三方试验检测制度。第三方检测又称公证检验,是第三方检测机构以公正、权威的非当事人身份,根据有关法律、标准或合同进行的检验活动。推行第三方检测制度是试验检测未来发展趋势。如我局于2010通过招标承但的天水-庄浪二级公路改建工程中,承但着庄天二级公路改建工程工地中心试验室,组织机构齐全,设主任、技术负责、质检负责和检测室负责人等,按照试验室质量管理体系和程序文件进行分工管理,责任到人。中心试验室正常运行费用由业主承担,是业主直接领导下的工地中心试验室,履行业主对施工单位工地试验室监管职能和抽检责任,代表业主对原材料、工程实体等进行检测。由于作为第三方的工地中心试验室和施工单位无直接利益关系,试验检测结果客观、公证、可靠,庄天路建成通车已一年多了至今未发生质量事故。

上一篇醉翁亭记

下一篇元旦祝福语