您现在的位置:普通话学习网 > 信息资讯栏目 > 普通话测试研究 > 正文

关于普通话水平测试内容与方法的思考

来源:普通话学习网    时间:2006-06-26

提要:普通话水平测试实行数年来的实践积累了丰富的经验,实践证明现行的《普通话测试大纲》的基本原则与指导思想是科学的。任何首创性的工作都是在不断探索与总结中获得完善的,经验的积累与总结为我们今天从理论与方法上对这一首创性的工程方案提出修改与完善提供了必要性和可能性。本文联系广东省近年普通话水平测试的实践,拟从理论与实际的结合上对现行测试方案的内容与方法进行剖析,并针对现行测试方案中尚存在的待完善的问题提出个人的修改建议。
关键词:普通话水平测试 总体构架 分值比例 

自国家三部委发布《关于开展普通话水平测试工作的决定》、国家语委发布《普通话水平测试实施办法》(试行)以来,普通话测试工作在全国全面展开,取得了可喜的成绩,我们不但建立了一套工作大纲与检测方法,而且培养了一支具有实战经验的测试队伍。七年来的工作实践证明,这项工作是非常必要的,它受到了全国各条战线上的普通话应用工作者的普遍肯定。

语言测试工作本身是一项科学含量高、方法细致的动态测评工作,国外亦处不断探索、完善的过程中。普通话水平测试工作的开展在我国是一项首创性的工作,无论在理论上还是方法上,均处在试行的起步阶段,七年来的实践和探索为我们积累了宝贵的经验,这是我们今天有可能对这项首创性的工作作出丰富和发展的基础。

一、关于普通话水平测试总体构架的思考

我们是身处一线的测试员,数年的测试实践告诉我们,设计词语、朗读、说话三个相互衔接的测试层面是科学的,把握了普通话测评的基本规律。评分方法的设计也具有可操作性。就总体而言,现行测试大纲的总体构架是基本合理的,但仍有进一步调整、完善的必要。

我们认为在目前普通话水平测试的总体构架上,对试项的设置与总体分值比例的设计两个方面尚存在修改的必要,具体建议如下:

(一)、关于重新调整测试项目的建议 

建议保留“词语”、“朗读”、“说话”三项测试内容,撤销“判断”项,加大“说话”项的测试比重。其理由有四:

1、“判断”项包括常用词语选择、量词选择、句式选择三部分,涉及词汇、语法两方面内容。从理论上说,这套试题库应涉及全国各片方言与普通话间有差异的词汇与语法内容才是科学的,因为被测人员来自于全国各方言区,方言覆盖率是100%,而现有试卷中该套试题方言内容的覆盖面还是相当窄的。方言与普通话的对比研究是一项专业性较强的工作,就目前我国现有的方言研究成果来看还远不能满足这一要求。

2、方言词语与普通话词语间并非都是一对一的关系,如普通话的常用程度副词“很”做状语时可对应吴语的“交关”,但作补语时情况就不完全一样。普通话“胖得很”是一般说明;吴语“胖交关”一定是比较说明(比以前、比他人),且不用助词“得”,对译成普通话的意思是“胖得多”。“交关”在广州话中的词义有两项:①表示程度深;②厉害。该类细微的对应差异如何在卷面的词语选择中准确落实不是一个简单的问题。另外,方言中的很多使用频率极高的词语是无字可写的,要将这些都落实到卷面上,难度是可想而知的。

3、设计这些对比判断的目的是为了检测特定方言区应考者的规范判断能力,其目标十分具体。要达到这一目的,试卷的设计必须具有很强的针对性,从道理上说应当因人而宜,起码是因方言区而宜。如果做不到这一点就不能保证该项测试基本目标的落实;要落实这一目标,在目前确实有较大的资源困难。即使依靠各地高校的科研队伍弄出一套选择试题库,也与目前抽签选题的方法相矛盾(抽签选题是任意的,没有明确的目标)。广东省语委近年一共组织进行了十三批测试,每一批应试者的来源都比较复杂,几乎遍布全国各大方言区,母语各不相同,如何保证该项选择测试的针对性,实际操作实在有较大的难度。

4、目前该项选择的内容完全是以书面形式呈现的,在我所接触的测试对象中,几乎每一个人都具备较理想的书面阅读能力,绝大多数应试者都能拿到该项测试的满分,这中的一个重要原因是他们可以凭借规范的书面语习得作准确的判断。卷面呈现的绝大多数方言词语和语法形式在他们的阅读经历中从未出现过,也就是说,应试者从小到大很少具备方言书面语的语感,因而正确选择也就不成问题了。一句话,该项选择往往不是应试者直接依凭普通话口语语感作出的判断,因而设立该项选择的意义就不是太大。

(二)、适当调整总体分值比例的建议

目前《普通话测试大纲》(以下间称《大纲》)规定的分值比例是这样的:一、读单音节字词10分;二、读双音节字词20分;三、朗读30分;四、判断10分;五、说话30分。其中一、二项纯属语音(音节和音节连读)分值,第五项说话的语音分值也占20分,只有第三项朗读所占的语音分值不好确计。我们不妨用排除法对第三项的语音分值作大概的估计:该项一共有6个评分标准,只有2(漏读增读)、4(停顿、断句不当)、5(语速过快或过慢)、6(超时)不属语音(音节和音节连读)考察,若以该项的总分减去非语音考察分即是该项的语音分值。假定一个中等程度的应试者参加测试,一次漏、增读8个字(应该不算少了)扣0.8分,停顿、断句不当5次扣5分,语速过快或过慢与超时各扣1分,非语音扣分累计也只7.8分。该测项共30分,扣除7.8分,该测试者的朗读测项中语音分值仍有22.2分,占该项总分的74%。如果将五项测试内容中的语音分值累加起来,共计72.2分,这一分值比例就约近于普通话水平测试总分的3/4了。如果刨开判断项10分,纯语音(音节和音节连读)考核分值占普通话水平测试总分值的80.2%,只有19.8%是考察语音之外的普通话内容,这一比例显然是值得商榷的。我们都知道,规范语音并不是普通话的全部内容,我们也从未见过一个只教普通话声韵调和音节发音的老师能真的教会学生说普通话。普通话的内涵包括语音、词汇、语法三个有机联系的部分,普通话水平测试实际是一个人普通话交际应用能力的测试,过分地偏于语音权重显然容易忽略应试者实际“能力”的考察,从而“水平”的检验也就难以落实了。

当然,语音的考核还应该是测试的重要内容之一,音节和音节连读是起码的基本功,可是孤立的音节与语流中的音节并不是同一回事,前者是相对静止的、死的,后者是流动的、活的。在具体测试中我们常常发现,有些应试者在读词语时很顺利,几乎挑不出什么大毛病,可一旦进入说话项时就几乎成了另一个人:当他顾及到语音时就话不成句、断断续续,当他顾及到表达连贯时就方音百出,这证明规范语音的真正掌握也必须在活的语流之中。上述现象具有一定的普遍性,其根本问题正是缺少普通话交际的实践,而普通话水平的衡量恰恰应该是普通话应用能力的衡量。

根据上述理由,我们的倾向是从测试的总体权衡上减少字词项的分值比例,扩大说话项的分值比例,取消“判断”项,将该项的分值移入“说话”。

二、普通话测试分项设计的思考

(一)、“读单音节字词”与“读双音节词语”试项设计的思考

1、存在的问题

在数年的测试实践中,我们接触了数百份不同的试卷、上千名测试对象,我们认为这两个测试项尚有以下几个问题值得讨论:

(1)、此两项卷面的设计对普通话声、韵、调的覆盖率均有一定的要求,而异读现象却是普通话不可回避的事实。在双音节词语中因为语素的相互制约,异读受到控制,可在单音节字词中完全没有制约的条件,只要是异读就存在一定的任意性。1985年修订的《普通话一读词审音表》共收异读字256个,看似不多,但在现有卷面上出现的频率却并不低,试以《普通话水平测试大纲》中“读单音节字词”的两份样卷为例:Ⅰ型样卷除去轻声异读外,尚有洗、炸、思、沙、亲、胖、空、分8个异读字;Ⅱ型样卷除去轻声异读外,尚有缩、思、撇、臊、否、蚌、晕、巷、佛、上10个异读字,占10%。按Ⅱ型卷声母的出现率1-7次、韵母的出现率1-5次来衡量,10%的比例足以左右单音节字词声韵母规定的覆盖率。

(2)、字是书写用的符号,作为书写形式的汉字与口说的普通话本身并没有直接的关系, “民”、“言”、“语”、“习”、“丰”等均是大家再熟悉不过的字,尽管如此,这些“字”在正常的普通话语流中从不会单独使用,独立出现在普通话中的只能是词语。既然这些“字”不会在普通话中单独出现,那么这些非普通话成分也就不宜作为普通话测试的内容。阅读《大纲》的Ⅱ型样卷第一试项,卷面共出现旅、思、镖、否、暂、凝、罐、翁、巷、庸、迥11个普通话不能独立成词的单“字”,这说明我们在该考项的设计上还有欠科学的成分。

(3)、一、二两个试项除考察应试者语音的规范程度外,我们认为还应该将他们规范阅读的熟练程度纳入考察的内容。目前两个试项的规定时间分别都是3分钟,在我们的评考经验中,最快的应试者78秒读完第一项,43秒读完第二项;最慢的应试者也用不完3分钟,可见3分钟的时限规定太宽,无法区分应考者规范的熟练程度。

2、改订建议

鉴于上述原因,我们提出如下改进建议:
(1)、建议在调查研究的基础上做出适当的规定,将试项一卷面出现的异读单音节词限制在一定的比例范围内(完全回避不容易办到),以避免对声韵母覆盖率产生明显的影响;
(2)、建议针对各方言区的语音特点,适当增加该方言与普通话读音差异较大的声韵母覆盖率的指数;
(3)、建议将测试第一项的名称改为“读单音节词”,取消普通话中不能成词的单音节字。
(4)、建议将该两项的阅读时限分别由3分钟改为两分钟。

(二)、“朗读”试项设计的思考

1、存在的问题

目前朗读试项在设计上的主要问题是与词语考核项的界限不清,《大纲》虽明确规定“重点测查连读音变、语气、语调,以及停顿、断句、全篇朗读语速和流畅程度”,但在操作上实际仍以语音分值为主(前面用排除法计算的一个中等水平应试者的该项语音分值占74%),所以造成了语音考核项外延的扩大、朗读考核项自身考核中心的不明。

朗读形式介乎语音词汇与表达之间,就其在普通话教学中的功能而言,它是词语连读向句子和说话过渡的桥梁,所以应当保证朗读测试自身的测查中心,并在合理的分值权衡中予以落实。

朗读的基本结构单位不再是词语,而是句子,它由句子、句群、段落组成篇章。与一、二项词语考察相比,它具备语义重音、语气、语调、停顿、节奏(语速及流畅程度)等内容,这些都是说话必备的基本表达手段。与说话相比朗读有文字凭依,内容是现成的,应试者只是以规范的表达手段再现文章,而说话是应试者个人即兴能动的发挥。鉴于这些特点,朗读应该是在规定的语流中对应试者的语音与必备的表达技术作综合测查,显然不应该与词语试项重合。

2、改订建议

为落实朗读考核合理的测查目标,我们建议:

(1)、在语音测查的同时,保证语义重音、语调、语气、停顿、节奏等普通话必备的基本表达成分测试分值的落实,并按语音与基本表达成分并重的计分原则予以合理规定。

(2)、测试实践告诉我们,朗读试项的语音计分方法不宜重复词语项一词一记的方法。朗读已进入了语流阶段,音节的流动速度大体是词语项的三倍到四倍,即使是最优秀的测试员也难以在不停息的语流中作逐音节判断。测试员若将主要精力集中于逐音节的判断,那就根本无精力再顾及到其他,这是很简单的道理。我们并不难想象目前测试员们在该试项实际操作中的无法超越的顾此失彼状况,因此其测试结果也就不难理解了。

我们认为,在该项的活语流中测查应试者的语音情况是必要的,因前提与内容的变化,该项与词语项的检测角度也应有所不同。我们建议该项宜舍弃逐字测检的方法,重点考察应试者在朗读语流中存在的语音系统上的问题,按类别问题的轻重作出区分,并以适当的规定从总体上对朗读语音加以把握。这一方法不但合理而且便于操作。

(3)、对朗读的时限作重新规定。电台播音员正常的播音速度平均每秒3.5个音节(包括停顿在内),如果平均语速慢于每秒2个音节就已经不是正常的语流。《大纲》规定400字的朗读时限是4分钟(合2400秒),平均每秒1.7个音节,显然低于正常语速。朗读项本身包括流利与否的考察,应试者起码应该具备正常的语速。在我们测试的实践中从未遇到过该项测查超时的现象,因此,该项的时限应改作3分钟较为合理。

(4)、宜保证朗读形式的相对完整。朗读的开头、过渡、结尾各部分是一个有机的组合体,相对完整是朗读表达形式的特点,尤其是朗读篇章的结尾,它一般都是全文内容的总结,文义往往集中体现在末段的句意与语气上。《大纲》目前的规定是“以前400字为准”,翻阅50篇短文,其中的48篇由双斜杠从句中将文章切开,两篇从段落切开,这就从形式上破坏了朗读内容的完整。试想,每一个应试者正读到句子中间时,忽听到测试员喊“停!”,这是什么滋味?不难理解,该项的设计从一开始就是以音节考核为出发点而不是朗读测试本身,故而不得不牺牲朗读的完整而以字数为限。维护朗读内容的相对完整实际是维护该测试项面貌的完整。

我们认为,如果采用语音系统错误判别的记分方法,那就可以相对摆脱严格字限的困扰,再对现有朗读篇章进行适度的加工节选,使我们能在较为完整的形式中判断应试者的朗读水平。

(5)、“漏读增读”的扣分不宜一概而论。50篇短文本身的文字就有明显的高下之分,即使是当今的经典作品也有版本的不同。对于大部分不曾有朗读实践的应试者来说,鼓励他们以流利的普通话朗读才是目的,流利与一字不拉不增是矛盾的,即使优秀的播音员有时也难免不经意地增、漏。我们认为,如果应试者在不影响原句意的前提下漏、增个别字,应该是无碍大体的,可不予扣分;如果漏、增字明显影响朗读句义,那当然另当别论。

(6)、《大纲》后附的朗读篇目宜作适当整理。目前所选的50篇短文朗读难易度悬殊较大,有些选篇的文字并不规范,有些文章并不适宜朗读。为维护《大纲》的权威性,我们建议对朗读选篇作重新筛选,在考虑规范性、经典性、可朗读性、难易适度的同时,一并考虑篇章的相对完整性。

(三)、“说话”试项设计的思考

1、存在的问题

“说话”试项的测查目标是应试者凭借自己的语言思维围绕一个选定的命题作规范表达的水平,即普通话应用的能力。这里应该包含三个考查内容:一、语言(包括语音、词汇、语法三方面)规范程度;二、对命题表达中心的把握程度;三、表达流利程度。无论从理论的角度还是从应用的角度分析,“说话”试项都不应该是前三项考核内容的重复,它应该是对应试者运用规范的现代汉语作命题达意能力的综合考察,不但检测应试者在随机表达中的普通话面貌,更重要的是要测查应试者普通话的应用水平。语言说到底不过是工具,普通话亦如此。工具与技能并不是一回事,工具再精致,如果不能按一定目的付诸运用,当然也就不能体现工具的价值,“说话”试项规定各种命题的目的正是要求应试者围绕某一个特定的中心作即兴表述。如果我们忽略了普通话应用能力的考察,只注重普通话这一“工具”的形式,实际上是离开了“说话”试项的考察中心。

根据“说话”试项应该具备的考核目的,我们认为该项目前有以下几个问题值得商讨:

(1)、过分偏重于语音考察会忽略普通话应用能力的测试。目前“说话”项的分值规定是:语音标准度20分,占该项积分的67%;词语、语法规范度5分,占16.5%;语言流畅度5分,占16.5%。如果将前两项分值合并,“说话”规范度的积分是25分,占该项考核总分值的83.5%,属于普通话应用能力考察的分值只占16.5%,对规定的命题内容(表达中心)没有作任何要求。严格地说,这已不是普通话表达水平的考察,而是普通话形式的考察。大家都知道,说话是一种交际表达行为,其目的是为了传递语言信息,世界上没有一种语言表达可以离开表达内容而能独立呈现,脱离表达内容的“说话”是不存在的。也只有在规定的内容中,我们才有可能测查应试者实际的“说话”水平,“命题”说话正是对应试者能否围绕一个指定中心作普通话应用的能力的检测,以防止应试者凭依事先准备好的文字作背诵表述。如果对此没有任何要求,《大纲》则完全不必作命题规定,听任应试者随意,这显然脱离了“说话”试项的预定宗旨。

(2)、缺少双向交际,应试者的“听”话能力始终得不到检测。目前“说话”的主要形式是单向表达,《大纲》虽提及“必要时辅以主试人和应试人双向对话”,因未作任何硬性要求,“对话”在测试实践中基本不用。因为是单向表达,且《大纲》对说话中心没有任何要求,应试者完全有充裕的时间在应试前准备几份机动的文字稿,考试时背诵或在背诵时稍加变化即可过关,即使“文”不对题,考官也没有任何扣分的依据。

在近年的测试实践中我们还奇怪地发现,很多应试者同一话题的内容几乎千篇一律,开头、结尾一模一样。原来市面上如今出现了各种各样的普通话水平测试指导书,《大纲》所列的所有话题在这些“指导书”中都有现成的文字答案,应试者完全可以照文背诵,以应付测试,可见仅凭单相交流已不再是考察说话能力的有效方法。
对于大多数人来说,双向交际是他们日常生活中的常用表达形式,双向交流有灵活多变的特点,听、说相间,便于更真实地测查应试者的实际普通话水平。从科学的角度说,“说话”不但要包括述说能力的测试,而且也要包括听话能力的测试,而听话能力在应试者的单向表达中是永远无从体现的,这也说明“说话”试项在设计上必须增加双向交流的内容才具备科学的考察信度。当然,这就对测试员的业务能力提出了更高的要求。

2、改订建议

依据上述原因,我们对该试项的设计提出如下建议:

(1)、在总体设计上将“说话”分为“单向表述”与“双向交流”两项,时限各为两分钟。两项测试分值并重,在测查内容上两项可相互参照。

(2)、单项表达不应只局限于命题表达一种形式,比如,在具备语音室或放音设备的条件下,可集中听一段录音,然后围绕这段录音分别从不同角度给应试者提出问题,让他稍稍准备后,作两分钟的阐述。这样不但有“说”,而且兼顾了“听”的考察。

(3)、区别“说话”与一、二、三试项的测查重点,压缩语音测查的分值比例,确定 “规范”内容检测与普通话应用能力检测并重的评分原则,并将“命题中心把握能力”的考核内容置于表达应用能力之中。

(4)、语音规范内容的测查同样舍弃逐字判断的方法,建议以系统错误与缺陷作为扣分的依据(参照“朗读”项的计分建议)。

三、关于试行初级、高级两步测试方案的建议

通过调查我们获得这样一组数据:广东省现有中小学普通话应试教师约100万,按现有测试速度计算,要完成100万名中、小学教师的测试任务需要8年时间。如果将全省的国家机关工作人员、行业服务人员包括在内,测试任务起码要增加10倍,这就不能不使我们思考目前的测试效率与测试进度,何年才能完成广东省的测试任务?

这里还有另一组数据:广东鹤山市2001年共测1241人,其中一乙1人(占0。08%),二甲80人,二乙464人,三甲614人,三乙82人。一乙以下共1240人,占总比例99.92%(其中三甲人数最多,614人,占总比例的49.4%)。惠州市2001年共测3248人,一乙1人(占0。03%),二甲142人,二乙1382人,三甲1667人,三乙56人。一乙以下共3247人,占总比例的99.97%(其中同样是三甲人数最多,1667人,占总比例的51%)。广州市2001年共测11652人,一乙31人(占0.27%),二甲2066人,二乙4864人,三甲4415人,三乙276人。一乙以下11621人,占总数的99.73%。即使是通过精心推选的广东省测试员培训班学员,2001年度一乙以上(包括一乙)的通过率也只有25.8%。测试实践证明,广东地区绝大多数被测者的普通话水平均在一乙以下。目前《大纲》只有一套测试方案,其测查的精密度以一甲为目标,而对于绝大多数被测人员来说并不需要这样高的精密度,所有被测者不必一律要经历“单音节字词”、“双音节词语”、“朗读”、“判断”、“说话”5项测查程序。为节省人力资源、加快测试进度,我们建议宜将整个测试分成初级测试与高级测试两个阶段,以现有的测试程序为“高级测试”方案,然后再简化内容,适当增删“词语”与“说话”两个试项,重新设立“初级测试”方案。“初级测试”方案同样以“三级六等”分级,按100分考计。每个被测者必须首先经历“初级测试”阶段,“初级测试”达到二甲以上者,方可有资格进入“高级测试”阶段。这样,总体测试进度可提高数倍。多年的测试实践告诉我们,二甲以下的应试者往往通过词语试项的考察即可有把握对其普通话所属的等级作基本的锁定,所以,我们提出增设“初级测试”方案的设想不但有实用的依据而且有可行的依据。如此不但可以大大提高整个测试的进度,而且两次测查可以有效地保证二甲以上的测试质量。

(暨南大学中文系 伍 巍)