时、度、效范文

2024-07-26

时、度、效范文（精选10篇）

时、度、效第1篇

关键词：三个突出,舆论引导,媒体融合,政府部门,新闻应急,时效度

随着人类社会进入数字化时代的步伐加快, 社会生活的信息化、网络化、数字化、智能化、媒体化程度越来越高, 信息技术、媒介手段、传播方式越来越先进, 从而对社会运行和大众生活的方方面面产生越来越大的作用和影响。移动互联网技术日新月异的发展与突飞猛进的进步, 致使各种新媒体 (如自媒体、小众媒体等) 不断涌现, 并且出现媒体与媒体之间 (如传统媒体与现代媒体、主流媒体与非主流媒体、大众媒介与小众媒介) 不断融合的趋势。尤其以互联网和信息行业高度发达为基础的大数据时代, 带给媒体本身和大众思想的冲击与影响更大更多、更广泛更深刻, 唯有放弃残缺守旧思想、大胆接受崭新挑战, 才能与时俱进、不断提升。而迎接和策应大数据时代的到来, 也必须高度重视和积极响应媒体融合的趋势与潮流。

但与报纸、杂志、期刊、广播、电视等传统媒体不同, 一些新兴媒体 (如博客、播客、微博、微信等) 的发布门槛较低、操作运行简单、审核把关微弱, 甚至出现“任意攻讦, 肆意谩骂”的价值偏离和“随心所欲, 为所欲为”的恶性苗头。这种放弃“把关人”的地位或者丧失“监管权”的做法, 往往导致虚假信息的传播或者不真实内容的散布, 再加上与主流思想、正面舆论相悖的各种观点、言论在新媒体上交互叠加, 使得不少有害的乃至有“毒”的信息在自媒体上“任性”散播。以至于在某一时期内一些错误舆论、反动思想占据上风, 甚至抢占了舆论话语权的高地, 将正能量的舆论和社会主义核心价值观挤进了“逼仄的舆论角落”, 形成了负面的社会效果和民众动员力。进而严重干扰依法执政、司法公正、民族团结、社会稳定及和谐社会构建, 导致了人们的思想混乱和社会矛盾的激化。

由此可见, 整合开发和高效利用媒体资源为新闻宣传与舆论引导服务, 需要深入思考与不断实践。科学合理综合运用文字、声音、视频、图片等媒体要素讲好中国故事、展现中国精神、树立中国形象、弘扬主旋律以及创新新闻写作模式与叙事方式方法, 需要不断改革与大胆探索。培养多元实践型、创意创新型的新闻复合人才, 需要积极尝试与敢于革新。顺应传媒集团逐步向融媒体方向靠拢的新媒体时代, 需要主动适应与开拓进取。因此, 在舆论引导的实施过程与具体实践中, 要牢牢把握和遵循习总书记提出的思想宣传工作的“时、度、效”原则, 以“三个突出”为“指针”切实把握好舆论引导的方向与质量。

一、突出“时”字, 确保“首发”定调

根据传播学的“首发效应”理论, 即首发信息, 容易让受众形成先入为主的第一印象或刻板印象, 并且以后很难有所改变 (即使改变也会大打折扣, 仍残留着第一印象或受第一印象的左右, 好比民间所说的“做坏一件事要做好十件事还不一定能够挽回”) 。[1]在高度发达的互联网时代和新媒体运行及其信息发布模式面前, 政府部门作为舆论引导的主体或者说主导者, 绝不能容许“谣言满天飞、真相未上路”的情况出现, 绝不能容许政府无可奈何、媒体无所作为和群众成为“沉默的大多数”的现象出现。所以, 必须高度重视舆论导向作用, 认清和把握舆论引导在信息时代的规律与特点。

(一) 舆论引导注重时间节点

舆论引导重在早、贵在快、强在速度、赢在效率, 特别是面对突发事件、应急事件、危机事件等特殊情境, 更要快速反应、研判准确、“亮剑”精准、处置得当, 第一时间做好新闻应急工作、第一时间启动舆论引导预案。政府及其相关部门要牢记面对舆情“捂”不住 (“盖子”总有被揭开的一天) , 处置事件不能“拖” (久拖未决处理更难、麻烦更大) 。与其被动不如主动, 与其压制不如疏导, 与其掩饰不如坦诚, 用理性态度、科学观点消解偏激的情绪、固执的偏见, 让错误的价值观念、不实的谣言蜚语没有生存的土壤和流传的环境, 从而牢牢把握舆论的话语权、信息的权威性, 掌控舆论引导的主动权和主导权, 确保先声夺人、权威公信的“首发”效应, 最终赢得社会和群众的理解、信任和支持。

(二) 舆论引导注重“首发”效应

在总揽全局和统筹兼顾的基础上, 政府及其相关部门要切实掌握好民意的集中方向、洞悉舆情的发展走势, 实时监控和总体掌握舆情民意的走向与动态, 坚持“真相要说出来、真理要大声讲”的原则, 确保“首发”定调、权威发布, 突出“实效性”、凸显“及时性”, 以便抢占话语先机和占领舆论制高点。当然“首发”定调, 不是盲目定调、胡乱定调、仓促定调、轻率定调, 更不是像一些媒体那样不顾一切“抢发”新闻、争夺“眼球”, 片面地只注重时间不顾及效果, 偏颇地只注重速度却忽略质量, 而是建立在科学认识、整体掌控、确实了解事件真相的基础上, 避免误传信息、以讹传讹, 积极消除误导、消解隔阂, 尽最大可能减少或减轻损伤政府部门公信力的行为与言论, 自觉维护党和政府的权威和形象。

(三) 完善和深化信息公开制度

政府部门必须确立“信息公开”为常态的理念, 树立由“管理型向服务型转变”的信念, 大力落实政府信息公开条例, 创新新闻发布的机制体制, 强化和培养新闻发言人制度及其队伍建设, 深化信息公开的各项制度。政府及其部门在具体操作和实施过程中应该而且必须做到:不断完善信息公开制度, 不断深化阳光政务改革, 不断推进透明政府进程, 并将常态性发布、制度性发布作为政府信息发布的重点, 做依法执政、民主行政、以人为本、为民服务的表率。

二、突出“度”字, 避免“过激”反应

随着政府信息化建设水平的迅速提升和透明政务的深入实施, 在媒体融合的媒介环境下, 网络 (电子) 参政议政成了扩大民主范围、拓宽监督渠道的有效方式与手段, 不仅为政治民主输送强大的社会动力, 也为政治决策营造良好的心理环境, 更集中民智民力于国家现代化建设。特别近几年来, 网络 (电子) 问政在民主生活、政治视域中的作用愈来愈凸显, 但也出现了一些“过激”现象或“偏激”倾向。例如, 某负面舆情一出, 整个舆论呈现出“一边倒”的形势, 没有调查、没有论证、没有研究就轻易下结论, 不问青红皂白、不管三七二十一立马给该事件 (或其人物) 定性, 站在道德批判的高度予以指摘, 而后却发现仓促草率中所下的“舆论”与客观事实相差甚远、真实真相与新闻报道背道而驰。尽管媒体或记者进行了声明道歉并在后续报道予以了更正, 但仍就给当事人 (或当事单位) 造成了难以估量的负面影响和声誉损失, 造成了难以愈合和弥补的伤害。又如, 与政府或官员有关的某事件一经报道, 当事人马上就被处罚甚至被免职, 还没有经过调查取证就匆匆下结论, 不管是对是错都“先打一棍子”, 相关部门希望以这种“从重从速处罚”的“表态”来平息舆论“井喷”、避免舆论扩大、事态升级, 制造一种积极与媒介合作、主动接受媒体监督的姿态, 这反而引发或加剧了民众对相关部门矫枉过正、反应过激或内存“猫腻”的质疑。上述种种行为, 是融媒体背景下新媒体在实施媒体监督时的一种越位和不正常的现象, 值得警惕, 应该避免。媒体监督固然重要, 然而媒体监督或者说网络 (电子) 问政, 不能取代司法公正、依法行政, 更不能凌驾于法律法规之上。因此, 在舆论引导和监督中, 把握好“度”、拿捏好“分寸”、控制好“火候”, 则显得尤为关键和相当重要。在危机事件、突发事件、紧急事件的新闻应急与舆论引导的处理中, 必须坚持法治精神和依法原则, 既不能遮掩护短、也不能过分反应, 以免造成舆论的“二次危机”和将舆论引导误入歧途、走向极端。总之, 一定要保持舆论导向的正确“轨道”和精准“航线”, 以平静心、平常态和规范化、制度化的原则把握好“度”的“节奏”、“进退”与“取舍”, 杜绝非理性行为和凌驾法律行为, 才能维护舆论的正常秩序和进行正确的舆论引导。

三、突出“效”字, 重在“效果”明显

(一) 敢于面对, 积极作为

面对大众舆论尤其是紧急、特殊、突发的民意与舆情, 如果一味“封、堵、躲”、一直“压、瞒、欺”, 只会做“埋头鸵鸟”、“甩手掌柜”、“太极高手”, 不会做“灭火器”、“解压阀”、“消气孔”, 就很可能引发公众信任危机, 导致群众对政府和领导干部的怀疑与否定, 将政府的威信与领导干部的威望送上“媒体审判” (如“人肉搜索”、“集体吐槽”) , 只会造成更加严重的后果与难以收拾的局面。其实, 问题发生了或矛盾出现了, 要敢于正视问题、勇于承担责任、积极寻求科学有效的解决方式和化解方法, 加强与媒体的沟通、主动与媒体的交流、学会与新闻记者打交道, 认真开展舆论引导和新闻应急的各项工作, 有针对性地迅速果断予以处理、科学高效予以处置, 而不是不管不问、任其发展, 更不是恶意干涉、封锁压制, 甚至威逼利诱、触犯法律。

(二) 依法依规, 合情合理

在各种舆论危机事件的新闻应急处置的过程中, 既要做到合情合理、又要保证合法合规, 坚持法理、情理“两条腿”走路。特别地, 政府及其相关部门或领导干部个人, 要通过对各类新闻宣传与舆论事件的反思反省, 审问为人民服务的原则坚持没坚持、群众路线教育实践活动落实没落实, 审视自己的理想信念坚定不坚定及各项工作完成得好不好。换言之, 抱着有则改之、无则加勉的态度, 该澄清事实的澄清事实, 该表明态度的表明态度, 该拿出措施的拿出措施, 该整改的立即整改, 该抓落实的抓落实。一般而言, 初期以表态为主, “快说经过、慎报原因”, 平息质疑, 平缓情绪。中期以跟进为主, “边做边说、公布措施”, 赢得理解, 赢得信任。后期以修复为主, “亡羊补牢、自查自纠”, 争取主动, 争取认可。[2]如果做得到位、处理得当, 甚至可以使负面新闻发挥正面作用, 化被动为主动、化腐朽为神奇, 使舆论监督成为促进各项工作改进的重要契机, 将本是负能量的事件转化为正能量的结果。最终, 以积极的姿态, 赢得媒体的信任与尊重;以主动的作为, 赢得群众的认可与尊敬。

四、小结

融媒体时代是一种媒体传播的质变, 在信息发布与传播高速快捷、全息个性的媒介环境下, 人们在思想活动中的独立性、选择性、多变性和差异性更加明显, 核心价值观的普及与宣教难度加大, 作为舆论引导主体的政府部门舆论导引的难度亦相应增加。[3]而做好舆论引导工作、提高掌控舆论能力是搞好执政党建设和提升政府运用新媒体能力的应有题中之义:要进一步提高政府规范媒体与导向舆论的能力, 以提高驾驭各种信息传播、舆情调控、民意监测、新闻应急等复杂局面的能力——这也是党和政府新时期执政理念的全新表达和新闻宣传思想工作的内在要求。

习近平总书记在全国宣传思想工作会议上指出“要抓好理念创新、手段创新和基层工作创新, 把握好新闻宣传的时、度、效”。[4]他反复强调“新闻宣传与政治思想工作一定要把围绕中心、服务大局作为基本职责, 胸怀大局、把握大势、着眼大事, 找准工作切入点和着力点, 做到因势而谋、应势而动、顺势而为”。[5]因此, 在融媒体“新常态”的条件与背景下, 把握舆论引导时效度的关键在于:强化媒体信息监管, 探索舆论引导机制, 努力提高新闻宣传的质量和水平, 增强思想工作的吸引力和感染力, 让群众对新闻宣传爱听爱看、产生共鸣, 对舆论引导接受认可、信任遵从。其中, 特别要充分发挥党报党刊等主流媒体正确舆论导向作用, 持之以恒, 久久为功, 以积极的心态和满满的正能量, 充分发挥正面宣传鼓舞人、激励人、提升人的作用。

参考文献

[1]汪家驷.论突发公共事件的报道[J].新闻战线, 2010 (4) :1.

[2]潘熙宁.舆论引导怎样把握“时”“度”“效”[N].光明日报, 2015-5-7.

[3]尹章池, 赵旖.融媒体时代传媒产业的现状以及发展对策[J].今传媒·传媒大讲坛, 2013 (4) :14-15.

[4]庹震.抓好“三个创新”提高工作水平[J].求是, 2013:18.

时、度、效第2篇

关键词：舆论传播；因子；建模机制；平衡

中图分类号： G206 文献标识码： A 文章编号： 1673-1069（2016）27-95-2

0 引言

在信息技术飞速发展的今天，舆论的形成以及可能发展的方向已变得更加复杂和不可预测，各种各样的传播媒体对舆论形成、传播以及演化的影响也越来越大。舆论传播自身所带有的复杂性、多元性、隐蔽性以及媒体所拥有的经济效益等因素的存在为舆论隐患埋下了种子。随着舆论在社会公共事件中扮演的角色越来越重要，舆论传播中所存在的隐患势必会影响到社会的安定与团结。如果不对舆论传播过程以及引导过程进行研究，不及时洞察舆论形成、传播及其引导规律，任其肆意发展将会给社会带来不可预知的灾难性的后果。因此本文试从舆论形成以及舆论引导的角度出来，通过建构“时、度、效”传播模型来研究舆论形成及引导的规律。

1 “时、度、效”因子对舆论成型的支撑解析

中国人民大学陈力丹教授认为：舆论是公众关于现实社会中的各种现象、问题所表达的信念、态度、意见和情绪表现的总和，它具有相对的一致性、强烈程度和持续性，对社会发展及有关事态的进程产生影响。①

什么是“时”？什么是“度”？什么是“效”？三者之间存在着什么样的关系？了解时、度、效三个维度，是舆论引导的重要基础。“时”即时间维度。无论是新闻传播还是更深层次的舆论引导，把握好“时”至关重要。这里的“时”，既可以是时间，也可以是时机。 “度”即方法维度，就是要注意舆论引导的尺度，要选择在恰当的时期做恰当的事，保证舆论引导适度而不过度。“效”即效果维度，就是要竭力追求舆论引导的效果，不断强化舆论的传播力和影响力②传播学研究者把大众传播效果类型分为：无变化、小变化、结晶、强化和改变五类。

舆论的“时、度、效”三个维度显然并不是独立存在的，它们之间是相互关联的。在新闻实践以及舆论引导活动中，要将三者有机地统一起来。在传播学视阈下，时，解决的是新闻主题或舆论主题的针对性、贴近性问题；度，解决的是新闻传播与舆论引导的科学性问题；效，解决的是新闻传播与舆论引导的传播力、引导力、有用性、影响性的问题，三者统一于一个完整的传播过程之中。③

因为舆论“时、度、效”三个维度共同作用才有舆论传播的价值，所以换句话说“时、度、效”三者共同作用于“价值”。根据数理逻辑思维，整个模型中一共有4个因素：时、度、效、价值，其之间的关系可以用公式来表示即：时+度+效=价值。顺着这个思维可以尝试把这个公式转换为一种立体的图形，即四面体。这个四面体的具体参数为：A面：时、B面：度、C面：效、D面：价值。其中X、Y、Z表示时、度、效三维度相互关系所构成的夹角，而三个夹角共同决定了D面，即舆论传播的价值。三个夹角的度数越大，则舆论传播的价值也就越大；三个夹角的度数越小，则舆论传播的价值也就越小，而夹角的度数并没有一个极值。因此，寻找一个合适的平衡点就尤为重要。在四面体中，正四面体最为特殊，它是由边长完全相等的四个等边三角形所构成。在正四面体中，所有的夹角都为60°，当然，X、Y、Z的度数也为60°。这也正是理想中的、完美的“时、度、效”与“价值”的运转结构模型，因为这样所构成的模型使得“时、度、效、价值”四要素间达到了一种完美的平衡，而舆论传播的价值就在于“平衡”，“平衡”才是王道。但在事物发展的过程中，不平衡是绝对的，平衡是相对的，因此要努力把握舆论传播的价值，不断追求舆论引导的“平衡”。

2 以“时、度、效”因子形成的舆论传播建模研究逻辑

在舆论“时、度、效”模型中设计为一个空间四面体其A、B、C、D四个面分别代表时、度、效、价值，时、度、效三者所构成的夹角为X、Y、Z。该模型为理想状态中的完全静止的正四面体模型，但运动是绝对的，静止是相对的，在突发性公共危机事件中，舆论引导的“时、度、效”并不是完全不动的，而是不断变化的。舆论引导要根据事件发展的具体状况，因时制宜，调整“时、度、效”，从而不断追求永恒的价值。价值是不变的，平衡是最终的实现目标。为实现舆论引导的价值即平衡的状态，议程设置是不可或缺的手段和方法。议程设置理论中的三个议程的行为主体分别为：媒体、公众、政府。

媒介议程正处于公众议程和政策议程的中间点，这是理想中的在两者之间保持平衡的位置，中间点即是最佳的平衡点。在这个位置上，媒体在使用议程设置进行舆论引导时，既不偏向于公众的一边，也不偏向于政府的一边，从而成为完全中立的角色，客观公正地依照事实情况进行舆论引导，其地位超然于二者之外，真正成为“第四权力”。但实际情况并非如此，由于政府对于媒体的影响力、媒体自身利益诉求等因素的存在，媒介议程并不能完全做到客观公正，超然于物外，它势必会偏向一方，或偏向于公众议程，或偏向于政策议程。根据黄金分割比例，当媒介议程位于某个临界点时，同样能够达到平衡，而这也是实际生活中舆论引导的平衡点。进一步对该问题进行延伸，当我们引入黄金分割比例时可能会出现：

黄金分割比例认为，当整体“1”中达到0.618，就能够产生对整体的决定性的影响；而达到临界点的另一半。即达到0.382，则可以使整体感觉到一种重要影响的存在。由这个理论可得知，当媒介议程位于0.618时，即媒介议程偏向于政策议程时，媒介议程、公众议程、政策议程达到实际中的平衡；当媒介议程位于0.382时，即媒介议程偏向于公众议程时，三者同样达到实际中的平衡。

当媒介议程偏向于政策议程时，媒体就从属于政治系统，受到政治系统的支配，就会宣传塑造政府形象，传播政治信息，提高政府的权威性，增加公众对政府的认同感与信任度，维持政府的合法统治，从而最大限度地保持价值体系和意识形态的一致与完整，维持社会秩序，加强凝聚力，保证社会的平衡稳定发展。

3 在舆论传播建模研究中追求社会平衡的价值

平衡，是指两个或两个以上的力作用于一个物体上，各个力相互抵消，是物体成相对静止的状态。世间任何事物都有平衡的特点，“物极必反”“过犹不及”“相生相克”等都是平衡的表现，其中任何一部分的变化，都会导致另一部分产生相应的变化，从而形成新的平衡。在人际传播关系理论中，无论是纽科姆的传播平衡模式理论，还是海德的平衡理论，都强调了平衡的重要性，突出了平衡的价值。而舆论传播的价值就是平衡，平衡既是一种舆论价值，也是一种社会价值。

3.1 舆论的价值与社会的价值之间存在稀疏关联

“舆论是我们的社会皮肤。”这个观点来源于诺依曼所著的《沉默的螺旋：我们的社会皮肤》，它强调了舆论的社会控制功能。诺依曼认为只有那些被认为是多数人共有的，能在公开场合表明的就是舆论，如与之相对就会有遭到制裁的危险。舆论就像是天秤中的砝码一样，努力地维持社会和个体之间的平衡。平衡不仅是舆论引导所要追求的价值，也是社会努力维系的价值。

3.2 舆论传播的多维空间可以为社会发展提供动力

舆论是社会中普遍成员参与社会管理的一个主要途径。社会的变动关系个体成员的切身利益，为向管理阶层表达自身的利益诉求，个体会不自觉地利用舆论团结大多数有共同利益诉求的个体，向上反映自己的心声。就如同东汉末年以及宋朝时期的士大夫公共批评运动，为挽救国家危机，士大夫阶层自觉团结在“意见领袖”的周围，向统治者发出自己的诉求，利用舆论来推动政府政策的改变，推动社会的发展。所以，就像李普曼所说的：舆论中的普遍参与和公共批评是社会发展的动力，舆论传播的多维空间可以为社会发展提供动力。

3.3 舆论在上、下行公共空间中展示社会平衡因素

哈贝马斯所定义的公共领域包含着三个方面的要素：公众、公众舆论、公众媒介。公共空间中必须要形成公众舆论，这种公众舆论的意见可能是一种，也可能是多种。同时公众舆论要代表公众的意见，公众利用舆论向上表达诉求，反映社会中存在的各种问题，以影响决策者，维护公众利益。因此舆论是社会中公共空间的确定方式。同时舆论也在上、下行公共空间中扮演着平衡的角色，它不仅是自上而下的权力部门向公众的舆论传播，而且也是自下而上的公众以强大的社会舆论影响和引导政府向公众期望的方向发展，从而使舆论成为国家或社会链接个体或群体的桥梁。

基于数理逻辑思维，通过建立舆论“时、度、效”传播模型，描述了“时、度、效”三个维度的运转机制，证明了平衡在舆论引导中的重要性。平衡不仅是一种社会价值，也是一种舆论价值，是舆论引导始终追求的价值目标。平衡不是完全意义上的两者之间的中间点的完美的平衡，这是理想中的平衡，而是根据实际情况所做出的权衡。理想中的平衡并不存在，存在的是实际中的平衡。这就要求我们在实际的新闻传播和舆论引导的过程中，要根据现实的需求，制定合理的舆论导向策略，不能搞“一刀切”“一锅端”。

舆论传播的建模机制能够尽可能地描述舆论传播中诸多的动量因素。本文所建构的模型比较基础和简单，对于许多动量因素并不能兼顾，只能描绘小部分的动量因素。对更多更复杂的动量因素的描述，需要建立更多更复杂的模型机制，通过模型来深入直观的探讨舆论引导规律。

注释

①卢毅刚，《舆论学教程》，郑州大学出版社，第二版，第19页。

②李朝晖、赵彦莉、李军松，传播学视阈下高校网络舆论引导的时、度、效，广西社会科学，2014（8）。

③张勇峰，舆论引导“时、度、效”方法论研究论纲，现代传播，2015（10）。

参考文献

[1] 张勇峰.舆论引导“时、度、效”方法论研究论纲[J].现代传播，2015（10）.

[2] 张洪超，吴青熹.在舆论引导中把握好时、度、效[J].新闻与传播研究，2013（12）.

[3] 陈争.浅析新闻宣传“时、度、效”[J].东南传播，2015（3）.

听力测试效度和信度的研究(英文) 第3篇

Language testing and language teaching are inseparable;i offers goals to practical teaching and realistic basis for teachers and students to achieve these goals.Only high-quality language test can well reflect the effect of language teaching,play a good backwash and help to realize the goals of language teaching.Lis tening is an important language skill and an important measure o the individual comprehensive language ability.Listening is there fore an important part of language teaching.Listening test is an evaluation of the level of the students’listening ability.A highqualified listening test can enable students to have a real knowl edge of their listening ability,but also allows teachers to guide their teaching practice according to the feedback information o the testing results.

2 Reliability and Validity of Language Testing

2.1 Reliability

Test reliability is indispensable for any test.Bachman de fines reliability as“consistency of measurement”(Bachman,L.F&A.S.Palmer,1996).In other words,it is the“consistency o test scores”.Heaton explains the detailed process in this way:re thing all the time,otherwise,if the test is administrated to the same candidates on different occasions then,to the extent that it produces different results,it is not reliable”(Heaton,J.B.1988).Three important factors are contained in reliability:the reliability of the test itself,the performance of the candidates from occasion to occasion and the reliability of the scoring.It is impossible to eliminate inconsistencies entirely.“What can be done is to try to minimize the effects of those potential sources of inconsistency,through test design”(Bachman and Palmer,1996).A lot of people list some factors which may influence the reliability of a test.The following is a summary of the factors affecting the reliability:1)the content of the sample of the material for testing;2)the conditions under which a test is administered;3)test instructions;4)different markers;5)the occasions on which the markers mark the paper.

If a test is not reliable we cannot know the students’true language ability.So reliability is a very important factor of any kind of a good test.There are some methods proposed by Hughes to make test more reliable,such as,1)taking enough samples of behavior,2)writing unambiguous items,3)providing explicit and clear instructions,4)ensuring the tests are well laid out and perfectly legible,5)making students be familiar with format and testing techniques,6)providing uniform and non-distracting conditions of administration,7)making comparisons between candidates as direct as possible,8)providing a detailed scoring key,9)identifying candidates by number,not by name,10)employing multiple and independent scoring,etc.

2.2 Validity

“The validity of a test is the extent to which it measures what it is supposed to measure and nothing else.Every test,whether it is short,informal classroom test or a public examination,should be as valid as the constructor can make it.The test must aim to provide a true measure of the particular skill which it is intended to measure”(Bachman,L.F.&A.S.Palmer.1996).There are five types of validity:face validity,construct validity,concurrent validity,predictive validity and content validity.

Face validity refers to the tests“surface credibility or public acceptability”.The role of face validity could not be neglected at all.It can guide the students how to take the test and balance the statistical analysis.Moreover,a test which has good face validity can maintain the students’motivation,because most students will try harder if the test looks reasonable and clear.If a test looks messy and unclear,students will feel confused and repulsion for it.The test lacking face validity will have bad effect on the students’mood and attitude.As a result,the students will not put maximum effort into performing the tasks set in the test:hence the reliability of the test will be reduced.

Construct validation is the process of gathering evidence to support the contention that a given test indeed measures the psychological construct the makers intend it to measure.It can measure some specific characteristics in keeping with a theory of language behavior and learning.Construct validity is the meaningfulness and appropriateness of the interpretations that we make on the basis of test scores.And this definition of construct validity is used to refer to the extent to which we can interpret a given test score as an indicator of the ability or construct we want to measure.The word“construct”refers to any underlying ability(or trait)which is hypothesized in a theory of language learning.As a result,two factors will decide the degree of construct validity,the purpose of a test and the theory on which the test is based.

The concurrent validity is to use a recognized,reputable test of the same ability to the same persons concurrently or within a few days of the administration of the test to check the validity of a target test.The resulting correlation provides a measure of the concurrent validity of the test.Predictive validity concerns the extent to which a test predicts candidates’future performance.The procedure is to compare test scores with those on another measure obtained later.Predictive validation takes time to assess.Content validity refers to whether or not the content of the test is sufficiently representative and comprehensive.There are some ways to achieve high content validity:1)make a careful analysis of the skill or an outline of the course,then decide what to cover;2)decide the proportion of the representative sampling of the content to be covered,the importance of the different areas,the classroom hours devoted to them and the difficulty level of each of them;3)make sure that important areas are adequately represented.

If we put a lot of efforts on designing the exams,but we don’t achieve the results we expect and the students also fail to know their real language ability according to the test,we may feel sad about it.So we must pay more attention on the validity of a test.There are some factors threatening validity.Professor Gui Shichun once mentioned nine factors that influenced validity:1)unclear directions on the test,2)vocabulary or syntax,3)inappropriate level of difficulty of test items,4)poorly constructed test items,5)ambiguity,6)test items inappropriate for the purpose of the test,7)test does not have enough items for objectives being tested,8)improper arrangement of items,9)identifiable pattern of answers

3 The Problems in Listening Test Design

Because of its inherent limitations,the type of questions in listening test is always single.The number of subjective questions is relatively small.Multiple-choice questions are designed primarily to examine student’s mastery of language.The multiplechoice question mainly tests the students’knowledge of the language and ability to identify and guessing,so it can only test the ability to identify accepted language.On the one hand,the subjects relying on speculation or exclusion(e.g.eliminate the interference term)to get the right answer could not show that the subjects has mastered the language and can use it.On the other hand,even if the subjects choose the correct answer on their own ability of language,he may not really can master and use the language.In other words,the results tested by multiple-choice questions can not completely reflect the actual language ability of the subjects,while pragmatic competence determines the true level of English language learners,so there will be the phenomenon that the subjects’actual score is different from their real language ability.So ignoring the pragmatic competence will affect the reliability of the test.Dictation test involves multiple comprehensive skills,including listening comprehension,listening memory range,spelling,identification segment and familiarity of grammar and vocabulary,etc.But the dictation test just focuses on the students’ability to identify the form of linguistic knowledge,and can not judge their language use ability and innovative ability when combined their linguistic knowledge with the contextual features.

4 How to Deal With the Problems

Scientific and reasonable test will have a positive backwash to teaching,so that language teaching and language testing can promote each other.For the above-mentioned problems in listening test,how can we truly realize the unification of reliability and validity of it?In fact,the language test is mainly used for testing the subjects’ability of using and accepting a particular language.As a form of language test,listening test demands the subjects with the following language skills:comprehend the main idea of the explicit or implicit conceptual meaning expressed;have a rele vant judgment,reasoning,extension;understand the speaker’s in tentions,ideas,and attitudes;be able to distinguish language from the continuous discourse;can recognize pronunciation and intonation and so on.Therefore,the test designers should have a clear understanding of the criteria of listening test to improve the testing system and reasonably design all aspects of testing practic es.In the test design process,we should note the following points:

Firstly,determine testing methods according to the purpose of testing.Different linguists have different definitions of listening comprehension skills.Rost’s listening skills include:distinguish different languages;know the words;identify stressed words and phrases;identify the language function(such as gratitude)in the conversation;combine language cues and auxiliary language cues(such as intonation,accent,gestures,facial expressions,etc.)to help understand;use background knowledge and context to pre dict and confirm word’s meaning;be able to recall importan words,topics and the central idea;can give the speaker reason able and appropriate feedback;can repeat or rearrange the con tent of the speaker’s discourse.

Secondly,the testing materials should reflect the genera communicative function,and the vocabulary involved should be the high-frequency spoken words.Thus the listening test materi als must be the oral English rather than written English.

Thridly,The content of the test materials should suit sub jects’learning hierarchy,life experience,age and other character istics.The readers of the recording should be native speakers o English.

Fourthly,the types of questions should be various,and the language should be succinct.Reduce the subjects’amount o reading.

Fifthly,the subject should be designed with pertinence.Ac cording to Rost’s recommendations,the designer can refer to the following:1)listen to the most obvious words in the semantic group;2)listen to the difference between tone of voice;3)guess the meaning of new words from the context;4)judge the relation ship between people and the events according to the words;5recognize the omitted part of the sentence;6)understand the com municative function of discourse;7)understand the speaker’s po topics;9)understand the conversational style differences and inter-cultural differences in the conversation;etc..

Sixthly,Control the time of listening test,usually 20 to 30minutes.

Seventhly,Audiometric equipment availability.

Lastly,timely analyze the test results,pay attention to the backwash effect of the test.

5 Conclusion

The improvement of listening ability of English has become an important aspect of English teaching.Listening testing,as a means of measuring listening comprehension,must be valid,reliable and feasible.In other words,the test designer in the design of listening tests is required to balance test validity and test reliability and reasonably design the tests in order to achieve the purposes of English listening tests.

摘要：听力测试是语言测试的一个重要组成部分。在听力测试的设计中,试卷设计者应该将信度和效度结合起来。该文对测试的两个重要因素——信度和效度进行了研究:解释了信度和效度的概念,影响信度和效度的因素,在听力测试设计中经常出现的问题以及如何解决这些问题。

关键词：听力,测试,信度,效度

参考文献

[1]Bachman L F,Palmer A S.Language Testing in Practice[M].Oxford:Oxford University Press,1996.

[2]Heaton J B.Writing English Language Tests[M].London:Longman,1988.

[3]Bachman L F.Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,2002.

[4]Rost M.Introducing Listening(Penguin English Series)[M].England:Penguin,1994.

[5]Li Xiaoju.The Science and Art of Language Testing[M].Changsha:Hunan Education Press,1997.

[6]刘润清,韩宝成.语言测试和他的方法[M].北京:外语教学与研究出版社,1999.

[7]Lei Xuemei,Zhu Jing.On Reliability and Validity in Lan guage Testing[J].重庆邮电大学学报,2007(6).

[8]赵成发.谈语言测试的信度与效度.[J].西安外国语学院学报,2000(1).

[9]Lyle F B,Adriab S P.Language Testing in Practice[M].上海:上海外语教育出版社,1997:85-231.

提高科学实验教学效度初探第4篇

【摘要】在深化小学科学课程改革过程中，科学探究往往流于形式，很难有深度的思考参与。小学阶段的科学探究虽然知识层面浅显，依然需要深入有效的探究，使学生思维的深刻性得到训练。那么如何使得科学探究更加深入？文章从灵活整合教材，实验材料准备，探究时间保证等方面进行了探究尝试。

【关键词】科学实验整合教材实验材料自主探究

科学探究是科学课堂的核心环节。提高课堂教学中科学探究的有效性已经成为当前深化小学科学课程改革的关键和根本要求。那么如何使科学探究更为有效？具体从以下几方面进行尝试探索。

一、灵活合理整合教材内容，更便于学生深入有效地探究

所谓“打破砂锅问到底”就是一种深入性的探究，我们的科学探究不妨也来个“打破砂锅问到底”。苏教版的教材图多字少，这是它的缺点也是优点，它给了教者和学习者更多的想象发挥空间，要求教师要有“用教材”而不是“教教材”的意识。那么又该如何把探究进行到底呢？

小学四年级上册《物体的形状改变以后》一课中，教师在课程设计中将教材的内容进行了拓展深入，增加了对橡皮筋拉伸的探究。课堂上，教师带领学生探究了拉力与弹簧拉伸长度之间的关系并发现了弹力规律，但没有满足于此，而是进一步研究了拉力与橡皮筋拉伸长度之间的关系。学生发现后者并不像前者那样有规律可循，当然这并不是教师所满足的设计意图。于是教师进一步让学生分析比较这两个实验中的弹簧和橡皮筋的拉伸有什么不同，最后学生发现了拉力与橡皮筋的拉伸无规律的原因。无疑在这节课中学生的探究是深刻而有效的，学生的思维是有深度的。

又比如四年级《加热和冷却》一课，教材中分别探究了固体、液体、气体的热胀冷缩性质。而教师在设计课时将对液体的研究单列出来，专门研究了“液体的加热和冷却”，将探究放在一个单一的主题上面，更利于进行深度挖掘。从最常见的水入手，再到其他各种常见液体，如酒精、油、洗洁精、果汁，由特殊到一般，使学生认识到大多数液体都有和水一样的热胀冷缩的性质，学生的认知程度也会随着探究的深入而深入。

这两节课通过对教材的合理整合和拓展，把学生的探究推向了有效和深入。笔者记得看过一幅漫画，画中有一个挖井的人，东挖挖西挖挖，挖了许多坑，却一处也没挖出水来，其实有许多坑只要再坚持挖几下就能出水了，而他却放弃了，不得不替他惋惜。我们的科学探究也要以此为鉴，只有认准了目标再深度挖掘，才能有更多的收获。

二、准备好实验材料，为深入有效的探究提供物质基础

没有材料就没有经历。所谓实验材料就是经过了精心设计，同时有着丰富内在联系的材料，是蕴含着某些关系和规律的典型教学材料的组合。教师利用实验材料可以為学生创设问题的情境，激发学生的探究欲望。

例如，苏教版三年级上册《神奇的水》一课，在探究水的毛细现象时，教师为学生准备了粉笔、纱布、餐巾纸，还特别将一块玻璃片、两块玻璃片分别放在了不同的组。结果关于水是否能顺着玻璃片往上爬则出现了两种完全相反的结论。这极大程度上激发了学生的探究欲望。正当两种意见相持不下的时候，教师选两组学生上来把刚才的实验在展示屏上再做一遍。于是学生发现了问题所在：原来水能顺着玻璃往上爬的是两块玻璃。这时教师进一步引导学生比较一块玻璃与两块玻璃的区别，学生很容易发现两块玻璃夹在一起形成了缝隙。这个认识正好触及了问题的核心，就此联系其他三种材料，学生对水的毛细现象有了深入地认识。

又比如在探究导体和绝缘体时，教师在不同的小组分别放了涂绝缘漆的钢尺和没涂绝缘漆的钢尺。当实验现象出现矛盾时，学生在对比中进一步发现了漆也是绝缘体。

以上两个例子中，教师仅仅是在实验材料上做了有针对性的安排，就使得学生的探究自然而然地推进深入，也使学生学会了透过现象看本质，使学生思维的深刻性也得到了训练。可见有结构的实验材料既能弥补学生感性认识的不足，又能激发学生探究的欲望，进而提高教学效果。

三、给学生充分的自主探究时间，为深入有效的探究提供保证

学生在动手操作的过程中，还要不断地尝试错误，其间，学生的思维在逐渐地发展，在操作材料的过程中有时会产生顿悟。这一过程需要时间，教师应该根据课堂教学的时间，设计探究活动的时间，如果设计得恰到好处，教师就不必督促学生，以免扰乱学生的思维，影响探究的实效性。

比如在《吃什么》一课中，教师引导学生在组内、班内两个层次来统计喜欢吃的食物，观察统计结果，并且思考和讨论是否最喜欢的食物就含有所有的营养，促使学生意识到：没有哪种食物含有所有的营养，食物要均衡、全面，不挑食，不偏食。还可以对统计的每一种食物进行分类，分析每一种食物所含有的营养成分。因此，在这一环节我给予了学生充足的时间和空间，让他们静心统计，仔细观察，充分讨论，正确分析，深刻体会。这样铺展开来，挖掘下去，能够充分展现这一活动的价值。学生在充分的活动中产生了很多思维火花，有了很多的收获。

总之，科学探究要真正做到深入有效，需要教师充分发挥自身的教学智慧，合理整合和拓展教材，并尽可能地为学生创设条件，从符合学生心理和行为特点的要求出发，在实验操作、深入思考、教学组织等方面多用心关注细节，同时也积极为科学探究的课外延伸给予支持和引导，从而真正实现科学探究的有效深入，凸现科学课堂的独特魅力，做到科学教学的精彩演绎。

【参考文献】

时、度、效第5篇

在我国的教育背景下, 考试仍然是检测学生学习成果以及教师教学水平的重要手段, 而试卷则是其中必不可少的测量工具。中考更是如此, 关系到考生的未来。一份好的中考试卷是决定中考到底能在多大程度上考察学生水平的基础。在平时的教研活动中, 教师也应该学会用相应的统计软件, 对试卷进行合理的解释分析, 不仅能够帮助自己更好的把握设计试卷的原则和注意事项, 而且对于之后的教学工作也起到了很好的指导作用。2009年是河南省中考英语试题改革的第二年, 对中考英语试卷进行分析, 能够帮助英语教师更好地掌握信息, 在教学中采取合理的应对措施。本文简单介绍如何运用SPSS软件对河南省2009年中考英语试卷的信度和效度进行分析, 以期能够帮助广大一线教师掌握试卷的定量分析技术, 增强运用科学手段解释考试结果以及从考试结果中提取有用信息的能力。

1 效度和信度概念的界定

1.1 效度

效度是指测量工具对测量对象的测量能力, 也就是说, 测量工具可以在多大程度上测量所要测量的东西。在社会科学研究中, 通常使用两种方法确立测量工具的效度:测量证据和统计证据。用逻辑证据来来确立效度就是证明测量工具中的问题与研究问题是否合适, 而用统计数据来确立效度则是通过一定的计算提供硬证据来证明问题与研究目的的关系。

效度可以分为内在效度 (internal validity) 和外在效度 (external validity) 。

内在效度是指存在于测量工具本身的效度, 它包括内容效度 (content validity) 和结构效度 (construct validity) 。

内容效度涉及量表项目或问题的关联性以及量表的覆盖范围。判断测量工具是否测量了想要测量的东西, 主要依据是问题与研究目的之间的逻辑联系。项目和问题必须覆盖需要测量的事物或态度的整个范围, 从这点来评判测量工具的项目就是内容效度。此外对测量的事物或态度的覆盖必须平衡, 也就是每一个方面必须用类似的, 足够的问题或项目呈现出来。

结构效度不是指测量工具的结构, 而是指以它为基础的理论结构。结构效度的建立依赖于统计方法, 它是由每一结构对观测对象的整个方差的贡献来决定的。

外在效度是指利用测量工具以外的标准, 即外在标准验证而得以证实的效度, 它包括预示效度 (predictive validity) , 和共时效度 (concurrent validity) 。预示效度的判断是根据测量工具能在多大程度上预示结果, 而共时效度的判断则是根据一种测量工具与另外测量工具同时使用时进行的比较。

1.2 信度

信度是只测量工具测出的结果具有一致性和稳定性的特性。如果测量工具有一致性和稳定性, 那么测试结果就是准确的, 也是可以预测的, 就可以说测量工具有良好的信度。测量工具的一致性和稳定性程度越高, 信度也就越高。

确定测量工具信度的方法多种多样, 如评估者之间的信度 (inter-rater reliability) , 再测信度 (test-retest reliability) , 复本信度 (parallel form reliability) , 拆半信度 (split-half reliability) 和Cronbach alpha系数等。这些方法可以分为两大类:外在一致性程序和内在一致性程序, 也可以成为外在信度检验方法和内在信度检验方法。其中外在信度检验方法是通过对累计检验结果进行比较来验证测量的信度, 包括对再测信度, 复本信度的检验;而内在信度检验方法则是指测量同一概念的不同项目之间的一致性, 包括拆半信度和Cronbach alpha系数检验。而本次研究正是采取了对Cronbach alpha系数的统计来实现对本套试卷的内在一致性的检验的。

2 研究过程

2.1 研究对象及方法

对象选取河南省安阳县某初级中学毕业班40名被试的模拟考试成绩为研究对象, 为了尽可能减少人为阅卷的差异, 在整个阅卷过程中, 要求教师严格依据试卷的评判根据标准答案及评分标准进行流水作业。得到成绩并审核后, 按预先设计进行编码、录入, 全部数据用SPSS13.0 for Windows进行统计分析和管理。

2.2 试卷结构及基本信息分析

本试卷共由7道大题组成, 详细见表1

注:q1:听力理解, q2:单项选择, q3:完型填空, q4:阅读理解, q5:词语运用, q6:补全对话, q7:书面表达。

将原始数据进行定义后, 输入到SPSS软件当中之后, 运行菜单Analyze→Descriptive Statistics→Frequencies得到表2统计频数表, 其中mean (平均数) 为92.650;std.deviation (标准差) 为13.5335;variance (方差) 为183.156;range (全距) 为52.0;maximum (最大值) 为114.0;minimum (最小值) 为62.0。

2.3 试卷的效度分析

本研究通过计算各试题考生得分与其卷面总成绩的Pearson相关系数来反映各试题的效度, 一般来说, 对某次测试的效度进行检验时, 除了参照教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外, 还须采用计算相关系数的定量方法, 及计算出考生每项题目的得分与总分之间的相关系数。系数高则有效性大。得出的Pearson系数一般在0.4-0.7之间, 即视为该题目的效度较高。

在SPSS13.0 for Windows软件中, 效度分析可调用过程:Analyze→Correlation→bivariate, 选择计算Pearson相关系数。统计结果见表3, 本试卷Pearson值大多超过0.4, 说明该试卷的有效度较高。

2.4 试卷的信度分析

在研究当中, 研究者通常采用计算克朗巴赫 (Cronbach) 系数来评价试题信度。Cronbach系数值介于0.00与1.00之间, 系数越高, 说明量表的内在一致性越强, 测量的结果就越可靠。一般认为可接受的信度系数不应低于0.70, 不过在实际研究中, 有时人们也使用了系数0.70以下的变量, 但他们往往在研究报告中说明了这一研究的局限性, 供以后类似的研究参考。表4可得知, 本试卷的系数为0.815, 所以可以认定这张试卷的可信度是处于一个比较高的水平的。

3 结论

通过运用spss软件对2009年河南省中考英语试题的信度效度进行分析, 得出其信度效度值都比较高, 是一套合理得试卷, 同时也给科任教师提供了科学的数据, 以便其在以后的教学工作中有针对性的改进教学方法, 指导学生更有针对性地面对中考。

参考文献

[1]魏连昌.试用统计软件SPSS进行试卷分析[J].吉林师范大学学报 (自然科学版) , 2005 (2) :75-76.

[2]陈忠平.SPSS与大学英语测试统计分析[J].湖南财经高等专科学校学报, 2003.19 (40) :88-91.

[3]竺丽英.SPSS软件在教学统计分析中的应用[J].化学教学, 2006 (3) :46-48.

[4]Davies A.语言测试词典[M].北京:外语教学与研究出版社, 2002.

关于数学课堂板书效度问题的研究第6篇

数学学科逻辑的严密性和思维的抽象性,决定了它具有不同于其他学科的特点,数学教师在教学中除了要应用具体、精准以及形象的文字语言表达外,还必须进行大量的推导、计算,更需要运用有条理、清晰恰当的板书来辅助语言表述的不足。小学数学教师应该要掌握好板书艺术,根据课堂教学任务和教学对象的具体特点,设计出条理清晰、逻辑严谨、科学精确、重点凸显、便于理解和记忆的板书,并在课堂上灵活、恰当地应用板书,才能充分发挥板书在数学课堂教学中的功能。数学教学中充分发挥板书的作用,是课堂教学中比较重要的一环,应引起教者的高度重视,我们不妨从以下几个方面来探讨一下数学教学中板书的效度问题。

一、板书应注重简洁和美观,要具有启发性

板书与讲解一样,贵在“精辟”。古人说:“少则得,多则惑。”板书要做到“精书”、“少书”,要“书”在点子上,“书”在关键处,才能起到“提纲挈领”、“画龙点睛”的独特效用。板书安排要体现数学知识的内在结构,有助于学生科学地分配注意力,帮助学生把握知识的难点和重点,理清学习的思路。小学低年级学生的思维以具体形象为主要形式,教学的板书内容必须遵循直观性、简洁性原则。例如,在教学《单位名数的换算》一课时,教者设计了如下的板书内容:

这样的板书对孩子来说好懂、好记、好操作,不仅能指导学生准确地进行单位名数的换算,而且有利于学生对数学知识的整理、归纳、提炼、总结。

二、板书应注重有序和规范,要具有层次性

著名教授王松泉曾这样描述过:板书教学的作用,在于它是反映教学内容的“镜子”,展示作品场面的“屏幕”;是教师教学引人入胜的“导游图”,学生学习掌握真谛的“显微镜”;是开启学生思路的“钥匙”,进入知识宝库的“大门”;是每堂课的“眼睛”,读写结合的“桥梁”。数学知识的条理性强,有序、规范的板书有利于将教材的知识结构内化为学生头脑中的认知结构。在板书设计中要做到布局恰当、层次清晰,能够体现出新、旧知识的紧密联系,凸显本节课知识的重点,突破本节课知识的难点。数学课堂教学中要运用顺序性和规范性相得益彰的板书来显示教学意图和教学内涵,一般来说,有规律的板书比杂乱无章的板书容易理解,让人了然于胸、爽心悦目。譬如在教学《解决问题的策略——转化》一课时,教者设计了如下的板书内容:

这样的板书规范有序,既为学生梳理了知识的学习经历,又展现了知识的内在规律,为学生学习并掌握数学知识的本质内涵提供了有效的场景,为学生学会学习打下了坚实基础。

三、板书应注重对比和重点,要具有目的性

俄国教育家乌申斯基曾指出:“比较是一切理解、一切思维的基础。”一个好的板书,在内容安排上必须实中有虚,虚中有实,虚实对比,虚实结合。这里所说的“实”,是教学内容真实完整地板书出来;“虚”是指板书时留出空白,可以让学生根据自己的理解给予充实。“实”的一面能让学生一目了然,加深对知识的理解,“虚”的一面则可以调动学生思考,激活其学习数学的兴趣。概念课中的一些主要的数学概念的归纳总结,计算课中的一些主要规律、法则、计算公式的推导和应用过程,解决问题中的一些主要数量关系和解题思路等,都是板书的重点,教师不仅应该把它们写在黑板的最为显眼的位置上,还可以根据具体情况,通过图表对比、画加重线、用彩色笔装饰、画箭头、放大部分字体等方法提醒学生,启发学生,强调重点,突破难点。譬如,在教学《长方形和正方形的周长与面积计算》的复习课时,设计了如下的板书内容:

电机提效迎来云开雾散时第7篇

电机消耗了如此之多的电能, 但长期以来, 我国的在用电机能效却远远低于国外先进水平。因此, 如何提高电机的能效水平, 一直是业内关注的焦点。3月下旬, 工业和信息化部出台了《2013年工业节能与绿色发展专项行动实施方案》 (以下简称《方案》) , 《方案》中将提高电机能效作为其主要的内容之一。期待能以一阵清风, 《方案》可以拂去长期阻挡电机效率提升这轮红日的云雾。

我国电机能效提升潜力巨大

电机是拖动风机、泵、空气压缩机、鼓风机、制冷机和机床等各种设备的驱动设备。我国电机能效水平一直低于国外先进水平, 这是不争的事实。因为电机消耗的电量太大, 电机的能效也越来越受到重视。

“十一五”期间, 国家提出了节能减排的约束性指标, 作为完成节能任务的重要手段之一, 电机系统节能与燃煤工业锅炉改造、余热余压利用等九项一起, 被列为“十一五”的十大重点节能工程。按照规划, “十一五”期间使用电机的运行效率要提高2个百分点, 形成年节电250亿千瓦时的节能能力。

经过“十一五”的努力, 电机的能效水平有所提升。但和发达国家相比, 我国的电机能效水平仍然较低。从电机自身效率看, 我国电机平均水平比国外低3～5个百分点;从电机系统运行效率看, 其运行效率比国外先进水平甚至要低10～20个百分点。因此, 提高电机能效刻不容缓。同时, 提高电机的整体效率将对我国能效水平的提高具有重要作用。我国在用电机总功率非常大, 据测算, 电机能效水平每提高1个百分点, 每年就可节约用电260亿千瓦时。据初步估算, 我国电机系统年节电潜力为1300亿～2300亿千瓦时, 相当于2～3个三峡电站的发电量。

《方案》中提出了2013年的主要目标:力争推广、淘汰和节能改造电机及电机系统1亿千瓦时, 扩大高效电机市场份额, 促进电机产品升级换代和产业升级, 提高电机能效水平, 实现全国工业用电节约1%, 约300亿千瓦时。

在工业和信息化部尚未对外公开的《电机能效提升计划 (2013～2015) 》 (征求意见稿) 中, 更提出了到2015年, 实现电机产品升级换代, 50%的低压三相笼型异步电动机产品、40%的高压电动机产品达到高效电机能效标准规范;累计推广高效电机1.7亿千瓦, 淘汰在用低效电机1.6亿千瓦, 实施电机系统节能技术1亿千瓦, 实施淘汰电机高效再制造2000万千瓦的目标。工业和信息化部希望通过提高电机能效水平, 在2015年实现当年节电800亿千瓦时, 相当于节能2600万吨标准煤, 减排二氧化碳6800万吨。

系统运行效率低成为掩日浓云

提升电机能效如何拨云见日?这就要分析是什么云遮住了太阳的光芒。

系统运行效率低下一直是电机能效不高的主要症结所在。而造成我国电机系统效率低下的主要原因是电机系统的匹配不合理和调节方式的不合理。由于我国电机系统效率与国外先进水平还有较大的差距, 因此提高电机系统整体的运行效率将对电机能效起到关键作用。

何为匹配不合理?其实就是我们常说的“大马拉小车”。为什么不选用合适的马拉合适的车?这个现象的形成却是由多个原因所致, 并且由来已久。

首先, 长期以来, 由于我国设备可靠性差, 在选用电机时考虑的安全系数都偏大, 一般要取10%～15%的裕量;其次, 我国电机规格较少、档次间距大, 在实际选型中没有合适的型号时就只能选用较大功率的电机。此外, 许多项目在设计之初, 也体现了投资者的意志, 一些投资者认为, 选用功率大一些的电机可以省去未来生产规模扩大而更换电机的麻烦, 甚至可以节省投资。这些都造成了“大马拉小车”的后果。

电机调节方式的不合理也导致电机系统的效率不高。如我国的风机、水泵等电机系统调节方式多是采用阀门和档板等落后的调节方式, 而先进的变频调速方式由于投资偏大, 虽在节电方面具有明显优势, 却仍未被用户全面接受。

变频调速具有效率高、调速范围宽、调节平滑等优点, 而且可以实现软启动, 避免对电网产生冲击。电机系统采用调速方式调节流量和系统负荷, 还可以使“大马拉小车”的系统运行工况处在高效区运行, 节约大量电能。变频调速这种节能效果明显的调节方式的普遍应用尚需时日。

使用高效电机是提效之本

通过电机系统的优化配置, 以及采用更先进的调节方式对提高电机系统的整体能效非常关键, 但电机系统中电机本身效率的高低同样不可小觑。

我国是电机的生产大国, 但高效电机的占比却非常小, 而且这很小比例的高效电机却几乎都被用来出口, 因此我国在用的电机能效水平都非常低。而在发达国家, 在用电机的能效水平都较高。上世纪90年代, 美国就开始启动电机改进计划, 2010年强制执行NEMA设计标准超高效率指标, 相当于我国新标准2级的电机才能进入市场;欧盟于2011年6月把电机能效限定值提高到了IE2, 相当于我国电机能效新标准3级的水平;澳大利亚、加拿大等国也正加速各类电机的更新换代。

生产和使用高效电机已经被国家重视。2012年9月, 我国修订《中小型三相异步电动机能效限定值及能效等级》 (GB18613-2012) 正式实施, 从而提升了我国电机能效指标, 其3级和2级与国际标准的IE3和IE2相一致。同时, 新标准还规定, 未达到新标准3级的电机不能再在市场上销售, 而被定义为高效电机的产品其能效应在2级以上。

为了推广高效电机, 国家已经将其列入了中央财政节能产品惠民工程予以补贴。新出台的《方案》中也明确了2013年要力争推广3000万千瓦高效电机, 并淘汰低效电机4000万千瓦。国家还将完善落后电机的淘汰政策机制, 工业和信息化部已经发布了《高耗能落后机电设备 (产品) 淘汰目录》 (第一批) 和 (第二批) , 并将制定《高耗能落后机电设备 (产品) 淘汰目录》 (第三批) 。

北京市在淘汰落后电机推广高效电机中已经先行一步。“十一五”期间, 北京市就开始在全市166家重点用能单位中开展“北京市推广使用高效电机、节能变压器示范项目”。到2011年底, 包括石化、水泥、供热、高校、电信等行业的75家重点用能单位参与了高效电机示范项目, 共更换高效电机1043台, 项目总投资8240万元, 市财政补贴了2620万元, 年可节能4429万千瓦时 (后三项包括节能变压器数据) 。

体质测量中柔韧性的测量效度分析第8篇

1 研究方法

1.1 文献资料法

综合近年来国内外的相关研究成果, 分析当前坐位体前屈测量中存在的弊端, 提出可操作性的对策。

1.2 实验法

随机抽取玉林师范学院体育系选修《体育测量评价》课程的2003级男生50名, 利用教学实验的机会进行测试。以坐位体前屈仪、关节角度仪和身高测量仪, 测量被试学生的身高 (h) 、坐位体前屈 (l) 以及上体前屈角度 (α) (肩峰点和大转子连线与水平面的夹角, 见图1) 。依据2003年国家体育总局颁布的《国民体质测定标准》[2], 对坐位体前屈进行标准化测量 (图1) 。受试者坐在垫上, 双腿伸直, 脚跟并拢, 脚尖自然分开, 全脚掌蹬在测试仪平板上;掌心向下, 双臂并拢平伸, 上体前屈, 用双手中指指尖推动游标平滑前移, 直至不能移动为止。以被试者的脚底面与坐位体前屈测量仪的垂直平面的结合处为测量的起点, 以游标超过起点的长度 (l) 作为测量成绩。

为减少身高因素对测量结果的影响, 将l/h作为测量结果的修正值。以上体前屈角度α为效标, 分别评价和比较坐位体前屈及其修正值l/h的有效性。

2 结果与分析

2.1 当前坐位体前屈测量的弊端

我国现行的坐位体前屈的测量方法虽然简单易行, 但最大的缺陷是测量结果会受身高等形态因素的影响, 从而导致测量结果有效性的降低。

柔韧性是指人体各关节的活动幅度, 即关节的肌肉、肌腱和韧带等软组织的伸展能力[8,9]。由此可见, 坐位体前屈的测量应围绕关节活动幅度这一核心问题, 测量结果应直接或间接地反映关节活动幅度的大小。如果能够采用角度测量法, 直接对坐位体前屈测试时的关节活动角度进行测量, 则测试结果就不会受身高、身体形态等个体因素的影响, 测量结果的有效性最高。但是, 由于对人体关节活动角度进行测量操作较为不便、测量效率较低, 往往不适合大样本的测试, 故在大规模的身体素质测量时, 常常采用较为简便的长度测量代替角度测量来测定柔韧性素质。长度测量方法存在一个严重缺陷, 即测量结果会受个体形态差异的影响, 不能反映关节活动幅度的大小, 测量的有效性被降低。如在以往坐位体前屈测量中, 身材高大者易于取得好成绩, 而身材矮小者难于取得好成绩, 使测量的有效性受到影响。

2.2 坐位体前屈测量结果的指数法修正

为减少身高因素的影响, 提高测量的有效性, 本文拟对坐位体前屈的测量结果进行修正, 即用坐位体前屈实测值l与身高h之比 (l/h) 作为坐位体前屈的指数。该指数实际上是柔韧性测量值与肢体长度的比值, 在《体育测量评价》中被称为相对柔韧性, 是排除了身体形态差异影响的一种测量属性, 能够提高测量的有效性[8,9,10,11]。

2.3 坐位体前屈指数有效性的实验验证

为验证坐位体前屈指数l/h的可行性, 于2007年3月25日随机抽取玉林师范学院体育系2003级男生50名, 用坐位体前屈仪、关节角度仪和身高测量仪进行测量, 测量项目为坐位体前屈l、身高h、上体前屈角度α。以上体前屈角度为效标, 用积差相关法估计坐位体前屈l和坐位体前屈指数l/h的有效性, 结果见表1。

可以看出, 坐位体前屈实测值的有效性为0.70 (P<0.05) , 坐位体前屈指数的有效性为0.87 (P<0.05) , 说明坐位体前屈指数能降低身高因素对测量结果的影响, 具有更高的有效性, 能够更好地反映柔韧性水平。

3 讨论

结果显示: (1) 坐位体前屈的测量结果会受身高等因素的影响, 使测量有效性降低; (2) 若将坐位体前屈的测量值与身高的比值作为坐位体前屈指数, 可提高测量有效性; (3) 坐位体前屈指数l/h只涉及l和h 2个参数。在体质测定工作中一般都包含身高的测量, 测量数据的处理也大都借助于统计软件, 因此计算坐位体前屈指数并不会额外增加太多的工作量, 适合于大样本量的施测, 具备可操作性; (4) 虽然坐位体前屈指数能够消除身高因素对测量结果的影响, 但未能剔除肢体比例等形态因素的影响, 当测量精度要求较高、实验样本较少时, 建议采用测量髋关节活动角度、脊柱屈或上体前屈角度等方法进行柔韧性素质的评定。

关键词：柔韧性,体质,统计学,学生保健服务

参考文献

[1]中华人民共和国体育委员会.中国成年人体质测定标准手册.北京:中国标准出版社, 1996:5.

[2]中国国家体育总局.国民体质测定标准.北京:人民体育出版社, 2003:14-15.

[3]中华人民共和国教育部, 中华人民共和国体育总局.学生体质健康标准 (试行方案) 和学生体质健康标准 (试行方案) 实施办法.北京:人民教育出版社, 2003.

[4]陆大江.新坐位体前屈测定法的研究.上海体育学院学报, 2002 (2) :36-39.

[5]柯遵渝, 代毅.坐位体前屈测量方法的研究.成都体育学院学报, 2002 (6) :90-92.

[6]MINKLER S, PATTERSON P.The validity of the modified sit andreach test in college agestudents.Res QExerc Sport, 1994, 65 (2) :189-192.

[7]HOEQER WW, HOPKINS DR.Hopkins acomparison of the sit andreach the modified sit and reach in the measurement of flexibility inwomen.Res Q Exerc Sport, 1992, 63 (2) :191-195.

[8]《人体测量与评价》编写组.人体测量与评价.北京:高等教育出版社, 1990:208.

[9]孙庆祝, 容仕霖.体育测量与评价.北京:高等教育出版社, 2001.

[10]全国体育学院教材委员会.体育测量评价.北京:人民体育出版社, 1995:191.

高考分省命题考试政策效度分析第9篇

我国的高考政策是国家面向全国公众，为高校选拔合格新生进而为国家选拔人才的考试政策，属于公共政策领域。在公共政策视野，考试政策是考试权力机构，为了考试事业的发展或为了解决考试活动中已经存在或可能出现的问题、实现考试相关的公共利益，根据历史条件和现实情况制订的考试行动过程方案。考试政策包含考试发展政策（考试改革政策等）、考试实施政策（试题命制政策等）、考试管理政策（考生资格政策等）等[1]。

公共政策评估是政策评估主体依据设定的政策目标，通过相关的评估程序，分析公共政策制定、实施等各个环节，对政策效度进行评价，以判断政策目标是否实现或实现程度的活动[2]。政策效度指的是政策在多大程度上实现了预期的目标。它通过对预期政策目标与实际政策结果的差距来分析确定[3]。对政策效度进行调查分析有利于促进政策的科学化，有利于合理配置政策资源，同时也是决定政策未来走向的重要依据。

政策评估是一个动态的过程，在调查分析过程中，须用多种科学的评估方法，以使评估的结果更具有准确性和科学性。政策效度评估常用方法有四种：（1）前后对比法；（2）专家判断法；（3）自我评估法；（4）对象评定法。对象评定法是由政策对象通过亲身感受和了解对政策及其效度予以评定的方法。由于政策对象既是政策的承受者，又是政策活动的主体，他们对政策的成败得失有切身感受，因而最有评价发言权。笔者采用对象评估法，在广东省对高考分省命题考试政策效度进行调查分析与评估。

二、高考分省命题考试政策实施现状

分省命题，古已有之。古代西周的选士制和汉代的察举制，就有按人口比例贡士的尝试。科举制诞生之后，从宋代的“逐路取人”到明、清的“分卷（南、北、中）施考、分省录取”，以及民国时期的分区考试，都可以说是“分省命题”的雏形。

1949年以后，我国的高考制度也可看作是一部“统”（统一命题）“分”（分省命题）史。在1952年建立全国统一高考之前，就有了分校命题（各高校自主命题）、分区命题（六大行政区[1]）等形式，只不过没有分省命题之名，但已有分省命题之实。即使在建立统一高考制度之后，1958年也实行过分省命题，但只实施了一年。1977年恢复高考时，因来不及准备，也只好实行分省命题，但由于存在诸多弊端，在1978年又恢复全国统一命题。1985年上海开始高中毕业会考与高考科目设置改革的试验，上海高考单独命题[4]。2002年北京也开始实行自主命题。2004年分省命题省（市）增加到11个。到2006年，全国实行高考分省命题的省份已达16个，涉及的考生占全国考生的65%左右。至此，高考分省命题格局已基本形成。2007年随着广东、山东、海南、宁夏四省（区）新课程高考改革方案的出台，高考分省命题的省（区）数量进一步扩大到18个。但由于主客观原因，海南、宁夏高考试卷仍由教育部考试中心命制，也就是说全国真正实行分省命题的省份只有16个。

可以说，1949-1985年的高考分省命题有不得已的原因，是偶然现象，是特殊政策；1985-2004年的高考分省命题是个别现象，是改革试点，是改革政策；那么，2006年至今的高考分省命题则已成为一种常态政策。

三、高考分省命题考试政策的目标

政策目标即政策制定者所期望的通过政策实施所达到的解决问题的社会效果或所要避免的消极社会影响，它是政策的灵魂，也是实施、评估政策方案的出发点[5]。一般而言，制定政策总是为了达到一定的目标，不会有无的放矢的政策。

《教育部关于印发<普通高等学校招生全国统一考试分省命题工作暂行管理办法>的通知》（以下简称《通知》）中明确说明“高考分省命题是在全国统考的框架内，由教育部授权，由有关省、自治区、直辖市教育行政部门，根据《普通高等学校招生全国统一考试大纲》（以下简称《考试大纲》）自行组织命题工作，《考试大纲》由教育部考试中心负责制订。”《通知》中第三条明确提出分省命题工作按照有助于高等学校选拔人才；有助于中等学校实施素质教育；有助于扩大高校办学自主权的原则实施，同时，要有利于考试的科学公正、安全高效与准确规范[6]。这些是高考分省命题考试政策明确宣示的目标，是该项政策的显性目标。当然，高考分省命题考试政策也有促进社会稳定、降低政策风险等隐性目標，本文不作讨论。

四、高考分省命题考试政策效度调查分析

高考分省命题考试政策自2004年开始推广，是迄今推行范围最广、稳定实施时间最长的高考改革政策，其效度如何，值得分析。笔者于2011年5月中旬在广东省对此项政策的效度进行了一次调查研究。

1.样本与问卷

样本的选择要具有科学性、可行性、全面性、代表性和均衡性。因此，在选择样本时，主要从以下几个方面进行选择。

（1）省份的选择

选取广东省进行高考分省命题考试政策效度分析是因为广东省位于我国改革开放的前沿，是全国人口大省，经济大省，经济条件比较好，新课程改革、高考改革启动比较早，自2004年开始自主命题，至今已有7年的命题经验，顺利实现从国家卷到地方卷地平稳过渡，有着较为完善的命题管理体制和运行机制，对此进行分析，具有较高的信度。

（2）地区的选择

结合样本的代表性与调研的可行性，本文选取了广东省省会城市G市、经济较为发达的Z市、以农业为主的欠发达的D县三个地区作为调研的对象，这三个地区分别代表省级、地市级、县级三个层次，这样就具有一定的代表性。

（3）学校的选择

本论文主要选取了高中和大学。其中高中有省级、地市级、县级三个不同层次；大学有国家211大学、地方院校、高职高专院校以及主要针对高考落榜生而举办的民办高校。

（4）对象的选择

本研究主要采用抽样的方法，这种方法的优点在于实施便利、易于组织、省时省力，因而它适合大规模的调查研究。本研究所抽样调查的对象有高中生、大学生、高中教师、高中校长、高校教师、高校招办人员、学生家长（主要是高三学生家长），因为这些群体对高考关注较多。

（5）问卷总量与问卷分布

本次调查共发放问卷550份，回收问卷550份，有效问卷538分。有效问卷分布按身份划分，学生问卷371份，教师问卷110份，校长问卷14份，学生家长问卷27份，高校招生人员16份；按地域划分，副省级问卷139份，地市级问卷141份，县级问卷140份，另外高校问卷118份。该问卷为自编问卷。问题1—6主要用来了解调查对象对分省命题是否实现了教育部考试中心所提出的6个政策目标。第7个问题主要用来了解人们对高考分省命题考试政策的总体评价，问题1—7是封闭性的。问题8是开放性的，主要是用来了解调查对象对高考分省命题是否还有其他的评价。

2.结果统计分析

为了保证问卷调查的有效性，在调查之前进行统一的讲解，要求每一个被调查的对象认真、坦率、真实地回答每一个问题。问卷回答完后当场回收。调查结果输入Exel2003统计软件进行数据整理分析。

（1）“有助于高等学校选拔人才”目标效度分析。就“高考分省命题是否有助于高等学校选拔人才”这一目标效度，我们在该省范围内抽样调查了2所211学校、2所地方院校、2所高职高专和2所民办高校的校长、教师和招办工作人员，调查结果如下图1所示。

从图1可以看出：在受访的8位校长中，有近62.5%的大学校长认为高考分省命题不太有助于或完全无助于高校选拔人才；在受访的16位高校招生人员中，只有25%的高校招办工作人员认为高考分省命题完全有助于或基本有助于高校选拔人才。在受访的20名大学教师中，有高达80%的大学教师认为高考分省命题不太有助于或无助于高校人才的选拔。可见，高考分省命题考试政策在实现“有助于高校选拔人才”这一政策目标上的回应度是不高的。

（2）“有助于中等学校实施素质教育”目标效度分析。从某种意义上说，高考分省命题考试政策的出台旨在让地方有权制定符合各自情况的教学与考试大纲，进而通过调整考试内容，使高考在本省实施素质教育方面更好地发挥“指挥棒”的作用。然而，我们通过统计分析大学生、高中生、高中教师、高中校长的调查问卷发现情况并非如此。以下是对这一目標效度的调查结果。

由图2可以看出：在受访的297名高中生和74名大学生中，有62.29%的高中生和73.32%的大学生认为高考分省命题不太有助于或完全无助于中等学校实施素质教育；在受访的90名高中教师中，有高达63.33%的高中教师认为高考分省命题不太有助于或完全无助于中等学校实施素质教育；在受访的6名高中校长中，也是高达66.67%的高中校长认为高考分省命题不太有助于或完全无助于中等学校实施素质教育。

（3）“有助于扩大高校办学自主权”目标效度分析

高考分省命题作为扩大自主权的一种积极尝试，要“有助于扩大高校办学自主权”。然而，目前我国高考试题是由教育部考试中心或各省（市）教育考试院（中心）统一命制，加之高校招生录取体制的核心是全国统考，根据“考生志愿+总分”从高分到低分按照120%的比例调档，这使得高校几乎无权选录自己认为有培养前途但分数稍低的考生。也就是说，高考分省命题几乎无助于扩大高校办学自主权。通过对高校招办人员和大学校长的调查也验证了这一点。

（4）“有利于考试的科学与公正”目标效度分析

科学与公正是所有考试都必须遵循的首要原则。[7]要提高考试的科学性就要尽量减小误差，提高考试的信度和效度。华中师大鲁子问教授从定性与定量两个方面曾对全国统一的高考英语作文与分省命题的15道英语作文题命题质量进行对比分析，发现试题效度存在较大差距，分省命制的作文试题73.3%语用目的不合理。通过对高中学生、高中教师、高中校长和大学生的调查问卷统计分析也验证了这一点。

（5）“有利于考试的安全与高效”目标效度分析

由于现代信息技术的广泛使用，使得高考的安全风险大大增加。在全国统一命题的模式下，一旦发生试题泄密的情况，影响范围将波及到全国的考生，而在高考分省命题的背景下，其影响范围则缩小很多。但通过对高中学生、大学生、高中教师、高中校长、学生家长的调查问卷统计我们发现另外一些答案。有超过六成的受访者认为高考分省命题不太有利于考试的安全与高效。他们对考试安全表示担忧，对高额的考试费用表示愤慨。高考分省命题考试政策从理论上来看是降低了风险系数，但从实际操作来讲，高考分省命题囿于一省之内，在保密、回避等环节上的执行难度相对于全国统一高考要大得多，风险系数非小反大成为不容回避的事实。

（6）“有利于考试的准确与规范”目标效度分析

克服命题上的主观性与随意性，增强命题的准确性与规范性，确保考试的科学性，对于规模大、影响广、要求高、时间短的高考命题来说尤为重要。高考分省命题考试政策的目标之一就是要“有利于考试的准确与规范”。

通过对高考分省命题考试政策的六个目标进行效度分析可以看出：尽管高考分省命题的理论优势十分明显，如有利于地方政府在发展教育这一公共事务中发挥更为积极、充分的作用；有利于高校有针对性地选才；有利于为基础教育改革和实施素质教育创造较为宽松的环境等等，但其政策效度并不理想，与政策目标相距甚远。有些受访者甚至强烈要求教育部收回高考命题权。通过对538份有效问卷统计发现，高达75.28%的受访者认为弊大于利。如图3所示。

这一调查结果与2005年7月搜狐新闻网和2007年7月新浪网的调查结果一致。2005年7月搜狐新闻网就“你赞同高考分省命题吗？”展开网络问卷调查，共有3406人参与网络投票，结果只有17%的人表示赞同，有高达83%的人持反对意见。[1]

2007年7月央视开辟了一档网络辩论赛《网辩天下》[2]，辩题之一是《全国高考应统一命题还是分省命题》，新浪网开通网络留言系统，共有5037名网友留言，其中支持全国高考应统一命题的有4645人，占92.22%；而支持全国高考应分省命题的仅392人，只占7.78%，时隔两年，高考分省命题考试政策的支持率不升反降！由此，我们很难说高考分省命题在多大程度上实现了其预期的政策目标。

五、高考分省命题考试政策调整对策建议

通过对该省的调查分析清楚地说明，高考分省命题考试政策没有实现其预设目标。尽管影响高考分省命题考试政策效度的因素有许多，但其主要原因则是：高考改革过于复杂，分省命题政策目标设置过高，单靠分省命题政策不可能实现如此复杂的目的。

分省命题只是高考改革政策中的一项，解决的只是命题权的分配问题，不可能解决高考所有的困难。但是，高考分省命题考试政策的目标却是整个高考改革的目标。

我们知道政策越复杂，执行的难度越大，尤其是综合性、创造性较高的改革政策，执行难度较大[8]。高考分省命题是对我国高考大一统考试制度的突破，是我国高考制度的一项重大改革，是涉及高校招生考试乃至教育全局的重大制度性改革。它所涉及的目标团体不仅包括教师、学生、还包括各级教育行政部门的管理者、相关的社会团体或单位，甚至还包括学生的家长等等。其政策目标对象的数量之多、规模之大、影响之广令人难以想象。所有这些无不昭示着高考分省命题考试政策执行的难度之大。

由于当今之高考已成为举国之大考，牵涉到社会的方方面面，要实现高考分省命题考试政策预期目标，必须多管齐下。也就是说，高考改革不仅仅是一场教育改革内部的改革，它是宏大的社会改革系统中的一个不可或缺的子系统；高考改革也决不是一个单纯的教育问题，它是一个需要综合治理的社会问题。高考改革要想取得突破，必须跳出教育改革的小圈子，立足社会，放眼世界，顺应潮流，推陈出新，综合治理。那种寄希望于考试科目的调整、命题权限的下放来达到其目标的考试政策是注定不会有较高效度的。

所以，高考分省命题政策需要调整，才可能维持其发展。我们认为，调整高考分省命题政策的对策有三。

1.强化政策执行

这一对策就是进一步强化分省命题政策的执行，强化政策目标，加强政策执行的措施，比如增加分省命题经费和人员，提高高考分省命题的试题质量。

2.调整政策目标

这一对策要求合理调整政策目标，使分省命题政策只承担其能够承载的目标。

高考改革政策事关国家选才用人，涉及社会发展，关乎家族命运和个人前程，是一项涉及国家和社会各个层面的大事[9]。高考分省命题政策目标的“三个有利于，三个有助于”中的任何一项目标都是牵一发而动全身的目标，必须有整体改革的思路，从国家的高度，以全社会公共利益最大化为指向，进行系统的政策改革设计。高考分省命题政策即使有效，也只可能是在高考改革这个政策体系有效的内部，实现其政策效度。所以高考政策应该集中国家和社会、机关和企业、学校和教师、家长和学生各相关政策主体，在公共利益最大化的前提下，实现尽可能的利益平衡，制定出長远的改革路线图和当下的改革措施，而不是像分省命题政策这样由教育考试部门在自身职权范围内进行宏大理想的改革。

其实，高考分省命题政策要科学地设置目标的话，倒也是非常可行的政策，也就是把目标设定在教育考试行政部门职权可以实现的范围之内。如：通过高考分省命题政策，使试题更适合本省学生，尤其是文化、社会、历史环境，从而降低考试的社会文化认知负荷，更为准确地考查学生的能力，进而使高等学校在本省市能选拔其所需的人才。比如让广东的学生写“荔枝蜜”就比写“我的地坛”更能合理地考查他们的写作能力，这样高校就能选择更具有写作能力的学生。

3.终止政策实施

这一对策就是结束高考分省命题政策的实施，重新回到统一命题的政策，或者制定新的命题政策。

我们认为，对策1和对策3的政策风险都很大。对策1强化高考分省命题考试政策的执行，只会加大政策执行成本，而政策目标仍然无法实现；对策3肯定会因为既行政策终止而带来政治、社会、教育风险。

所以，理性的选择是实施对策2，我们没有必要终止高考分省命题政策，而是调整分省命题政策目标，促进高考分省命题考试政策的科学性，使其承担可以承担的目标，而不是用一个过于宏大的目标来束缚其发展。因此，高考分省命题考试政策的目标应以本省（市）教育发展为核心目标，即高考分省命题工作应有助于设计本省（市）考生在高考中能充分展现其能力的试题，从而使高等学校可以从本省（市）选拔其所需的人才。这一对策既不会加大政策实施的成本，也不会导致政策实施的风险。

参考文献

[1] 鲁子问.高考政策的国家利益优先性探讨.考试研究，2006（4）.

[2] （美）沙维奇.公共政策分析和规划的初步方法.北京：华夏出版社，2002.

[3] 张国庆.公共政策分析.上海：复旦大学出版社，2004.

[4] 杨学为.高考文献.北京：高等教育出版社，2003.

[5] 陈振明.公共政策分析.北京：中国人民大学出版社，2003.

[6] 教育部.普通高等学校招生全国统一考试分省命题工作暂行管理办法.中华人民共和国教育部公报，2006，（10）.

[7] 廖平胜.考试学原理.武汉：华中师范大学出版社，2003.

[8] 谢明.公共政策分析.北京：中国人民大学出版社，2004.

时、度、效第10篇

信度和效度是评价语言测验质量高低的核心指标,不过,信度具有一定的静态性,是效度的必要而非充分条件,信度的高低可以从测验本身获得刚性的佐证。效度则是柔性的,只能依据各种经验证据、理论证据或统计证据论证测验效度的高低。效度验证必须以测验分数的使用、解释或推断为参照点,依靠各种外部证据证明效度的高低。对于语言能力测验而言,最重要的是构想效度问题,即“语言测验实际测得的东西与理论假设的语言能力要素或心理特征相吻合的程度”(舒运祥,1999)。如果测验的构想效度不高,那么测验结果(测验分数或测验表现)就无法对被试语言能力的高低做出有效的解释或推断,更无法准确地对考生在非测量情景中的语言表现水平做出有效的概括。

很久以来,关于效度,特别是构想效度的定义问题,在心理测量学界颇具争议。有不少学者主张将效度划分为内容效度、效标效度和构想效度等不同形式,但Messick(1981,1989,1996)、Cronbach(1971)和Bachman(1990)等人认为,内容效度和效标效度是获得构想效度的手段,三者具有一元结构性。通过专家评判获得的内容效度,以及通过测验之间的相关分析所获得的效标效度,只是为构想效度提供证据和输入而已(Shohamy,1991),因此,在所有的语言能力测验中,构想效度问题都是测验设计、开发和使用中无法回避的首要问题。

在构想效度的验证过程中,获取证据的来源越广泛,证明测验使用或分数解释有效的说服力就越强。效度验证时所获得的各种类型的证据,包括重要的、但未必支持测验使用或解释的证据,都应该被测验开发者予以评估甚至采纳,以编制出更有效的测验或对现行测验进行必要的改进,使之更合理。证明测验使用或解释具有构想效度的过程是一个不断积累证据的动态过程。比如,我们可以通过考察测验实际所测的东西与某种理论依据是否吻合来说明测验是否有效,或者依靠专家的经验判断从测验内容方面探讨效度的高低,也可以使用各种统计方法获得实证证据对效度进行验证。总之,效度验证不是一劳永逸的即时过程,而是一个使用多种方法从多方面、多渠道不断进行证据积累的历时性论证过程。

中国汉语水平考试(HSK)是以测试母语非汉语者的一般汉语能力为唯一目的的国家级标准化考试,其测量结果对考生求学、求职以及汉语能力评价的影响后效均具有高风险性,因此,HSK从设计之初就十分重视测验的效度问题。HSK考试的基本理念是,以听力理解和阅读理解为主线,语言能力测试为核心,标准化形式(多项选择题)为基本方向(刘英林,1989)。为了比较准确地测量考生的一般语言能力,在测验任务设计时,要对考生的目标语言使用域及交际特征进行分析与概括,并从中选取若干典型样本作为测验任务。

考虑到听力理解能力测试在汉语水平考试中的特殊性,本文拟使用实证统计法专门研究听力理解测验的构想效度问题。研究的基本思路是:首先运用多元等级聚类分析法对HSK听力理解测验的三种任务形式,即句子、简短对话和长对话(或讲话)三种听力测验项目所测量的潜在纬度结构进行考察,然后验证测验项目纬度结构与HSK听力理解能力的一元结构构想是否吻合,最后以本研究的统计证据为基础,从提高测验任务的真实性角度出发,在不损害测验效度并维持现有分数体系的前提下,对HSK(初、中等)听力理解测验任务类型的改进提出自己的建议。以期对未来HSK测验方式的改进与完善提供可资借鉴的参考。

二听力测验的构想与测验方法

听是语言交际活动、二语习得的前提,是获取信息的重要途径之一,同时也是语言学习者生存、发展所必备的一项社会文化技能(Anderson,1999)。在语言习得过程中,以听和读为主要形式的接受型技能总是先于表达型技能(邹申,2005)。从语言能力结构角度来看,几乎所有的语言能力模型都将听力理解能力看作模型的重要组成部分。听力理解能力被公认为是一个人语言水平高低的重要标志,在第二语言教学和测试中都占有重要的地位,因此,国内外几乎所有的综合性语言测验,均以相当大的权重将听力理解能力列为必考的内容之一(如TOEFL、IELTS、MELTB、TEF、J-TEST、CET、PETS等)。不过,语言理解能力属于一种非常复杂的构想,因而对听力理解能力的认识是人类从心理学、语言学角度不断探索的漫长过程。从现有的L1和L2听力研究文献中,我们还没有找到一个测验可以依据的、被普遍接受的听力能力解释理论。在实践中,测验设计者往往在参考其他相关测验的基础上,凭知觉或个人经验来编制听力理解测验(Buck,1991),因此,测验质量保证的理论依据是什么?或者说使用什么样的测验任务来测量听力理解能力,无疑是影响测验使用或分数解释效度的关键。

由于听力理解能力是一种抽象的特质,它本身不能像物理测量那样进行直接测量,只能建立在对经验事实或行为观察的基础上(陈宏,1997)。因此,测验设计和开发者必须根据构想定义的能力要素,从那些与一般语言能力具有潜在对应关系的目标语言使用域中,选择若干有代表性的听力材料作为测验任务输入,然后针对听力理解材料设计一个或若干个多项选择题,要求考生在理解加工输入材料的基础上,从备选项目中选出正确答案。最后再根据被试在测验任务上的表现情况,来推断其在目标语言使用域中的一般听力理解能力或特征。在应用性测量中,了解考生在特定测验任务上的表现,并不是测量所期望达到的最终目的,我们更感兴趣的是,把被试在测验上的表现或分数解释为个人语言能力水平指标的有效性、合理性和恰当程度,而不是仅仅把被试的测验表现解释为其参加特定测验的应试能力(Bachman and Savignon,1986)。听力测试的有效程度就在于测试结果能否真正反映考生在现实生活中应该具有的听力理解能力,因此听力测验任务的特征与目标语言应用任务特征的吻合程度,是影响测验构想效度的关键要素之一(Bachman&Palmer,1996)。如果两种任务特征脱节,那么考生在测验任务上的表现水平对考生在目标语言应用域中的语言使用表现就没有足够的概化能力(见图1),即测验缺乏构想效度。

HSK(初、中等)的听力理解测验部分,在遵循HSK总体设计原则的前提下,主要承担对考生一般汉语听力理解能力的测量,即“通过测量考生能否听懂语速正常的句子、对话和一般题材的讲话(或长对话)来考察考生的听力理解能力”(刘英林等,1989)。测验所选用的语料在内容和题材等方面适当广泛。在语料集层面上追求多元性、平衡性和中立性,避免语料在风格和内容等方面具有明显的专业倾向性,以便为不同地点、以不同方式和依据不同教材学习汉语的考生群体提供均等的考试刺激条件。

HSK(初、中等)的效度问题,一直是设计和开发者最关注的问题。刘英林(1994)对HSK(初、中等)设计的理念进行过最基本的探讨。张凯(1991)用因素分析法对HSK(初、中等)测验的构想效度进行了研究,郭树军(1995)、陈宏(1997)分别用Grant Henning的内部结构效度法和多质多法就HSK(初、中等)的构想效度作过考察。这些研究所得出的结论比较一致,即:尽管HSK(初、中等)考试的测验操作结构由4个分测验、9个小部分所构成,但从测验实际所测量到的能力因子来看,HSK(初、中等)主要测量了听力理解能力和阅读理解能力。HSK(初、中等)的听力理解测验构想就是考生的一般汉语听力理解能力。

三听力测验项目的聚类分析

HSK(初、中等)的听力理解测验任务,由基于三种不同类型的言语刺激形式所设计的50个多项选择题所构成,测验试题包括句子理解15题(S01~S15)、简短对话理解20题(S16~S35)以及长对话或讲话理解15题(S36~S50)。测验的具体操作结构见图2。通过三种相对独立的测验任务来测量考生能否了解句子、简短对话和讲话的基本大意,跳跃障碍,抓住主要信息或重要细节,根据所听到的材料进行推理和判断,理解说话人的目的和态度。本研究主要通过对测验项目进行聚类分析来探索句子理解测验任务是否测量了相对独立的因子。

(一)研究样本

研究所采用的数据来自中国国内32个考点参加HSK(初、中等)考试的7828名考生的实测数据。本研究只对由句子理解、简短对话和长对话(或讲话)三部分所构成的听力理解测验部分进行统计分析。为了确保研究样本具有足够的代表性,我们从考生团体中随机选取1000名考生的数据作为研究样本。样本结构和测验分数描述情况见表1。

(二)研究目标

HSK(初、中等)的听力理解测验部分,一共由50个多项选择题构成。出于对HSK试卷进行等值处理的需要,在听力理解测验的第一部分和第二部分分别嵌入了4个“锚题”,为了排除“锚题”曝光率因素给研究结果可能带来的统计“噪音”,本研究不考虑考生在“锚题”上的作答反应情况,只对卷标为J323卷的42个有效测验项目进行实证聚类分析。

(三)研究方法与研究过程

本研究采用的统计方法是等级聚类分析法。等级聚类分析(Hierarchical Cluster Analysis,简称HCA)是一种根据变量之间相似程度或距离远近进行聚类的多变量分析程序。在对测验项目进行聚类以前,先不考虑每个测验项目所属的刺激结构,也不局限于项目预期测量功能(functioning)的先验判断,而是把测验项目看作平行变量,淡化每个测验项目在试卷卷面中的自然结构和篇章或任务类型的约束关系,根据被试作答的认知反应模式,以考生实际认知反应的相似程度为分类基础。

聚类分析的基本原则是,被分在同一类内的测验项目,应该具有尽可能大的同质性,而被分在不同类内的项目之间则应该具有尽可能大的异质性。

由于测验采用的是(0/1)二分记分法,因此聚类研究可供选择的测度指标有简单匹配系数、雅可比系数和果瓦系数等三种(郭志刚,1999)。本研究采用雅可比系数为测度指标,以组间平均联结法为聚类方法,用逐次聚类的方式对3种听力测验任务的42个多项选择题进行统计分类。

(四)聚类输出结果

聚类分析的结果,最终以聚类树状图的形式将所有项目成员之间的嵌套关系、等级层次关系等形象地显示出来。据此我们可以比较直观地观察项目间的聚合、亲疏关系。项目树状图可以从横向上揭示类和类之间的异质程度,在同一类内可以反映项目之间的同质性;在纵向上可以揭示亚类和母类之间的等级层次关系。通过考察测验项目聚类结构与测验任务操作结构之间的对应情况(测验任务与测验项目的操作结构情况,见图2),来探讨测验项目与任务类型之间的约束关系。研究样本的统计聚类结果见图3。

(五)聚类结果解释

根据对聚类树状图的直观分析可以明显地发现:所有的听力测验项目几乎均以“从下而上”的方式逐级递增而被聚合为一个大类。测验项目的聚类顺序与测验任务的顺序之间没有对应性。项目的聚类结构具有如下基本特征:

1.在以句子、简短对话和长对话(或讲话)三种任务为约束关系的42个听力理解测验项目中,只存在两组连锁项目,分别是第15题和第37题、第47题和48题;

2.从整体上看,测验项目并没有按照测验任务的分类约束关系进行对应聚类;

3.测验任务之间基本上不存在等级嵌套关系,测验项目的潜在纬度只有一个。

四讨论

语言测验任务的选择,是测验设计理念的体现,是测验开发者依据不同的语言能力模型,结合测量目的、用途及可行性,并从保证测验使用具有较高效度的角度出发所做出的主观决策。从本质上讲,HSK(初、中等)听力测验的任务由两个基本要素构成:其一是需要听解的言语刺激或输入,其二是根据听解结果要求考生对命题者编制的二级刺激(即多项选择题)做出的必要反应。三种测验任务在刺激长度、交际特征、信息密度和语境依赖方面均存在较大差别。从传统的语言加工理论上来看,与同一类测验任务相对应的测验项目之间理应具有较强的聚敛效应,与不同测验任务对应的题束之间应该具有一定的判别效应,即测验项目应该按任务类型形成平行结构或嵌套关系。然而,项目的实证聚类结构与预期的项目结构完全不同。

首先,被试在回答三种测验任务的题目时,虽然需要借助的语言知识、背景知识、策略知识和短时记忆负担有所区别,与同一测验任务类型对应的测验项目所发挥的测量功能应该具有较强的同质性,在聚类树状图上至少应该各有一个亚类与测验任务相对应。但聚类结构图显示,测验项目并没有按照三种任务类型形成聚类结构,以不同任务类型为约束的42个听力测验项目实际测得的因子比预期的要单一得多。听力测验项目的潜在纬度只有一个。假如HSK(初、中等)听力理解测验设计的初衷是通过句子、简短对话和讲话或长对话来测量一元结构的听力理解能力的话,研究结果表明,HSK(初、中等)的听力理解测验较好地达到了预期的测量目的,三种测验任务共同测量了被试的汉语听力理解能力,因而测验结果可以很好地反映被试汉语听力能力的高低,听力测验具有较高的构想效度。

其次,聚类结果显示,有两对测验项目的局部聚敛性较强,分别是S47题和S48题、S15题和S37题。通过与测验任务结构对比,我们不难发现,测验项目S15和S37分别属于测验的第一部分和第三部分,显然这两个测验项目并不受同一个输入刺激约束,因此不属于影响测验效度的构想无关变异。不过,测验项目S47和S48则受同一段长对话材料的约束,因而发生了连锁项目关系(Aiken,2003)。通过考查,第47题和48题之所以发生连锁关系或者缺乏局部独立性的原因,很可能是题目所考查的东西重叠或彼此间具有较强的暗示效应。如果测验中存在过多的连锁项目,无疑会导致不恰当的项目聚敛关系,从而影响测验的构想效度。研究结果表明,由于有完善的命题、预测和分析等质量控制体系,HSK(初、中等)的听力测验部分已经将项目的连锁现象降低到最低限度,从而保证了测验项目具有良好的性能。

最后,项目实证聚类结构并没有显示相对独立的因子与测验任务相对应,从测量一元结构的听力理解能力角度来看,HSK(初、中等)的任何一种听力任务类型在测量功能方面均不具有不可替代性。

五结论与建议

语言测验的基本目的是通过被试在测验任务上的表现水平,来推断其在现实生活中的语言能力,因此,测验任务要尽可能反映与构想定义相对应的目标语言使用域中语言使用任务的基本特征。如果测验任务特征与非测量情景中的语言使用任务特征相比具有足够的真实性,那么测验结果就可以准确反映考生在真实生活中运用语言的能力;反之,如果测验任务与语言使用任务特征的吻合性不高,那么测验结果就只能反映考生完成特定测验任务的表现水平,而不能据此推断或解释考生在非测量情景中的语言能力。

经验证据显示,在HSK听力理解测验的三种任务类型中,句子理解测验任务与其他两种测验任务相比,在任务真实性、交互性等方面均处于劣势(见表2)。而本研究的统计证据则进一步表明,在测量目标方面,句子理解测验部分并未测量到其他听力测验任务所无法测量的独立纬度,三种测验任务在测量目标方面具有相当强的一致性。这说明现行HSK的听力理解测验在测量考生的听力理解能力方面具有较高的构想效度,但是,如果从听力测验任务的拟测功能来考察,使用其中任何一种测验任务置换另外一种测验任务形式的话,测验仍可以实现期望测量的目标。

语言能力不是考生静态语言知识的简单再现,而是语言知识、语用知识、社会语言能力以及策略能力在现实交际活动中的综合反映。在语言测验的设计、开发和使用中,应尽可能保证所选择的测验任务特征与非测量情景中的语言使用任务特征具有最佳对应性。考虑到句子层次的听力理解任务与其他两种任务类型相比,在真实性、交互性方面较差,而句子理解题目在实证研究中又没有体现出测量不同因子或特质的独特功能,因此,可以考虑通过增加简短对话和长对话或讲话题目的数量,取代句子听力理解测验任务,这样不仅可以结合交际语境全面考察考生的语言知识、语用知识、语言策略,而且还可以在保证甚至提高测验构想效度的前提下,明显提高测验任务的真实性、交互性,确保现有记分方法和分数体系的稳定性。

摘要：本文在探讨测验构想效度验证和测验方法的基础上,使用等级聚类分析法(HCA)对HSK(初、中等)听力理解测验的项目纬度进行研究。基于测验构想效度和任务真实性考虑,并参照听力测验项目的实证聚类结构与句子、简短对话、讲话或长对话三种测验任务的操作结构对应关系,对听力理解测验任务形式的有效程度和改进方式,提出了自己的建议。

本文来自 99学术网(www.99xueshu.com)，转载请保留网址和出处

【时、度、效】相关文章：

>> 查看更多相关文档

上一篇：会计专业实践问题下一篇：调度运行体系

时、度、效范文

时、度、效第1篇

时、度、效第2篇

听力测试效度和信度的研究(英文) 第3篇

提高科学实验教学效度初探第4篇

时、度、效第5篇

关于数学课堂板书效度问题的研究第6篇

电机提效迎来云开雾散时第7篇

体质测量中柔韧性的测量效度分析第8篇

高考分省命题考试政策效度分析第9篇

时、度、效第10篇

全站热搜

相关推荐

时、度、效范文

时、度、效 第1篇

时、度、效 第2篇

听力测试效度和信度的研究(英文) 第3篇

提高科学实验教学效度初探 第4篇

时、度、效 第5篇

关于数学课堂板书效度问题的研究 第6篇

电机提效迎来云开雾散时 第7篇

体质测量中柔韧性的测量效度分析 第8篇

高考分省命题考试政策效度分析 第9篇

时、度、效 第10篇

全站热搜

相关推荐

时、度、效第1篇

时、度、效第2篇

提高科学实验教学效度初探第4篇

时、度、效第5篇

关于数学课堂板书效度问题的研究第6篇

电机提效迎来云开雾散时第7篇

体质测量中柔韧性的测量效度分析第8篇

高考分省命题考试政策效度分析第9篇

时、度、效第10篇