美国基础教育质量监测考察报告

撰写时间：2013-01-06　　来源：广东省教育研究院

浏览量：

应美国康州教育部邀请，教育部国家教育督导团和国际合作与交流司于2012年10月30日—11月19日组团赴美开展“基础教育质量监测与评估体系”项目培训。培训团由来自全国9个省（直辖市、自治区）的21名教育行政管理与督导人员、教育与评估研究人员组成。省教育厅副厅长朱超华、省教育研究院基础教育研究室黄志红同志参加了本次培训。培训团先后在康州校长培训中心、南加州大学罗希尔教育学院听取了美国基础教育质量监测体系及准则、美国教育制度概况等专题讲座，参观了康州、加州一些中小学，开展教学观摩、座谈等交流研讨活动。

一、20世纪以来美国基础教育改革发展及其主要特点

（一）以平等、民主和效率为准则，由分权化走向准集权化是美国基础教育改革发展的趋势

美国的教育行政体制是在 “学区自治”传统上建立起来的，宪法规定教育不属于联邦的职能范围，教育管理实行层层分权，州政府在宪法中是各州最高的教育行政主管部门。州政府制定关于教育的基本法规，再将许多具体教育事务的管辖权分配给地方教育委员会。20世纪30年代以前，联邦政府教育职能十分微弱，有限的教育法规也主要是指向某个特殊的教育领域，如职业教育、军事教育等。自罗斯福新政以来，尤其是二战后，联邦政府对教育的干预开始涉及各级各类教育，加强教育立法，从公民的受教育权、课程、教师培训、教材、校舍、学校设备与教学器材、学生午餐、助学金、奖学金、补偿教育计划等方面制定教育政策。二战后，海军上将里科弗将教育比作“美国的第一道防线”，并断言“未来属于教育最优的国家”。哈佛大学校长科南特也指出“教育是生存攸关的大事”。教育被认为是美国在科学和技术上重新取得并保持对苏联人的优势所不可或缺的手段。如下观念在1957年苏联卫星上天后深入人心：军事竞争就是科技竞争，科技竞争就是教育竞争，教育是通向军事强国之路。

1982年美国的盖洛普民意调查报告显示，当问及“什么是未来强大美国的最好的保证”时，“强大的教育制度”以最多的选票位列第一，“强大的工业制度”与“强大的军事”票数竟低于教育而分别位居第二、第三。

总之，以民主、公平、效率为准则，以加强教育在国际上的竞争力为目标，联邦政府主导改革，教育从分权走向集中是美国20世纪基础教育改革发展的明显趋势。联邦政府负责制定教育方针及政策、各级教育制度、全国教育发展规划、教育课程的最低限度或各种标准，以及全国教育统计；地方则遵照既定的全国性目标和标准，根据地方需要，拟订具体计划并付诸实施。联邦政府重在指导与监督，地方政府重在执行与创新。

（二）以质量为基准成为美国基础教育改革发展的主线

如上所述，随着联邦政府对国家教育职能的强化，教育公共性的日益增加，公众对基础教育提出了越来越多的诉求。但另一方面，二战后，美国的基础教育一直处在公众的不满与批评中。20世纪80年代，美国公立教育的质量问题引起了全国性的关注。学生学习成绩的持续下降招致家长、雇主和高校的不满。当时发表的一系列调查报告，包括著名的《国家在危险之中》（A Nation At Risk，1983），都纷纷提出警告，认为学生学习的失败将导致经济危机并成为涉及国家安全的大事。教育逐渐成为一个全国性的热点议题，社会各界纷纷就教育改革问题发表意见，提出建议。其中，提高学术标准、改善评估体系被普遍认为是提高教育质量的关键所在。此后的几十年中，美国的基础教育改革基本围绕“严格学业标准，提高教育质量”和“追求个人完善发展，适应现实生活需要”这两个目标展开。
1991年，布什总统召集各州州长、教育和商业界领导人举办了第一次美国教育高峰会议。会议确立了2000年需要达到的六大教育目标。其中特别提到，所有学生都要掌握核心科目的某些关键知识领域，学生在数学和科学两个学科的成绩要达到世界一流水平。布什总统开始尝试建立一个全国性的学术标准和测试体系，并且拨款资助类似的研究。

1994年，克林顿总统签署通过《2000美国教育目标法》（Goals 2000：Educate America Act），同时对联邦基础教育法案作了修订。这是美国历史上首次通过立法的形式资助和鼓励各州建立自己的学术和测试标准，用以衡量学生的学习进步情况，特别提出要努力帮助处境不利儿童提高学业成绩。但情况并不理想，到1996年召开第二届教育高峰会时，只有14个州制订了学术标准。社会各界对公立学校的教育仍怨声载道。面对种种责难，联邦政府作出了对公立教育进行系统改革的承诺，同意建立州一级的课程标准并对学生进行测试。1997年，克林顿提出《重建美国学校伙伴关系法》，在教育经费和保障制度上协助州和地方提高学校教育质量，并从4年级和8年级入手，开始推进阅读和数学自愿性全国测验，试图通过评价的方式促进教育质量提高。

从那以后，几乎每一个州都制订了课程标准，40多个州建立了测试体系，检测学生是否达到为他们所设置的目标。对那些考试失败的学生和他们所在的学校，各州都采取了一些措施，这些措施包括：年级考试失败的将不能自然升级；毕业考试失败的将不能获得毕业证书；依据学生的学习成绩对学校进行排名；把学生的学习成绩与教师业绩挂钩；向社会公布学生“成绩报告卡”等。尽管这样的措施也遭到了一些反弹，并引起1999年第三次教育高峰会的关注，但建立严格的学术标准和测试体系毕竟是大势所趋，难以逆转了。

2001年小布什总统上任后，把教育改革作为他任内的一个主要议题，高调推出名为“不让一个孩子掉队（No Child Left Behind）”的基础教育法案，与克林顿时期相比，该法案要求更加严格，目标更加具体。它不仅要求各州建立严格的学术标准和评估体系，并且要求所有的学生，不论其族裔、收入、居住地、语言背景如何，都必须在今后的12年内达到学术上的“掌握”（proficiency）程度。那些达不到年度进步要求的学校和学区，将承担相应的责任，学校将面临着允许学生转学、接受私人辅导、撤换教师和管理层乃至对学校进行重组的处罚。在“不让一个孩子掉队”的法案中，最核心的条款之一是提高学术标准和监测学习成绩，要求各州建立一个适用于全州所有公立学校学生的课程内容标准和学术进步标准，各州每年通过统一的学科考试掌握学生的学业进展情况，并与全国考试指标进行比较，以确定下一年度的进步指数。法案提出到2005-2006学年，各州必须制订科学课程学习标准，要对3-8年级所有学生的阅读和数学进行年度考试，同时还包括在10-12年级进行至少一次年度考试。科学学科的测试必须至少在3-5、6-9、10-12年级各举行一次。同时，每隔一年，各州还须抽取4年级和8年级的学生参加全国性的数学和阅读统一考试（全国教育进展评价，National Assessment of Educational Progress，简称为NAEP），用以检测和对比各州的教育质量。

2009年，奥巴马总统推出的“力争上游（Rise to Top）”计划，开始了美国历史上最大规模的联邦教育改革投入，目的是促使各州承担起相应的义务以促进教育质量提高。具体措施由联邦教育部制定全国统一的教育标准，扶持优质的特许学校，改革和关闭失败的学校，刺激各州争取“冲顶赛跑”拨款的同时，改进学生学业成就、促进学校持续发展以及增强学校系统活力的创新战略。

回顾20世纪80年代以来美国教育改革发展历程可以看出，虽然不同阶段对教育的要求、目标和策略有所侧重，但“建立优质教育，提升教育质量”的教育标准始终是贯穿美国教育改革的重要指导思想。直至目前，这种基于教育标准的教育改革仍在美国基础教育改革和发展中起主要作用。因此，发起于20世纪60年代的美国教育进展评价（NAEP）开始进入蓬勃发展时期，被各州采用作为衡量州内学生学业表现的监测评价，至2012年，已有49个州签署采用NAEP的协议，NAEP真正意义上成为美国唯一的国家基础教育质量监测和评价体系。

二、以结果为导向的美国基础教育质量监测体系的建立与实践：全国教育进展评价（NAEP）

（一）NAEP的发展历程

NAEP始于20世纪60年代，源于在全国范围内以一种标准化的方式，对学生各个学科表现进行测量的必要性的认识。在此之前，尽管已经有个别的州、学校及教师对学生进行了一些测试，但是各个州的测验各不相同，其结果也不具可比性。NAEP起初是对全国年龄在9岁、13岁和17岁的学生进行数学、阅读、科学和写作等科目的抽样测验。20世纪90年代初期，NAEP转而对四年级、八年级和十二年级的学生进行测验，并且增加了州的样本数量。直到2003年为止，各个州都是在自愿的基础上参与这些评价的。美国《不让一个孩子掉队》的法案要求所有的州都必须参加四年级和八年级学生的数学与阅读测验，并将其作为各州能否获得联邦对弱势儿童教育资助的条件之一。加上NAEP能够在全国范围内以一种标准化的方式对各州的学生学业表现进行衡量，能够对学生在不同时期内在各个学科的表现进行衡量，越来越多的州参与NAEP测试，NAEP真正成为了美国国家基础教育质量监测评价体系。

NAEP主要由国家评估管理委员会(National Assessment Governing Board，NAGB)和国家教育统计中心(National Center for Education Statistics, NCES）共同完成。NAGB是民主、共和两党于1988年联合成立的组织，其成员由州长、州立法委员、当地或州的学校官员、教育家、商业代表和一般公众组成，直接向国会负责。NAGB为NAEP制定政策、框架和规范，NCES负责执行。NCES隶属于联邦教育部下属的教育科学研究所，机构的职责是通过收集和发布全国各方面相关教育数据，为肩负教育发展重要的组织机构提供有价值的服务，为美国的教育决策提供全面系统的数据支持。NAGB和NCES的经费由教育部预算提供，每年都要经总统和国会批准通过。
（二）监测框架：监测的对象、标准、内容、方式

NAEP每隔两年在全国范围内取样，评估四、八和十二年级学生的学业水平，涵盖阅读、数学、科学、写作等，其中以阅读、数学和科学为主。NAEP可按不同维度进行分类：按评价的层级，分为全国评价、州评价和区域评价；按时间维度，分为长期趋势评价和短期评价；按针对性，分为普通评价和特殊评价。不同的评价类型在目的、方法、题目、对象上相应有所不同。另外，该项目还在测试的同时通过问卷调查、查阅学校纪录卡等途径收集学生的性别、年龄、种族、社会经济状况、父母受教育状况等方面的背景信息。

NAEP由三类问题构成：多项选择题、简答题和论述题。简答题和论述题都属于问答题，要求学生必须写出或长或短的答案，有时还要求学生解释他们是如何形成这一回答的。NAEP高度强调监测内容与课程标准的一致性，要求监测与课程标准要达到四个方面的一致性（内容一致性、深度一致性、广度一致性、知识样本平衡一致性），强调学生对课程内容理解、概念掌握、运用知识解决问题以及批判性思考能力的培养。监测方式逐渐在纸笔考试的基础上加入了表现性评价项目。表现性评价是对传统纸笔考试的改革与补充，主要用来测量不能被客观试题很好测量的学习结果，要求学生能够模拟真实情景，创造出答案或结果以展示其知识或技能，显示学生掌握课程内容的真实水平。

考虑到社会经济地位等背景因素对学生学业成就的影响，采用统一的评价标准显然有失公平，NAEP采用增值评价法，对学生学业成就的进步程度进行评价，这也是“进展”的真正意义之所在，从中体现了“用不平等对待不平等”的教育公平理念。

在此以2007年数学测试为例介绍NAEP评估框架的制定。为了制订2007年的数学评估框架，成立了专门指导委员会。该委员会由国家政策组织、数学协会、数学研究者、商业和工业代表组成，负责制定政策建议并确定该项目的方向和范围。还成立了计划委员会，计划委员会成员包括数学教育者、数学家、课程督导和教师等，在指导委员会的政策范围内负责起草评估框架内容。此外，还成立了技术顾问小组，由大学教授、州测试专家和来自私人研究组织的测量专家组成。评估框架的修订试图达到以下目的：一是反映最新的课程重点和目标；二是纳入决策者、学者、实践者以及感兴趣的公民认为评估应该包含的内容；三是维持四年级和八年级的短期趋势评估；四是为每个年级制定更明确和更具体的目标。最终确定了数学评估框架的两个维度，一个是数学内容（Content Area），一个是数学复杂度（Mathematical Complexity of Items）。　

2007年数学评估的内容包括:（1）数字属性与运算，包括数字感知、数字估计、数字操作、比率和比例推理、数字属性与操作等;（2）测量，包括测量物理属性和测量体系；（3）几何，包括尺寸和形状、转换形状和保留性质、几何图形之间的关系、位置和方向以及数学推理;（4）数据分析与概率，包括数据表达、数据集合的特征、实验、样本和概率;（5）代数，包括模式、关系与函数、代数表征和变量、表达式与运算等。
每个评估项目都测量以上5个方面的相关内容，同时每个项目又对学生的思维提出一定的要求，这些对学生思维的要求决定这个项目的数学复杂度。数学复杂度分为低复杂度、中等复杂度和高复杂度三个等级水平。　
（三）监测评价结果呈现及其发布

NAEP不是用简单的分数或平均成绩来呈现学生的学业成绩，而是用数学模型对原始数据进行处理得出量尺分数（scale scores），并为各年级和学科制定成就水平（achievement levels）。阅读、数学、历史和地理科目的量尺分数范围是0-500，科学、写作和公民是0-300;成就水平划定为基本（basic）、熟练（proficient）和高级（advanced）三个层次，通过临界点分数（cut score）设置来判定学生回答到什么程度才算是基本、熟练或高级。为此，NAEP以学生的真实作答为案例，详细描述各级成就水平上学生应具有的关键表现特征，并使用项目反应理论（IRT）制定了各学科的评分量表。评分量表结合成就水平，对学生的答题情况以标准参照的形式进行学生学业成就的综合分析描述，可以用来鉴别学生“会做什么”和“不会做什么”，从而提高了量尺分数的效度。

除此之外，在对监测数据进行分析时，NAEP采用多水平模型分析影响学生学业成就的各种因素（种族、家庭、学校、社区，这些因素在测试的同时以背景调查问卷的形式进行收集），并通过方差分析的方法得出导致成就差异来源中各种因素的贡献量。

NAEP在监测结果报告方面已经形成了完善的报告制度。监测结果以“国家教育报告卡”（The Nation’s Report Card）的形式，每年向公众报告。报告卡的内容涉及学校的成绩表现及各州的进步情况。测验结果按照性别、种族、社会经济地位、学校地理位置、特殊需要与英语熟练程度分开报告，以防止仅提供学校的平均水平而掩盖不同学生群体之间的成绩差距。报告卡一般由NCES对外向公众发布，同时也会以书面报告的方式提交给联邦教育部长、总统办公室、国会教育委员及一些肩负发展重任的教育组织机构、研究机构和个人。在信息形式上，除了书面报告外，通常还会借助新闻发布会、电视媒介、报纸、网络等渠道，方便公众获取信息。此外，NCES、NAGB还专门设立了投诉渠道，由NAGB整理审查投诉及反馈信息，并在30天内作出回应，以此确保社会、学校、家长的知情权，使评价监测的过程和信息得以透明化。

作为美国家喻户晓的“国家教育报告卡”，NAEP的信息发布机制不仅达到了向公众、政策制定者和教育者提供学生在各个学科方面能力的描述性信息，而且为修订完善下一步的监测标准、框架及政策提供了可靠的依据。各级政策制定者们也常常会运用NAEP的结果作为优先发展教育的理由之一。教育工作者则经常引用NAEP的结果来呼吁加大对教育的公共经费投入。

三、经验及启示

美国实施国家教育进展评价，在提高学生学业成就、提高教育质量方面取得了比较明显的成效。有数据显示，美国在国际数学和科学研究趋势（TIMSS）中的排名的总体趋势不断提高。NAEP作为全国性的长期性的基础教育质量监测体系，其实践经验可以为我们提供多方面启示。

（一）完善政策配套，建立全方位基础教育质量监测支持系统

美国的NAEP的实现建立在权威性法案和政策的基础上，有广泛的社会参与并为其提供足够的资金。具体的操作层面由NAGB制定政策、NCES执行方案，而评价的设计和具体考务实施、数据分析则是通过竞标的方法交由专业评价与测试服务的中介机构去完成。从这个角度来看，一方面我们应充分认识到基础教育质量监测对于教育内涵发展、质量提升，对于教育决策科学化的重要作用，给予基础教育质量监测恰当的法律定位，为其开展提供强有力的政策依据。另一方面，政府应每年确定监测专项经费，保障监测工作顺利进行。同时，要成立由多方力量参与的监测组织领导和实施机构，从监测规范、框架制定到监测实施方面建立起专业支持系统。
（二）转变评价理念，确定质量监测服务于教学的评价观，坚持评价的低利害性和公平性

NAEP是一种低利害性的教育质量监测评价体系，其目的是监测美国中小学学业成就现状与变化趋势，从而为国家教育政策制定和改进以及相关教育研究提供数据来源和依据，尤其注重影响学业成就的背景因素，面向全体学生、面向教育全过程，而不是追求形式上、程序上的公平。我们可借鉴NAEP的经验，通过监测了解不同年级学生对不同学科的掌握和应用情况，设定出学生所需要的知识、技巧和能力；同时在试题开发过程中关注弱势群体，关注地域、经济、父母受教育程度等差异性，在监测的同时辅以针对学生、教师和学校的背景调查问卷，努力挖掘数字背后的影响因素，注重对区域及学校教育质量状况进行纵向跟踪比较，使监测更具科学性和公平性。
（三）质量标准先行，构建基于课程标准的质量标准框架及监测体系

美国基于标准的基础教育改革强调以课程标准为驱动提高教育质量，2012年又发布了新的各州共同核心标准，在核心课程标准上，建立了课程学习内容和课程复杂度的清晰界限。我国至今没有国家基础教育质量标准出台，各级政府对基础教育质量的问责缺乏一致性的质量标准。借鉴美国的经验，我国在构建国家教育质量标准框架上，可与当前基础教育课程改革紧密结合起来，以课程标准内容为标准建立相应的评估监测标准，发挥课程标准对于提高教育质量的驱动作用。另外，在质量标准的研制问题上，可借鉴美国的经验，先制定一个统一的国家标准，各地方可根据国家标准进行补充和修改，形成分级、分类、分科的教育质量标准体系，以反映不同地区的差异性，满足特殊需求，达到“质量”与“公平”兼顾。

（省教育研究院基础教育研究室黄志红撰稿）

（共被浏览次数：1671 次）