主成分分析法在学生成绩分析中的应用

2022-10-03

如何科学地、可观地、全面地评价学生的综合成绩对学生和学校都特别重要。目前, 大多数院校统计学生综合成绩的普遍做法是用学分绩, 这种方法能够体现学时多, 即学分高的课程的重要性, 但各门课程给定的学分数是否合理, 学分绩是否能全面反映原始数据的主要信息?

我们知道主成分运用少数几个无关的新指标来代替原来众多的相关指标, 能全面地反映原变量的信息量, 用主成分得到的学生成绩排序来看学分绩的得到的学生成绩是否合理。我们可以用学分绩和主成分两种方法研究一年级学生成绩排序和后续学年的排序是否相关?

1 研究对象

本文以天津工业大学电信专业05级99名为例, 以三个学年成绩作为样本将每学年的各科成绩作为变量, 以三学年成绩排序为研究对象, 数据由天津工业大学教务科提供。

2 评价学生综合成绩的模型

2.1 平均学分绩模型

天津工业大学实施以学分绩对学生进行学业评价制度, 每位学生的学分绩是按照下面的公式算出: (总和的) 百分制成绩×学分÷总学分。

2.2 主成分分析模型

下面是主成分分析的步骤:设有n个样本, 每个样本有m个数据, 记为:

(1) 对x的列进行标准化变换:

其中, 得到标准化矩阵x*, 仍记为

(2) 用计算机计算指标变量的相关系数矩阵:

其中

(3) 用相关系数矩阵计算R的特征值iλ。

(4) 确定主成分个数, 称为第k个主成分的信息贡献率, 记为βk, 称为前k个主成分的累计贡献率超过70%时, 取前k个主成分代替原来的m个指标。

(5) 利用特征向量z= (z ij) nm和因子载荷矩阵A= (a ij) mn的关系, 利用spss中的命令可直接得到因子载荷矩阵A, zij=aij/

(6) 建立主成分模型:

对学生三学年学习成绩按照上面的步骤, 利用软件SPSS。第一学年的操作结果 (见表1、2) 。

由表2知, 第一个主成分有较大载荷的是高等数1、高等数学2、大学物理1、C语言程序设计等, 在系数上都是正值相差也不是很大, 反映了学生的总的学习能力。由表1知相关特征根分别为6.045, 1.139, …可知第一特征根的所占比重为46.498%, 表示第一主成分承载了学生成绩的主要综合信息。这样用第一主成分就可以对学生综合素质进行合理评价。下面是第一学年第一主成分的计算公式:

第二学年的操作和上面类同, 它的特征值及贡献率表以及主成分载荷矩阵省略。只给出分析结果, 从主成分载荷矩阵可以看出第一主成分系数比较大的是概论论和数理统计, 积分变换, 复变函数, 大学物理实验2, 信号与系统, 模拟电子系统, 电子实践电子技术实验, 数据结构。第一主成分反映是电信的专业课以及部分基础课, 这与大二课程的特点相符和。第一主成分的特征根是10.017, 第一特征根的所占比重为52.723%。表明了第一主成分承载了学生成绩的主要综合信息, 所以用第一主成分当作学生的综合成绩比较好。第二学年的第一主成分计算公式为:

三学年的操作同上:它的特征值及贡献表以及主成分载荷矩阵省略, 只给出分析结果在第一主成分中系数较大的是:高频电子技术, 数据压缩与编码, 专业外语, 数字电子技术, 数据库原理与应用, 计算机接口技术应用实验, 计算机接口技术及应用, EDA原理与应用等。可见第一主成分主要反映的是专业课的学习能力。第一主成分的特征根是11.874, 贡献率是69.845%, 表明第一主成分承载了学习成绩的主要综合信息, 第三学年学生成绩的第一主成分的计算公式为:

综上所述, 第一主成分与原始变量的综合相关度最强, 所以我们用一个单变量即第一主成分来代表学生的综合成绩, 与学分绩算出的综合成绩相比较, 看学分绩算出的综合成绩是否合理。由上面的公式算出三年学生学习成绩的第一主成分, 并进行排序。

2.3 排序的比较分析

把每一学年的学分绩和第一主成分的排序作相关分析, 得到的相似系数矩阵, 可以看出第一学年两种排序的结果之间的相似系数是0.995, 第二学年的两种排序的结果之间的相似系数是0.998, 第三学年的两种排序结果相似系数是0.998, 显著相关, 这说明三个学年的成绩按照这两种方法排名结果也是几乎是一致的。由两种排序的比较结果, 可以看出学分绩与第一主成分排序在一定程度上有差异, 但从总体来看差别不大, 一般相差不超过4名。画出第一主成分参照学分绩排名的散点图可以看到, 第一主成分排名总体和学分绩排名上下波动, 起伏不大。散点图略。

2.4 一年级学生成绩和二年级、三年级的相关性

把按照学分绩排序的第一学年与第二学年、第三学年的成绩作相关分析。由SPSS操作结果知第一学年与第二学年的成绩排序相关系数为0.866, p值为0.000, 第一学年的与第二年的成绩排序显著相关。第一学年与第三学年成绩排序的相关系数为关系数为0.794, p值为0.000, 第一学年与第三年的成绩排序显著相关。由第一主成分作相应的相关分析, 结果一致。由上面可知不论是按照学分绩还是第一主成分第一学年的成绩排序与第二学年、第三学年显著相关。

3 结语

按照第一主成分来算学生的综合成绩能够承载学生成绩的主要综合信息。而学分绩排序和第一主成分排序基本相符, 所以学校按照学分绩来算学生成绩是合理的, 另外按照两种方法对三学年成绩进行排序, 发现一年级的排序和第二学年和第三学年显著相关, 说明一年级的成绩对后续学年的成绩有影响, 一年级是基础, 所以因加强对一年级的管理。

摘要:本文用主成分方法研究了学校实行的学分绩的合理性, 还给出了了学科成绩方面的分析, 并且发现一年级的排序和二、三年级的排序的成绩显著相关, 说明一年级的成绩对后面的成绩有影响, 对教学管理有一定的指导意义。

关键词:平均学分绩,第一主成分,学生成绩,学年

参考文献

[1] 宇传华.SPSS与统计分析[M].北京:电子工业出版社, 2007.

[2] 吴海英.学生成绩排名的综合评价模型[J].大学数学, 2006, 22 (4) :142~145.

[3] 方开泰.实用多元统计分析[M].上海:华东师范大学出版社, 1989.

[4] 朱宁, 等.学生成绩的学分绩和主成分排序模型[J].大学数学, 2007, 23 (1) :31~36.

[5] 扬宇音, 赵雅明, 曲立敏.因子分析法在大学生综合排名中的应用[J].贵州工业大学学报, 2005, 34 (1) :9~12.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:“光电类”专业创新创业情况调查及策略剖析下一篇:电站压力容器失效分析