教务数据论文范文

2024-09-12

教务数据论文范文(精选9篇)

教务数据论文 第1篇

教学事务处理是学校的根本, 也是学校运作的核心数据。学生的学籍成绩等数据需要在学校长期保存, 甚至学生毕业离校后仍需保留若干年。教务数据量大且精确, 可以从这些海量数据中发掘出更深层次的信息, 以监控学校运转状况及作出合理的战略计划。

1 教务数据处理手段及来源

1.1 数据来源

目前, 学校日常的教务数据多用于数据的收集、积累、查询等, 对教务数据的分析也仅仅局限于数据的简单汇总。要想从教学数据中发掘深度信息, 还需引用其它关联数据。研究发现, 这些信息的来源大致有以下几种: (1) 学籍数据。比如:学号与姓名、性别、年龄、籍贯等属性的关联。这些数据可来自于招生办、各学院年级管理部门等; (2) 课程数据。比如:课程号与课程名称、课程性质、课时、授课教师等属性的关联。这些数据多来自学校教务办或各学院年级办; (3) 成绩数据。成绩数据主要由教务办收集存储; (4) 教学条件数据。比如:是否在多媒体教室和实验室授课、教室大小等, 这些可来自于资产管理部门, 这些数据同样也会对教学效果产生影响, 也是值得挖掘的; (5) 学工数据。比如:特长学分、获奖情况等也可计入学生成绩, 这些数据来自于学工部门。

1.2 处理手段

教务数据处理方式主要有人工处理和计算机处理两种。

1.2.1 人工处理

为了反映较大范围教务情况的整体特征, 教务部门经常要付出庞大的人力和物力收集大量数据。人工处理数据有时会面临这样的窘境:上一期的数据结果还没分析出来, 下一期的数据收集又要开始了, 因此整个数据收集和分析工作变得没有任何意义。除此之外, 如果学校还需了解较长年限的教学质量, 则必须有近10年、20年甚至更长时间的教务数据, 这些工作如果靠人工去做非常困难, 导致许多教务数据分析工作无从实施。

1.2.2 计算机处理

20世纪80年代以来, 基于计算机技术的教务处理工作经过了面向数据处理、面向信息处理等阶段。在这两个阶段, 许多教务工作 (比如教务数据收集、汇总等) 确实提高了工作效率, 但是教务海量数据中隐含的价值仍不能被有效发掘。比如, 学校专业发展转变趋势、学校培养模式变化等。虽然许多部门都已经构建了自己的MIS (Management Information System) , 这些部门能够在MIS上有效工作, 但对于整个学校系统, 由于缺乏统一规划, 各子系统或多或少存在“信息孤岛”的问题, 也没有有效的方法从海量的相关数据资源中快速挖掘更有价值的知识信息。因此, 耗费成本收集的数据没有利用就被弃置了, 教务数据分析仅停留在表面。

信息时代逐步进入知识处理阶段, 急需应用数据仓库和数据挖掘技术来处理教务数据。

2 建立面向知识处理的教务数据仓库

数据仓库 (Data Warehouse, 即DW) 是指一个面向主题的、集成的、非易失的且随时间变化的数据集合, 用来支持管理人员的决策[1]。按照上述分析的结果, 首先要构建教务数据仓库, 这部分主要有4个任务: (1) 确定教务系统中的数据源; (2) Web日志数据的预处理; (3) 多维Web数据模式的建立; (4) OLAP技术应用。

2.1 选取适当的教务数据源

如前所述, 首先应统一各部门共享的数据规范。比如:学号、课程号、成绩格式、学分计算规则等, 这样便于数据仓库的统一组织管理。例如“开课计划”主要由各学院按照培养计划每学期提交, 包括各专业班级的课程安排、授课教师、课时、学分等。这部分数据主要以Excel表格形式提交, 教务部门对这部分的数据收集与存储大部分停留在文档形式;又例如, “课程成绩”主要在每学期末由授课教师分专业班级课程提交。目前, 这部分数据收集有的以纸质文档形式收集, 部分以Excel文档形式收集, 也有的实现了数据库收集存储。在进行数据挖掘之前, 需使用数据仓库统一组织管理这些数据。目前, 许多学校实现了在线登录成绩, 那么如何对庞大的Web数据建立数据仓库呢?

2.2 Web数据预处理

通过Web收集的数据称之为原始数据, 如:专业班级名称、教师登录名、课程名称、成绩比例、分数等, 对Web数据的预处理包括两个步骤: (1) 清除噪音, 即去掉对知识挖掘无关的数据。比如:无效的成绩值、休退学的学生记录; (2) 转化数据, 即将原始数据按照挖掘需求, 通过重新组织或简单计算转换成规范模式。比如:将等级制成绩按照约定规则转换为百分制成绩。

2.3 建立多维Web数据模式

(1) 选取维。多维数据便于从多个角度、多个侧面对数据仓库中的数据进行观察、分析, 以深入了解包含在数据中的复杂关联。N维数据矩阵用C (A1, A2, ..., Am, count) 模式表示, 其中Ai代表第i维, i=1, 2, ..., n, count是变量, 反映数据的实际意义。数据单元用r[A1:a1, ..., An:an, count]模式表示, 即为维Ai选定一个维成员ai, i=l, …, n, 这些维成员的组合唯一确定了变量count的值。

(2) 构造多维视图。如图1所示, 建立Date_Class_Course的3D视图, 可以了解某学期某班级具体课程的开设情况。

(3) 创建多维数据模式。在图1基础上, 根据需要还可建立三维以上的数据视图, 加大数据检索的范围。

2.4 应用OLAP技术

OLAP, 即在线联机处理。OLAP可以方便快捷地从Web数据矩阵中做出一些简单的结论性分析。针对如图1所示的数据视图, 可以采取切片分析 (Slice) 技术获取二维视图, 比如:某专业某课程设置的变化趋势;某学期所有课程的情况分析等。

3 教务数据深度挖掘

数据挖掘 (Data Mining, 即DM) 是指从大量的数据中, 抽取出潜在的、有价值的知识 (模型或规则) 的过程。数据挖掘就是从大量数据中“挖掘”知识。一般的挖掘流程是: (1) 确定挖掘对象; (2) 数据准备; (3) 数据挖掘, 即模式提取; (4) 结果分析, 即模式评估[2]。

3.1 数据挖掘技术应用范围

虽然现在已有很多学校建立了教务管理网站, 但多数只是在Web上进行成绩的登录和查询, 并没有发挥信息技术的智能化优势。对于学校而言, 教务部门希望能够从其门户网站中收集大量原始数据, 并依此挖掘更深入的服务信息。同时, 学校高层也希望能从教务系统中了解多方面的学习情况、课程计划的实施效果等, 这些都需要从海量的教务数据中应用特定的挖掘模型反映出来。基于此, 对于下一次培养计划的修订才有现实的数据支撑。对于学生而言, 如果能直观地了解自己成绩变化趋势, 获取同专业同课程或同年级的横向比较信息, 学生便能尽早了解自己的优势与弱势, 查缺补漏。

3.2 应用挖掘模式提取和分析知识

根据不同的应用需求, 在数据挖掘模式中选择合适的方法进行计算, 提取有效数据, 得出知识。对于教务系统而言, 可以应用聚类 (Clustering) 方法汇集专业与课程信息的分布情况, 从而识别出以下问题: (1) 对于某个专业班级, 哪些课程学习效果较好? (2) 对于学习效果较好的课程, 是因为教学效果好, 还是开课计划恰当? (3) 对比同一门课的不同专业班级, 辅助各学院分析培养计划的适应性; (4) 不同专业招生、毕业率的比对等。数据挖掘系统要能够挖掘多种类型的模式, 以适应不同的用户需求或不同的应用。常见的DM模式有:Class/Concept Description、Association Analysis、Classification and Prediction、Clustering、Outlier Analysis等。

4 结语

教务管理不仅是日常的学校事务, 它更重要的作用体现在反映学校的教学效果和分析学校培养方向是否正确, 并以此帮助学校向更好的方向发展。关于面向知识处理的教务数据分析, 还有许多方面值得深入研究。

参考文献

[1]WILLIAM H, INMON.Building the data warehouse fourth edition[M].北京:机械工业出版社, 2006.

[2]韩家炜, MICHELINE KAMBER.Data mining concepts and techniques third edition[M].第3版.北京:机械工业出版社, 2012.

教务数据论文 第2篇

关键词:

关键词:决策支持系统;数据仓库;多维分析

在现有的教学信息化系统中,存储了包括学生的学籍信息、学生的选课数据、各科成绩数据等在内的大量数据,这些数据的条数动辄上百万条,信息和数据量都比较大,同时这些数据中通常能够挖掘出有用的规律信息。不过,通过对现有应用现状分析可以发现,人们更多的是将各种表单数据进行计算机管理,没有利用计算机的数据挖掘能力对这些数据进行分析,更没有从中找到潜在海量数据中的规律。教学数据仓库

1.1 总体结构 在对现有教学管理系统的决策需求进行深入和一线调研的基础上,笔者给出了基于教学数据仓库的决策系统,并对系统中经过结构化的四层教学决策支持系统的总体结构进行了设计。具体如图1中所示。图1教学决策支持系统的总体结构图

1.1.1 源数据层 该层是构建教学系统的最低层,也是实现数据仓库的关键。在数据仓库中所包含的数据,主要来自于学校现有的与教学相关的各种信息库。而在这些信息数据库中,存储了学校教学过程中所积累的主要数据,也是学校在制定各项政策和决策中必须参考的主要数据。这样设计,也更好的说明一个成熟的教学决策系统应该具备广泛的数据来源。

1.1.2 引擎数据的处理层 该层的功能主要从现有的教学信息系统中实现数据的抽取,然后对抽取得到的各种数据进行清洗,最后才能够将这些数据都添加到教学数据仓库中。所以,这就使得数据处理层成为数据仓库构建的关键层。

1.1.3 信息层 信息层的作用就是为数据访问层和源数据层提供联通的桥梁,为数据提供特定处理过程,得到经过处理后的不同层次信息。这样分析层就可以在这些数据的基础上进行建模。在信息层中,其关键为教学数据仓库,这主要是由于该仓库能够完成各种数据的收集、筛选和抽取等多种操作,进而最终形成能够为学校的政策制定和日常教学决策提供参考与支持的包含了多个粒度等级的数据库,结果就是顺利完成对各种数据源的统一管理与信息提取。

1.1.4 数据访问层 该层主要作为整个高校决策支持系统的为用户所提供的操作接口,可以让用户非常方便的进行内容的查询、报表、OLAP等多种应用。不仅如此,为了能够很好地服务高等院校的日常教学决策需求,该层还为用户提供了多种基于多维分析的手段,和一下相对简单的分析模型。基于这些模型和分析方式,用户可以在实际使用过程中构建专用的分析系统,从而有效保证所研发的教学决策支持系统能够具有较高的灵活性。之所以采用结构化的四层体系结构,主要是考虑到这种结构能够很好的契合高校在日常决策中的方式。不仅如此,还可以通过教学仓库来实现不同系统的数据驱动。在这种结构中,修改、删除或者添加任何一层,给整个系统所带来的影响都非常小。

1.2 ETL工具设计解释 基于ETL工具完成设计,就是从各种数据源中提取数据,并在此基础上对获得的数据进行清洗、转换等处理的多个步骤后,将数据加载到数据仓库的过程。笔者通过代码的手工编写,来实现数据的转换与抽取,并最终实现教学仓库的ETL工具的设计与实现。在对标准ETL数据进行抽取操作的过程中,存在于原系统中的数据质量问题有可能暴露出来。同时,所采用数据的质量能够给仓库的可信度带来直接影响,并对最后的多维分析结果产生影响。所以应该重点提供所提取数据的质量。因此,在各种数据源的数据进行预处理过程中,应确保所涉及数据的完整性,进而实现数据质量的检验,以及数据的去噪与净化处理。

教务数据论文 第3篇

一、知识发现与数据挖掘的理论基础

(一)知识发现的研究综述

知识发现(Knowledge Discovery in Databases,KDD)一词最早出现在1989年8月美国底特律召开的第11届国际联合人工智能学术会议上[1]。1996年,知识发现被Fayyad U,Piatetsky,Shapiro G和Smyth P定义为:知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程[2]。对KDD的研究主要包括从数据库的角度进行研究以强调知识发现的效率,从机器学习的角度进行研究以强调知识发现的有效性,从统计分析的角度进行研究以强调知识发现的正确性,从微观经济学的角度进行研究以强调知识发现的最大效用。KDD过程是多个步骤交互螺旋式上升的学习和总结过程[3],基本流程包括:

(1)限定学习领域,储备预先知识、确定学习目标;

(2)聚焦目标数据集,选择一个数据集或在多数据集的子集上聚焦;

(3)数据预处理,数据降噪或数据清洗;

(4)数据转换;

(5)确定数据挖掘功能法则;

(6)获得知识信息、运用知识成果并重新选定学习目标。

在创新的过程中,单单依靠显性知识已经不足以支撑整个思维求异和技术创新的全流程。随着数据量的爆炸式增长,传统数据库的检索查询已不能满足信息社会的深层次需求,再加上传统分析手段的落后,大量数据来不及整理、分析或利用就已“时过境迁”成为无效信息,而且被长期积压在数据库中浪费存储资源。为了及时消解数据产生和数据理解之间的矛盾,还必须定期对数据进行深度挖掘,使得大量被隐藏的、有价值的信息得到有效利用。

(二)数据挖掘的理论探索

数据挖掘(Data Mining)是指使用算法来抽取信息和模式,通常是知识发现过程的一个重要步骤。数据挖掘融合了机器学习、模式识别、数据库技术、统计学理论、人工智能及信息管理系统等多门学科的最新成果。应用数据挖掘技术从大型数据库中发现隐藏在其中的规律和有用信息,为管理层决策提供事实型数据和研究模式。

根据KDD的目标任务,数据挖掘任务可分为:分类或预测模型发现、数据总结与聚类发现、关联规则发现、序列模式发现、相似模式发现、混沌模式发现、依赖关系或依赖模型发现、异常和趋势发现等。而所要挖掘的对象则可以分为:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及web等对象的挖掘。从方法论讲,其挖掘方法一般分为:聚类分析、探索性分析、机器、统计、神经网络(Neural Network)、遗传算法(Genetic Algorithm)、数据库、近似推理和不确定性推理、基于证据理论和元模式、现代数学分析、粗糙集(Rough Set)、集成方法等方法[4]。

(三)小结

综上,知识发现用于从大量数据中抽取规律信息,发现非预期或潜在的价值量,而数据挖掘作为知识发现的重要一环是与实践应用紧密相连的,两者不仅仅是对数据的简单检索调用,而是从数据集合中自动提取出隐含在数据中的关系和模式,进而对未来可能发生的行为进行预测,为决策者提供有力支持。

二、高校成绩管理与学科建设

成绩是学生在校学习期间对所学知识理解掌握情况和教师教学质量评价的原始记录,对学校的教学管理和教学改革措施评价具有重要的参考价值[5]。成绩管理是高校教学管理中的最为基础性的一个环节,是根据教学目的和教学任务,

通过学生的实际量化考核分数来进行统计、查阅和分析的综合性数据处理过程。该过程的科学与否,直接关系到教务管理的实际质量和教学工作的可持续发展,特别是在网络化和信息化的新形势下,该项工作被素质教育赋予更加深远的现实意义。本文所指学科成绩不仅限于学生的笔试成绩,还包括了学生参加各种校内外实习和培训,以及其他形式素质教育的量化数据。

(一)高校成绩管理所面临的新形势

从宏观上讲,随着国家高等教育普及工作的不断推进,以及教育战线“以人为本”理念的逐步深入,高校教务在成绩管理这一环节上所面临的任务显得比以往任何时刻都更加繁重。

首先,院校扩建和学生扩招为学科成绩管理模块在数据容量上增加了压力。近几年,随着一些高校教学资源的整合和扩充,许多高校设立了新校区、设置了新专业,反映在学生成绩管理上则是成绩数据的时空容量同时增长。每多出一个学生,从学籍材料到各年度学科数据再到图形化成绩资料都会相应增加,教师教务管理系统所要处理的信息量也会相应增加,这首先在量上增加了数据压力。

同时,素质教育为学科成绩管理如何更好地服务教师施教和学生学习提出了新的课题。素质教育是我国长期以来所推行的一项基本国策。学科成绩是高校学生在校的唯一量化评价指标,如何通过这些数据来及时反映出学生的学习效果和心理需求、反映出教师队伍的教学质量和教学改革进度,已经成为教务管理系统化的一个重要课题。

其次,教学管理模式改革为建立规范化的成绩管理系统并进行深度信息挖掘提出迫切需求。当前许多高校都在积极推进教学管理制度改革,逐步以学分制和选课制替代原有的学年制和班级授课制度,这种模式的改革在提高学生的学习积极性的同时,无形之中也为成绩管理工作带来了一定难度,比如增加了课程设置的不确定性,成绩管理不能再以自然班级为单位,而是必须以单个的学生或者学生组合为单位,使得成绩管理更加复杂。

教务管理信息系统的数据库建模 第4篇

关键词:管理信息系统,数据库建模,UML,类图

一个数据库应用系统的开发,最关键的步骤就是整个系统所依托数据库的建模。数据库建模是一种软件工程实践,是一项系统工程。在传统的结构化系统设计中,以系统的需求分析结果为前提,将需求分析阶段得到的实体-关系(Entity Relationship,ER)图转化为关系数据库模型,将实体转换为关系模式,实体的属性转换为关系模式的属性。面向对象的系统设计中,使用统一建模语言(Unified Modeling Language,UML)的类图能够更好地进行数据库建模。传统的ER图仅仅着眼于数据,UML的类图不但对数据建模,而且能对行为建模,这些行为在物理数据库中被设计成触发器和存储过程。在面向对象的系统设计阶段,以系统分析阶段所获得的类图为基础进行数据库的逻辑结构设计,可以把 UML类图转化为关系数据库模型。从类图到关系模型的转换,按照一个类映射为一个关系的大原则进行,而类的属性即为关系的属性[1]。本文以一个已开发的教务管理信息系统的数据库建模为例,讨论将UML类图映射成关系型数据库中表的方法,该系统主要实现学生学籍管理和成绩管理。

1 UML类图

随着使用UMI进行数据库设计的出现,类图变得更加重要。从系统需求分析所得到的用例模型和顺序图出发构建系统类图,类图可以清晰地描述系统所涉及的事物及其属性和方法,主要用来描述系统中各类之间的静态结构。

在面向对象的系统中,对象分为3类:实体类、边界类和控制类[2]。其中实体类表示的是系统领域的实体,实体对象具有永久性,并且存储在数据库中,其他2类不会实现至数据表。因此,基于UML类图对系统的数据库建模,只需关注构建系统的实体类类图。

类图不仅定义了系统中的类,还表示了类之间的关系。类之间具有关联、泛化、聚合和组合等关系。关联表示2个类之间的一对一、一对多及多对多的联系,泛化指类之间的一般和特殊的关系,聚合表示类之间整体与部分的关系,组合指的是类之间强的聚合关系[3]。

类图的建立通常可采用以下几个步骤来实现:

(1) 识别系统的类;

(2) 对类进行划分;

(3) 确定类的属性和操作;

(4) 确定类间联系,建立类图。

建立类图的关键是首先识别出系统的类,类的识别是逻辑架构建模的核心和关键所在,常用的识别方法有名词识别法和运用自已有的开发经验来识别系统的类等方法[4]。名词识别法,即根据用例描述(即用例文字描述和顺序图),找出名词、名词短语或名词性代词,然后从候选对象(类)中筛选去掉一些名词,得到系统的一些类;而依据系统开发经验获得的类,则需首先找出系统中E-R图中的实体,即系统中持久的元素,然后参照E-R图中的实体去定义相应的类。其次识别类与类之间的关系,显式的关系可以从用例模型的用例中找到。

按照如上方法,通过对教务管理信息系统进行系统需求分析,在建立系统用例图(如图1所示)和顺序图的基础上,找出教务管理信息系统中类及类之间的关系。教务管理信息系统中需要永久性存储在数据库中的主要实体类类图,如图2所示。

在图2所表示的教务管理信息系统的实体类类图中,学生实体与与个人简历、社会关系及考勤实体之间存在聚合关系,班级实体与学生实体之间存在一对多的关联关系,学生实体与成绩实体之间、课程实体与成绩实体之间以及班级实体与成绩实体之间存在一对多的关联关系。

2 教务管理信息系统中基于类图的数据库建模

基于类图的数据库建模,是将系统实体类类图映射到关系数据库,其映射的基本规则主要有[5]:将实体类映射为表; 将属性映射为列;将属性的类型映射为域;类之间的关系根据具体情况进行映射。

2.1 将类映射到表

从教务管理信息系统的实体类类图可知,系统共有班级类、课程类、成绩类、学生类、个人简历类、社会关系类、考勤类、用户类等8个实体类。按照映射规则,这8个实体类可映射到8个数据表,即学生类映射为基本情况表;个人简历类映射为个人简历表;社会关系类映射为社会关系表;考勤类映射为考勤表;课程类映射为课程表;班级类映射为班级表;成绩类映射为学生成绩表;用户类映射为用户账户表。

2.2 将类的关系映射到关系数据库

实际建模时,类图中很少有类单独存在,大多数类以关联、泛化、聚合和组合等几种关系相互协作的形式出现。映射到数据库后,要用表的形式反映出各种可能的类关系。

2.2.1 关联关系的映射

在UML类图中,关联表示类的实例之间存在某种关系。它通常可以有一对一、一对多和多对多等情形。在关系数据库中,可通过使用外键来实现类的关联,外键允许将表中的某一行与其他表中的行相关联[5]。

对于类的一对一关联,在关系数据库中,仅需要在表中加入另一个表的主键。

对于类的一对多关联,在关系数据库中,将外键放置在“多”的一方。如果“一”方是可选的,则外键可取空值,以表明“多”方的记录可以独立于“一”方存在;如果一方是强制性的,则外键一定要非空。

对于类的多对多关联,在关系数据库中,通过在2个表之间增加一个表来实现映射关联,从而把原来多对多的关系简化为2个一对多的关系。实现时,在增加的1个表中,建立2个外键,用于分别指向原来的2个表的主键[6]。

教务管理信息系统的实体类类图中,共有4个一对多的关联,应用映射规则,产生如下表间的关系。

班级表与基本情况表、成绩表这2个一对多关联中,“班级代码”为班级表主关键字,并作为基本情况表、成绩表的外键。

基本情况表与成绩表一对多关联中,“学号”为课程表的主关键字,并作为成绩表的外键。

课程表与成绩表一对多关联中,“课程号”为课程表的主关键字,并作为成绩表的外键。

2.2.2 泛化关系的映射

泛化关系是类与类之间的继承关系,代表“a kind of”的联系。将具有泛化关系的类映射为数据表时,有3种映射方式:第一种方式是将一般类和特殊类的所有属性都放在一张表中,成为单一数据表;第二种方式是将一般类的所有属性、方法复制到各个特殊类中,成为数个特殊类的数据表(实际数量为特殊类的个数);第3种方式是将一般类和各个特殊类分别映射为数据表(实际的数量是特殊类的个数加一个一般类),一般类数据表的主键成为各个特殊类数据表的主键或外键。

2.2.3 聚合关系的映射

聚合是类之间的整体与部分关系,是一种特殊的关联关系,代表“has a”联系。其中“部分”不仅可以被多个“整体”共享,而且“部分”独立于“整体”而存在。

将具有聚合关系的类映射为数据表时,有2种对应的方法:一是紧密的聚合关系,它可以在一张表中实现;二是松散的聚合关系,它与一对多的关联映射方法一样[7]。

从教务管理信息系统的实体类类图可知,学生实体与与个人简历、社会关系及考勤实体之间存在聚合关系。将聚合关系映射为数据表时,采用将构成整体与部分的每个实体类映射到表,并实现一对多的关联映射[8]。按照映射规则,该聚合关系映射为基本情况表与个人简历表、社会关系表、考勤表3对一对多关系,设置“学号”为基本情况表的主关键字,保证学生基本信息的惟一性;同时设置“学号”为个人简历表、社会关系表和考勤表的外键,作为一对多关系的多方。

2.2.4 组合关系的映射

UML 中组合关系是一种特殊的聚合关系,表示事物的整体/部分关系较强的情况,称为“contains a”联系。此时,“部分”不能为多个“整体”所共享,只依附于一个“整体”而存在。

具体的映射策略与聚合类似,由于组合关系中整体和部分间存在很强的所有关系和一致的生命周期,所以子类所对应的子表中的外键不能为空[9]。

教务管理信息系统的实体类类图中类间不存在泛化和组合关系,因此不考虑这些关系的转换。

按照以上映射方法,将教务管理信息系统的实体类类图映射为关系数据库,如图3所示。

3 结 语

一个数据库应用系统的设计包含数据库设计和应用软件设计2部分,UML既可以用于数据库设计,也可以用于一般应用系统建模。本文以开发了的教务管理信息系统数据库建模为例,讨论基于UML类图的数据库建模的方法与过程,主要探讨了UML类图到关系数据库的转换,即数据库的逻辑结构设计。UML类图作为共用的中心图,数据库设计者和应用程序开发者都把它作为设计的基础。使用UML,能真正做到将两者结合起来,从而大大提高开发效率。

参考文献

[1]卢莹,林荫.一种基于UML的关系数据库建模方法[J].电脑知识与技术,2008(5):1025-1036.

[2]王恩波,王若宾.管理信息系统使用教程[M].北京:人民邮电出版社,2007.

[3]郑远挺.UML类图实现至对象关系数据库之研究[D].天津:天津大学,2003.

[4]范晓平,王修智.UML类模型满足用例的责任者[J].电脑编程技巧与维护,2011(3):5-7.

[5]申光,陈志刚.UML在关系数据库设计中的应用[J].计算技术与自动化,2005,24(1):112-118.

[6]王修智,范晓平.从类模型到数据模型[J].电脑编程技巧与维护,2011(7):5-7.

[7]张念春,杨寿保.UML模型向关系数据库的映射方法初探[J].计算机工程与应用,2002(19):212-214.

[8]王志和,袁飞勇,毛韶阳.基于UML的数据库设计与实现[J].科学技术与工程,2006,23(6):4784-4788.

数据库技术在教务系统中的应用 第5篇

教务管理是教学工作的重点内容, 也是学校运作的枢纽, 而教学质量与水平将直接影响到高校在行业内的竞争水平, 进而影响到学校的生存和发展。当前, 社会已经进入了高度发达的状态, 计算机技术为教务管理信息化提供了强有力的手段。与此同时, 随着国家教育体制的不断改革和发展, 高校招生规模急剧扩大, 也给高校教务管理工作带来了新的压力。因此, 必须在现有的软硬件条件下, 运用现代化信息网络技术建立完善的教学管理系统。教学管理水平的高低, 不仅反映了学校内部的管理水平, 也影响到国家教育事业的发展方向。同时, 实现教务管理信息化也是教育现代化、规范化、科学化的基础。

1 教务系统数据库需求分析

通过对现有的教务系统进行分析, 结合高校教务管理工作的具体情况, 可以得到教务系统的主要功能模块, 包括学生信息管理模块、教师信息管理模块、院系信息管理模块、课程编排信息管理模块、学生成绩管理模块、综合信息查询模块、系统管理模块。下面分别对这些功能模块进行分析:

(1) 学生信息管理模块。该功能模块主要对教务工作人员开放, 可以对学生信息进行管理, 包括添加、删除、修改、查询等功能。在录入学生基本信息后, 系统在保存信息时会检查信息的重复性, 如果存在重复的学生编号, 系统会明确提示。在删除学生基本信息时, 系统首先会提示用户是否确认删除操作, 这样可以保障系统安全。

(2) 教师信息管理。教师信息管理也是重要功能模块之一, 教务工作人员可以通过此模块来添加、修改、删除、查询教师的基本信息。系统在保存教师信息时会检查教师编号, 在删除或修改教师基本信息时会提示确认信息。

(3) 院系管理。院系管理模块主要是对院系信息进行管理, 包括院系类别的设置、修改、查询、删除等。在添加新的系别信息时, 系统首先检查系别编号的唯一性;在修改、删除系别信息时, 会提示操作用户确认信息, 从而保证信息的安全性。

(4) 课程编排信息管理。课程编排信息管理功能模块主要对学生课程信息进行编排和管理, 包括添加、修改、删除课程信息, 以及班级课程管理等功能。

(5) 学生成绩信息管理。成绩管理模块主要对学生的成绩信息进行管理, 包括成绩信息的录入、查询和修改。教务工作人员可以通过该功能直接对学生成绩信息进行管理。

(6) 综合信息查询。综合信息查询模块主要对教务系统中的各种信息进行查询, 包括学生基本信息、教师基本信息、成绩信息等。比如, 在查询学生基本信息时, 可以输入学号、班级编号、姓名、宿舍编号等信息来检索信息, 可以根据需要设置查询条件, 也可以组合查询条件。同时, 系统支持模糊查询, 这样有利于查询管理。综合信息查询功能可以对学生基本信息、院系信息、课程编排信息、学生成绩信息等进行多条件综合查询, 还支持报表输出。

(7) 系统管理模块。系统管理模块主要包括用户管理、用户权限分配管理、数据库备份与恢复、系统基本信息设置等功能。其中, 用户管理是对系统中的用户角色进行配置和管理, 用户权限是对用户能够操作的功能进行划分和管理, 保障系统安全。教务工作人员在登陆系统时会输入自己的工号、密码, 系统根据用户权限来初始化操作界面。用户管理主要是对用户信息、用户账户信息进行管理。

2 教务系统数据库设计

高校教务管理系统主要是对学校教务工作进行信息化管理, 其功能模块包括学生信息管理模块、教师信息管理模块、院系信息管理模块、课程编排信息管理模块、学生成绩管理模块、综合信息查询模块、系统管理模块。通过对教务系统进行数据库的需求分析后, 可以得到教务系统的主要数据流包括如下元素:

(1) 学生基本信息:学生姓名、学生学号、学生性别、专业ID、班级编号、出生日期、联系电话。

(2) 教师基本信息:教师姓名、教师性别、教师编号、出生日期、班级编号、联系电话。

(3) 教务用户信息:用户编号、用户名、密码、权限编号。

(4) 课程编排信息:课程ID、课程名称、课程描述、代课老师编号、课程日期、班级编号。

(5) 系统日志信息:日志编号、用户编号、操作时间、动作描述。

(6) 用户权限信息:用户编号、权限等级、权限描述。

(7) 院系基本信息:院系编号、院系名称、院系描述、专业描述。

(8) 学生成绩信息:学生编号、学生姓名、课程编号、课程成绩。

(9) 系统操作描述表:操作编号、操作名称、操作描述。

(10) 用户留言信息:用户编号、留言ID、留言时间、留言描述。

(11) 资讯信息:资讯编号、资讯主题、咨询内容、发布时间。

3 数据库技术

3.1 SQL Server数据库

微软推出的关系型数据库SQL Server具有如下重要特点:

(1) 高性能设计, 可充分利用Windows.NET的优势。

(2) 系统管理先进, 支持Windows图形化管理工具, 支持本地和远程系统管理及配置。

(3) 强壮的事务处理功能, 采用各种方法保证数据的完整性。

(4) 能够满足多种CPU处理器架构, 从PC机到嵌入式的硬件结构均能满足。并且具有自己特有的三层模式结构, 以及对数据调用的数据库语言。内部可简单快捷地对数据进行复制、删除、增加等管理, 为系统用户和研发维护人员提供安全可靠的平台。

3.2 数据库技术与教务系统

本教务系统主要采用基于校园网络以及数据库支持的架构模式, 其中数据库适用微软公司推出的MicrosoftSQL Server 2005。SQL数据库在安全性、系统性能和稳定性等方面都具有得天独厚的优势, 数据处理实时性强、效率高, 而且支持微软软件开发平台Visual Studio.NET, 可以实现SQL Server数据库和开发平台的无缝对接。SQL Server数据库非常适合中小型信息管理系统的数据库管理要求, 因此将SQL Server数据库作为教务系统的数据支撑平台非常合适。

4 教务系统数据库设计与应用

4.1 数据库物理结构设计

下面针对教务系统, 对部分数据库表进行物理结构设计, 如表1—表7所示。

4.2 创建数据库

新建教务系统数据库:

以创建学生基本信息表为例:

5 结语

高校信息化建设已经成为高校提高行业竞争力的重要砝码, 教务管理工作作为高校教育工作的重点内容之一, 迫切需要通过计算机信息系统来提高工作效率。开发基于网络数据库的教务系统有利于提高高校教育教学质量, 加速推进教育现代化、国际化发展。

摘要:随着高校招生规模的不断扩大, 在高校现有的软硬件条件下, 学生人数比例急剧增加, 给高校教务工作带来了巨大的压力。为了保障学校教育教学质量, 发挥现有软硬件、网络等资源条件, 开发基于校园网络的教务管理信息系统尤为必要。对教育系统数据库进行了分析与设计, 进一步完善并建成了初具规模的基于网络数据库的教务系统, 以解决传统单机模式的教务管理工作效率低下等问题, 提高教务系统工作效率, 并保障教学质量。

关键词:教务系统,数据库,校园网,信息系统

参考文献

[1]刘伟.山东司法警院教务管理系统设计与实现[D].济南:山东大学, 2009.

[2]詹茂森, 刘彬.高校教务管理信息系统信息编码问题的研究[J].科技信息, 2011 (22) .

[3]段杰.浅析高校教务管理信息化建设[J].石家庄理工职业学院学术研究, 2011 (2) .

[4]刘建清.高等学校教务管理要素探析[J].中国大学教学, 2011 (6) .

教务数据论文 第6篇

关键词:教务管理,数据仓库,模型设计,系统实现

0、前言

我国高等教育招生规模的扩大,加快了我国高等教育从"精英教育"向"大众化教育"转变的进程,同时,国家取消了分配制度,高校培养出来的人才必须自主就业。使得各高校必须采取有效的管理,提高教学质量,培养出高素质的人才,才能更好地促使学生就业[1]。目前,我国各高等院校相继设计出面向业务处理的教务管理信息系统,建立起自己的数据库,在长期的业务活动中,积累了大量的业务数据,然而各高校都面临着数据量越大信息越缺乏的困境[2]。一是因为高校各部门使用自己的教务管理系统或教学管理系统,使得教务管理数据可能分散在不同部门的数据库中,形成了若干"信息孤岛",二是因为大部分教务管理系统都是基于联机事务处理开发的,没有数据分析与数据挖掘的功能,使得隐藏在数据背后的有价值的信息无法被发现。如何制订教学计划、如何发现学生学习的特点和共性、影响学生能力培养的因素有哪些、老师的教学质量与哪些因素有关、社会需要些什么样的人才等等,这些都是高校做出正确决策的依据。为了更好地利用现有教务管理系统中积累的数据,提供教务管理人员在制订相关教务管理制度、选择有效教务管理方法时的决策支持,必须建立起基于现有教务管理系统的数据仓库,采用联机分析技术等分析出隐藏在大量数据背后的有价值的信息。

1、高校教务管理系统现行状况

目前,高校教务管理系统主要用于事务处理,很少用于决策支持分析处理。业务数据被存放在关系数据库中。高校教务管理系统实现的共同功能主要包括教学计划的制定、教学课程安排、学生在线选课、学生对教学的评价、教师在线答疑、考试成绩提交、试卷分析等功能,在这些教学活动中,主要形成的数据信息有:学生信息、教师信息、课程信息、教学计划、选课信息、教学效果评价、答疑信息、成绩和试卷信息。在教务管理活动过程中积累起来的这些数据信息,可以较好地支持数据仓库的建立及教务决策支持分析。

2、高校教务管理数据仓库的设计

2.1 数据仓库及其特点

"数据仓库之父"W.H.Inmon在他的"Building Data Warehouse"一书中把数据仓库定义为"数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用于支持管理决策过程"[3]。与传统的数据库相比,数据仓库体现出面向主题、数据的集成性、数据不可修改、数据与时间相关四个特点,但数据仓库又是基于传统的数据库基础上建立起来的,数据仓库的基础数据大部分来自于传统的数据库。

2.2 体系结构设计

数据仓库是基于联机事务处理(OLTP)积累的数据和其它渠道采集的数据构建起来的,面向联机分析处理(OLAP)的信息集合,总体结构为三个层次两级处理的结构,即源数据层、信息层和分析结果层三个层次,数据抽取、转换和加载(ETL)处理和联机分析处理两级处理。高校教务数据仓库体系结构如图1所示。

2.3 主题划分

数据仓库的建立首先要基于不同分析用户关注的问题进行主题划分,然后根据不同的主题建立数据仓库模型,通过ETL将数据从数据源中抽取到数据仓库,最后采用OLAP技术或DM技术对数据进行分析挖掘,根据分析及挖掘结果做出相应的决策。在高校教务管理中,决策分析用户主要划分为负责教务或教学管理的校级领导、教务管理人员。校级领导关心的是整个学校人才培养的质量,根据人才培养的质量分析,宏观调整教学管理规章制度,而教务管理人员关注的不仅是管理过程中存在的问题,他们还关心学生的学习情况、教师的教学水平等。所以在高校教务管理数据仓库中,分析的主题主要包含人才培养质量、教学计划、选课、成绩、教师教学水平五个方面。

2.4 数据仓库模型设计

常见的数据仓库模型有星型和雪花型两种,星型模型由一个事实表和多个维表相连接,具有查询分析速度快的特点,在高校教务管理系统中采用星型模型建立面向主题域的数据仓库模型。下面以人才培养质量和成绩两个主题域为例讨论高校教务管理系统数据仓库模型设计。

2.4.1 人才培养质量主题域模型设计

人才培养质量事实表由就业率、继续深造率、学生发表论文数量及等级、学生获奖数量级等级组成,影响人才培养质量的因素主要包含教学计划的科学性及执行情况、生源质量、教师教学水平、学生学习情况、学生奖惩情况、学生就业情况,以上信息形成人才培养质量的维表。

2.4.2 成绩主题域模型设计

成绩事实表由学号、课程号、教师编号、学年学期、教学班号、平均分、优秀(90分以上)人数、良好(80-89分)人数、中等(70-79分)人数、及格(60-69)人数、不及格(60分以下)人数、及格率构成,维表包括学生基本信息表、课程信息表、教师信息表、教学谋划表、班级信息表[4]。

2.5 联机分析

联机分析是基于某一分析主题,采用联机分析技术或数据挖掘技术对数据仓库中的信息进行分析处理。联机分析包括多维数据分析方法总体上可分为上卷、下钻、切片、切块和旋转五种。针对人才培养质量主题域,采用旋转方法从不同角度分析影响学生就业率的主要因素有哪些?从而可以发现教务管理中存在的问题,包括教学计划的科学性不够或执行情况不正常、生源质量不高、教师教学水平有待提高等,通过下钻可以进一步分析影响教学谋划执行的深层因素是什么。

3、高校教务管理数据仓库的实现

3.1 ETL的实现

采用Microsoft SQL Server 2000的数据转换服务DTS从事务处理型的教务管理系统数据库中抽取相关数据,数据仓库的数据源格式比较复杂,并不是将文本中的内容简单分割后存储到数据库中,除直接使用DTS中提供的文本转换功能外,采用C#编程结合查询语言SQL对其中的数据进行处理,并从外文档或直接输入的方法补充完善分析信息,将这些信息存储于教务管理数据仓库中。

3.2 联机分析的实现

高校教务管理数据仓库中联机分析采用Microsof SQL Analysis Server 2000实现,结合Visual Studio2005和Office2000的Office Web Components (OWC)进行编程[5],用OWC组件在Web上发布电子表格(spreadsheets)、数据透视表(pivot tables)和图表(charts),为用户提供了和EXCEL电子表格一样丰富的交互功能。通过OWC对数据仓库中的数据进行多维分析、汇总,形成图表或报表,使教务管理决策者可以直观地看到分析结果。

4、结论

数据仓库技术在高校教务管理系统中的应用,将充分挖掘隐藏在数据背后的高价值的信息,为高校教务管理人员进行决策提供有效依据,进一步推进高校教务管理和信息化进程,提高培养人才的质量。

参考文献

[1]武彤.高校教学质量分析与评估系统的数据仓库模型[J].贵州工业大学学报, 2007, 10, P54-58

[2]刘琼梅, 彭国星, 刘强.浅谈数据挖掘在高等教育信息化中的应用研究与展望[J].福建电脑, 2010, 4, P39-40

[3]王丽珍, 周丽华等.数据仓库与数据挖掘原理及应用[M].科学出版社, 2005, 7

[4]魏丽, 王雁苓.高校学生成绩分析数据仓库的建立[J].吉林省教育学院学报, 2010, 6, P42-43

大数据可视化在教务管理中的应用 第7篇

在这样的背景下,开展教务大数据的分析处理及可视化工作已成为我校现实需求,我校在相关研究方面进行了初步的尝试。

1 系统结构图

教务大数据可视化方案需从繁杂的教务数据中抽取和提炼出有用信息,摆脱传统的枯燥的数字结论,将之转化为图形或图像,再通过人的视觉优点和主观判断,快速掌握教师、学生、教学环境、学习内容、作业、成绩等各个方面,对工作中的得失进行研判,并以此指导教师教学、学生学习。

图1为系统整体架构图,其中教务管理业务模块为既有的信息化管理子系统。为实现最终诉求,设计了数据统计分析模块及数据可视化模块。其业务逻辑如图2所示。

数据分析工具集与可视化模块相耦合,其中数据分析工具集对抽取出的学生、教师和成绩等进行统计分析处理,由可视化模块将结果以图表化的方式展现。数据分析工具系统的数据来源于教务管理系统的数据库。

数据分析工具集的用户操作接口如图3所示。首先需确定分析对象,在此以教师为例,在确定使用教师信息分析模型后,需做范围设定,该工具集的范围可以设定为全校教师、年级组或教研组等;在维度设定时,可以规定职称、教龄等规则。范围及维度确定后,数据经由后台处理,得到进一步提炼。为取得直观地效果,处理后的数据再以预定的一维表、二维表,乃至柱状图、雷达图、饼状图等多种方式进行输出。

2 关键技术

涉及到的两个主要技术问题有两个,一是数据统计分析方法的技术实现,二是分析结果可视化。

1)数据统计分析方法及技术实现。大数据统计分析涉及频率分布、二元回归、t检验和方差检验等,该系统采用基于Oracle数据库和Java的开源统计方法库Apache Commons Math类包,通过Oracle强大的分析函数功能建立完善的大数据分析模型,实现对数据进行分析处理。

2)分析结果可视化。可视化(Visualization)是利用计算机图形图像技术,将数据转换成图形、图像呈现出来,并进行交互处理的理论、方法和技术。因教务管理系统采用Web页面展示图像数据,简便易行的做法是使用基于Java Script技术的可视化手段。其优点是该技术通用性好,系统资源占有率低,有很多开源的基于Java Script的可视化图表库可供选择。在此选择基于Java Script的ECharts作为可视化图表库。

3 结论

限于篇幅,本文仅对教务大数据可视化方案做了扼要介绍,也仅仅是抛砖引玉。未来要做的工作还有很多。

教务数据论文 第8篇

关键词:实体联系模型,关系模型,数据库,管理信息系统

1 数据库建模概念

一个安全稳定的管理信息系统(Management Information System,MIS),离不开一个结构优越的数据库。特别在网络系统中,拥有一个稳定而高效的数据库结构,可以使系统具有良好的性能。要设计一个数据库,首先要确定数据库的结构。一般来说,数据库结构设计可分成三个部分:概念结构设计、逻辑结构设计、物理结构设计[1]。其中,概念结构设计和逻辑结构设计是独立于具体的数据库管理系统(Database Management System,DBMS)的,也就是说这两个部分与具体数据库管理系统不存在依赖性,它们针对不同DBMS的设计方法都是一样的。而物理结构设计却依赖于某一特定的数据库,本文着重讨论前两种的结构设计方法。

2 概念结构设计

概念结构设计的任务是在需求分析阶段产生的需求说明书的基础上,按照特定的方法把它们抽象为一个不依赖于任何具体机器的数据模型,即概念模型。概念模型使设计者的注意力能够从复杂的实现细节中解脱出来,而只集中在最重要的信息的组织结构和处理模式上。

概念结构设计也是数据库结构设计过程中最困难和最关键的一步,它是从用户的角度来设计数据库,使用用户比较容易理解的模型来表示数据内部及数据之间的相互关系。E-R图是进行数据库概念结构设计最有效的工具。

2.1 数据分析

对于一个大型的系统,由于各种业务需求及数据之间的关系错综复杂,为了使得E-R图能尽最大限度的表示各种数据关系,在设计E-R图之前,数据分析也是至关重要的。首要的是对系统内数据进行全面的收集、整理及分析。经过广泛地调研和资料收集,获得教务管理信息系统的主要功能简述如下:

新闻消息发布(包括普通公告、事务通知,教务信息等);人员管理(教师信息管理、管理员信息管理等),事务管理(科研、课程)等。

本文对新闻消息相关的实体主要介绍。

为统一管理,将各消息统一为同一实体,并采用一个类型标志属性来区分不同类型。教师信息为一个独立实体。办公管理人员也是一个实体,并拥有不同的权限等级,可根据其权限进行不同的操作。因此就有一个权限等级实体,这个实体增强系统各数据的独立性,方便系统的升级与维护。并将图片、附件作为独立的实体,达到系统的最低耦合。同样,尽可能地实现各模块的独立性,进行其他实体的设计。

2.2 E-R模型的设计

由数据分析、各实体的初步确定、系统功能及数据联系,可设计各实体之间的关系图[2](即E-R模型)。

2.2.1 实体和关系的确定

实体之间的关系主要有:一对一、一对多和多对多。本系统各实体之间的关系(E-R模型)如图1,其关系有一对一和一对多。

2.2.2 实体属性的确定

对于实体属性的确定,要充分考虑实体所要表示的数据形式,及各数据之间的联系,使数据形式尽可能的简洁、全面,避免出现冗余和复杂数据。如新闻实体,该实体所要表示的数据有四种类型,于是可用一个“类别”属性来区分。作为一则新闻,它有一些基本的属性,如标题、内容、发布者、发布时间和类别等。因此可设计新闻实体各属性。

同样,由于新闻图片及前面数据分析结果可确定图片实体的各属性,其设计见图2至图4。

由确定好的实体属性图可知,图片属性中的“新闻编号”为新闻实体的一个外键,通过该属性把两个实体联系在一起,形成一对多的关系。

同理,其他实体也可以得到它们的实体属性图。

对于大型的系统,其功能需求更多,数据量更大,各实体属性及实体之间的联系也更为复杂,其E-R模型的设计常使用化整为零,分散设计的方法。先设计各子功能的E-R图,再汇总整合,形成全系统E-R图。

3 逻辑结构设计

关系模型是借助于非常复杂的关系数据库管理系统(Relational DBMS,RDBMS)实现的。RDBMS系统具有与分层和网络DBMS系统相同的基本功能及许多使关系数据模型更易理解和实现的其他功能[3]。

关系模型的特点是结构简单,容易理解,使用方便,便于维护与扩展,更有利于实现分布式数据库系统。关系数据模型被用户视为存储数据的二维表的集合,即二维数据关系表,每个表都是由一系列行/列交点组成的矩阵。

3.1 E-R模型转换为关系模型

要将设计好的数据库结构应用于实际系统中,需将设计好的E-R关系转为关系模型。

在转换过程中,可根据以下方法进行:

a.每个实体对应一个关系模式,实体的属性即关系模式的字段,实体标识符即关系模式的主键(Primary Key,PK)。可将设计好的E-R模型各实体转为关系模式(二维表)如图5所示[4,5]。

b.每个联系对应一个关系模式,其中主要有:1:1、1:M和M:N的关系。

对于一对一的关系,只需把任一方的编号(主键)作为另一方的属性(外键)即可;对于一对多的关系,要把一方的编号(主键)作为多方的属性(外键)。在本系统中,“办公人员”和“权限等级”为一对多的关系,在这里把“权限等级”的编号放在“办公人员”实体的一个属性中;再比如该系统中的“新闻”和“图片”的关系,一则新闻有多个新闻图片,于是把“新闻”的PK作为“图片”外键(Foreign Key,FK)。对于多对多联系,转换处理比较复杂,也较容易出错,但可通过创建复合实体和桥接实体的方法来避免容易出现的错误。因本系统未用到多对多联系,在这里不作具体介绍,具体方法参考文献[6,7]。

3.2 数据库表的规范化

规范化(normalization)是估算并校正表结构以使数据冗余最小化的过程,它可以帮助消除数据的异常。在规范化过程中,通过依次分解范式1NF、2NF、3NF、BCNF到4NF,消除不良的数据结构,避免数据异常,完成良好数据库结构[7]。

4 数据库的实现

将转换后的模型在SQL SERVER上进行实现。转换后的各个表先映射成SQL SERVER上的表,可采用命令行方式执行,或直接用SQL SERVER 2000管理工具进行直观设计。

设计完成的关系表见图6,系统数据库关系图见图7。设计过程中要对各字段进行具体分析,如新闻标题采用可变长度类型VARCHAR,提高数据空间的利用,这里长度为100。又如新闻类型,采用4个字符来标志,是为以后的扩展。最后,完成其他二维表的设计,得到基于SQL SERVER实现的系统数据库关系图。

5 结语

本文针对某一实际教务管理信息系统,介绍了E-R模型设计的具体方法,并实现E-R模型向关系数据库模型的转换,最终在SQL SERVER 2000上进行实现。下一步将结合前台网站的实际使用需求和情况进行改进和优化,保证整个系统的稳定良好运行。

参考文献

[1]Rob P,Coronel C.数据库系统设计、实现与管理(第6版)[M].张瑜,杨继萍,等译.北京:清华大学出版社,2005:64~133

[2]石伟,王中华.一种用E-R模型实现数据库设计的方法[J].航空计测技术,2000,20(2):22~25

[3]Stephens R.K.,Plew R.R.数据库设计[M].何玉洁,武欣,邓一凡译.北京:机械工业出版社,2001:103~118

[4]姜翠霞.E-R模型向关系模型转换的研究[J].齐齐哈尔大学学报,2004,20(4):58~59

[5]年轶,林琳.E-R图向关系模型转换规则的研究[J].微型电脑应用,2004,20(1):12~14

[6]Mannino M.V.数据库设计、应用开发和管理[M].韩宏志等译.北京:清华大学出版社,2007:3~20,43~73

[7]萨师煊,王珊.数据库系统概论(第3版)[M].北京:高等教育出版社,2000:1~80

教务数据论文 第9篇

随着“中央电大人才培养模式改革和开放教育试点”已经通过教育部的总结性评估, 现代远程开放教育成为电大办学的常规形式, 这表明电大教育进入新的发展阶段。开放教育事业的飞速发展, 学生注册人数不断增加, 毕业生的数据也在持续递涨[1]。由于电大主要面向成人教育, 具有远程教育特征、采用多种媒体教学、共享优秀教育资源、开放的学习模式、学籍年限长等特点。一方面学生们学习目的明确, 学习主动性很高, 他们都希望学到知识的同时能在教育部规定的最短年限内获取毕业证书;另一方面作为学校, 也希望在保证教学质量的同时, 提高学生首次毕业通过率。但如何才能在最短年限内取得证书?这已成为制约学校招生、教学管理发展的棘手问题。本文希望通过数据挖掘技术能在大量的教务管理系统数据中, 发现潜在规律, 找出隐含的模式, 找出制约的原因, 为学校的管理决策提供有力的数据支持和依据, 提高管理水平和办学质量。

1 数据挖掘的基本理论

1.1 数据挖掘的基本概念

数据挖掘就是技术地从大型数据库或数据仓库中提取人们感兴趣的信息和知识, 这些知识或信息在被提取之前是是隐含的, 事先未知而潜在有用的, 被提取的知识表示为概念、规则、规律、模式等形式。

1.2 数据挖掘的对象

原则上讲, 数据挖掘可以在任何类型的信息存储上进行, 包括关系数据库、事务数据库、数据仓库、高级数据库系统和面向特殊应用的数据库系统 (面向对象数据库、对象-关系数据库、空间数据库、时间数据库、时间序列数据库、文本数据库、多媒体数据库、WWW等) [2,3,4]。

1.3 数据挖掘的过程

数据库中的知识挖掘是一个多步骤的处理过程, 数据挖掘的基本过程和主要步骤如图1所示。

1.4 数据挖掘的方法和算法

常用的数据挖掘方法有关联分析、序列模式分析、分类分析、聚类分析、预测分析、回归分析;而常用的数据挖掘算法有人工神经网络、决策树、遗传算法、最临近技术、规则归纳、可视化技术等。数据挖掘不是一个单向的过程, 对同一个问题, 可有多种不同的算法。不同的数据挖掘方法作用于同一数据库, 对数据的理解可有不同的角度, 每种方法的合理与否都有可能。这就需要将发现结果在实际运用中反复求证, 以检验其合理性。

2 关联规则中的Apriori算法及分析

1993年IBMAldRhCt的RkhAgawl等人首先提出关联规则挖掘, 关联规则挖掘目的是发现大量数据中项集之间有趣的关联或相关联系, 可以帮助许多商务决策的制订, 如市场规划、广告策划、分类设计等。

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。该算法的基本思想是:首先找出所有的频集, 这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则, 这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则, 产生只包含集合的项的所有规则, 其中每一条规则的右部只有一项, 这里采用的是中规则的定义。一旦这些规则被生成, 那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集, 使用了递推的方法。

3 数据挖掘在电大教务管理中的应用

以广东电大为例, 抽取2004年级的12001名本科学生为主要分析对象, 根据这些学生的学籍及第一年考试成绩作为分析的原始数据, 参考其他高校分析的一些指标定义, 构造挖掘模型。从教务管理广东理工职业学院数据仓库中导出相关的基本表进行集成、清理、转换等数据预处理;使用关联分析中的Apriori算法对数据进行挖掘分析, 从数据中发现某些规律和参考信息, 找出学生能在最短年限内毕业的因素, 对教学等管理提出建议。

3.1 设立模型

对电大学生数据建立分析模型, 以选择合适的方法和算法对数据进行分析, 得到一个数据挖掘模型的过程。一个好的模型没必要与已有数据完全相符, 但模型对未来的数据应有较好的预测。建立分析模型如图2。

3.2 数据预处理

数据的预处理是数据挖掘过程中一个非常重要的环节, 一般需要用掉挖掘过程中70%的工作量。本文以2004年级的本科学生为主要分析对象, 因此从教务管理系统仓库中导出相关的三个表:学生基本档案表、成绩总表、毕业生名单, 并对这三个表进行预处理。经过数据采集、数据清理、数据集成、数据转换、数据消减这五个步骤后, 最终建立了可用于下一步数据挖掘的目标数据表。如图3所示。

其中:xh (学号) 字段值为

20041440000001-20041440011999;

kscs (考试次数) 字段值定义为:1-16;

hgcs (合格次数) 字段值定义为:1-16;

rxjd (入学季度) 字段值如此定义:1表示春季入学, 2表示秋季入学;

A表示90-100、B表示80-89、C表示70-79、D表示60-69、F表示低于60分;

hydm (婚姻代码) 字段值如此定义:根据全局统计只有两种状况:1表示未婚, 2表示已婚;

nl (年龄) 字段值如此定义:年龄采用等高方式划分bucket, 分成5个年龄段:20、25、30、35、40;

dwdm (单位代码) 字段值如此定义:将广东电大系统地区划分为四个区域, A代表粤北, B代表粤东, C代表粤西, D代表珠三角。

3.3 数据挖掘

从目标数据表中统计, 约25.5%的学生就读五个学期后毕业, 约45.1%的学生就读六个学期后毕业, 其余剩29.4%的学生不能在最短的第五或者第六个学期毕业, 下面通过Apriori算法对该表进行挖掘应用, 找出答案。

事务数据库D由已经经过预处理的目标数据仓库中 (见图3) 给出, 设最小支持度Minimum support=0.05 (612 instances) ;Minimum metric<confidence>=0.2, 利用Apriori算法找出D的频繁项集。

1) 扫描整个表, 计算出D中所包含的每个项目出现的次数, 得出C1。将C1各项计数, 由最小事务支持计数为0.1, 从C1中可以确定出频繁1-项集, 得出L1:

2) 执行L1∪L1产生侯选2-项集的集合C2, C2由CL2个2-项集组成, 扫描D, 计算C2中每个侯选项集的支持计数 (2-项集的子集均属于L1, 这样对C2不用剪枝) , 根据最小事务支持计数2, 从C2中确定L2, 即把C2中满足最小事务支持计数2要求的候选项目集放入L2中:

3) 执行L2∪L2产生C3, 根据Apriori-gen中剪枝步骤对C3进行剪枝, 然后扫描事务数据库对C3中的项目集进行计数, 得出L3, 同理得出L4、L5:

4) 在执行L5∪L5后, 通过剪枝与计数, 得出C6, 在扫描以及对比数据库与最小支持计数后, 得知C6=Φ, 算法终止。

经过以上4个步骤的频繁集生成规则共有228条。

3.4 结果分析

1) 以全省总体来说:第五个学期毕业的置信度比第六个学期毕业要低, 即使全部考试都合格的情况下, 结果也一样;但分布来说:粤东地区第五个学期毕业的置信度比第六个学期毕业要高;粤西地区就刚好相反;珠三角地区则有一半的学生在第六个学期毕业;

2) 以全省25岁的学生为参照物, 第一年参加考试次数7次比参加考试6次在第六个学期毕业的置信度要高;

3) 如果考试次数为8次在不考虑合格率的情况下, 其置信度比只考7次的要低;

4) 婚姻状态与能否在最短年限内毕业结果无关;

5) 年龄与学生毕业时间没有太大关系;

6) 入学季度与学生毕业时间没有太大关系, 但粤西地区春季入学的学生比秋季入学的学生, 在第六个学期毕业的置信度高得多;

7) 综合平均分为D以上的学生在六个学期前毕业的置信度比较高, 但综合平均分为F的, 有八成多都不可能在六个学期前毕业。

根据以上分析, 对学校招生管理部门建议:学生报读时提醒学生学习态度是决定其能否最短时间拿到毕业证书的关键。想按时毕业有几个关键因素:第一年参加考试总次数要在6次或者以上并且至少有6次及格;第一年综合平均分要为D以上。对学校教学管理部门建议:鼓励学生以积极的态度去学习, 第一年尽可能多的参加期末考试;进一步指导学生进行有效的学习、复习, 提高考试通过率的同时尽量拿取高分数。

4 结论

本文通过介绍数据挖掘的基本概念、对象、过程、方法和算法, 分析了随着电大办学规模的不断扩大, 信息量大幅度增加, 使用Apriori关联规则挖掘算法对数据仓库中的部分数据进行挖掘, 找出潜在的关联规则, 获取影响学生能在最短年限内毕业的潜在因素与信息, 用于指导教学, 开展有针对性的教学安排与教学组织, 借以提高教学质量, 对学校教学管理提出建议。将数据挖掘技术引入教育领域是可行的, 可以对教务管理庞大的数据进行多方面、多角度的数据分析和挖掘, 应该会得到大量的有指导意义的结果, 以提高学校管理的决策, 提高管理水平和办学质量。

参考文献

[1]田红梅, 彭愈强.论现代远程开放教育学籍管理的特点及战略意义[J].厦门广播电视大学学报, 2008 (1) :10-12.

[2]邵峰晶, 于忠清.数据挖掘原理与算法[M].中国水利水电出版社, 2003, 8.

[3]Jiawei Han, Micheline Kamber.数据挖掘概念与技术[M].范明, 孟小峰, 译.机械工业出版社, 2001.

[4]谈恒贵, 王文杰, 李游华.数据挖掘分类算法综述[J].微型计算机与应用, 2005 (2) :4-9.

[5]陈京民, 等.数据仓库与数据挖掘技术[M].电子工业出版社, 2002.

[6]黄丽莉.电大教务管理工作的改革与创新[J].科技传播, 2010 (1) :84.

[7]陈文庆.关联规则挖掘APriori算法的改进与研究[J].微机发展, 2005:85-89

上一篇:科技合作发展下一篇:我国水利工程质量管理