电视数据挖掘论文

2022-05-05

要写好一篇逻辑清晰的论文,离不开文献资料的查阅,小编为大家找来了《电视数据挖掘论文(精选3篇)》,希望对大家有所帮助。摘要:当今,在新媒体的猛烈攻势下,传统电视媒体受到了很大的冲击。传统媒体正开始寻求与新媒体的融合发展,媒介融合、台网互动由学术概念发展到实际的业务当中。本文在对国内外研究成果梳理、总结的基础上,结合自身的项目经历,运用大数据、数据挖掘、文本情感分析等理论和方法,探索了大数据在互联网电视节目效果评估中的应用。

电视数据挖掘论文 篇1:

集成数据挖掘技术的电视台广告管理系统

[摘 要] 采用针对性更强的广告投放策略能够帮助企业进一步降低成本,提升效益转化比率。在互联网背景下,借助信息技术手段,信息管理系统实现了对电视广告业务的有效管理。然而,电视台采用的传统广告管理系统多以业务为导向,虽整合了多种不同类别的业务模块,却未能实现对原有数据的利用,没有充分挖掘出其中的价值,用以指导并提升广告投放的效率和针对性。为此,文章参考传统电视台广告管理系统的架构,提出集成了数据挖掘模块的电视台广告管理系统框架及相应的设计方案。文章以改善电视台广告系统为核心,以增强广告受众针对性为导向进而给出合理的系统方案,为优化电视台广告管理系统,提升广告业务信息化水平提供了有力参考。

[关键词] 电视广告;信息系统;数据挖掘;系统方案

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2015 . 13. 050

0 引 言

随着互联网技术的发展和智能移动终端的普及,广告业务在内容、形式、投放方式等多个方面都发生了巨大变化,成为厂商和广告商关注的焦点。一些独特的手段如Cookie、A/B测试、数据挖掘等已经被用于改善广告投放针对性,在互联网领域得到普及,并在实践过程中检验了其有效性。

电视媒体作为传统的广告投放平台,虽在同互联网广告业务的竞争中逐渐处于下风,却因其具有固定的广告受众和直观的广告传达模式,依然保有生命力,具有重要价值。为实现对业务信息的整合和高效管理,广告业务管理系统能够直观、清楚地反映完整的工作流程,将客户关系、业务合同、广告发布、内容查询等多项业务内容整合一体,目前被电视台广泛采用。然而,传统管理系统主要以业务为导向,只能优化电视台广告的业务管理,却不能有效弥补电视广告较之互联网广告显露出的两大劣势。首先,原有电视广告的投放针对性不强,虽然能够做到按时段或按价位投放广告,却未能按受众群,以转化率更高的方式有选择地投放广告;其次,降低电视广告,尤其是直销类广告的成本是长期存在的,并被电视台和广告商共同关注的问题。电视台有必要从原有数据中挖掘出用户转化率最高的广告投放模式,对广告类型、时长、时段、播放周期等做出最合理的安排。

数据挖掘技术在提升互联网广告投放针对性方面发挥了重要作用,其思想同样适用于优化电视台广告管理系统,增强广告投放针对性,实现对原有数据的充分利用。通过对已有数据的挖掘,广告商可以进一步提升所投放广告的转化率,更具针对性地选择广告受众群,控制成本的同时创造出更多商机。为此,文章将数据挖掘技术与传统以业务为导向的系统进行结合,给出相应的业务流程及需求分析,提出能够满足当代电视广告业务管理的需求,整合了数据挖掘模块具有统计分析功能的电视台广告管理系统的架构,为优化电视广告业务,探索精细化经营模式提供了参考。

1 广告管理系统的相关技术

1.1 系统的业务逻辑实现技术

数据挖掘技术是现在研究领域的重要核心技术,它快速、便捷地从大数据里提取有用的信息,进行企业的规划与优化,是被大部分企业广泛运用的计算机技术。数据挖掘技术是对统计学知识,情报搜集技术,智能学习,制定学习机制和专家预测等的综合运用,能够让电视广告企业在大量数据中提取对于企业有用,并且容易被忽略和隐藏的数据。

数据挖掘技术通过对大量的数据进行挖掘,发现其中的规律,从而得到有用的信息,其主要涉及以下3点:数据搜集、数据分析和数据结果。数据搜集是指在大量的数据里面进行选取,选择有用的信息进行整理,存储在一个数据集中。数据分析是指通过对于数据进行有效的分析,运用可靠的算法,从中得到数据的规律与趋势,主要方法有聚类、分类、关系分析、异常处理等。数据结果就是指按照企业或者顾客想要得到的数据形式进行输出,从而能够让顾客快速地得到满意的处理方案。

数据挖掘由于能快速帮助企业找到合理方案,降低企业成本,因而越来越受到企业的青睐,成为企业发展的重要方向。该技术现在主要有两个派系:第一个是基于统计学知识,运用假设检验等方法进行数据的分析与挖掘。该种方法具有操作简单,能够快速地找到解决方案,但是方法在数据量巨大的情况下,容易导致数据出错,结构差异等后果。第二种方法是通过运用神经网络分析,智能学习或博弈等方法进行深入研究,这些技术的运用能让数据挖掘更快速、便捷地找到最优方案,同时适用于大量数据的处理。另外,数据挖掘技术还结合了最优化理论,动态控制原理,可视化技术等的优势和优点,以提高處理速度与质量。

数据挖掘技术在不同领域之间存在差异,同时计算机技术的进步与各相关领域理论的发展也在促使数据挖掘技术不断提高与完善。考虑到数据挖掘技术处理数据方式的差异性,电视广告业务在进行数据挖掘时也要注重不同方式的运用,才能得到更加合理而有效的结果。

1.2 系统的开发技术

电视广告系统主流的系统架构主要采用MVC架构。MVC架构包括模型、视图、控制器3个部分,分别承担不同的功能与任务。模型部分主要负责处理数据的逻辑结构,让数据能够快速地进行存储。视图部分主要功能是负责与用户交互的数据的处理,数据传输的结构的设计等。控制器部分主要运用于用户交互的识别,用户数据输入的控制,同时将数据传输给模型。

电视广告系统的页面端实现技术主要包括JavaScript、Ajax、Json等。JavaScript主要用来处理网页的兼容性,确保系统能够在各种浏览器上被使用。Ajax主要用来进行网页交互性的优化,让网页能够更加快速地处理用户数据。Json主要负责数据的传输,让数据能够快速的进行交换,进一步提升用户体验。

在电视广告系统开发中,一些系统级开发手段还包括Structs2、Spring、Hibernate技术。Structs2实现了MVC的架构,体现了由过滤器处理数据,然后经由拦截器,最后将数据反馈给客户端的完整过程。Spring主要功能在于简化开发与测试的复杂性,帮助快速完成编程工作。Hibernate简化了与数据库的操作,能够让技术人员快速联接数据库系统,进一步提升了开发效率。

2 业务流程及需求分析

电视广告是一种以电视为传播媒介的电子广告形式,具有覆盖范围广,感官刺激强等特点。其发布形式包括但不限于特约播映、资讯传达、普通宣传、公益推广等。电视台对于广告的选择和播放除需要考虑自身效益外,还受到相关法律法规的严格限制,在业务管理上具有复杂性。例如,我国《国家广播电影电视总局令第17号》第二十条对酒类广告的播放做出明确限制,要求每套电视节目每日播放数量不超过12条,19:00至21:00间不超过2条。因此,电视台往往采用信息系统实现对广告信息的管理和播放模式的安排。

集成数据挖掘技术的电视台广告管理系统的业务流程主要涉及两个方面,分别是广告业务管理和数据分析支持。其中,广告业务管理即实现对涉及电视广告业务各方面的综合化管理,包括办公人员管理、客户关系管理、广告排期、发布管理、业务合同管理等多个模块。该业务流程已基本在传统电视台广告管理系统中得到实现;而数据分析支持在于不光能对系统内数据进行基本的统计、分析,还能够通过数据挖掘技术提升广告投放覆盖率,优化广告内容配置,提升投放效率与目标针对性,进而达到更满意的广告宣传效果,为电视台和广告商带来更多利润。因此,系统必须做到:

(1)数据信息安全。系统对数据信息的管理要做到完整、精确、唯一;系统运行过程中,要保证数据信息的使用安全、传输安全和存储安全;后台数据库应具有一套完整的数据备份机制,同时对敏感信息或业务涉及到关键数据进行加密处理;对数据挖掘所得结果的使用要考虑相应的隐私保护策略。

(2)保证系统健壮性。系统应具有较强的容错能力和高负载能力,能够应对业务变化造成的数据量激增等特殊情况;集成数据挖掘技术的功能模块在大数据环境下依然能够保证较好的工作能力。

(3)充分满足使用需求。系统应根据既定业务实现所需的各项功能,并能够在未来对功能进行扩展或更新,以适应新业务的出现或原有业务的变化。

(4)满足使用体验要求。系统应具有美观的用户界面和友好的用户操作体验,能够引导系统使用者轻松、高效地进行操作。

3 集成数据挖掘的电视广告业务系统架构

结合前文分析,本节给出相应的系统架构。集成数据挖掘的电视广告业务系统是B/S架构下,兼具日常电视广告业务管理能力和面向业务的数据挖掘服务的信息管理系统。数据在整个系统中扮演最为重要的角色,而数据挖掘功能的实现则借助于系统内部各模塊间的相互配合。

如图1所示,系统主要包括9个部分,分别是可视化用户接口、用户角色管理器、数据挖掘模块、事务模块、功能模块、知识库、数据仓库、源数据库、集成/转换中间件。可视化用户接口是用户与系统双向交互的载体,为使用者提供图形化的用户界面(GUI)。用户角色管理器对系统用户实现有效管理,承担用户角色分配、用户配置文件管理、操作账号分配、使用权限管理等任务,能够让用户根据自身角色,按照使用权限,依照既定需求,灵活、针对、高效地使用系统。系统的事务模块即可独立存在发挥自身功能,又可以为系统其他模块的正常工作提供支援。该模块主要实现了信息查询、报表呈现、数据的基础分析与统计、信息录入、信息输出等一般性事务功能,而系统的其他模块会按需调用这一模块中的接口。功能模块是对传统电视广告业务管理系统功能的高度概括,集成了客户关系、业务合同、广告发布、广告排期等各项业务功能。该模块能够以定制的方式,按使用需求对内部子模块进行缩减或扩充。源数据库用于存储系统原始数据,是系统各个模块的数据“集散地”。数据仓库实现对系统数据的重组织,是面向主题的,相对稳定的数据集合,用于辅助数据挖掘。数据从源数据库集成到数据仓库需要经历一个数据准备过程,包括数据抽取、转换、装载等工作。这些工作均由集成/转换中间件实现。数据挖掘引擎是数据挖掘模块的核心,集成了决策树、贝叶斯网络、支持向量机等多种有监督或无监督算法,实现了对既得数据的分类及预测、聚类分析、关联分析和孤立点分析。数据挖掘模块从数据中寻找“模式”,经验证、完善后便可形成用于指导决策的知识,这些知识最终会被组织在知识库中。

日常使用时,电视台业务人员在系统中被赋予相应的角色,依照各自职能,操作并使用对应的子功能模块。过程中产生的原始业务数据会被存储于源数据库中,经抽取、转换,装载到数据仓库,供数据挖掘模块使用。数据分析人员在系统中具有独立角色,可以在数据挖掘模块的帮助下,从数据中寻找独特的模式,进而形成有价值的知识,这些知识将被用于指导管理者形成更具科学性的决策判断,如根据广告类型、时常、时段的安排预测其最后的效益好坏,或在接到新的广告业务时,根据其各项属性判断该广告业务在多大程度上能够超额获利。这些知识可以在决策者查询系统时以相对简单的方式呈现,也可以借助数据可视化、明细报表等手段给出更为详细的结果。

4 优势分析

数据挖掘将传统分析方法与应对大量数据的复杂方法进行结合,帮助电视台在广告业务管理过程中,利用分类、聚类分析、关联分析、异常检测等手段,实现对既得数据的深入探索,找出更好的广告投放模式,做出更明智的决策。将数据挖掘技术集成于电视台广告管理系统的优势在于,较之传统技术手段,数据挖掘能够应对的数据量更大,所适用于的数据结构也可以更加复杂;同时,数据挖掘真正实现了从数据到知识的转化。举例来说,通过分类模型,广告系统能够根据一则广告的类型、时常、时段安排等属性预测该广告是否属于具有高转化率的“优质广告”;通过聚类分析,电视台可以在客户关系管理过程中对相关广告商实现分组;关联分析帮助系统使用者从已有数据中探索具有强关联特征的模式,挖掘新的商机;异常检测帮助系统使用者在所获数据中发现异常点,对业务情况的特殊变化做出预警。

借助该系统,电视台能够实现了对广告业务更加精细化的管理,这进一步提升了广告投放的针对性,有效降低了成本。

5 结束语

电视是人们日常生活中重要的信息传播媒介,为广告业务提供了良好平台。面向电视台的广告业务管理系统不应仅局限于满足日常管理需求,还应该充分利用已有数据,挖掘其背后的价值,创造更高的利润。本文在传统电视台广告管理系统架构基础之上,提出了集成数据挖掘模块的电视台广告管理系统框架及相应的设计方案,将数据挖掘技术融入电视台广告业务管理中,进一步提升了对广告业务的信息化管理水平。未来研究或将所提出的系统设计方案应用于实际开发中,通过系统实例验证其可行性和有效性。

作者:董玉杰

电视数据挖掘论文 篇2:

大数据挖掘在电视节目效果评估中的研究与应用

摘要:当今,在新媒体的猛烈攻势下,传统电视媒体受到了很大的冲击。传统媒体正开始寻求与新媒体的融合发展,媒介融合、台网互动由学术概念发展到实际的业务当中。本文在对国内外研究成果梳理、总结的基础上,结合自身的项目经历,运用大数据、数据挖掘、文本情感分析等理论和方法,探索了大数据在互联网电视节目效果评估中的应用。

关键词:大数据;数据挖掘;电视节目

引言

大数据时代,每一档电视节目,观众均会对其发表大量的网络评论,这些评论带有观众对电视节目的态度和观点,通过研究这些网络评论数据可以挖掘观众态度、喜好,电视工作者通过这些信息可以更好地进行节目内容的创作。

1 需求分析

本文研究的内容来源于实际项目的需要,研究电视节目在新媒体领域的传播效果。系统主要功能包括:视频网站中电视栏目的用户评论的采集、海量用户评论的存储、用户评论的分析。本次研究,将选取综艺节目《奔跑吧兄弟》,采集其在爱奇艺、优酷、腾讯视频平台的评论数据,通过海量数据的数据挖掘,评估用户对节目的情感倾向性。

2 系统设计与实现

2.1 系统总体设计

本系统的技术架构[1]:

(1)数据采集层:采集海量的用户评论数据。采集后的数据经过抽取、转换、加载的处理。

(2)数据存储层:汇总存储采集的用户评价数据。

(3)数据挖掘层:由管理平台负责整体任务的调度,MapReduce负责计算引擎,通过机器学习模型,实现海量用户评论数据的文本情感分析,并将分析后的数据存储到数据仓库中。

(4)数据可视化层:接收用户提交的各项分析任务请求,调用底层的分析引擎进行数据的分析任务,将底层分析结果返回给前台界面显示。

数据流的走向设计:

2.2 数据仓库设计

本系统的数据仓库基于数据立方体理论进行设计[2],包含2-D数据表,以及3-D数据表:

2.3 大数据平台设计

本次课题研究将选取Cloudera发行版作为大数据平台。

基础环境采用4台机器的集群模式,单台机器配置:

CPU:Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz *4

内存:32G

硬盘:1T

操作系统:CentOS6.5

主机 Hadoop組件

CDH Node1 HBase Master、HBase RegionServer、HDFS NameNode、HDFS DataNode、YARN NodeManager、Zookeeper Server

CDH Node2 HBase RegionServer、HDFS DataNode、HDFS SecondaryNameNode、YARN NodeManager、YARN ResourceManager、Zookeeper Server

CDH Node3 HBase RegionServer、HDFS DataNode、Oozie Server、YARN NodeManager、Zookeeper Server

CDH Node4 HBase RegionServer、HDFS DataNode、YARN NodeManager

2.4 数据采集模块的设计与实现

本系统涉及的数据源包括优酷、爱奇艺、腾讯三个视频网站的综艺节目《奔跑吧兄弟》的用户评论数据。

用户评论数据表,共分为三个数据库表comment_youku、comment_iqiyi、comment_qq,MySQL数据库表设计

数据采集模块的工作流程:获取用户评论数据URL->解析URL数据->将数据暂存到MySQL数据库。

2.5 数据存储模块的设计与实现

数据存储模块,定期从数据库表comment_youku、comment_iqiyi、comment_qq同步数据到HBase中。

使用ETL工具将MySQL数据库中的用户评论数据定期、增量导入到HBase,处理流程:配置MySQL/HBase数据源->MySQL中的数据表与HBase中的数据表进行映射和规则转换->配置每天零点定时执行的计划任务。

2.6 数据分析模块的设计与实现

本文将采用基于机器学习的情感分析方法。为了能针对海量评论数据进行大规模的情感分析,需要基于MapReduce计算引擎完成。

本系统将使用Java开发实现MapReduce的过程:连接HBase数据库->创建MapReduce任务->Map过程:调用机器学习模型完成每条用户评价的情感倾向性判断->Reduce过程:实现电视节目评价分析的数据汇总。

2.7 数据可视化模块的设计与实现

数据可视化模块,使用Web交互模式,用户可以通过浏览器查询分析结果。采用MVC设计模式。在页面展示方面,图表展示基于ECharts框架进行开发。

数据可视化模块的处理流程:互联网电视节目评价分析查询->根据用户选择的不同维度匹配不同的分析引擎->查询数据仓库相应的维度数据->页面呈现。

3 结语

大数据挖掘技术应用于电视节目效果评估,本文进行了研究及系统设计实现。我们可以基于此系统,进行非常广泛的实际应用,例如通过获取观众对电视节目的评论信息,分析观众对电视节目的喜好,及时调整电视节目的制作。

参考文献

[1]曹佳豪. 基于Hadoop的报文数据挖掘研究与应用[D]. 武汉邮电科学研究院,2018.

[2]丁青松. 基于Hadoop平台的大数据增量处理技术的研究[D]. 东北大学,2014.

作者简介:刘丹(1980-),女,汉族,辽宁沈阳人,硕士,软件工程师,研究方向:大数据技术

作者:刘丹 赵云飞

电视数据挖掘论文 篇3:

数据挖掘技术在研究生教育中的应用研究

摘 要:在分析数据挖掘模型和主要技术方法的基础上,针对目前我国研究生培养方式和特点,结合作者研究生教育培养中的经验,探索了数据挖掘技术在研究生培养中的应用,并分析了未来的应用前景和主要难点,为我国的研究生培养机构和指导教师提供借鉴,以适应教育信息化对研究生培养提出的更高要求。

关键词:数据挖掘研究生培养应用

近年来随着信息技术的迅速发展和我国高等教育信息化的稳步推进,在高校的教务管理系统中积累了海量的数据,挖掘出这些数据背后隐藏的大量有价值的信息,对加强高校的教学和管理将会起到重要的作用。由于传统的数据分析工具很难对如此大量数据进行更深层次的处理,教育工作者只能望“数”兴叹,难以对这些数据加以充分的利用,而数据挖掘技术的出现和迅速发展为解决此问题带来了有效的方法和手段。

数据挖掘是数据库研究中的一个很有应用价值的新领域,它融合了多个领域的理论和技术,能提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式[1]。数据挖掘是分析处理大规模数据的有效工具,在诸多领域已经得到了广泛的应用[2],并取得了良好的成效,但在教育领域的应用研究还处于初级阶段,目前国内的应用主要集中在教务管理、教学评估、学生成绩分析等方面[3~5]。

信息技术的快速发展也对研究生的教学和科研能力的培养提出了更高层次的要求,数据挖掘技术为传统研究生培养模式的变革与创新提供了良好的资源。本文在分析数据挖掘技术步骤和主要技术的基础上,针对我国现阶段研究生培养方式和特点,结合作者在研究生教育中的经验,对数据挖掘技术在研究生培养中的具体应用进行了有益的探索。

1 数据挖掘主要技术方法

作为一种有效利用数据资源的方法和途径,数据挖掘技术在教育领域具有广阔的应用范围和开发前景。正确的理解数据挖掘各种技术方法的特点,以及潜在的应用领域,是减少应用盲目性,充分发挥其技术优势的前提。下面对数据挖掘在高校研究生培养中作中适用的几种技术作简要介绍。

(1)关联规则。

关联规则挖掘用来发现数据库中一组项目之间的关联和相关关系,是数据挖掘的一个重要方法。它最初应用在分析市场购物篮中,目的是发现顾客的购买模式[6]。关联规则可以从大量的关系数据或事物数据中,挖掘出有用的知识和模式。

(2)分类与预测。

分类是数据挖掘的一种重要的方法。分类是在已有数据的基础上,学会一个分类函数或构造出一个分类模型,从而将数据库中的数据映射到指定的类别中[7]。分类是一种有指导的学习过程,样本训练集是已知类别的,而类别中的个体数量也是确定的。预测是从历史数据中自动推导出给定数据的推广描述,从而对未来数据进行预测。分类与预测的区别是分类模型输出的是离散型的类别值,而预测输出的则是连续数值。

(3)聚类规则。

聚类是一种常见的描述工作,主要是把一组个体按照相似性归纳出若干类别,即“物以类聚”。它的目的是使同一类别中的个体之间的距离尽可能小,不同类别上个体间的距离尽可能的大。与分类不同的是,聚类是一种无指导的学习过程,事先不知道样本的类别,也不知道类别的个数。

2 数据挖掘在现阶段研究生培养中的应用

2.1 研究生培养方案制定

研究生培养方案的制定是研究生教育的基础和准则,是决定研究生培养质量的关键因素。目前大多数研究生培养机构都采取学分制的教学管理制度,主要以选课制为核心,允许研究生根据自身的基础和特长、本科所学专业情况及对知识的掌握程度,在一定范围内选择适合自己的课程、学习量和学习年限。这样做可以使学生在知识的广度和深度上充分发挥主观能动性,但在具体实施过程中,由于选课主动权大多掌握在学生手中,缺乏科学有效的指导,会造成一定的盲目性,使得课程学习及以后的科研工作缺乏联系性和系统性,对培养质量带来负面影响。

数据挖掘技术通过对数据进行分析,从中挖掘出规律为决策者提供有价值的参考。随着数据库技术的成熟和普及,目前国内大多数高水平院校都已经根据自身的特点,建立了各式各样的成绩管理和分析系统,积累了大量的学生成绩和行为等数据资料,其中隐藏了丰富的知识和有价值的信息。利用数据库中的海量数据,发挥数据挖掘的关联分析与时间序列分析等功能,可得出一些影响研究生课程学习和学术能力的信息,并可帮助分析课程之间的相关性,在此基础上,就可制定出较为科学合理的培养方案,以指导研究生的课程学习和科研等工作。

2.2 研究生学习行为特征可知性分析

学习行为特征指的是在特定环境下,学习者在学习行为活动中表现出来的行为构成及行为发展变化方面的规律,它包括群体性特征和个性化特征两个方面[8]。对于研究生而言,群体性特征包括在学习、科研时间上的规律性及其对学习资源、导师等的共同需求等;个性化特征包括学习风格、个性因素、兴趣偏好、知识结构等。对于研究生教育体系而言,教务部门和导师对研究生的学习、科研特征的全面、客观了解,对于实施因材施教,改进研究生的学习行为、提高学习、科研能力,提高创新思维和创新意识、完善人格、促进全面发展具有至关重要的作用。

目前许多研究生培养机构的数据中都存储了大量能综合反映学生综合特征的数据,通过数据挖掘的聚类分析方法,可以对研究生进行分类,然后根据分类结果寻找其中的内在联系,进而针对不同类型的研究生,可以进行准确的定位,确定其学习行为特征,以便导师采用不同的培养策略,实施个性化指导。

3 数据挖掘技术在未来研究生培养中的应用前景

3.1 WEB数据挖掘技术

以互联网为主的信息技术快速发展为研究生培养创造了积极、灵活、富有创新价值的环境和基础资源,即扩展了研究生获取新知识、解决问题的新视野和新途径,带来了学习方式的巨大变革,由此而诞生了大量基于网络的新型学习模式,但与此同时也为研究生的教学与科研能力培养带来了新的任务和目标。由于在网络环境下,研究生获取外部学习资源的途径增多,接受新知识的信息量急剧增加,必然导致培养机构在研究生教学内容、方式与方法及科研能力培养的重点与目标方面急需改进和完善,如何指导研究生科学、有效的利用网络资源成为教育工作者的一项重要任务。WEB挖掘是数据在WEB上的应用,它可以用数据挖掘技术从互联网相关资源和行为中抽取出感兴趣的、有用的模式和隐含信息,设计WEB技术、数据挖掘、计算机语言、信息学等多个领域,它在研究生培养中具有广阔的应用前景。

3.2 可视化数据挖掘、空间数据挖掘和视频、音频数据挖掘技术

可视化数据挖掘、空间数据挖掘和视频、音频数据挖掘技术都是新兴的数据挖掘技术。可视化数据挖掘技术建立在可视化和分析过程基础上,可以从大的数据集中将数据转化为图形或图像,在屏幕上显示出来,并可进行交互式处理。空间数据挖掘可从空间数据中抽取出令人感兴趣的、隐含的知识和空间关系,或是空间内数据库没有明确存储的其他模式;视频和音频数据挖掘是指对动画视频和音频信号信息的自动处理[9]。将这三种数据挖掘技术应用到研究生培养中可以带来更加丰富和多样化的培养手段,并可最大程度的利用电视、广播等媒体发布的重要信息,拓宽研究生的视野,增加知识面,对于研究生科研能力和综合素质的提高大有裨益。

4 数据挖掘在教育中应用的难点

(1)数据挖掘仅是一种工具和手段,其目标是通过已发生数据来预测学习者未来的行为,这种预测实际上只是一种概率预测。即使通过数据挖掘可以对学习者将来的行为作出准确预测,也很难获知此行为产生的根源。(2)数据挖掘在教育系统中的应用还处于发展阶段,在研究生教育中的应用更是处于初级阶段。数据挖掘囊括了诸多技术,对绝大多数教育工作者来讲,很难掌握和熟练应用。此外由于研究生的学习特征、学习过程及学习结果有时很难进行量化,因此开发的难度较大。(3)数据挖掘技术在研究生培养中的应用涉及对其特征的提取过程,其中涉及到社会环境、文化背景、价值理念等诸多因素,造成知识发现过程算法的多样化,以往的经验只能参考借鉴,不能直接应用。

虽然数据挖掘技术在具体应用中存在上述诸多难点,但其本身是人们大量实践的结晶,为建立传统人才培养模式中很难获取或不可能获取的模型提供了突破口。

5 结语与体会

随着教育信息化带来的信息量的急剧增长,及教育系统对信息提取的更高要求,数据挖掘技术在人才培养中应用的潜力巨大。本文在分析数据挖掘技术步骤和主要技术的基础上,针对我国现阶段研究生培养方式和特点,对数据挖掘技术在研究生培养中的具体应用进行了有益的探索,并分析了应用过程中的主要难点。实践证明,数据挖掘技术具有很广阔的应用范围和很强的适用性,因此将其应用于研究生培养教育是完全可行的,并且可以取得良好的应用效果。

参考文献

[1] 吉根林,帅克,孙志挥.数据挖掘技术及其应用[J].南京师大学报(自然科学版),2000,23(2):25~27.

[2] 黄解军,潘和平,万幼川.数据挖掘技术的应用研究[J].计算机工程与应用,2003(2):45~48.

[3] 刘晓霞.数据挖掘技术在高校教学中的应用[J].实践与经验,2008(6):115~117.

[4] 马希荣,孙华志.数据挖掘技术在教学评价中的应用[J].计算机工程与应用,2003(19):51~53.

[5] 林阳.数据挖掘在教育信息化中的的潜在价值[J].现在教育技术,2002(1):65~67.

[6]H Mannila,H Toivomen,et al.Efficient algorithms for discovering association rules[C].In:Knowledge Discovery in Database(KDD 94),AAA1 Press,1994:181~192.

[7]汪澜.数据挖掘技术在教学评估中的应用研究[D].辽宁工程技术大学硕士学位论文,2003.

[8]余倩.基于校园网络环境下的自主学习的群体性学习行为特征分析[D].陕西师范大学硕士学位论文,2007.

[9]戴永群.数据挖掘在教学中的应用[J].福建电脑,2005(9):158~159.

作者:彭勇 梁国华 王国利

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:版画艺术创作论文下一篇:林业经济管理论文