数据挖掘技术应用范文

2023-09-19

数据挖掘技术应用范文第1篇

一、数据挖掘技术概述

数据挖掘技术主要的作用是发现数据库的相关知识,又被称为数据采矿、资料探勘。在对大量数据进行相应的搜索时,数据挖掘技术能够根据相关的算法对其中隐藏的信息进行相应的搜索。一般情况下,数据挖掘技术与计算机科学有着密切的关系。对相关的信息实现相应的目标搜索,依靠相关的技术如模糊识别、机械学习、检索、在线分析以及统计等技术。在进行数据挖掘技术的过程中,首先要对信息进行收集。在所给的数据中进行相关的数据分析对象进行特殊信息的分析,随后对这些数据进行相应的信息收集,将信息收集到相应的数据库中。随后要进行集成数据。对不同的数据,即不同的性质、领域以及格式,在相应的层次上进行集中,将全面的信息提供给相关的组织或是企业。然后是进行规约数据。进行数据挖掘技术的应用,相关的技术仍然有待提高,因此便在一定程度上增加了相应的数据挖掘,因此进行数据规约技术,对数据集进行相应的规约,即是在保持数据原始性的基础上对数据的体积进行相应的缩小,挖掘的结果基本是一样的。之后是清理相关的数据。数据库中的数据种类繁杂,有完整的数据,同时也有不完整的数据,如不一致数据、噪声数据等,这类相关的数据会在一定程度上影响数据的准确性,因此需要把这类数据进行过滤,数据库储存的是正确、准确的信息。在进行清理数据后,需要对相应的数据进行变换。进行数据挖掘的最终目的是将相应的信息转化为能够被挖掘的信息,因此需采用相关的方法,如数据离散化转换、概念分层等。进行数据挖掘的过程中,需要结合相应的数据信息,在进行分析时,需要结合相关的工具,所选择的工具需要适当合理,在进行分析后得出真正有效的信息。随后要对相关的模式进行评估。相关的组织或是企业的专家对数据库的信息的准确性进行评估。最后是进行知识的表示。对挖掘的数据信息,呈现给相应的人群。在对数据挖掘技术进行反复的应用过程中,每一步都需要进行精准的把握,达到预期的目标,其中对数据的预处理花费的时间最长。

进行计算机数据的开发以及应用在很多方面都能够得到良好的体现,比如能够在市场营销领域进行相应的应用,根据固结的日常购买习惯进行相应的分析,从而进行更好的产品活动,制定正确的战略,从而有效增加企业的经济效益。在金融投资行业进行良好的应用,通过对相关数据的分析,进行风险的预测,从而更好做出相应的预处理机制,制定相应的方案,促进金融市场的发展。在产品制作环节进行应用,对产品制造过程中产生的数据进行分析,对其中存在的隐形问题进行分析,从而有效提高产品的质量。在电子商务领域进行应用,对不同商务数据进行分析,根据商户的信息以及相应的消费情况,制定个性化的服务,促进为顾客提供更好的服务,增加自身的效益等方面,促进不断的发展。随着技术的不断发展,对计算机数据挖掘技术的应用也越来越广泛。但同时,数据挖掘技术仍然有很多问题需要解决,需要相关的研究人员进行不断的深入研究,从而对社会当中的大数据进行良好的查找以及获取,增加相关的组织和企业的效益,提高对数据挖掘技术的不断探索,促进不断的发展。

二、数据挖掘技术开发分析

(一)神经网络

神经网络技术有良好的储存能力、适应性以及处理能力,因此能够很好的应用到数据挖掘体系当中。神经网络技术能够进行相应的识别、挖掘、预测以及分类,对大数据信息进行相应的处理,建立相应的模型,即前馈式神经网络模型。其中较好的模型,能够有效实现联想记忆以及优化计算等内容。但另一方面,神经网络技术的执行过程会有些难度,因为在对神经网络进行应用时,能够狗对学习与决策进行理解。

(二)决策树

预测模型算法之一的决策树,能够分类海量的数据,从而能够对其中更具价值、有良好的潜在优势的数据进行挖掘。在进行实际使用的过程中,决策树的优势体现在描述简单,且效率高等,因此处理大规模的数据较为方便。最早的决策树能够作为一种单变量,对复杂的概念表达较为困难,能够对同性的相互关系进行强调等。

(三)粗集

作为一种结合理论,粗集研究的数学工具特点是不准确且不确定的。粗集的优势主要表现在其不用借助额外的信息,对输入的信息能够给胡一个简化的表达空间,且操作较为容易,算法也比较简单。但同时,粗集不能狗对联系的信息属性进行处理,但在实际的应用过程中,连续属性是较为频繁且普遍的。

(四)遗传算法

遗传算法具有良好的适应性、并行性,能够与其他的模型进行相关的结合,在数据挖掘的实际应用过程中较为普遍。对其进行应用,能够对神经网络结构进行优化,删除多余的隐藏单元以及连接。但遗传算法的结构较为复杂,仍有很多问题需要解决。

三、对计算机数据挖掘技术的开发体现

进行计算机数据挖掘技术的开发,首先需要对相应功能有一个较为全面的了解,从而更加具有针对性,为相应的适合的行业和组织提供更好的服务,并以此推动数据挖掘技术的发展,促进深入开发以及使用。传统的统计方法一般有多元化统计、抽样调查以及预测。在进行相关的应用过程中,对相关的复杂结构的数据进行相关分析,抽样调查,进行相应的数列分析。在对大部分数据进行计算的过程中,不具有明显的特性。可视化技术即能够对高维数据进行相应的现实,促进对相关数据的分析,但其中仍然存在很多的问题需要进行解决。进行计算机联机处理方法,是对数据实施分析。在相关的客户需要这样的需求时,相关的工作人员需要对相关方面的工作进行良好的配合,有效提高数据的精准性,从而更好的促进数据挖掘技术的发展以及深化。

四、数据挖掘技术的开发工具

计算机数据挖掘技术有很多种类的开发工具,例如抽样技术和多元统计分析以及统计预测,这些都属于是一些传统的统计方法。如果针对的是大量的数据,使用抽样技术对数据进行分析,就会大量的消耗时间。如果是一些结构比较复杂的数据,那么对其进行分析时可以采用多元统计分析,对数据进行序列分析以及回归分析就是统计预测。在分析数据时,就会发现,有一些数据的特征的状态是非常模糊的,想要对其进行直接的过程是比较困难的,所以如果出现这种情况,就可以使用图表展开数据的特征,这就是可视化技术的技术要领。在对数据进行分析的过程当中,可以采用联机的方式将多维数据分析进行实现,在进行联机时,需要相关的用户进行一些支持帮助。对相关工作人员的联机分析处理提供帮助,将相关用户的数据需求作为依据。相关的工作人员要进一步的筛选和确定相关的分析算法,数据的模拟对象定为神经元功能,首先可以先构建一个比较完善的神经网络,之后分类以及分析整个的数据结果。输出层和输入层以及隐藏层是神经元功能的主要构成部分。数据挖掘技术的开发工具当中还包括遗传算法,整个算法的计算基础就是自然进化论,将基因遗传的相关特点作为依据,优化相关的算法,走后就可以将完整的数据模型进行构建和完善。

五、计算机数据挖掘技术的使用

(一)计算机挖掘技术在市场营销当中的应用

市场营销的日常工作就是整理和收集数据,将市场数据的调查结果作为决策的依据,将其作为企业接下来的营销计划的整体方向。目前,移动支付是非常流行的一种支付手段,剋将人们的出行进行简化,而且互联网销售商会收集人们在使用支付宝或者微信进行支付的过程当中产生的消息,销售商会将消费者的各种信息进行收集,从而形成一个巨大的数据库,之后再对数据挖掘技术进行使用,收集和整理数据库当中有用的信息,对这些信息进行有效的利用,研究不同消费者的不同消费心理,摸清消费者的消费情况,这些数据可以作为企业下一步营销计划的依据,为企业制定下一步的营销计划指明方向。

(二)数据挖掘技术在金融投资方面的应用

金融投资行业需要对各种不同的信息以及不同的资料进行有效的判断,如果想要做出正确的投资决策,那么就需要正确的预测信息收集构建出的模型。进行金融投资虽然会有很大一部分的收益,但是其风险也是非常大的,在使用金融投资的过程当中,各种因素都会对其产生影响。所以,为了将其中的风险进行减少,国际上已经将现在的金融投资方式作为依据,从而制定了一套比较完整的金融投资风险预测系统。使用该项系统,需要分析和收集以及统计各项数据,而且还要处理这些数据,这样对数据的处理和分析也就更加的科学,可以将其中的风险进行有效的减小,提高其安全性。使用计算机挖掘技术可以将数据检索的准确性进行保证,而且还可以将工作效率进行一定的提高。

(三)计算机挖掘技术在人事管理方面的应用

社会正在不断的发展和进步,国家的经济也随之得到飞速发展,这推动了国家很多的企业和机构也不断的发展和进步,这些企业和机构现在已经成了一个非常巨大的机构系统。国内市场竞争非常的激烈,企业如果想要通过选拔人才将自身的竞争力进行提升,那么就需要将自身的人力资源管理体系进行不断的完善。人力资源部门的工作人员在对开展人事评定工作时,如果使用计算机数据挖掘技术,可以将人力资源管理部门工作人员的工作量进行大量的减少,这样还将工作人员的工作效率进行了有效的提升。使用该项技术还可以将相关人员的每项资料从资料库当中进行快速的获取,正确的判断工作人员的工作质量和发展情况,将企业的人事评定系统不断科学化,将系统进行不断的完善,推动企业的发展和进步。

(四)数据挖掘技术在档案管理上的应用

社会科技正在飞速的发展和进步,信息技术随之飞速发展,这样就会不断的增加档案的管理对象,这时,使用计算机数据挖掘技术,可以建立一个相关的档案管理系统,这样就可以有效的整理和归纳处理对象的档案。应用计算机数据挖掘技术,可以将档案进行有效的分类,可以快速的搜索档案数据,。可以先对数据分布的结构模型进行构建,之后分类整理这些相关的数据,对数据的特性进行寻找,而且要关联性的处理这些数据,之后再挖掘这些数据,最后对这些数据进行检测和分析。应用计算机数据挖掘技术对档案进行管理,可以将数据的安全性进行有效的提高,而且也会将相关的检索速度进行提升。

(五)计算机数据挖掘技术在其他领域当中的应用

计算机数据挖掘技术的应用面非常广泛,在各行各业当中都发挥着很重要的作用。当前社会不断的发展和进步,社会科技也不断的发展,计算机也随之普及,人们可以对计算机灵活的进行应用,这样就将信息处理上的工作的实用性进行了很大的提升。计算机数据挖掘技术不仅在收集数据的领域发挥着很大的作用,还在制造业当中发挥着巨大的作用。在国家的制造行业当中,计算机数据挖掘技术大大的提升了一些产品质量的贡献量。在半导体制造业企业当中,计算机数据挖掘技术的作用非常的突出,技术人员在进行研发的过程当中,需要对数据进行大量的收集,这样才可以将产品研发的研发方向进行明确,在对产品进行测评的过程当中,需要将数据和其他的数据进行相关的比较,这时,使用计算机数据挖掘技术,就可以对新产品的每项性能进行快速的直观的反应。计算机数据挖掘技术在电子商务领域也有着很大的作用,而且发展空间非常的广泛,网络正在不断的发展和进步,在网络上进行交易或者浏览商品的现象也很多,但是对闪频进行浏览或者交易都需要很多的流量,而出现这些信息,就可以将电子商务的发展空间进行扩展,促进电子商务行业的发展和进步。

结语

综上,随着科技的不断进步和发展,计算机领域也得到了飞速的发展,于是出现了计算机数据挖掘技术。计算机数据挖掘技术的应用非常的广泛,在各个领域当中都发挥着很大的作用。使用计算机数据挖掘技术可以将共组人员的工作效率进行有效的提高,还可以将一个完整的数据库进行构建,推动企业的发展。

摘要:计算机数据挖掘技术能够度整个计算机领域的发展起良好的推动作用,同时也能够促进社会的进步,满足人们的生活以及工作的相应的搜索需求。因此,对数据挖掘技术进行相应的开发以及应用十分重要。本文即就此对计算机挖掘技术的相关内容进行分析,以期提高计算机挖掘技术的发展。

关键词:计算机,数据挖掘技术,开发应用

参考文献

[1] 夏天维.计算机数据挖掘技术的开发及其应用探究[J].决策与信息(下旬刊),2016,(3):234-234.

[2] 杨柳,李豫芹,黎红等.计算机数据挖掘技术的开发及其应用[J].数码世界,2018,(11):65.

数据挖掘技术应用范文第2篇

一、数据挖掘技术的含义

数据挖掘技术是一门具有多个学科交叉特征的技术。其内容不仅仅包括数据统计和数据库, 而且还包括机器学习和神经网络等。在统计行业中应用的范围很广。数据挖掘技术是将大量的数据进行分析和整理, 从中找到具有价值的信息。然后再对其进行分析。将大量并且复杂的信息进行整理, 使其变的规范和有价值。数据挖掘技术能够让经济统计从业人员和数据的使用者在获取数据信息时更加的便利。数据挖掘技术对大量的原始数据进行不同程度的加工, 让这些数据变为有价值的数据, 去除了原始数据的模糊性、随机性、不完全性等缺点。

二、据挖掘技术的特点

数据挖掘技术可以处理大量原始数据, 使其变得更加有价值。数据挖掘技术具有以下几个特点。

(一) 数据挖掘技术可以从容的面对大量增长的经济统计数据。

数据统挖掘技术可以不断地扩大自身的数据库。从而使搜索需求达到满足。还可以不断提高在搜索过程中查找数据的准确性。可以使使用者更加快速的找到所需要的数据。

(二) 数据挖掘技术可以对使用者输入的关键词进行联想搜索。

对不确定搜索内容的使用者有了更加便利的搜索方法。并且可以将使用者所输入的内容查找出的信息进行有序的排列。

(三) 数据挖掘技术可以在数据库的大量信息中找到数据与数据之间的关联。

然后联系起其他各方面的数据, 从而进行预测未来的经济发展方向。

(四) 数据挖掘技术可以处理的数据非常巨大。

面对大量的数据, 数据挖掘技术也可以从容的对其进行处理。

三、数据挖掘技术在经济统计中的应用

数据挖掘技术不仅可以从大量的原始数据中准确的找到具有代表性并且真实的数据, 还可以对这些数据进行合理、有效的处理, 使其变得有价值。数据挖掘技术在经济统计中的运用越来越广泛。并且自身的技术也在不断完善。数据挖掘技术的主要应用方式有以下几种。

(一) 集成化处理应用

数据集成的含义是对大量不同的数据进行整理。使其由复杂、杂乱变的规范和具有整体性。经济在不断发展, 信息的来源也变得更加广泛, 由此收集到的数据也越来越多, 内容也越来越复杂。从而导致的是数据集成变得更加困难。而且数据的来源也具有多种途径, 不仅仅是官方的统计, 还有其他的来源, 这就使得所收集到的数据具有多种模式。将大量的原始数据进行处理时期, 使其变的精简和有效。让数据库的大小保持在较小的水平。才可以让数据使用者和相关单位在使用数据时更加方便。

(二) 预处理方法

对经济数据进行预处理是经济统计过程中较为基础的一种方法。数据挖掘技术是在基础信息的前提下对数据进行整理和分析。而无法替代经济数据收集系统的功能。因此经济数据收集系统收集到的数据要进行预处理才可以让数据挖掘系统在此前提和基础下进行工作。预处理的内容包括将数据中偏差较大、不准确、不真实的数据进行去除。处理这些数据的方法叫作数据清理。数据清理也包括多种方法, 例如:预测法、平滑法、均值法等。均值法是现代分析技术中的一种应用形式。均值法的应用范围是当原始数据有一个数据为空值或者是数据是噪声数据时。利用均值法对其进行处理。具体的方法是将数据库中已知的属性填入原始数据的空缺中。然后使数据挖掘系统在分析时具有完整的数据, 从而提高数据的准确度。

(三) 决策树方式应用

数据挖掘技术对原始数据进行分析整理后输出便于使用者利用的数据信息。这些输出数据的有效形式可以由决策树的方式进行表现。首先决策树将输出的数据信息进行整理分类, 然后再以树状图的方式进行表达。决策树方式可以构建出明确的体系, 将数据进行分类和排序, 并准确地挑选出使用者所需信息。当决策树中的数据进行多次分类, 达到最终目的使标志的决策树的数据分布完成。当然决策树整个完成后, 要对决策树进行再一次修整。主要内容是去掉不相关的数据, 使整个决策树变得更加统一。

(四) 转换方法应用

使用某种方法使数据变为满足数据挖掘进行的形式, 这个过程指的是数据转换。数据转换要将数据变得更加规范, 同时还要将数据泛化, 即将高层次的数据信息替代低层次的数据信息。除此之外, 还要对数据进行连续进行处理。由于连续性处理的方法比较困难。所以可以采用概念分层, 即将数据进行划分, 然后将某些数据用代号来表示从而达到减少数据收集的量。

结语

将经济挖掘技术更好地应用在经济统计中, 要做好经济统计工作, 正确的认识到这个工作的重要性, 同时还要深刻的认识数据挖掘技术并且了解数据挖掘技术的特点。通过数据挖掘技术使数据的质量得到提高, 获取的信息也更加的准确和广泛。

摘要:近些年来经济发展速度快, 工作量也大幅度增加。工作中面临的统计数据更是有很大的数量。因此经济统计工作便成为了十分重要的工作内容。要做好经济统计工作, 就需要正确的认识到这个工作的重要性。同时还要深刻的认识数据挖掘技术, 并且了解数据挖掘技术的特点。然后才可以将经济挖掘技术更好地应用在经济统计中。本文分析了技术挖掘技术的内涵和特点, 然后探讨了数据挖掘技术在经济统计中的应用。

关键词:数据挖掘技术,经济统计,集成化处理

参考文献

[1] 辛金国, 柯芳, 李绍君, et al.数据挖掘技术在经济统计中的应用探索[J].统计与决策, 2009 (9) :24-27.

数据挖掘技术应用范文第3篇

一、当前我国网络安全现状与技术

互联网之所以便捷主要是因为其具有以下几种特点:(1)无主管性:每个人都可以是计算机和网络的主人。(2)跨国性:利用网络可以轻松实现跨国交流,因此这也加大了网络安全的防范难度。(3)不设防性:大部分计算机不具有较高安全系数的防御系统,因此容易成为黑客和病毒的攻击目标。除此之外一些网络犯罪分子更加猖獗,依靠技术肆意破坏网络安全。当前我国的网络安全方面主要面临的隐患有以下几点。

(一)不法分子对网络的恶意破坏

因为信息价值的重要性大量不法分子利用黑客技术对个人用户和企业用户计算机进行攻击,并大量在网页和一些应用软件中植入病毒和木马程序,在没有专业杀毒软件的情况下或是由于轻信钓鱼网站的陷阱就很容易被攻击或者造成信息丢失。在目前世界范围内黑客网站的数量已经突破十万,并且其规模和技术还在快速增长,甚至部分技术增长速度要超过一半杀毒软件的木马识别数据库,令用户防不胜防。还有计算机病毒的攻击,这种攻击往往不容易被察觉也并没有实质性表现,只是一段运行代码就可以让计算机或者软件处于瘫痪状态,严重会造成大量数据的丢失状况。目前我国在应对黑客和病毒方面的措施还比较落后,互联网风险还比较大。

(二)网络违法犯罪引发的严重危害

相比于黑客和病毒的攻击网络违法犯罪对于个人用户和企业用户的危害更为直接,往往会直接影响到生活和经济。当前利用网络技术进行犯罪的主要形式有:(1)经济诈骗类:有很多不法分子利用银行的漏洞或是受害者防范意识不强的心理来进行犯罪,他们盗刷银行卡,通过各种手段窃取银行卡信息,造成了很大的经济损失。还有利用伪基站等技术进行电信诈骗的犯罪事件,其影响恶劣让人触目惊心。(2)信息类犯罪:当前很多不法分子利用各种渠道来获取用户在网页上浏览的痕迹和在一些网站上留下的个人信息,他们窃取其电话、各种证件的号码来实施犯罪,更有甚者还会窃取个人企业机密信息甚至国家机密信息进行贩卖或是进行相关犯罪活动,这对用户的安全造成了巨大的威胁,在很大程度上破坏了社会稳定性和国家安全。(3)金融类犯罪,目前各个银行的手机客户端和微信支付宝等第三方客户端在用户当中得到普及,一些不法分子利用一些非法手段进行用户支付密码的窃取,或是进行相关金融诈骗造成了金融安全的严重漏洞,这严重危害了互联网的健康发展。

(三)传统的网络入侵检测方法所存在的弊端

传统的网络入侵检测方法的弊端也给了不法分子可乘之机,网络入侵检测大体上分为异常入侵检测和误用入侵检测两种方法:(1)误用入侵检测方法:这种方法只能对以往的行为进行相关检测,而对于一些新入侵行为则无法进行发现和预警,这种检测结果的实际效果非常小,因此在当前网络入侵检测中该种方法逐渐被淘汰掉。(2)异常入侵检测方法:这种检测方法相比于误用入侵检测法要先进的多,对于一些小规模网站的检测有着很高效便捷的效果,能够有效做到入侵甄别。但是如果网络入侵手段比较高明且伪装比较好或是一些个大型的网站检测这种方法就显得力不从心。异常入侵检测法用到了数据挖掘的技术,但是其核心还是围绕传统的统计方法和贝叶斯网络来展开的,随着网络规模的不断扩大该种技术的适应性变得越来越差,因此开发以数据挖掘为核心的网络防护技术显得至关重要和迫切。

二、计算机病毒特点

计算机病毒不好被控制防范有很大程度上来源于病毒自身的特点,一般病毒的特点可以总结为三种:传染性强、传播方式多样和破坏性强。这三种特点让计算机病毒的防控工作成为了难点。

(一)病毒的传染性特点

之所以称之为“病毒”是因为它像现实生活中的生物病毒一样拥有者较强的传染性。与现实中生物病毒所不同的地方是计算机病毒是由黑客编制的程序代码,它的“宿主”可以是计算机中的任何一个软件或是文件、文件夹,由于是人为编制的原因其适应性一般较强能够兼容在任意符合条件的储存介质中进行搜索。所谓传染性指的是“病毒”的自我繁殖过程,一旦计算机的一个文件或是程序软件感染病毒,在启动时如果关联到任何其他软件都可能造成并发“感染”,病毒的恐怖之处还在于当被感染用户进行联机上网时它还可以入侵与之相关的其他设备造成大规模入侵持续感染,危害极大。

(二)病毒有多重传播方式

病毒传播方式多种多样,这来源于互联网的开放性,一般来讲病毒最主要的传播方式要借助于系统漏洞和电子邮件,目前利用电子邮件进行病毒传播的行为比较常见,当打开电子邮件后里面的一个链接就很可能导致计算机感染病毒。当然利用网络系统漏洞来进行病毒传播的也屡见不鲜,当因为漏洞感染病毒时,病毒会在计算机上对远程主机系统进行不断的扫描和搜索,当这种搜索搜寻到新的漏洞时便会让远程主机感染病毒,进而让更多用户受到侵害。

(三)病毒破坏性极强

计算机病毒的破坏性在于持续泄漏用户的数据信息,一旦通过黑客木马等感染病毒,依据病毒的潜伏性隐蔽性特点就很有可能造成长期的损失,最严重的状况可能让整个计算机和网络系统瘫痪,让正常工作被迫停止。

三、数据挖掘技术概述

数据挖掘技术的基础是当前的数据库技术,它的核心是通过对一个范围内所有数据的挖掘研究来找到其中有用的数据来进行收集和整理,在整理之后最重要的是要将得到的数据内在的联系进行发掘,通过数据之间的各种表现来找到客观的规律,进而进行相关判断。一般进行数据挖掘后往往能够找到平时难以发现的联系,找到新的突破口。数据挖掘的过程一般要分为三个阶段:(1)数据的准备。将需要的数据录入到系统中。(2)设置数据挖掘的模式,在这个环节需要根据所需要挖掘的数据的不同和预期结果的不同来进行模式设置,在模式设置后可以让系统更高效的运行。(3)分析后的数据整理:分析后的数据整理主要是得出数据间的潜在联系,将数据进行总结归类,并将结果作为后期的数据处理依据。

利用数据挖掘进行计算机网络防控的优势在于它能更好的发现平时不易察觉的数据间的联系,这也正是针对病毒的隐蔽性特点,利用数据挖掘可以较快速的实现对未知入侵的检测,并且还能将得到的结果进行备份处理,这样对于服务器和代理服务器也可以实现高效的监督和检查效果。数据挖掘的方法还有较强的适应能力,能够根据病毒等的不断变化而随之变化,当前的利用数据挖掘技术实现的“人工免疫”防控技术能够实现计算机网络的自我监督,自我更新,这种动态化的学习能力克服了传统网络监测技术的更新慢,动态反应慢的问题,针对未来未知的可能发生的病毒侵害,这种方法显现了其优势。

四、利用数据挖掘进行网络安全防控的工作原理

(一)工作原理

数据挖掘技术的原理要分为几个模块:(1)数据源模块:这个模块的主要功能是将网络上的数据进行整合,并将整合后的数据源传输给终端主机,在这个阶段不需要进行过多的处理只需要进行简单的预处理,最主要还是要抓住特定数据的相关结构。(2)预处理模块:预处理模块的主要工作时进行数据的分类,并将数据的格式进行规划统一将其转化为主机能够识别的格式。进行数据分类时主要是依据数据的来源IP与端口位置,利用预处理技术能够减少数据的冗余,让数据的辨识度得到提高,最终提高终端的处理效率。(3)数据挖掘模块:该模块依据不同的模式有着不同的算法,通过该步骤能够较准确的发掘数据间的潜在联系,为后期的进一步决策做好数据分析基础。(4)规则库模块:规则库模块包括对以往病毒种类的储存和对新型病毒种类的更新,它会将以往挖掘过的病毒的信息存储在其中,并以此对当前挖掘结果进行分析,一旦出现吻合就会以识别出来。如果出现新病毒则会纳入其储存库中。(5)决策模块,这时整个系统的最终模块,决策模块是最终决定挖掘结果的,如果病毒与库中出现大面积吻合则可直接判断为病毒进行防御,如果吻合度不高但挖掘结果表明其风险性较大,则进一步进行决策判断,如果其是病毒则纳入库中进行收集并进行防御。

(二)构建以数据挖掘技术为基础的计算机网络安全病毒防御系统

构建防御系统需要以下几个阶段:(1)关联原则:关联规则是数据挖掘技术的基础,在数据挖掘时主要是依据数据间的因果、时序和简单三种关联关系来进行判断,并将复杂的数据整理成相互关联的关联网。(2)聚类分析:聚类分析首先要将有同一特性的数据划分到一个组内,这样不同的组有不同的特性在挖掘时就可以进行组内挖掘和组关系之间的挖掘实现疏密分布识别,对于全局性的把控有很大帮助。(3)分类分析:分类分析主要用到了统计的方法,将预定的分类个体按照类别进行录入能够充分的利用机器学习的方法构建模型进而达到分析数据的目的。(4)异类分析:异类分析的核心是找到与其他数据偏离较大的数据或是不能分组的孤立数据,往往这种数据是整个数据挖掘的突破口,能够在其中找到想要的结果。

(三)决策树挖掘

决策树挖掘的理论是将判断条件进行分解,依据从大到小,从广到细的原则将数据的判断进行逐级划分,进行分别的状态测试,当有一级不满足判断条件即可做出相应的防御反应。一般利用数据挖掘来进行决策树挖掘的条件为(1)该程序是否有破坏能力。(2)该程序是否有传染复制能力。(3)该程序是否具备隐蔽性能力。依据决策树进行逐级分析判断能够很好的利用以往数据库中的存储的结果,同时在逐级判断的过程中可以在第一步或是前几步就得出病毒的信息,这样可以大大的减少计算机的分析时间和压力,为后面的系统细致分析做好基础。

五、基于数据挖掘技术的防御系统构建策略

构建基于数据挖掘技术的防御系统需要分成几个步骤来实现。

(一)构建健全的数据挖掘技术理论体系

数据挖掘理论体系在实时更新着,因此企业技术专业人员要首先完善理论技术的体系构建,要加强企业与国外先进技术的融合和国内高校新成果的结合,要积极构建适合自己行业模式的数据挖掘系统,在基础理论上加以深化。要依照企业内部需要进行数据挖掘模块划分以适应企业自身的需求。

(二)构建数据挖掘技术的标准和软件系统

一般软件系统的获得有三种途径,第一种是直接购买成品软件,这种方法一般对于企业适应性较差但是方便快捷。第二种是企业进行自主软件开发,这种方法需要投入大量人力物力资源,适合经济实力足够的大型企业,软件能够直接与企业需要相符提高防御效率。第三种是聘请专业公司人员进行辅助开发,这时一般企业最多选择的方式。随着数据挖掘技术交互性的增强订立数据挖掘的标准非常重要,要引进标准的处理数据库服务器进行硬件支撑,利用国际通用的数据语言进行标准化作业可以实现更高效率的数据挖掘。

(三)利用专业化人员进行后期网络管理维护

数据挖掘技术是持续保证企业网络安全的关键技术,因此在建设完毕后需要专业人员进行维护和管理。企业应当积极聘请专业人员进行相关维护工作,同时积极组织企业内部人员进行相关理论的学习与研究,与时俱进。企业可以与高等院校形成合作关系,利用高校研究成果辅助企业健全网络管理维护工作。

结语

综上而言,数据挖掘技术是针对网络安全方面目前的高效率应用技术,企业要积极针对此加以建设以防范可能发生的黑客攻击病毒侵入导致的信息机密泄露事件。要不断对该技术进行创新应对未来更多变的网络环境。

摘要:21世纪是互联网的时代,无论是生产还是生活都离不开互联网,在网络给我们的生活带来极大的便利的同时,网络上一些不安全因素也侵害信息安全和财产安全,因此必须要在使用网络的时候明确一些危害的来源,找到解决的方案。数据挖掘技术作为当前最新型的计算机网络防御构建技术对于净化网络空间,保证使用者信息财产安全有着极为重要的作用。本文将从计算机网络病毒和危险进行分析从而进一步提出相关的数据挖掘技术原理与实际应用途径,希望能对有关人员起到一定的帮助作用。

关键词:数据挖掘技术,网络安全,计算机,病毒,应用

参考文献

[1] 郑艳君.数据挖掘技术在网络安全中的应用[J].计算机仿真,2011,28(12):118-121.

[2] 陆科达,万励,吴洁明等.基于数据挖掘技术的网络安全事件预测研究[J].科技通报,2012,28(6):37-39.

数据挖掘技术应用范文第4篇

摘要 目的:基于数据挖掘技术分析全国中医妇科名家诊治不孕症的共性用药规律。方法:采用Excel电子软件将《妇科名家诊治不孕症临证经验》一书中所收录的95位妇科名家治疗不孕症的方剂录入数据库,借助SPSS 25.0、SPSS Modeler 18.0统计软件进行频数分析、因子分析、聚类分析、关联规则分析。结果:共录入方剂453首,分類中以活血化瘀类最多,单味药物中使用频次最高的为当归;因子分析提取出有效公因子9个,聚类分析得到药组14个,关联规则分析得出规则23条。结论:妇科名家治疗不孕多以活血化瘀、补肾疏肝、燥湿化痰、清热解毒为主要方法,活血常用桃仁-红花、败酱草-大血藤、蒲黄-五灵脂为药对,补肾常以左归丸为底方加减,疏肝则用开郁种玉汤为基底,后辈医家临症遣方用药可以此为参考,灵活应用于临床。

关键词 数据挖掘;不孕症;用药规律;聚类分析;频数分析;因子分析;关联规则;名老中医药专家经验

不孕症是指妇女婚后未避孕,有正常性生活,夫妇同居1年而未孕的病症[1]。据相关文献统计,目前不孕症发病率为8%~12%[2]。随着社会发展的需要,“二孩政策”的开放,为延缓社会老龄化、增加出生率,不孕症已经成为了公共卫生领域的研究重点。中医对不孕症的记载可追溯至《黄帝内经》,所谓“督脉者……此生病……其女子不孕”。中医古籍中该病有“全不产”“绝嗣”“断绪”之称。不孕症的病因病机错综复杂,当代中医名家在临床中积累了丰富的经验,但治法方药却各有特色,由韩延华、罗颂平主编的《妇科名家诊治不孕症临证经验》一书,汇集了全国25个省份,95位妇科名家,包含国医大师、全国第一批至第六批名老中医药专家学术经验继承工作指导老师,重点学科学术带头人、全国中医妇科流派的代表性人物及主要传承人治疗不孕症的经验,充分展现出地域性差异和个体化治疗不孕症的特色。我们以此为基础,运用数据挖掘技术,采用频数分析、因子分析、聚类分析、关联规则等方法对书中大量的医案数据进行分析,旨在挖掘出名老中医治疗不孕的用药规律,提炼出不孕症治疗的核心药物,为中医药治疗不孕症提供切实可参考的经验。

1 资料与方法

1.1 文献来源 2019年由韩延华、罗颂平主编的人民卫生出版社出版的《妇科名家诊治不孕症临证经验》[3]。

1.2 检索策略 检索《妇科名家诊治不孕症临证经验》一书所涉及的全部方剂。

1.3 纳入标准 1)所选病案的医家均为国家中医药管理局认可的全国名老中医药专家、国医大师、中医妇科流派代表性传承人及主要传承人。2)方药组成、药物剂量完备。3)首选辨证分型清晰的方剂。4)以中药内服方剂为主。

1.4 排除标准 1)仅列方剂名称,未详述药物组成与剂量的方剂。2)重复录入的医案和(或)方剂。3)以西医治疗或针灸等治疗为主的医案。4)病案主治症状复杂,不具备代表性的方剂。5)非水煎剂的方剂如外敷等。

1.5 数据的规范与数据库的建立

1.5.1 数据库的建立 采用Excel 2010软件建立数据库,以二分类变量形式录入,频数分析、聚类分析、因子分析应用SPSS25.0软件实现,关联规则分析使用应用SPSS Modeler 18.0实现。

1.5.2 数据库的规范 按照《中药学》[4]、《中药大辞典》[5]标明的中药名称进行规范化处理,如“熟地”改为“熟地黄”“仙灵脾”改为“淫羊藿”;对于不同炮制方法的同一种药物,如不影响药物性味归经则统一为一种,防止分析结果失真。

1.6 数据分析 频数分析:作为最简单医学统计方法之一,通常用来对医学数据进行初步分析,得出量化依据,提炼高频信息。在本研究中鉴于涉及的方剂、药物众多,应用频数分析先初步筛选出高频药物,为后续系统深入分析用药规律奠定基础。

从《妇科名家诊治不孕症临证经验》一书中共录入方剂453首,涉及中药333味,总频次为5 438。对所有中药进行频数分析后将频次≥20的中药进行降序排列,得到高频中药,并统计累计百分比,即药物出现频次占总频次的百分比。

因子分析:因子分析是为了从大量数据中,提取可测变量间的共同因素,将大量变量简化为具有代表性的少数潜在因子,利用潜在因子来发现数据的本质规律,是数据挖掘技术中典型的降维分析方法。本研究选取主成分分析算法,在高频中药中寻找其潜在规律,将相关联比较密切的中药归在同一类中,每一类中药就成为一个公因子,以最具代表性的公因子来反映不孕症用药的共性规律[6]。

对出现频次≥20,累计百分比前80%的67味药物进行因子分析,结果显示巴特利特球形度检验:P=0<0.001,存在内部因子结构,KMO值为0.687,适合因子分析,特征根大于1时可提取出公因子23个,依据专业知识提取载荷系数绝对值大于0.4的有效药物组合9个。

聚类分析:聚类分析的基本思想是对变量间的相似程度进行研究,通过计算相似性程度将相似程度大的变量聚合为一类,分类后的变量组内相似性最大,组间相似性最小,是分类学基本统计方法之一。聚类分析树状图直观表达了变量间的相似性大小,距离越大相似性越低,本研究借助聚类分析寻找在高频中药中存在密切联系的药物组合体,进一步分析不孕症用药规律[7]。

对出现频次≥20,累计百分比前80%的67味药物进行聚类分析,选取系统聚类组间连接法,词篇矩阵选择Ochiai系数,得出聚类谱系图。药物间横轴距离越近即表示关系越紧密。

关联规则:关联规则是寻找变量之间的联系规律和特征性结构的统计学方法,本研究选取最常用的Apriori算法,在大量方剂数据中寻找频繁项集,依据频繁项集计算提取相应关联规则,其优点在于对大量无效规则的筛选,执行效率较高。本研究借助关联规则分析通过支持度、置信度、提升度等指标,找到药物间的最优匹配,最终得到不孕症治疗的核心药对,支持度即指X和Y 2种药物的交集在总体中出现的概率。置信度就是指出现了药物X的方剂中,药物Y也同时出现的概率。提升度为置信度与支持度的比值,提升度越高则关联规则可信度越好,提升度小于1的规则应予剔除[8]。

采用SPSS Modeler 18.0进行关联规则分析,并建立关联规则网络图,对高频中药进行可视化探索,线条粗细表示关联度的强弱。见图2。线条越粗两药关联度越强,如木香-砂仁、墨旱莲-何首乌、蒲黄-五灵脂等,鉴于可视化探索信息丟失率较高,为分析出核心药对,建立Apriori关联分析模型,规定最低支持度5%,最小规则置信度70%,最大前项数1,剔除提升度小于1的相对无效规则,分析出核心药对组合,并依据置信度由高到低排列。

因子分析、聚类分析、关联规则分析三者分别从降维、分类、内部结构规则探索3个方面挖掘数据的隐含规律,三者结合能够最大效率地减少统计分析中的信息损失,最全面地得到方剂数据中的规律。

2 结果

2.1 药物使用频率 67味高频药物累计百分比可达79.90%,最高频次药物为当归273次,根据药物功效可分为,活血化瘀药、补阳药、清热药、补气药、理气药、补阴药、补血药、清利水渗湿药、温里药、解表药、祛风湿药、固涩药、攻毒杀虫止痒药、化痰止咳平喘药、止血药、化湿药。其中活血化瘀药最多,共16味,累计百分比16.1%;补阳药居次,共9味,累计百分比12.17%;理气药7味,累计百分比6.26%,清热药6味,累计百分比6.00%;补气药5味,累计百分比9.91%;补阴药5味,累计百分比3.97%;补血药5味,累计百分比8.70%。见表1。

2.2 高频药物因子 F1有中药7种,F2有8种,F3,F4,F6均为5种。药物分布情况见表2。

2.3 高频药物聚类 由此可提取核心药物组合14组,A1:三棱、莪术;A2:皂角刺、穿山甲;A3:桃仁、红花;A4:丹参、赤芍;A5:败酱草、大血藤;A6:延胡索、川楝子;A7:五灵脂、蒲黄;A8:女贞子、墨旱莲;A9:淫羊藿、仙茅、巴戟天;A10:续断、桑寄生;A11:白术、党参、黄芪;A12:菟丝子、熟地黄、枸杞子、山药、山茱萸;A13:当归、川芎、白芍、香附、甘草、茯苓;A14:陈皮、半夏、苍术。见图1。

2.4 关联规则 得出高频药物关联规则25条,其中提升度较高的依次为五灵脂-蒲黄、莪术-三棱、女贞子-墨旱莲、续断-桑寄生、茯苓-半夏、菟丝子-覆盆子、菟丝子-枸杞子、菟丝子-杜仲;置信度较高的为菟丝子-覆盆子、当归-川芎、续断-桑寄生、当归-红花、菟丝子-枸杞子、菟丝子-杜仲、当归-熟地黄、当归-白芍等。见图2和表3。

3 讨论

不孕症是妇科领域的疑难病症,是造成家庭不稳定的重要因素,全国各地妇科名家对于不孕症的诊治各有特色,因而在大量方剂数据中寻找名家的共性用药规律对指导后辈医家的临床用药大有裨益。女性不孕的主要病机是脏腑功能失常,冲任气血失调,胞宫不能摄精成孕。肾气盛,冲任二脉通盛,两精适时相搏,方可摄精成孕。本研究经频数分析后,发现妇科名家诊治不孕症的方剂中以活血化瘀药最多,《诸病源候论》有云:“积气结搏于子脏……阴阳血气不调和,故病结积而无子。”女子性本善怀多郁,又求子心切,肝气郁滞,瘀结冲任;或感染外邪直中胞中,蕴结血分,冲任不通,瘀阻胞宫,血瘀是女性不孕症发展中的重要病理产物。姜俊雨[9]认为活血化瘀药,能够推动气血经络流畅运行,调和气血,起到疏通输卵管,恢复其摄精拾卵之功能,促进卵泡发育、排出的作用。此外方剂中大量出现补益类药物,补阳、补阴、补气、补血皆有,体现出阴阳并行,气血同治的用药特点,肾乃先天之本,若女子肾精不足,精不生血,则精枯血乏,无法妊养胞胎,应用补益类药物可使气血调和,阴平阳秘,为胞胎的生长发育提供基础。与此同时,佐以理气药物使诸药补而不滞,更能纾解肝气之郁结,相辅相成。而清热类药物则具有较好的消炎功效,能够消除输卵管炎症积液,畅通输卵管,恢复其摄精拾卵的生理功能。

本研究中,因子分析和聚类分析虽然分别采取了降维和分类的分析方法,但其结果却有交叉相似之处,例如F1-A12、F2-A1+A14、F3-A13、F4-A9、F5-A7、F7-A5等,对二者结合分析更能全面深入地挖掘出数据隐含的共性规律,使得本研究结果更具参考价值。F1-A12组均为补益药,功效以补益肝肾,填精益髓为主,可谓阴阳并行,气血皆益,F1组成与左归丸药物组成极为相似,于莎等[10]研究发现左归丸能够提高DOR不孕患者获得有效胚胎的周期比率,进而提高辅助生殖技术的成功率;F2组中三棱、莪术,破血行气消积,聚类分析A1组将此二味单独分类,恰为龙江韩氏妇科常用药对[11],常用于治疗输卵管炎性不孕。随着我国社会经济高速发展,居民物质生活愈加丰富,部分女性常贪嘴好甜,恣食膏粱厚味,形体肥胖,痰湿内蕴,痰浊阻滞冲任,阻碍胞宫摄精受孕,《丹溪》云:“肥盛妇人,禀受甚厚……不能成孕……湿痰闭塞子宫故也。”提出痰湿了不孕的机制,F2组中半夏、陈皮、苍术、枳壳相须为用,共奏燥湿化痰,理气宽中之功;白术、茯苓补气健脾,以填后天生化之源,通补兼施,化痰消浊,恰合痰湿不孕之治法;肝主情志,须其气和志达,方能协调平衡全身气机升降出入,而女子以肝为先天,以血为用,《笔花医镜》提到:“肝气唯妇女易动焉,……一有逆意,即牢结胸中……郁久而成病。”肝为冲任所系,若肝气失调,木郁犯脾伐土,气血顿失生化之源,冲任虚损,则妊养无力。F3-A13组以疏肝理气,活血调经为主,其中当归补血养肝、和血调经,香附疏肝解郁,理气调经,川芎、白芍活血行气、柔肝和营,配当归则滋补阴血,补而不腻。F3-A13组的药物组成,与傅山治肝郁不孕症之“开郁种玉汤”极为相似,丛慧芳等[12]研究发现开郁种玉汤能够有效改善肝郁肾虚型证候积分、焦虑自评量表积分,提高妊娠率。

F4-A9组以补阳药为主,当中淫羊藿、仙茅合为二仙汤,与巴戟天相配,能起温肾阳,益肾精,调冲任之效,墨旱莲、白芍则兼顾肝肾,二仙汤能够通过PI3K-AKT信号通路、MAPK信号通路、TNF信号通路等对卵巢功能产生影响[13]。F5-A7组蒲黄、五灵脂组成妇科常用方剂失笑散,能入肝经血分,治疗瘀停胞宫脉道阻滞之症;F6组以滋补肝肾,补气健脾为主,聚类分析将其中的续断、桑寄生提炼为核心药对组合A10,能补肝肾、强筋骨、安胎元。A11则由白术、党参、黄芪三味组成,具补气升阳、生津养血安胎之效,使气血化源充足,奠定胞宫妊养所需的良好环境;输卵管炎性不孕以瘀滞为主,兼夹湿热之邪,应治以活血行气,化瘀通络之品,而F7-A5组中败酱草、大血藤能清热解毒,活血祛瘀,与牛膝相伍能获补肝肾,强筋骨,逐瘀通经之效,能够疏解子管之瘀滞,复其摄精拾卵之能。研究认为大血藤的抗炎机制与TNF信号通路、NOD样受体信号通路、凋亡、MAPK信号通路、Toll样受体信号通路及核因子κB信号通路等密切相关[14];F8组中郁金活血止痛、行气解郁,川楝子疏肝泄热、行气止痛,王不留行、路路通活血通经,体现出疏肝通经活血之法。

此外,因子分析和聚类分析还分别得出了一些核心药对组合,如F9牡丹皮、女贞子,能清热凉血、消炎镇痛、滋补肝肾;A2:皂角刺、穿山甲,活血消癥、消肿排脓;A3:桃仁、红花,活血调经、祛瘀止痛,二味常相须而用,治妇科血瘀诸症;A4:丹参、赤芍活血祛瘀、凉血消痛;A6:延胡索、川楝子行气活血止痛;A8:女贞子、墨旱莲,补益肝肾,凉血止血,临床可以考虑根据其藥效灵活加减应用。

在关联规则结果中,五灵脂-蒲黄、莪术-三棱、女贞子-墨旱莲、续断-桑寄生、茯苓-半夏均为前文因子及聚类分析已述之药对,不再赘述,3种数据挖掘算法得以相互印证及补充,增强了本研究结果的可参考性。另外在关联规则网络连接图中,可以看出木香-砂仁组合,该组合行气止痛为主,常用于输卵管炎性不孕伴发的腹痛腹胀等症。而墨旱莲-何首乌则以滋补肝肾为主。在高频药物关联规则25条中,与当归相关的规则最多,可达13条之多,结合频数分析,我们发现当归在不孕症的诊治中具有不可或缺的地位,当归素有“妇科圣药“之名,现代药理研究表明,当归能增强人体免疫力,调节子宫平滑肌收缩,促进造血[15],当归酚性油对细菌具有抑制作用,能够抑制慢性炎症和组织水肿。根据其提升度大小,我们将与当归相关的药物进行重要性排序,由高至低的前5味药物依次为川芎、红花、熟地黄、白芍、枸杞子,提升度越高则妇科名家使用该药物组合治疗不孕症的概率越高,可信度越大。其中当归、川芎、芍药、熟地黄四味即为四物汤,养血调经而促孕。Zhou等[16]通过实验发现四物汤能够显著改善POF小鼠的雌激素水平、卵泡数量、抗氧化防御和微血管形成,显著激活Nrf2/HO-1和STAT3/HIF-1alpha/VEGF信号通路以促进血管生成,改善妊娠结局。与菟丝子相关的规则居次共5条,重要性排序依次为,覆盆子、枸杞子、杜仲、紫石英、淫羊藿。针对排卵障碍性不孕,菟丝子是公认的能够改善卵巢功能及女性激素水平的重要中药,孙向明等[17]发现菟丝子可能具有与己烯雌酚相似的拟雌激素作用机制,能够有效的影响体内生殖激素的水平。Gao等[18]通过检测菟丝子总黄酮对基质金属蛋白酶9及其相关通路上关键因子的表达,发现它是通过激活Notch/AKT/MAPK信号通路发挥作用的,能够借此治疗卵巢内分泌和生殖障碍相关疾病。雷娜等[19]发现,杜仲叶总黄酮可有效调节多囊卵巢综合征大鼠血清中雌孕激素水平,并达到良好的治疗效果。李锦英等[20]经网络药理学研究认为菟丝子-枸杞子药对的多种活性成分可能通过PI3K/AKT信号通路、MAPK等多条通路作用于AKT1、TP53等靶点改善卵巢功能。

采用数据挖掘方法对全国中医妇科名家的方剂进行分析,有助于从庞博纷杂的文献资料中找到当代名家遣方用药的共性规律,能够为科研提供可靠的理论依据和更为清晰的研究方向,为后辈医生诊治不孕症提供指导依据。本研究运用频数分析、因子分析、聚类分析、关联规则分析对95位妇科名家,453首方剂进行分析,并得出其共性核心药物组合,发现妇科名家治疗不孕多以活血化瘀、补肾疏肝、燥湿化痰、清热解毒为主要方法,用药中以当归、白芍、菟丝子最为常见,后辈医家临症可以此为参考,灵活应用于临床。

参考文献

[1]谢幸.妇产科学[M].北京:人民卫生出版社,2013:369.

[2]Vander Borght M,Wyns C.Fertility and infertility:Definition and epidemiology[J].Clin Biochem,2018,62:2-10.

[3]韩延华,罗颂平.妇科名家诊治不孕症临证经验[M].北京:人民卫生出版社,2019:23-615.

[4]高学敏.中药学[M].上海:上海科学技术出版社,2011:341-345.

[5]南京中医药大学.中药大辞典[M].上海:上海科学技术出版社,2006:1-194.

[6]于林童,曲文白,余新波,等.数据挖掘方法在名老中医用药规律研究中的应用现状[J].中医杂志,2017,58(10):886-888,900.

[7]隋明爽,崔雷.基于SPSS的共现聚类分析参数选择的实例研究[J].中华医学图书情报杂志,2016,25(1):52-56.

[8]趙艳青,李青松,项敏泓,等.中医药数据挖掘中常见问题的思考与策略——以中医药术语及用药规律总结为例[J].中华中医药杂志,2018,33(4):1220-1225.

[9]姜俊雨.活血化瘀法治疗不孕症的研究[J].中国社区医师,2019,35(8):113-114.

[10]于莎,李江慧,龙慧,等.左归丸加减对卵巢储备功能降低肾阴虚证不孕患者体外受精-胚胎移植治疗的影响[J].中国中医药信息杂志,2019,26(9):29-33.

[11]韩延华.韩氏女科[M].北京:人民军医出版社,2015:287.

[12]丛慧芳,高强,栾毅峰,等.肝郁肾虚型体外受精-胚胎移植患者应用开郁种玉汤妊娠结局临床观察[J].辽宁中医药大学学报,2020,22(10):5-8.

[13]李敏,郭淼,孙建华,等.二仙汤治疗POI的网络药理学分析[J/OL].世界中医药:1-6[2021-08-24].http://kns.cnki.net/kcms/detail/11.5529.R.20210527.1259.002.html.

[14]徐锋,黄旭龙,张梅,等.基于网络药理学的大血藤抗炎作用机制研究[J].中华中医药学刊,2020,38(8):249-253,29.

[15]黄红泓,覃日宏,柳贤福.中药当归的化学成分分析与药理作用探究[J].世界最新医学信息文摘(连续型电子期刊),2019,19(58):127,153.

[16]Zhou F,Song Y,Liu X,et al.Si-Wu-Tang facilitates ovarian function through improving ovarian microenvironment and angiogenesis in a mouse model of premature ovarian failure[J].J Ethnopharmacol,2021,280:114431.

[17]孙向明,宋辉,赵丽珠,等.菟丝子拟雌激素作用体内直接作用物质的发现[J].药学学报,2021,56(7):1826-1831.

[18]Gao F,Zhou C,Qiu W,et al.Total flavonoids from Semen Cuscutae target MMP9 and promote invasion of EVT cells via Notch/AKT/MAPK signaling pathways[J].Sci Rep,2018,26,8(1):17342.

[19]雷娜,任凤兰,王娜梅.杜仲总黄酮对多囊卵巢综合征模型大鼠相关激素水平的干预作用[J].中医学报,2020,35(8):1727-1731.

[20]李锦英,张兆萍,叶金飞,等.基于网络药理学的菟丝子-枸杞子药对治疗卵巢早衰的作用机制研究[J].中国药房,2020,31(18):2202-2209.

(2020-07-31收稿 本文编辑:张雄杰)

数据挖掘技术应用范文第5篇

数据挖掘作为一种信息技术的应用, 它的发展历史较短, 在这个过程中对数据挖掘技术的具体定义也比较模糊, 没有一个清晰完整的概念。但是, 在数据挖掘发展的这个短时期内, 它的发展速度却很惊人。越来越多的行业和企业开始对这项新技术予以关注, 并开始尝试将其运用于企业的发展过程中。具体而言, 数据挖掘是一项系统性工作的总称, 它的主要用途就在于对大量的繁杂的数据按照客户的需求进行处理。在这其中可能会涉及到数据库、统计学、模式识别、信息检索等一些具体的工作。数据挖掘的一般性含义就是从已有或者构建的数据库中获取具有应用价值的信息或者数据的过程, 在性质上类似于数据分析工作。

在开放型的市场经济中, 客户已经成为市场的另一个代名词, 如何占领市场也就意味着如何获取更多的客户, 客户在当前的经济发展中的重要地位已经毫无疑问的凸现出来。客户关系管理 (CRM) 就是在这种客观形势下应运而生, CRM的一个显著特点就在于对客户信息的关注, 将企业长期遵循的产品中心转移到以客户为中心的模式上来, 通过对客户信息的准确分析来对产品的市场进行准确的定位, 为企业以最低的成本谋取最高效的利益, 这是CRM在当前企业中应用的一个重要原因。

2 数据挖掘在CRM中的应用分析

2.1 数据挖掘的具体步骤

数据挖掘是一个系统复杂的工程, 从本质上讲, 它的作用就在于从众多的数据中找出潜在的具有利用价值的信息和数据。按照具体的操作流程, 数据挖掘大概有以下几个方面的步骤。

(1) 数据清洗。数据清洗就是根据数据挖掘的目的, 来确定数据挖掘的相关领域, 对于与挖掘目的无关的数据或者主体予以清除, 对空白的数据域进行排除, 这是数据挖掘工作的第一步。

(2) 数据集成。在数据挖掘的过程中, 可能会涉及到不同领域的数据进行集合, 各个不同的数据源中的数据要在同一个数据库中进行操作, 这就要对这些不同源的数据进行整合。

(3) 数据转换。上面的数据集成工作, 可能会涉及到不同源的多种数据, 这些数据的格式也不尽相同, 如果要使用数据挖掘系统对这些数据进行操作就必须保证他们在格式上的统一, 因此要对不相同的数据格式进行转化。

(4) 数据挖掘。数据挖掘既是对已经进行过清洗、整理、转化的数据, 按照数据挖掘的目的, 选择一种最合适的方式对数据进行挖掘的工作流程。对数据进行挖掘的方法很多, 根据挖掘用户需要选择特定的数据挖掘算法。

(5) 模式评估。所谓模式评估就是对以上所做的各项工作进行评估, 保证工作进行具有价值意义。

(6) 知识表示。知识表示是数据挖掘的尾声, 即用可理解的方式将数据的挖掘结果展示给要求进行数据挖掘的直接客户。

2.2 C R M数据挖掘的方法分析

CRM (客户关系管理) 是一项复杂的工作, 将数据挖掘运用到具体的CRM管理系统中, 能够提高C R M的整体运作水平。CRM作为一个系统延续的流程, 数据挖掘可以应用于它的各个不同的阶段, 并且在每个阶段, CRM中数据挖掘的方法也都各不相同。

(1) 关联分析法。所谓关联就是指在两个或两个以上的不同变量之间存在着某种潜在的规律, 通过对这种规律的掌握能够更好的将这些数据进行使用。在CRM中, 就是要利用关联分析找出与客户想关的各方面的数据, 并从中找出其联系, 为企业的市场战略提供理论支持和依据。

(2) 序列模式分析。序列模式其实也是一种数据关联, 但是它更重要的是体现数据字前后关系上的顺序和联系。这个方法被用于C R M中对客户流失的分析策略中。

(3) 分类分析。所谓分类分析就是将数据库中的数据按照一定的原则或者标准进行细分, 在每一个分类中再具体的使用某一种数据挖掘算法进行分析统计。在CRM中运用这种方法能够使市场细分化, 使数据挖掘的精准度更高, 能够为市场提供更准确的信息。

(4) 聚类分析。聚类分析是一种在形式上与分类分析相反的模式, 在CRM中, 我们有时可能需要对数据的细分来保证市场的精准, 同时也不排除我们需要对不同的数据进行对比、归纳和整理, 这就需要聚类分析的方法来帮我们达成目的。

3 CRM管理系统在保险行业中的具体应用

CRM管理系统在保险行业的具体应用, 也就是要结合保险行业的具体情况, 使CRM管理的各项工作能够更加高效的为保险行业服务。根据数据挖掘的相关流程, 结合保险行业的具体特征, CRM管理系统在保险行业中的具体应用主要有以下几个内容。

3.1 确立客户挖掘主题

确立客户挖掘的主题也就是保险行业必须首先明确其进行CRM管理工作的根本目的。例如是以车险客户为目的还是以人身险客户为目的, 这些是保险行业自身应该确立的问题。数据挖掘工作必须紧紧的围绕这个主题来进行, 保证挖掘工作的有效。

3.2 建立客户价值模型

客户价值模型, 是保险行业对客户所能带来的潜在利益价值进行判断。每个客户的生命周期中在保险行业中的投入并不相同, 对这些不同的客户能够给保险行业带来的价值进行预估, 能够帮助保险行业最大的挖掘客户的单个价值, 避免各种资源的浪费。建立客户价值模型, 应该包括这三个方面的内容:客户生命周期价值、当前价值和潜在价值。

3.3 建立数据库

对客户进行数据挖掘的前提就在于有一个比较完整的数据库, 数据库的建设应该按照挖掘主题来进行确定, 对保险行业在开展各项工作的过程中收集的客户信息进行整理, 按照挖掘主题的要求对相关的数据进行清洗、转化、集合, 使之形成一个可以用挖掘技术进行统筹的较为完善的数据库, 这是进行数据挖掘的必要准备工作。

3.4 利用分析工具进行数据统筹

在数据库已经建立以后, 就应该利用一定的工具来对数据进行分析, 对于保险行业而言, 可以利用一些简易的数据挖掘软件来对数据库中数据进行分析。例如SAS, 可以利用它的细分、聚类、关联等技术对数据进行筛选分析。

3.5 管理结果的应用评价

数据挖掘的最终目的是要将其运用在具体的商业事项中, 对与CRM的管理结果, 必须通过具体的市场反馈来进行确认和评价。以其实施的最终结果来判断数据挖掘和C R M的管理是否有效, 并以此来促进C R M管理系统的完善和改进。

摘要:数据挖掘技术是信息技术运用于实际生活的又一项进步成果, 将数据挖掘技术应用于CRM的管理中已经成为当前的一个潮流和趋势。特别是对于保险行业这种以客户为导向的行业而言, 做好CRM管理工作更是极为必要。将数据挖掘技术运用到保险行业的CRM中是一种进步, 如何实现二者结合功效的最佳发挥, 是本文要解决的主要问题。

关键词:数据挖掘,CRM,保险行业,应用

参考文献

[1] (美) Alex Berson, Stephen Smith, KurtThearling[著].构建面向CRM的数据挖掘应用[M].北京:人民邮电出版社, 2001.

[2] 吕延杰, 尹涛, 王琦.客户关系管理与主题分析[M].北京:人民邮电出版社, 2002.

数据挖掘技术应用范文第6篇

摘 要:当前,随着教育的普及,高校的教育质量也在不断上升。对于很多高校来说,科研是必不可少的,很多导师基本上都有科研项目,因此,对于高校来说,需要具备完善的科研管理系统,方便科研管理者的工作,更为从事科研工作的导师打好坚实的基础。科技的进步为高校科研项目带来了很多便利,在科研项目进行的过程中,产生数据与记录是不可避免的,有的科研项目甚至会产生庞大的数据量,所以,随着科研项目的进行,其科研信息数据库中的历史数据也会越来越多。但是教师往往需要对一些有用的数据进行提取,或者是找到众多数据的规律等,而一些传统的方法已经不能满足科研工作者对数据处理的需求,因此,高校需要在科研管理系统中引进计算机数据挖掘技术。数据挖掘技术是专门对数据进行处理的一种技术,即使面对非常庞大的量的数据,它也可以从数据库中提取中有价值的规律,方便高校科研系统管理者和科研工作者的工作。该文就高校科研管理系统中计算机数据挖掘技术的运用进行分析与探讨。

关键词:高校科研管理系统 计算机 数据挖掘技术 运用

1 数据挖掘的概述

数据挖掘不是一个简单的学科,它包含可很多个领域的知识,目前,对数据挖掘的定义并不是完整的,就数据挖掘涉及到的相关知识来说,就有数据库、数据统计、人工智能化、机器应用与学习等,从这个角度来说,数据挖掘技术包含的知识点比较复杂。但是当前很多学者对数据库有一个比较普遍的概念,就是从一些大量的、不完整的、模糊的、随机的数据中,提取一些有用的信息,但是这些信息并不是显而易见的,而是隐含在其中,人们之前不知道的一些有用信息或者是知识的一个过程,这就是数据挖掘。从另一个角度分析,数据挖掘就是采用某些数据分析工具,来观测一些有价值的或者是被忽略的信息。

目前,数据挖掘主要可以分为两类:预言性数据挖掘以及描述性数据挖掘。预言性数据挖掘就是采用相关模型对一些数据进行预测,在进行预言性数据挖掘的时候常常采用分类的方法,也就是说对数据库中的数据进行分类,以区分数据的类别,进而得知一些未知数据的类别,通过这个方法可以得知某些未知数据的某些性质。描述性数据挖掘是采用概述的方式,对一些数据信息进行描述,然后从描述中得知数据的一些性质。要进行数据挖掘,就需要运用数据挖掘技术,当前使用的最多的技术就是关联规则方法,除此之外,还有分类分析、聚类分析等技术模式,这些技术模式在数据挖掘的发展中非常重要。

2 高校科研管理的重要性

随着教育的普及,各大高校之间的竞争也越来越激烈,高校如果要在其中脱颖而出,就需要不断的促进其自身实力的提升。对于高校来说,其科研管理系统对其发展非常重要,因此,高校在发展的过程中,需要不断提升其科研水平。要想培养高素质的人才,高校需要保证其教学质量,科研在一定程度上可以有效促进高校教学质量的提升。提升科研水平的前提是保证科研管理质量,在进行科研项目的过程中,如果其管理出现问题,那么科研项目的质量与水平都会降低。高质量的科研管理可以提升科研工作者的积极性,帮助高校科研建设项目更好的实施。

3 高校科研管理的现状

随着科技的不断进步,很多领域的管理已经开始往智能化的方向发展,但是,当前很多高校由于对科研管理的重视度不够,导致在管理水平与技术停滞不前,在进行科研管理中的统计工作时,仍然采用人工的工作方式。在对学校各院系导师的科研成果进行统计的时候,一般都是由科研管理人员到各个院系进行登记与整理,将导师的科研项目、发表的论文以及获奖等情况一一登记好,然后再录入到电脑管理系统中进行统一的汇总,这种收集资料的方式效率是非常低的,而且当有导师在外出差的时候,很容易将某些导师的研究项目、研究成果等漏掉,导致数据不完整等现象。而且管理人员往往就是将收集到的资料进行简单的整理与分析,由于其水平的限制,他们只能对收集到的数据进行简单的处理,并不能有针对性的对高校的科研水平与成果进行规范化的处理,得到的数据处理结果往往没有权威性与借鉴性。

其次,高校在进行科研管理的过程中,缺乏针对性的与科研相关的软件,每个高校的发展特点都是不同的,在进行科研管理的时候,学校应该根据自身发展的实际情况,选择科学、合理的科研量化软件,以做到对科研数据统计的科学化与正规化。人工录入数据的工作方式对与科研系统管理者来说,其工作强度是非常大的,而且在人工操作的过程中,出现错误是不可避免的。这些都是目前高校在科研管理中存在的问题,为了促进高校科研管理质量的提升,高校一定要引起高度重视,结合自身发展的实际情况,借助高科技技术,在科研管理系统中采用数据挖掘技术,提高科研管理质量。

4 数据挖掘的主要技术

数据挖掘并不是单纯的使用数据库技术就可以实现,它需要将人工智能与数据库技术结合起来,其中有很多方法都需要通过对机器的学习才能掌握好,在人工智能领域中经常会用到的一些技术都是数据挖掘的基础。在高校科研管理系统中运用的数据挖掘技术并不是固定的一种,根据科研管理系统的不同,进行数据挖掘操作时需要采用不同的技术与方法,一般来说,比较常见的有以下几种:

第一,统计分析法;数据挖掘中往往都需要对数据进行统计,然后从中提取中有用的数据,因此,很多数据挖掘工具都需要以统计分析方法为基础,是计算机数据挖掘技术中应用的最为广泛的一种;第二,人工神经网络法;这种方法是软计算中的一种重要方法,在学习的时候可以采用两种模式:管理模式与非管理模式,不同的管理模式在数据挖掘过程中适用的范围也是不一样的。一般来说,管理模式往往是对现有示例进行预测,将预测结果与标准答案进行对比,然后得出错误的数据;而非管理模式是对数据进行描述,一般不用于对结果的预测。在实际运用中,需要根据管理系统的不同需求选择不同的方法,以保证数据挖掘质量;第三,关联规则法;关联规则是运用数据挖掘技术来发现数据库中存在的一类重要的、可被发现的知识,并且发现的这个知识存在一定的价值。例如:“尿布与啤酒”的故事,这是在美国沃尔玛连锁超市发生的真实事件,沃尔玛拥有巨大的数据库系统,对数据库的数据进行挖掘后,沃尔玛惊奇的发现人们购买尿片的同时,购买最多的商品是啤酒。后來经过大量的调查与分析,发现这个结果是事实。如果不采用计算机数据挖掘技术,沃尔玛超市是很那发现这个现象的。除此之外,数据挖掘技术还包括:计划计算法、事例推理法等,在具体运用中,需要结合数据的特点,做出合理选择,进而提升数据挖掘技术的使用效果。下图为一般计算机挖掘技术运行的流程图,通过对数据库中数据的一系列的分析与挖掘,一些被隐藏在数据中的知识就可以显现出来。

5 数据挖掘技术在高校科研管理系统中运用的必要性

当前,随着科技的不断进步,高校科研管理系统也在不断完善中,但是一些高校的科研管理系统缺乏对数据分析功能,也有的学校已经具备这种功能,但是其在对数据的处理与分析上还是存在一些不足。有的管理人员掌握的数据处理技术过于表面,只能简单的對科研项目、导师发表的论文数量等进行统计,不能分析出所得数据所反映出的问题,也很少将数据库中的信息与相关部门共享,导致学校在科研管理上存在诸多问题。科研是一门很深的学问,通过科研项目得出的数据,很多都有其独特的含义,不同数据表达的含义也不同,当导师需要对某个项目进行一定改动或者根据某些数据信息得到相关结论时,简单的对数据进行处理得出的信息可能不能作为理论依据,也就是说经简单处理的数据其辅助策略功能是非常薄弱的,有的甚至不存在。虽然一些高校科研系统管理者已经意识到了计算机技术、网络技术的便利与强大,他们之中有的也掌握了比较全面的管理技术,精通管理功能,但是本身数据分析能力却非常弱,对科研管理系统的运行没有实质性的帮助。因此,在高校科研管理系统中,必须要科学、合理的运用数据挖掘技术,通过数据挖掘,为科研工作者找出数据库中有价值的信息,可以有效促进管理者对科研管理系统进行客观、正确、全面的管理。

6 数据挖掘技术在高校科研工作分析中的应用

对于教师来说,科研工作与教学工作应该是相辅相成的,教师在平常的工作中,要将这两者科学、合理的协调好,这样才能在保证科研质量的前提下,有效提升教学质量。

数据挖掘技术在高校科研工作分析的应用的项目比较多,比如对数据的整理,很多专业的科研结论需要大量数据的支持,随着科研项目周期的增长,产生数据的量也会越来越大,通过数据挖掘在数据库中选取有效数据,将数据严格按照处理标准进行处理,然后得出一些有效信息,作为项目结论的有力依据;其次,数据转换也是科研项目中经常会出现的,也就是数据变换,科研项目中的数据有的时候并不就是一个简单的数字,利用数据转换可以将数据值转换成某些概念,例如:可信度、支持度等,然后利用关联规则对数据进行处理,得出相关信息。另外,数据挖掘技术可以通过对数据库中数据的挖掘做出结果表达,根据管理者制定的标准,可以对科研工作者的科研量进行统计与归类,进行总结出教会的科研工作量,作为判断教师有没有将精力放在科研实践上去,如果出现科研量超出标准的导师,也可以合理对其进行调整,要保证其在进行科研的同时不耽误其教学。

7 结语

综上所述,高校在科研管理中还存在比较多的不足,要结合科技的发展,将计算机数据挖掘技术良好的运用到科研管理系统中,以促进高校科研管理质量的提升。

参考文献

[1] 魏一搏.浅谈数据挖掘在高校科研业务管理系统中的应用[J].信息系统工程,2010(4):37-38.

[2] 郭卜铭,吕渭济.高校科研管理中的数据挖掘技术及应用[J].科技和产业,2007(6):38-40.

[3] 刘华,胡运全.数据挖掘技术在高校管理信息系统中的应用[J].亚太教育,2016(13):199.

[4] 王利.数据挖掘技术在高校管理中的应用[J].福建电脑,2005(6):48-49.

[5] 李庆梅.数据挖掘技术在学生信息管理系统中应用研究[J].电脑知识与技术,2014(1x):241-243.

[6] 刘涛.基于数据挖掘技术的毕业生信息管理系统的研究与开发[J].数字技术与应用,2016(4):160-161.

上一篇:城市社会治理体系范文下一篇:护士专题报告范文