信息化水平聚类分析

2024-07-01

信息化水平聚类分析(精选8篇)

信息化水平聚类分析 第1篇

关键词:灰色聚类评估,信息化,评价指标

引言

随着国际经济形势的好转,我国纺织企业将会有更多的机会利用全球资源,更大范围地参与国际市场竞争。但是,在信息网络时代,我国纺织企业不能只依靠低成本、低价格手段参与竞争,应该加快技术进步和产业升级,信息化建设是不可少的重要内容。企业信息化建设是一项系统工程,也是一个不断评价和完善的过程。因此,探索出一种科学合理的评价方法,客观评价信息化发展水平,比较企业间信息化水平的差异和特点,显得尤为重要。深入研究信息化水平测试体系和评价方法,全面、客观和科学地评价纺织企业信息化水平,有助于企业发现问题、加强管理、准确把握信息化的方向,为管理层制定信息化发展战略提供量化的依据。

本文根据相关数据量少和具有一定灰度的特点,采取灰色理论的方法,通过对纺织企业信息化指标进行定量化描述,建立灰色聚类评估模型,旨在为客观评价和比较纺织企业信息化水平提供一定依据,并试图分析出其影响因素,最终为决策提供依据。

1 纺织企业信息化水平评价的指标体系

通过对纺织企业生产管理的特点分析,得出影响其信息化水平的主要因素,最后建立评价指标体系,见下表1:

在本文所建立的灰色聚类评估模型中,ω代表评价的总目标,表示纺织企业信息化水平。第一层指标集为μ={μ1,μ2,μ3},μ1是信息化建设水平,μ2是信息化应用程度,μ3是信息化效益水平。μ1的下一级指标集有ε1={ε11,ε12,ε13},ε2={ε21,ε22},ε3={ε31,ε32,ε33,ε34};μ2的下一级指标集有ψ1={ψ11,ψ12,ψ13},ψ2={ψ21,ψ22,ψ23,ψ24},ψ3={ψ31,ψ32,ψ32,ψ34};μ3的下一级指标集有δ1={δ11,δ12,δ13},δ2={δ21},δ3={δ,δ,δ},δ={δ,δ,δ}。

获得纺织企业信息化指标数据的方法很多,最普遍的是问卷调查法。首先,依据该指标体系,设计出调查问卷,并根据领域专家意见进行修正;其次,在小范围内进行问卷测试,根据测试结果对问卷的设计进行调整;最后,发放和回收调查问卷,对回收的问卷灰色进行信度和效度检验,确保问卷数据有效。得到较为真实、可信的数据后,再选取比较科学的模型进行评估。

2 纺织企业信息化水平的灰色聚类评估模型

灰色聚类有灰色关联聚类和灰色白化权函数聚类。灰色关联聚类主要用于同类因素的归并,以使复杂系统简化。灰色白化权函数聚类主要用于检查观测对象是否属于事先设定的不同类别,以便区别对待。根据两方法和待解决问题的特点,本文选取灰色白化权函数聚类方法建立模型。

灰色白化权聚类根据聚类对象的不同聚类指标所拥有的白化权函数,按s个灰类进行归纳,主要检查观察对象是否属于事先设定的不同类别,以便评价或比较。根据这一基本思想,灰色聚类评估模型可考虑如下:

a)设受评的纺织企业有n个,第q个纺织企业信息化水平综合评价值为ω(q)(q=1,2,…,n)。μi(i=1,2,3)代表一级指标,εi(i=1,2,3)、ψi(i=1,2,3)、δi(i=1,2,3,4)代表二级指标,εij、ψij、δij(i=1,2,3,4;j=1,2,3)代表三级指标。为方便起见,三级指标仍用上述相应的三级指标符号表示。

b)按照评估要求所需划分的灰类数s,选取λ,λ,…,λ为最属于灰类1,2,…,s的点(以属于该12s灰类最大可能性为选取依据,成为中心点),将各个指标的取值范围也相应地划分为s个灰类。以指标ε为例,将11ε指标的取值范围[λ,λ]划分为s个小区间

c)同时连接点(λ,1)与第k-1个小区间的中心点以及与第k+1个小区间的中心点(λ,0),得到ε指标关于k灰类的三角白化权函数可分别将ε指标取数域向左右延拓至λ,λ,可得ε指11 0s11标关于灰类1和灰类s的三角白化权函数

对于指标ε的调查值x,可由公式11

计算出其属于灰类k(k=1,2,…,s)的隶属度

d)计算评价指标ε(j=1,2)关于灰类k(k=1,2,…,

s)的聚类系数其中,为指标ε子11类白化权函数,η为指标ε在综合聚类中的权重。

e)由max{σεk11}=σk*ε11,判断指标ε11属于灰类k*;依次可以算出其他指标所属的灰类。

f)将企业q的所有评价指标所属的灰类计算出来后,根据每个灰类中的指标数的多少判断企业q最终所属的灰类。

当然,不同指标在评价中的重要程度也不相同,通过赋予不同的权重以强调其不同的重要作用。或对这些灰类赋予一定的数值,相应地得到这些三级指标所属灰类的数值,再继续使用灰色聚类分析方法,计算出其所属的二级指标应属的灰类,判断企业q最终应属的灰类;或再次使用灰色聚类评估方法,进一步测算一级指标所属的灰类,最后确定企业q的灰类。

总之,得到企业q所属的灰类后就能初步判断其信息化水平。如果有多个企业同属于一个灰类时,还可以根据综合聚类系数的大小确定同属于一个灰类之各个对象的优劣或位次。

3结论

由该模型评估纺织企业的信息化水平时,测算出企业各个三级指标的灰类后,就能发现影响企业信息化水平提高的具体因素。进一步地,若能依据模型计算出各个二级、一级指标的灰类,就能从整体上把握纺织企业在实施信息化时应重点建设的项目,为企业信息化战略提供一定的依据。

该评价方法操作比较简便,使用灰色系统理论软件也很容易实现。既能够用于同行业企业间的横向比较,也可以用于某一企业若干年的信息化水平的纵向比较。对于不同的指标体系,该模型同样适用。

如果在指标体系中加入评价全行业信息化的指标,再设计出合理的问卷,获得较为真实的相关数据,则可利用该模型评价整个纺织行业的信息化水平,并发现制约行业信息化水平提高的因素,为制定行业信息化发展政策提供依据,促进整个产业的信息化水平提升。

参考文献

[1]唐笑非,侯锡林.钢铁企业信息化建设基于灰色关联分析的研究[J].商场现代化,2007(12下旬刊):69.

[2]刘思峰,谢乃明.灰色系统理论及其应用[M].北京:科技出版社,2008:88-89.

[3]颜志军,郭兵珍,阮文锦.企业信息化水平测评方法研究[J].北京理工大学学报,2009(2):178.

[4]蒋艳霞,柯大钢.企业信息化灰色评价方法研究[J].情报杂志,2005(5):25-27.第4版.

中国各省区市经济发展水平聚类分析 第2篇

关键词:聚类分析;层级聚类;各省区市;国内生产总值

一、引言

十七大报告指出:坚持走中国特色新型工业化道路,坚持扩大国内需求特别是消费需求的方针,促进经济增长由主要依靠投资、出口拉动向依靠消费、投资、出口协调拉动转变,由主要依靠第二产业带动向依靠第一、第二、第三产业协同带动转变,由主要依靠增加物质资源消耗向主要依靠科技进步、劳动者素质提高、管理创新转变。同时指出:缩小区域发展差距,必须注重实现基本公共服务均等化,引导生产要素跨区域合理流动。要继续实施区域发展总体战略,深入推进西部大开发,全面振兴东北地区等老工业基地,大力促进中部地区崛起,积极支持东部地区率先发展。因此,分析各个省区市的国内生产总值和三次产业及财政、人口等指标的相关性,在分析中对促进产业之间和地区之间的协调发展,提供经济发展水平具有重大意义。

本文根据《2009年全国统计年鉴》的相关资料,采用生产总值、第一、二、三产业增加值及第一、二、三产业产值在国内生产总值中所占比例、人口总量、财政收入和财政支出进行聚类分析,给全国各个省区市的经济发展水平以客观的分类。通过对数据的相关性分析,得出生产总值与第一、第二和第三产业增加值的相关系数分别是0.736、0.991和0.966,生产总值与人口数量的相关系数为0.777,与财政收入的相关系数为0.919,与财政支出的相关系数为0.935。从相关系数上来看,与生产总值强相关的变量有二、三产业增加值、财政收入和财政支出,其他的显示出弱相关。因此,对我国各个省区市经济发展水平的分类应从不同的角度进行分析和分类。

二、从国内生产总值角度分析

国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。当GDP的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入了衰退时期。

图1和图2表明,广东、山东和江苏的国内生产总值和国内其他省区市相比遥遥领先。从国内生产总值角度分析,若把全国各省区市分为五类,则第一类包括:广东;第二类包括:江苏、山东;第三类包括:河北、浙江、河南;第四类包括:天津、山西、内蒙古、江西、吉林、广西、海南、重庆、云南、贵州、宁夏、陕西、甘肃、青海、新疆、西藏;第五类包括:北京、辽宁、黑龙江、上海、安徽、福建、湖北、湖南、四川。

若分为四类,则第一类包括:广东、山东、江苏;第二类包括:河北、浙江、河南;第三类包括:天津、山西、内蒙古、江西、吉林、广西、海南、重庆、云南、贵州、宁夏、陕西、甘肃、青海、新疆、西藏;第四类包括:北京、辽宁、黑龙江、上海、安徽、福建、湖北、湖南、四川。从图1和图2分析得出:从总量上比较,仅能得出单纯的总量指标,并不能反映出经济内在结构。

三、从各产业增加值角度分析

一般来说,最有说服力来衡量经济发展水平的指标就是国内生产总值了。但是,国内生产总值也有其自身的缺点,比如无法衡量人类经济活动对环境造成的破坏,也无法衡量人们因为爱好不同,同一件商品产生的效用不同等等。同时,国内生产总值与人口的多少密切相关,比如印度的国内生产总值远比瑞士多,但是人均国民生产总值却远不如瑞士,其经济发展的总体水平也远远落后于瑞士。因此,在对全国各省区市的经济发展水平进行分类的时候,不仅从总体生产总值的角度分析,也应从产业分析等其他的角度分类。经济的发展是有一定的规律的,最著名的就是“配第——克拉克定律”。该定律认为:经济的发展是从低到高的,主要体现在就业人数从第一产业向第二产业转移,然后向第三产业转移;第一产业产值比例逐渐下降,第二、第三产业的产值比例上升。因此,在分析经济发展水平的时候,一定要考虑三次产业的产值及其所占的比例。

现代经济理论认为,经济越发达,第二、第三产业在国民经济中的比重越高,第一产业的比重越低。从图3和图4可以看出:江苏、山东和广东在产业结构中占有较大优势。从各产业结构角度分析,若把全国各省区市分为五类,则第一类包括:广东;第二类包括:山东和江苏;第三类包括:河北、上海、浙江、河南;第五类仅包括北京,第四类包括其余各省区市。若分为四类,则第一类包括:江苏、广东和山东;第二类包括:上海、浙江、河北、河南;第四类仅包括北京,第三类包括其余各省区市。

四、结论

从以上分析可以看出,广东、江苏和山东无论从经济总量角度还是从经济结构角度,都走在了全国的前列,其次是其它处于东南沿海的省区市,最后是地处西部的省区市。总体看来,东部经济优于西部经济。这与我国上世纪优先发展西部和农业支持工业的政策有莫大关系。

通过以上分析我们提出以下建议:继续实施西部大开发战略,国家和东部省区市要支持西部省区的发展;坚持产业结构调整和优化升级,强调科技创新,以此来促进产业水平的提高和产业结构的改善;支持农业和农村的发展与建设,以城带乡,以工哺农,促进农业发展,作为第二、第三产业发展和经济结构优化的基础条件。

参考文献:

1、编委会.2007年中国统计年鉴[M].中国统计出版社,2008.

2、薛薇.基于SPSS的数据分析[M].中国人民大学出版社,2004.

3、林杰斌.SPSS12——统计建模与应用实物[M].中国铁道出版社,2006.

信息化水平聚类分析 第3篇

一、聚类方法简介与指标选取

在统计时经常采用聚类分析法进行分析。聚类分析又称群分析, 是多元统计分析中研究样本或指标的一种重要的分类方法, 是指将物理或者抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。随着社会和经济的发展, 结合了更为强大的数学工具的聚类分析方法已经越来越多的应用到经济分析和社会工作分析中。在经济领域中, 主要是根据影响国家、地区或者单个企业的经济效益、发展水平的各项指标进行聚类分析, 然后根据分析结果进行综合评价, 以便得出科学的结论。

系统聚类 (Hierarchical Cluster Analysis) 是使用最多的一种聚类方法, 它的基本思想是:将全部n个样品各看成一类, 即得到n类;确定样品与样品和类与类之间的距离;计算各类之间的距离, 并将距离最近的两类合并为一类, 形成一个新的类;重复计算距离。这样从有n类开始, 每次合并一类, 经过n-1次合并后, 所有的样品成为一类;将上述合并的全部聚类过程用一个直观图形画出来, 即画出聚类图;决定类的个数, 并由上述步骤得到相应的聚类分析的结果。

合理准确地进行聚类分析需要进行合适的指标选取。反映一个地区的经济发展水平的指标很多, 为了能客观、全面地反映各市经济发展水平, 必须建立适当的指标体系。本文经济指标的选取遵循如下原则:

1.要体现江苏省各市经济协调发展的战略;

2.要反映江苏省各市的特征, 不同市的指标值具有明显差异;

3.不同市的指标不能高度相关;

4.选择的指标体系要全面、综合、公平;

5.数据的可得性。

基于以上原则, 本文选取了江苏省13个市2008年国内生产总值GDP (亿元) 、居民消费水平 (元) 、地方财政一般预算收入 (万元) 、地方财政支出 (万元) 、农村居民人均纯收入 (元) 、城镇居民人均可支配收入 (元) 、全社会消费品零售总额 (万元) 、海关进口总值 (亿美元) 、海关出口总值 (亿美元) 、实际使用外商直接投资 (亿美元) 等10个指标。数据来自《江苏统计年鉴2008》。

二、数据处理

把江苏省的相关指标数据进行整理, 并进行归一化后, 使用SPSS软件进行处理。我采用系统聚类分析法的Ward’s Method对标准化后的数据进行处理。使用SPSS的Classify→Hierarchical Cluster程序进行聚类分析。其中Method子对话框里, 方法选择最小方差法 (Ward’s Method) , 间距测度变量选择Squared Euclidean Distance (欧式距离的平方) , 然后得出如下结果:

1.对系统进行聚类分析时, 13个样本都进入了聚类分析。

2.系统之间进行聚类的以此顺序为扬州和泰州最先进行了聚类, 第二步连云港和淮安进行了聚类。其他一次进行聚类, 经过12步聚类, 13个样本聚成了一个大类。

3.对所有城市进行聚类后的情况如下表所示

该表格是样本系统聚类分析聚成4个类时, 样本的类归属情况表。从该表格可以看出, 南京和苏锡常 (苏州、无锡、常州) 市为一类, 扬州市、镇江市和泰州市聚为一类, 徐州、南通、连云港、淮安、盐城5个市聚为一类, 宿迁市单独聚为一类。

三、结果分析

通过上面的聚类分析, 根据2008年江苏省各市国民经济的主要指标, 我们将目前江苏省各市的经济发展水平划分为4个经济区域:

1.发达市:

南京和苏州、无锡、常州。南京市作为历史悠久的江苏省会, 是江苏省较大的工业城市。其拥有良好的地理环境、悠久的城市历史、合理的产业机构、发达的商业和房地产业。苏锡常三个城市的个体私营经济非常发达, 其经济总量与南京比较接近, 近年随着开放的不断深入, 以及成功的招商引资、产业升级, 其经济发展在全国前列。

2.较发达城市:

扬州市、镇江市和泰州市。这三个城市工业发展完善, 城市基础设施完备, 大力发展对外贸易, 其制造业较为发达。经济增长速度相比苏州还有一定差距。把这3个城市均归为较发达的城市。

3.中等发达城市:

徐州、南通、连云港、淮安、盐城。就整体而言, 其产业结构层次低于苏南地区, 农村经济发展较快, 农村产业结构发生很大变化。工业内部结构除南通、连云港外, 其他两个市工业比重不高, 主要仍以采掘、原材料为主。因此归为中等发达城市。

4.欠发达城市:

宿迁市。与苏南、苏中地区相比, 产业结构层次低。农业内部结构变化不大, 工业主要以劳动密集型工业为主, 轻工业所占比重较大, 轻工业中以农产品为原料所占比重依然很高。因此归于欠发达城市。

四、政策建议

由以上分析可以看出, 江苏省经济发展不均衡体现十分明显, 苏南是江苏经济发展水平最高的地区, 苏中、苏北地区发展水平较低。为了促进江苏省经济建设的和谐发展, 缩小地区和贫富之间的差距, 应该从以下几方面着手:

1.正视地区差异, 重视经济发展效率

任何国家和地区的社会经济发展过程中, 公平与效率都曾使决策者处于两难境地, 发达国家也曾经历过牺牲公平、换取效率的过程。它们都是选择最具优势、最具发展潜力的地区首先重点发展建设, 当总体经济水平达到一定程度时, 才重视公平问题, 即使到现在, 发达国家的国内地区差异仍然很大。改革开放以来, 江苏省也采取相应的倾斜发展战略, 使经济得到较快发展, 但是仍落后于广东、上海等经济发达的沿海省区。在这种落后的形势下我们首先的任务是发展而非均衡。虽然省内人均GDP的地区差异相当大, 如2008年排在人均GDP首位的南京市是最末位宿迁市的14倍, 但居民实际生活水平、社会、文化等方面的差异小于人均GDP的差异, 因此重视效率仍是江苏今后发展经济的主要出发点。

2.优化经济结构, 加快产业结构调整

20世纪90年代以来, 江苏省产业结构整体上有了很大改观, 农村产业结构变化大, 乡村非农化发展十分迅速;工业进展较大, 科技和品牌创新都取得了良好的成果;第三产业发展较快, 也带动了农业和工业。同时也面临一些问题, 如工业处于转型期, 结构调整升级缓慢, 技术构成低;第三产业结构层次低, 而且地区产业结构趋同程度仍然很大。为进一步优化江苏产业结构和协调地区经济, 应充分利用农业基础好, 农业生产能力强的优势, 大力发展高效、高产、低耗农业。苏南地区以农产品出口创汇为发展目标, 苏北地区继续抓好粮食生产, 积极推进农业产业化经营, 促进农村剩余劳动力的转化以及农业现代化建设;加强工业内部结构调整, 对传统产业, 以提高产业技术构成, 提高技术密集型和知识密集型产业的比重, 培育新的经济增长点, 带动结构优化升级。按照区域比较原则, 西部地区发展资源与劳动密集型产业, 发挥区域整体优势, 形成具有特色的产业体系, 避免区域产业结构的趋同现象;第三产业的发展, 应突出改善投资环境的基础功能, 带动区域经济发展的引导功能, 以及直接获取产出效益的产出功能, 建立商品流通、交通信息、旅游等支柱产业, 以及金融保险、房地产、信息咨询、市场中介服务等新兴行业协调发展格局。此外, 各市还应结合自身实际情况寻找最适宜自己的发展道路, 创出自己的特色。

3.拉动经济增长, 加大基础设施投资

随着社会不断发展, 国内原有的一些消费热点逐渐平淡, 新的消费热点尚未形成, 消费需求对经济增长的贡献度稳中趋降。在这种情况下, 增加固定资产投资成为扩大内需的主要选择。目前, 由于大量生产资料和消费品已经供求平衡或供大于求, 市场销售平淡, 在固定资产投资中再增加一般加工工业投资, 势必造成重复建设, 导致库存积压增加, 扩大固定资产投资应当注重基础设施建设。“八五”以来, 江苏省基础设施建设取得了巨大成就。但总的看, 基础设施整体水平依然不高, 与国民经济发展和改善人民生活的要求还很不适应。农业基础脆弱的状况还远未根本改变;农村的水、电、路等基础设施的状况十分落后, 严重制约了农村的生产发展和生活水平的提高;生态环境问题愈益突出;在铁路密度、复线率、电气化率、行车速度和集装箱、冷藏等现代化运输手段方面, 与国外相比有很大差距, 区域性高速公路建设刚刚起步。加快基础设施建设既是国民经济发展的战略任务, 也是扩大内需、拉动当前经济增长的重大举措, 而且投资风险小, 长期经济效益和社会效益好, 能为闲散资金找到出路, 为下岗职工和农村剩余劳动力创造较多的就业机会, 有利于增加城乡居民消费, 实现国民经济的良性循环。

4.重视人才培养, 实施“科教兴苏”战略

科技水平和人口素质的提高是经济发展的支柱, 没有科学技术和高素质人才的支撑, 发展便无从谈起。“科教兴苏”必须“强化科教”。今后应改变目前资金投入不足, 科技成果转化率不高, 高、精、尖项目缺乏, 人才密度低, 高层次人才少, 人才短缺和人才浪费现象并存等局面, 进一步树立“科教兴苏”意识, 加大科技、教育投入, 加快基础设施建设步伐, 完善政策, 培养高层次人才, 提高科技人才使用效益, 依靠人才和劳动者素质的提高, 促进经济增长方式的转变。

参考文献

[1]张尧庭, 方开泰.多元统计分析引论[M].北京:科学出版社, 1982.

[2]Friedman J.R.Regional development policy:a casestudy of Venezuela.Cambridge:MIT Press, 1996.

[3]李双杰, 顾六宝.用聚类分析法评估区域经济[J].中国农村观察, 2001.

[4]吴明隆.SPSS统计应用实务[M].科学出版社, 2003.

[5]王学明.应用多元分析[M].上海:上海财经大学出版社, 2004.

[6]何晓群.多元统计分析[M].北京:中国人民大学出版社, 2004.

[7]任军, 张加恭.广东区域经济差异研究的回顾和展望.广东商学院学报, 2006.

信息化水平聚类分析 第4篇

城镇化水平是衡量一个国家或地区社会经济进步状况的重要标志。四川省的城镇化发展水平比较低, 严重制约着我国城镇化进程的整体步伐。为此, 笔者对城镇化水平核算进行分析, 以期认清四川省各地市城镇化的发展阶段, 从而采取相应的城镇化推进政策。

目前, 国内学者在城镇化评价方面的研究也有很多, 张玉周[1]对河南省城镇化水平的测度, 如张科静和高长春[2]的基于主成分分析法的城市创意的竞争力的评价等, 都取得了很好的效果, 然而在指标的选取和权值的处理方面主观性太强, 同时综合评价指标的数据意义不够准确。笔者使用主成分分析和信息墒法确定权值合成综合指标, 对综合评价指标使用功效系数得分, 更符合人们的习惯, 再对综合指标进行聚类分析, 以更好地评价四川省各个地区的城镇化水平。

一、城镇化水平测定指标体系建立

城镇化指标体系是对城镇化的具体量化, 它应当准确、客观地反映城镇化的水平, 并便于计算和比较。根据指标体系建立的原则及方法, 参考国内外专家学者[3]对城镇化进行衡量的指标, 本报告主要从城镇发展、经济发展、服务功能三个板块来建立四川城镇化综合评价指标体系。 (1) 城镇发展。衡量城镇发展的指标主要包括城镇人口占总人口比重、城区面积占总面积比重这两个指标。 (2) 经济发展。一个地区的经济发展也是城镇化的一个表现。体现经济发展的指标主要有以下各个指标:人均GDP、人均地方财政收入、人均可支配收入、恩格尔系数、非农产业占GDP比重。 (3) 服务功能。服务业发展的水平也体现了一个地区总体经济发展水平。城镇化水平提高, 服务水平也随着发展起来, 人民生活质量也有了较大提高。体现服务功能的指标主要如下:人均道路面积、万人拥有公交车辆、用水普及率、燃气普及率、人均住宅建筑面积、人均公共绿地、生活垃圾清运量。

二、数据分析

计算综合评价指数与得分, 在数据处理和分析过程中都需要科学的方法。笔者参考了杨贞[4]力因素的主成分分析和李娟文、王启仿[5]经济发展阶段理论与我国区域经济发展阶段现状分析中的方法, 并结合城镇化指标的特性, 提出一种符合该问题的合理、科学的方法。步骤如下:

(1) 对原始数据进行均值化处理。均值化处理就是用各指标的原始数据除以各自的均值。

(2) 对各二级指标进行主成分分析。为了减少主成分数目, 同时使主成分集中最大限度的样本信息, 此处分别对城市发展指标、经济发展指标、服务功能发展指标的二级指标做主成分分析和信息墒法确定权值。计算综合得分时用德尔菲法确定各一级指标的权重。

(3) 将均值化的数据转化为功效系数得分。用标准化方法处理后的数据出现负数, 这不大容易被理解和接受。功效系数变换的方式如下:

同时可以证明, 这样的线形变换对综合排序并没有影响。

(4) 为使主成分分析结果进一步明晰, 对四川省城镇化水平综合得分 (见表1) 进行聚类分析, 使用的方法是系统分类法。

三、城镇化水平评价的实现

根据上述指标体系, 选取四川省18个地级城市为研究对象, 收集整理得到各地市2007年的各项指标值, 对数据进行改进的主成分分析和模糊聚类分析, 并以此为基础研究城镇化水平的测度。

(一) 改进主成分分析过程及结果

数据均值化处理。由指标体系从《四川省统计年鉴2008》上得到对应各地市的原始数据, 利用Spss软件对其进行均值化处理。借助Spss软件[6]分别对一级指标即城镇发展、经济发展和服务功能经行均值化处理, 处理后的数据, 对服务功能指标进行主成分分析, 得到指标特征值的贡献率, 选方差贡献分别为87.105%, 所包含的原始信息较多, 从而可减少综合评价的工作量。对于城镇发展指标和经济发展指标, 由于其不满足主成份分析的条件, 使用信息墒法确定其权值, 再进行综合得到的综合指标。德尔菲法赋权。采用德尔菲法赋权进行综合得分计算, 经过10名专家推荐分别赋予城镇发展指标 (X1) 、经济发展指标 (X2) 和服务功能指标 (X3) 权重0.4、0.3、0.3, 分别乘以各自的第一主成分然后相加, 即F=0.4*x1+0.3*x2+0.3*x3, 可得到18个地市城镇化水平的综合得分 (F) 及排名。见表1。

(二) 四川省各地市城镇化水平综合评价和分析

为使主成分分析结果进一步明晰, 对四川省城镇化水平综合得分 (见表1) 进行聚类分析。可将四川省18个地市分为四类:第一类城镇化水平高的地区:成都市。成都市综合得分为100分, 远高于第二名攀枝花市。作为省会城市, 成都市城镇化水平整体和各项发展水平相对突出, 成都市在城镇发展、经济发展指标和服务发展指标三方面的项排名均为第一。第二类城镇化水平较高的地区攀枝花市。攀枝花市位于四川西南边陲、雅砻江与金沙江汇合处, 是四川省一座新兴的钢铁工业城市。除城镇指标排名第四以外, 经济指标和服务功能指标排名均为第二位。攀枝花市是四川省一座得天独厚的自然资源宝库, 这里有着丰富的矿产、水力和农业资源, 是全国十大钢铁城之一。第三类是城镇化水平中等地区, 包括自贡市、德阳市、乐山市、绵阳市、遂宁市、眉山市、泸州市、内江市、南充市。由于受到成都市经济辐射的影响, 这类城市具有一定的地理优势, 在地理位置上处于成都的东南部, 同时也具有自身的资源优势, 但限制性因素也较明显。第四类是在城镇化水上平较低的地区, 包括宜宾市、雅安市、达州市、资阳市、广元市、广安市、巴中市。这类城市因受到人文环境、自然环境等制约, 城市化水平多项指标均处于全省下游。这些城市属典型的传统农业区, 人口基数大, 有地方资源, 工业亦不发达, 致使发展速度不易提升。这说明, 要提高此类地区的城市化水平, 应从推进工业化进程和转移农村劳动力着手。

四、结论

笔者通过对四川省18地市的城镇化水平分析表明:四川省18地市的城镇化水平发展不平衡性和具有层次性。由于历史基础、资源条件等差异, 四川省城市化水平总的趋势是东南部高, 西北部较低, 以成都为中心向四周呈下降趋势。近10年来, 四川省18地市的城镇化水平在空间上趋于中心-外围结构, 且中心有向川东南地区偏移的趋势。城市化水平具有很强的历史依赖特征, 亦造成强者日强、弱者日弱的发展局面, 落后地区很难跳出原有发展因素的制约。由于内部结构等因素的差异, 城市化水平相近的地市应根据各自特点, 实行差异化的城市化促进政策。

参考文献

[1]张玉周, 基于改进主成分分析法的河南城镇化水平测度[J].商业时代, 2010, (11) :129-130.

[2]张科静, 高长春.基于主成分分析法的城市创意的竞争力的评价[J].情报杂志, 2010, 29 (4) :68-71.

[3]冯尚春.中国农村城镇化动力研究[M].北京:经济科学出版社, 2005.

[4]杨贞.城镇化动力因素的主成分分析——以河南为例[J].河南省农业科学, 2006, (5) :5-7.

[5]李娟文, 王启仿.区域经济发展阶段理论与我国区域经济发展阶段现状分析[J].经济地理, 2000, 20 (4) :6-9.

信息化水平聚类分析 第5篇

关键词:现代农业,聚类分析,河南省

“三农”问题在我国社会主义现代化建设中始终处于重要地位。2004年至今, 中央一号文件已经连续12年锁定“三农”问题。2007年中央一号文件更是明确提出新农村建设首要任务是发展现代农业。2012年《全国现代农业发展规划 (2011—2015年) 》指出, 加快发展现代农业, 既是转变经济发展方式、全面建设小康社会的重要内容, 也是提高农业综合生产能力、增加农民收入、建设社会主义新农村的必然要求。河南是我国的农业大省, 也是全国重要的粮食主产区。2013年农业总产值达4202.3亿元, 占全省生产总值的13.1%, 粮食总产量达5713.69万t, 占全国的十分之一, 小麦总产量达3226.44万t, 占全国的四分之一。由此可见, 河南省为全国农业发展和粮食安全做出了重要贡献。虽然通过近些年的努力, 河南现代农业发展具备了一定的基础, 但是农业整体发展水平还不算高, 还面临着很多矛盾和困难, 如粮食单产不高, 农产品效益低下, 农民增收缓慢, 生态环境恶化等。现在多数学者都是通过对河南省现代农业整体发展水平的研究, 提出对策建议, 但是省内各个地区自然资源禀赋并不同, 发展水平也不在同一水平线上, 因此研究河南现代农业区域差异具有重要的现实意义。本文通过聚类分析对河南省18个地市进行评价对比, 找出制约各地区现代农业发展的主要因素, 充分发挥各地比较优势, 进而从整体上推进河南现代农业的进程。

注:劳均农业耕地面积 (hm2/人) 、单位耕地面积农机总动力 (kw/hm2) 、有效灌溉率 (%) 、单位耕地面积化肥施用量 (kg/hm2) 、农业劳动生产率 (元/人) 、土地生产率 (元/hm2) 、农民人均纯收入 (元) 、粮食单产 (kg/hm2) 、城镇化率 (%) 、农业从业人员比重 (%) 、初中以上文化程度的农村劳动力比重 (%) 、恩格尔系数 (%) 、森林覆盖率 (%) 、农业成灾率 (%) 。

1 评价指标体系的建立及数据来源

本研究在分析现代农业内涵和特征的基础上, 借鉴前人已有的成果, 并结合河南省的实际情况, 查阅大量资料后, 最终选取了14个有代表性的指标构成现代农业发展水平评价指标体系, 并将其用作河南现代农业发展水平的聚类指标体系。该指标体系包括:劳均农业耕地面积 (B1) 、单位耕地面积农机总动力 (B2) 、有效灌溉率 (B3) 、单位耕地面积化肥施用量 (B4) 、农业劳动生产率 (B5) 、土地生产率 (B6) 、农民人均纯收入 (B7) 、粮食单产 (B8) 、城镇化率 (B9) 、农业从业人员比重 (B10) 、初中以上文化程度的农村劳动力比重 (B11) 、恩格尔系数 (B12) 、森林覆盖率 (B13) 、农业成灾率 (B14) 。研究所用数据均来自《2014年河南省统计年鉴》和河南省政府网站, 通过计算得到各指标实际值 (具体数据见表1) 。

2 聚类分析

为了找出河南省各地区现代农业发展的共同点, 以及各地区的优势和差距, 本文采用系统聚类法对上述数据进行聚类分析。聚类分析的基本思想是将每个聚类对象看作一类, 根据究对象间的相似程度, 将相似程度高的进行合并, 并计算合并后类与其他类之间的距离, 再与相近者进行合并, 每合并一次就减少一类, 直到所有对象都合并为一类。聚类分析的原则是同一类中个体之间相似, 不同类中的个体差异很大。本文利用SPSS21.0统计分析软件, 采用欧氏距离平方、组间平均距离连接法对表1数据进行聚类分析, 分类结果如图1所示。

3 结果分析

由聚类分析结果可知, 河南省18个地市的现代农业发展水平存在较大的差异, 大致可以为4组。

第一组:焦作市、三门峡市、开封市。焦作市作为河南最早开发的资源型城市, 其在农业资源、能源资源以及旅游资源等方面有着丰富的区域经济优势。2013年焦作市粮食单产达7495kg/hm2, 居全省第一位。单位面积农机总动力和有效灌溉率也排在全省第一位, 分别为20.48kw/hm2和83.02%。作为豫西门户的三门峡, 有着丰富的矿产资源和旅游资源。近些年, 三门峡大力发展特色农业, 取得了一定的成就。果品和烟叶在全省有着明显的优势。全市生态环境较好, 森林覆盖率达50.72%, 居全省首位。开封市位于黄河中下游平原, 具有丰富的自然资源。开封市是国家小麦、花生、棉花的重要产区, 所属五县小麦、棉花、花生均跃入全国百强县, 4个县被确定为国家优质粮食产业工程项目县。西瓜、花生产量居河南之首, 大蒜总产量位居全国第二。开封市农业产出水平业比较高, 农业劳动生产率和土地生产率均居全省首位。

第二组:驻马店市、平顶山市、南阳市、新乡市、郑州市、济源市、鹤壁市。郑州市作为河南省会城市, 是河南经济发展水平最高的地市, 也是河南乃至全国的交通和通信中心。郑州有着丰富的自然资源, 有较强的经济支撑能力, 农业发展要素投入充足, 城镇化水平领先于河南其他地市。驻马店市位于河南中南部, 具有良好的自然条件、生产基础和区位优势, 享有“中原粮仓”、“中州油库”、“芝麻王国”之称。济源市是首批被命名的“国家现代农业示范区”, 2013年农民人均纯收入达11958元, 城镇化率为54.8%, 仅次于郑州市。平顶山、南阳、新乡、鹤壁这些地市具有优越的地理位置和便利的交通条件, 为现代农业的发展提供了良好的基础。这些地区农业基础比较好, 产业化程度比较高, 同时农田化肥施用水平也比较高, 如平顶山1158kg/hm2、南阳824kg/hm2、新乡1099kg/hm2、鹤壁659kg/hm2。但是农业科技投入较低, 也影响着这些地区的现代农业发展水平。

第三组:许昌市、濮阳市、漯河市、洛阳市。许昌市立足于“粮食主产区”和“优势特色产区”, 形成了“五点一线”的现代农业精品线路:即鄢陵县优质花木生产示范区-许昌县陈曹五女店粮食生产稳产核心示范区-许昌天和现代农业示范基地-许昌县蒋李集榆林粮食高产稳产核心示范区-襄城县库庄有机蔬菜及粮食高产稳产核心示范区。濮阳市经过近些年的努力, 形成了以优质专用粮食、畜禽、油料、蔬菜、林纸林板、花卉及辣椒、食用菌等区域性特色产业格局。漯河市是一个以农副产品加工业为主的城市, 也是我国第一个无公害基地建设示范点、全国农业标准化示范试点市。洛阳作为河南重要的工业城市, 经济发展水平仅次于郑州, 烟叶产值连续多年全省第一, 森林覆盖率达47%, 仅次于三门峡市。但是这些地区还存在着农业产业化程度不高, 农产品缺乏竞争力等问题, 这些都是制约现代农业发展的主要因素。

第四组:信阳市、安阳市、周口市、商丘市。这些地区经济实力相对较弱。信阳、周口属于传统的黄淮农业发展区域, 经济基础相对薄弱, 从而使得现代农业发展水平不高。安阳市处于传统农业发展地区, 农业产业化发展程度不高、农业从人员比重较大和城镇化水平较低, 这些都是阻碍现代农业发展的重要因素。商丘位于黄河中下游平原, 资源禀赋条件较好, 但是农业发展结构比较单一, 纯农业发展特征较为明显。这些地区农业投入不足以及城镇化水平较低, 属于河南省现代农业发水平较弱的地区。

4 讨论与建议

综上所述, 由于河南省各个地区资源禀赋、经济发展、市场前景等的不同, 造成了全省各个地区现代农业发展水平也存在很大差异。经济实力强的地区其现代农业发展水平也相对较高, 因为经济实力强的地区农业投入较高, 农业基础设施建设也相对较好, 所以现代农业发展水平也就较高。经济实力相对较弱, 但农业产业化程度高、特色农业发展较好的地区其现代农业发展水平也相对较高。因此, 河南省应依据各个地区的区域优势, 因地制宜, 制定出符合各个地区发展的总体战略。第一组地区, 应大力发展城郊型农业和高效型农业。城郊型农业应大力发展生态观光农业, 形成布局合理、特色鲜明、种类丰富的观光休闲农业发展格局。如“农家乐”、采摘园和度假村等。高效型农业应重点发展一些市场需要的反季节蔬菜、稀有花果以及一些附加价值高的经济作物。第二组地区, 农业基础比较好, 应加大农业科技投入, 把科技成果应用到农业中, 提高农业综合生产能力, 延长农业产业链, 使农业成为高经济效益的产业。政府还应引导涉农企业与科研院所紧密合作, 促进农业科技成果的尽快转化。第三组地区, 大力发展优质特色农产品, 如优质玉米、高产高油大豆、优质芝麻、双低油菜等, 延长产业链, 提高农业产业化程度。积极发展农产品加工业, 延长农业产业链, 提高产品附加值。在扶持和培育一些龙头企业的同时, 应加强对中小企业的扶持力度。第四组地区, 应加大农业投入和城镇化建设, 增强农业综合生产能力, 完善农业基础设施。

参考文献

[1]裴东鑫.河南现代农业发展路径[D].郑州:郑州大学经济管理学院, 2006.

[2]刘养卉, 龚大鑫, 窦学诚.甘肃省各地区现代农业发展水平聚类分析[J].中国农业资源与区划, 2010, 31 (2) .

[3]王得华.河南省各地市农业竞争力的评估及比较[D].武汉:华中师范大学城市与环境科学学院, 2013.

[4]蒋和平, 辛岭.建设中国现代农业的思路与实践[M].中国农业出版社, 2009.

信息化水平聚类分析 第6篇

本文对广东省67个县及县级市经济发展水平进行聚类分析。首先应用层次分析法来确定分类数, 并找到各个分类的中心, 作为快速聚类的初始聚类中心, 然后用快速聚类对初始聚类结果进行迭代, 得到最终的聚类结果, 克服层次聚类法只能单方向聚类的缺点, 增加聚类结果的可信度。结合聚类分析的结果, 对广东省的经济不平衡增长提出一些对策和建议, 供决策参考。

一、经济发展水平评价指标的选取

反映一个地区的经济发展水平的指标很多, 为了能客观、全面地描述各地区经济发展水平, 必须建立适当的指标体系。文中经济指标的选取遵循如下原则:要体现广东省各县市经济协调发展的战略;要反映广东省各县市的特征, 不同县市的指标值具有明显差异, 不能高度相关;选择的指标体系要全面、综合、公平;数据的可得性。

基于以上原则, 文中选取了广东省67个县市2006年社会总产值 (X1) (万元) 、人均社会总产值 (X2) (元/人) 、人均粮食产量 (X3) (公斤/人) 、第三产业与第一产业的比例 (X4) 、社会消费品零售总额 (X5) (万元) 、在岗职工平均工资 (X6) (元) 、人均城乡居民年末存款额 (X7) (万元/人) 、固定资产投资总额 (X8) (万元) 和非农业人口在总人口中的比重 (X9) 等9个指标。数据来自《广东统计年鉴2007》。

二、聚类分析步骤与结果

首先采用层次聚类分析方法中的离差平方和方法进行初始聚类, 得到4大类及各类指标平均值;接下来, 把各县市指标平均值作为快速聚类的初始聚类中心, 克服层次聚类法只能单方向聚类的缺点, 增加聚类结果的可信度。聚类分析后各类最终中心如表1, 其中类1、类2、类3、类4的案例个数分别为16、1、22、28, 总计67个案例。具体各县市所属类别如表2所示。

聚类分析得到的结果, 将广东省67个县市按照综合经济指标进行划分, 得到了经济发展水平由高到低的四个分类, 依次是类2, 类1, 类3之亚类1, 类3之亚类2。每一类所包含的县市都具有相同或类似的经济特征, 且都与其他类存在差异。

(一) 类2只有增城市一个县。在所选取的9个指标中, 只有人均粮食产量比其余的类低, 其他的指标都是比其他的类高, 特别是人均地区生产总值更是其他类的3.5倍以上。说明增城市总体的经济水平较高, 各方面的发展都处在全省各县的前列, 且农业在经济中的地位并不是很重要, 这和广东省只有增城市是“全国百强县”的实际是完全符合的。

(二) 从代表一个地区最重要的指标人均地区生产总值来看, 类1是类3的1.64倍, 第三产业与第一产业的比值也比类3的高, 这说明类1的经济水平虽然比不上类2, 但是却好于类3, 产业结构的改革也比类3做得更有成效。虽然类1和类3的在岗职工平均工资相差不大, 但是类3人均粮食产量比较高, 故所应缴纳的税收相对较重, 这导致人均年末存款余额和固定资产投资总额相对较低。

(三) 属于类3的县市个数占了全省县市总数的74%以上, 可以说我省大部分的县市都属于这一类, 要想发展好广东省的经济, 提高类3各县的经济发展是关键。类3又可分为亚类1和亚类2, 分别占全省县市总个数的33%和42%。亚类1和亚类2的主要区别体现在社会消费品零售总额和固定资产投资总额上, 亚类1的社会消费品零售总额为260240万元, 远远高于亚类2的96494万元, 而固定资产投资总额为162150万元, 也同样高于亚类2的67704万元。这说明亚类1的可支配收入和对生产的重视程度都高于亚类2, 因此亚类1的经济水平高于亚类2。

三、聚类结果分析与提升广东省区域经济发展的对策与建议

由于区域间自然条件、经济基础、优惠政策等不一样, 广东省各县市之间的经济发展水平出现了很大的差异。本文结合广东省67个县市各自经济发展的实际情况, 对聚类结果进行分析, 得出如下结论。

(一) 广东省的区域经济发展水平主要可分为四个层次。改革开放以来, 少数县市 (如类2) 发展已经远远走在前面, 而绝大多数县市 (类3) 发展较慢, 人均地区生产总值远低于类2和类1的县市;而且其中一些县市 (亚类2) 农业所占比重还是较大, 经济很不发达。

(二) 造成区域经济差异的原因是多方面的, 与区域环境条件有着密切的关系。而导致广东省67个县市社会经济发展产生差异的原因就是自然资源的地区分布不平衡, 产业结构存在的差异, 人的思想观念方面的差异和优惠政策的地区倾斜。

(三) 广东省各地区之间经济差异是不可避免的, 并且在当前经济发展形势下, 经济发展水平差异将长期存在。

提升广东省区域经济发展的对策与建议:加快产业结构调整步伐、优化经济结构;加大对相对落后地区教育的投资力度;加大对基础设施的投资力度。

摘要:本文选取广东省各县市的无高度相关的经济指标数据, 用层次聚类法对标准化后的数据进行初步聚类, 确定类数目和初始聚类中心, 再用快速聚类法对初始聚类结果进行迭代聚类, 得到最终的聚类结果, 进而分析广东省区域经济发展差异与特点, 为进一步提升广东省区域经济的发展提供决策参考。

关键词:区域信息化,层次聚类,快速聚类

参考文献

[1]任军, 张加恭.广东区域经济差异研究的回顾与展望.广东商学院学报, 2006.

信息化水平聚类分析 第7篇

一、数学焦虑各因素显著水平及程度

据教育生理学相关研究表明, 大学生数学焦虑因素主要有下列五种: 数学专业与非数学专业 ( 即专业差别) 、性别差异、课堂提问方式、学习障碍、考核方式。为了科学分析这五种焦虑因素的焦虑水平, 我们对文[2]中各焦虑量数据换算成相应得分后编制成表1 - 1。

把上表数据输入软件, 得各因素焦虑水平, 如表1 - 2:

从表1 - 2 可知, 五种数学焦虑因素水平依次为: 考核方式> 课堂提问方式> 性别差异> 专业差别> 学习障碍。可见, 焦虑量最大的为考核方式, 焦虑量最小的为学习障碍, 五种焦虑因素量的波动性几乎相等, 近似等于1, 易知五种焦虑因素的调查统计数据比较科学。而五种因素的显著程度在文[2,3]中已统计出结果, 即闭卷显著于开卷、口头提问方式显著于书面提问方式、学习障碍不问时产生的数学焦虑显著于问老师、问同学两种方式、女性显著于男性、数学专业显著于非数学专业, 本文不再讨论。

二、数学焦虑产生因素的数据的分布及数据属性特征

调查数据的分布特征及属性在概率统计分析中有着比较重要的作用地位。一是, 可以分析大学数学焦虑因素的数据分布特征。二是, 可以了解数学焦虑因素的数据关联属性。三是, 为解决数学焦虑提供科学的信息来源及应对策略。

( 一) 数学焦虑产生因素的数据分布特征

为了了解数学焦虑产生因素的数学焦虑量数据的未知分布, 我们主要采用拟合优度检验。下面我们就用检验来分析这五种因素的分布情况。先统计好数学焦虑量频率数据, 如下表2 - 1。

对于给定的显著水平 α = 0. 05 , 在spss中输入上表数据, 经过K - S统计分析后, 获得数学焦虑相关分布特征统计结果, 如表2 - 2。

根据表2 - 2 的分布特征统计结果数据可知, 五种焦虑因素的正态分布、均匀分布、指数分布的检测显著性概率约等于0. 000, 都小于0. 05, 可见五种数学焦虑因素的统计数据均不服从正态、均匀、指数三种分布。而考核方式、性别差异的泊松分布的显著性概率分别为0. 157、0. 161, 都大于0. 05, 即考核方式、性别差异服从泊松分布。专业差别、课堂提问方式、学习障碍三个因素的泊松分布的显著性概率均小于0. 05, 即不服从泊松分布。从表2 - 2 统计分析结果可知, 五种数学焦虑因素中, 唯有数学考核方式、性别差异两个因素服从泊松分布。[4,5,6]

( 二) 数学焦虑因素的数据属性特征

在数学焦虑因素的数据属性特征的非参数统计分析中, 不仅要分析数据的属性特征, 并了解多变量不同取值下的分布, 而且还要分析掌握多变量的联合分布特征, 以此分析变量之间的相互影响及水平关系。

其非参数统计分析思路:根据数学焦虑因素的统计数据情况。先令一个列联表, 它含有A、B两个属性, 共有个体, 其中i=1, 2, …r;j=1, 2…, c。并且A含有r类, B含有c类。现构造非参数统计量:, 则Pearsonχ2服从卡方分布, 其中, df= (c-1) (r-1) , r、c别为列联表的列数行数, foij为观察频数, feij为期望频数且。建立原假设H0:A、B两属性相互独立;备假设H1、:A、B两属性不相互独立。首先, 根据数据算出P0=Pearsonχ2, df= (c-1) (r-1) , 给出显著水平α, 查卡方分布表得Pearsonχ2α然后判断P0是否大于显著水平α。

对于A、B属性的关联水平也可以通过关联系数来了解, 其中。GL又称为关联统计量。特别, 当GL=0, 则有A、B两属性之间没有关联, 当GL→1时, 则可知A、B两属性之间关联性很强。[7,8,9,10]

根据Pearson χ2的非参数统计分析思路, 统计出焦虑量数据理论频数feij表2 - 3。

对于给定的 α = 0. 05 , 根据Pearson χ2检验原理, 输入表2 - 3 数据, 卡方检验结果如表2 - 4:

a.2单元格 (8.0%) 的期望计数少于5.最小期望计数为2.99。

对于定的显著水平 α = 0. 05, 根据表2 - 4 统计结果Pearson χ02= 70.991 , 相伴概率为0. 000, 则有相伴概率小于0. 05, 易知卡方检验显著, 焦虑程度与焦虑类型之间几乎没有关联性。

根据表2 - 5 分析结果易知, 关联水平GL = 0. 286 , 则可判断出数学焦虑因素与焦虑程度的关联性非常小, 每个焦虑因素的焦虑量几乎没有关联, 即相互独立。

( 三) 数学焦虑产生因素的数据的聚类分析

聚类分析是将样本个体或指标变量按其具有的特性进行分类的一种统计分析方法, 其原理是选择相关的观测指标, 通过不同的距离实现分组, 使组内的数据对象具有高度的相似度[11]。现根据表1 - 1 数据, 将变量分成三类, 利用spss进行K - 均值聚类分析, 得到表3 - 1 最终聚类中心、表3 - 2 最终聚类中心间的距离、表3 - 3 聚类成员分析结果:

通过聚类分析的结果可以看出, 五种焦虑类型若分成3 类的话, 数学考核、数学课堂提问方式、性别差异这三楼比较相似, 距离也远, 焦虑程度也高。因此, 我们在解决数学焦虑问题时, 可考虑主要从这三个方面下手。

参考文献

[1]谷彬, 赵彦云.非参数统计作用与发展[J].中国统计, 2004, 38 (4) :56-57.

[2]范大付.大学生数学焦虑产生因素的非参数统计分析[J].重庆理工大学报 (自然科学) , 2012, 26 (7) :94-99.

[3]范大付.非参数统计在大学生数学焦虑中的应用研究[M].南宁:广西大学, 2012.

[4]朱新玲, 黎鹏.非参数检验在市场假查中的应用[J].江苏统计应用研究, 2003, 19 (11) :24-25.

[5]徐明.两种非参数统计方法的应用[J].体育科学, 1997, 15 (6) :88-89.

[6]洪楠.SPSS for Windows统计分析教程[M].北京:电子工业出版社, 2000.

[7]易丹辉等.非参数统计:方法与应用[M].北京:中国统计出版社, 2009.

[8]孙山泽.非参数统计讲义[M].北京:北京大学出版社, 2000.

[9]王静龙, 梁小筠.非参数统计分析[M].北京:高等教育出版设, 2006.

[10]范金城, 梅长林.数据分析[M].北京:科学出版社, 2002.

信息化水平聚类分析 第8篇

聚类分析是:首先将一定数量的样本 (或指标) 各自看成一类, 根据样本 (或指标) 的相似程度, 将相似程度最高的两类进行合并;然后考虑合并后的类与其它类之间的相似程度, 再进行合并;重复这一过程, 直至将所有的样本 (或指标) 合并为一类;最后根据各类之间的相似关系, 绘出一张完整的分类谱系图。

一、建立指标体系

为了更好地反映陕西各地区经济发展水平的差异, 我们采用了目前公认的多指标体系, 这主要是从指标体系的综合性、指标的代表性、指标的可比性、指标的可得性、指标体系的简洁性等方面考虑的。根据《陕西统计年鉴 (2010) 》的统计数据, 选用较能反映一个地区经济发展水平的地区生产总值、农村牧渔业总产值、固定资产投资总额、财政收入、在岗职工平均工资、社会消费品零售总额、进出口总额等7项指标 (分别用X1, X2, X 3, X 4, X 5, X 6, X 7表示) 构建分析区域经济发展水平的指标体系。以上7个经济指标基本能反映区域经济发展状况, 如表1所示。

注:部分数据直接来源于《陕西统计年鉴 (2010) 》, 部分数据是根据该年鉴计算得到的。

二、对原始数据进行标准化

由于表1的不同变量之间存在不同量纲、不同数量级的情况, 为使各个变量更具有可比性, 使数据得以在更平等的条件下进行分析, 有必要对数据进行转换。目前进行数据处理的方法大致有四种, 即总和标准化、标准差标准化、极大值标准化和极差标准化。

为便于更直观地比较各地区之间同一指标的数值大小, 我们采用了极差标准化方式, 其计算公式是:

经过这种标准化所得的新数据, 各要素的极大值为1, 极小值为0, 其余的数值均在0与1之间。进行标准化转换后, 所有参与聚类分析的指标数据见表2。

三、聚类分析

以下利用统计分析软件SPSS17.0 for Windows软件中的系统聚类过程Hierarchical Cluster Analysis对表2的9个观察指标进行聚类分析。

1、聚类方法。

系统聚类法中计算类与类之间距离的方法有多种, 主要有最短距离法、最长距离法、中间距离法、重心法、类间平均法、类内平均法和离差平方和法七种方法。为了确保分类结果的准确性, 本文采用类平均法:合并两类的结果使所有的两两类别之间的平均距离最小。

其中, D (p, q) 表示类Gp与类Gq的距离, np、nq表示Gp、Gq两类的样本数。

2、聚类结果分析。

根据表2的数据, 首先按类平均法进行聚类分析, 得出如下结果, 见表3。

四、分类结果分析

对陕西省的11个地区进行经济区划分, 根据聚类图, 并结合陕西的实际情况, 可把11个地区的经济发展状况分为五类。

第一类是西安。西安是陕西省的省会城市, 2009年全市国内生产总值达到2 724.08亿元, 占陕西省总量的49.92%。除了农林牧副渔业总产值仅次于咸阳263.40亿元位居全省第二位外, 其他各项经济指标数量均独占鳌头。从第一、二、三产业的产量看, 西安都具有绝对的经济优势, 远远高于其他各地市的产值, 无疑是陕西经济发展的领头羊。

第二类是延安。延安市2009年总产值为728.26亿元。地方财政收入90.47亿元, 总量和增长速度均居全省第二。近年来, 延安的煤、石油、天燃气等资源的开发利用, 大大带动了延安的经济发展。另外, 延安一直是汉民族与北方少数民族的交融地, 很早就成为陕北地区政治、军事、经济和文化中心, 而且红色旅游的发展也颇具特色。

第三类是杨凌。杨凌农业高新技术产业示范区和西安-杨凌生物产业基地已成为国家级高新技术产业示范区。2009年, 杨凌示范区生产总值达到40.68亿元。杨凌示范区相对其他10个地市来说, 成立较晚, 地市最小, 但人均产值毫不落后, 特别是在农业高新技术方面, 占据着绝对优势。比如, 在小麦育种、旱作节水农业、植物保护、土壤肥料、家畜生殖内分泌与胚胎工程、水土流失综合治理、荒漠化防治、森林培育、园林绿化、果树园艺、植物资源保护、开发及综合利用等方面的研究均居全国领先水平, 部分研究达到国际先进水平。杨凌示范区是陕西省地级市中的亮点。

第四类是宝鸡、榆林和铜川。宝鸡市2009年总产值806.54亿元, 居全省第四位。宝鸡具有悠久的历史, 优越的地理环境, 雄厚的工业基础, 丰富的矿产资源, 便捷的交通, 是连接西南、西北的交通枢纽。榆林市2009年总产值1 302.31亿元, 地方财政收入91.18亿元, 增长速度居全省第一位。榆林市矿产资源丰富, 具有世界七大煤田之一的神府煤田、我国陆上最大的整装气田以及占全国总量18%的岩盐和储量惊人的油田。此外还有储量相当可观的地下水、高岭土、铝土矿、石灰岩等多种矿产资源。目前, 榆林市已经被确定为国家能源重化工基地。铜川市2009年总产值154.40亿元, 规模以上工业总产值195.02亿元。铜川拥有以煤炭、建材、陶瓷、铝冶炼、纺织、机电、医药、食品、化工等为骨干的30多个工业门类。

第五类包括咸阳、汉中、安康、渭南和商洛。咸阳市2009年总产值873.20亿元, 居全省第二位;农林牧渔业总产值263.40亿元, 居全省第一位。剩下的四个地市, 经济发展较前一年均有突破。渭南市2009年总产值636.96亿元, 固定资产509.39亿元。汉中市2009年总产值415.64亿元, 社会商品零售总额133.02亿元。安康市2009年总产值274.95亿元。商洛市2009年总产值224.47亿元。综上所述, 这些地市的经济都有较稳定的增长。

西安是陕西经济发展最迅速、发展水平最高的市, 所以单列为一类。杨凌示范区是以农业经济发展为主的经济区, 整个区的经济发展重点在农科方面, 农业科技发展水平首屈一指。再加上杨凌地方小、人口少, 介于西安和宝鸡之间, 使得人均各项经济指标较高, 因此单列为一类。延安的煤、油、气等矿产资源丰富, 能源重化工业发展迅猛, 其旅游经济的开发也很有成效, 单独列于第三类。宝鸡、榆林和铜川是除西安之外陕西的主要大中城市, 具有雄厚的工业基础, 自然资源丰富, 农村地域相对较少, 非农业活动频繁, 社会经济发展水平较高, 综合发展状况较好, 故列为第四类。剩下的咸阳、渭南、汉中、安康和商洛大多位于陕南地区, 形成了陕南经济发展区域类型, 归为第五类。

综上所述, 聚类分析的结果基本符合2009年陕西经济发展水平的实际情况。在进行经济结构调整、确定产业布局和制定产业发展政策时, 应该根据各经济区的不同特点, 分类指导经济活动, 鼓励和引导发挥区域比较优势, 形成特色经济。

五、对陕西经济区域协调发展的分析和建议

从总体上看, 以西安为中心的关中地区处于全省经济的主导位置, 全省的经济发展呈现“北强、中快、南弱”的格局。陕西的省域行政界线所反映的形态呈南北向条形结构, 与大、中城市西安、宝鸡、咸阳、渭南经济带的东西走向不相吻合, 经济辐射作用也不明显。因此, 可以考虑将以西安为中心点, 陇海铁路陕西段和宝潼高速公路为轴线的关中高新技术产业带和星火产业带的“一线两带”战略调整为“两线两带”战略。这样可以发挥关中经济中心的带动和辐射作用, 以西安高新区为龙头, 依托杨凌示范区、西安经济开发区、宝鸡高新区和咸阳、渭南开发区, 以及各类园区, 使之成为全省经济增长速度最快、带动能力最强、率先实现跨越式发展的区域, 带动陕南陕北的经济发展, 实现全省经济的协调发展。

关中地区:目前应借助高校的科研成果, 发展壮大电子信息、现代生物与医药、机电一体化、光电子、航空航天、新材料和高效节能环保等在全国处于领先位置的高新技术, 带动整个工业结构的优化与升级, 使其尽快形成在全国有影响的产业群, 同时全面推进农业经济结构调整和第三产业的发展。

陕南地区:陕南秦巴山区水力、矿产、生物资源丰富, 应加强汉江航运和梯级水电站的建设, 建成与长江通航的黄金水道, 加快汉中、安康、商洛三个科技产业园区的陕南现代生物医药产业基地建设, 推动矿产、生物、水力三大资源的开发, 形成陕南水力、矿产、生物资源开发带;以汉中、安康、商洛三个城市为中心, 集中力量建设汉江工业走廊, 加强与长江经济带的联合协作, 形成西接川陇、东连晋豫, 中连各重要商镇、商埠, 辐射汉江两侧秦巴山区的一条商贸——工业走廊, 使陕南经济融入长江经济带的辐射圈, 把陕南建成融生物资源、旅游资源、水资源开发为一体的多元经济区。

陕北地区:应加快能源重化工业基地建设, 榆林应该做大做强煤电工业和煤电转化, 围绕煤向电力、向载能工业品转化和煤油气盐向化工产品转化, 做深油、气开发产业, 做精化工产业, 使陕北能源无可替代。

在加大城市经济建设力度的同时, 一要注重城市环境绿化工作。重视对市徽、城标的设计以及市树、市花等城市品牌基本要素的确定, 以及开发、建设利民、便民和乐民的城市标志性景观。给陕西人民创造优美的生活环境和高品质的生活质量。二要弘扬文化之魂, 培育城市特色。城市的特色和声誉, 是历史传统、文化习俗、自然条件、建筑特色、产业集聚、名优产品、管理和服务等一系列要素构成的综合体, 但贯穿其中的主线和灵魂是城市文化。充分发挥陕西的历史文化优势, 打造现代化的旅游特色城市。

参考文献

[1]白永秀, 利萍.陕西城乡一体化水平判别与区域经济协调发展模式研究[J]1嘉兴学院学报, 2005 (1) .

[2]罗姗, 国会.全国区域经济发展水平的聚类分析[J]1重庆交通学院学报 (社科版) , 2005 (4) .

[3]周衍庆, 等.SPSS的聚类分析功能在经济地理分区中的应用[J]1枣庄师范专科学校学报, 2003 (5) .

[4]陕西省统计局.陕西经济热点透视[M]西安:三秦出版社, 2004 (1) .

[5]陕西省统计局.陕西统计年鉴 (2005) [Z]北京:中国统计出版社, 2005.

[6]徐建华.现代地理学中的数学方法[M]北京:高等教育出版社, 2002.

上一篇:记录不一样的美下一篇:电商的世界