基于SAS聚类分析的用户类型划分

2022-09-13

电信各运营商经过一番重组, 形成了新联通、电信、移动三足鼎立的局面。三家运营商都成为全业务运营商, 重组的结果是三家运营商各有所长, 又各有所短, 它们之间的竞争将更加激烈。现阶段, 各运营商的竞争或将在争夺语音客户领域展开;或是新联通、新电信避开移动的2G业务优势, 主动发展3G数据业务, 在3G数据用户发展到一定规模时, 引导或捆绑数据用户使用语音通信业务。移动在保持存量市场的同时, 会积极发展TD-WCDMA用户, 引导高价值用户使用3G业务。但是, 无论采用何种经营策略, 获取更大的用户规模、发掘用户消费潜能、提升用户消费水平是各运营商的共同目标。数据挖掘理论和技术的兴起, 为精细化营销管理提供了有利的技术支持。数据挖掘理论及相关技术能够挖掘潜在的高价值客户, 能够将客户划分为不同类型, 并依此指导营销活动的展开。

一、聚类分析

聚类 (clustering) 是一个将数据集划分为若干组 (class) 或类 (cluster) 的过程, 并使得同一个组内的数据对象具有较高的相似度;而不同组中的数据对象是不相似的。相似或不相似的描述是基于数据描述属性的取值来确定的。通常就是利用 (各对象间) 距离来进行表示的。聚类分析的典型应用主要包括: (一) 在商业方面, 聚类分析可以帮助市场人员发现顾客群中所存在的不同特征的组群;并可以利用购买模式来描述这些不同特征的顾客组群。 (二) 在生物方面, 聚类分析可以用来获取动物或植物所存在的层次结构, 以及根据基因功能对其进行分类以获得对人群中所固有的结构更深入的了解。聚类还可以从地球观测数据库中帮助识别具有相似的土地使用情况的区域。此外还可以帮助分类识别互联网上的文档以便进行信息发现。作为数据挖掘的一项功能, 聚类分析还可以作为一个单独使用的工具, 来帮助分析数据的分布、了解各数据类的特征、确定所感兴趣的数据类以便作进一步分析。通常聚类分析算法可以划分为以下几大类:划分方法;层次方法;基于密度方法;基于网格方法。常用的也是最知名的划分方法就是k-means算法和k-medoids算法及其变化版本, 在大型数据库中采用CLARA (Clustering LARge Application) 方法。本文拟采用典型的k-means算法对用户类型进行划分。

二、用户类型划分过程及结果

(一) 数据挖掘流程。

本文使用SAS Enterprise Miner对某公司某月用户消费数据进行分析。用户消费数据中包含5个变量:市话费 (L O C A L_F E E) 、长途费 (T O L L_F E E) 、漫游费 (ROAM_FEE) 、短信费 (SMS_FEE) 、GPRS费 (GPRS_FEE) 。本文提取正常在用的用户79924位, 设计了图1的数据挖掘流程。

(二) 聚类分析结果。

设定将用户划分为5种类型, 使用SAS Enterprise Miner对提取的数据进行聚类分析处理后。图2给出了5个变量在5种类型上分布的盒型图。从图2的结果可以明显地看出:1类主要为漫游型用户;2类为长途型用户;3类为短信型用户;4类为GPRS上网型用户;5类为市话型用户。

各类用户数及相关统计量如表1所示。在所有观测中有442个观测在5个变量上的值都是0, 被剔除。表2给出了各类的类中心值。观察每种类别各个变量的类中心值, 就可以明显看到, 在每一类中都有一个占主导地位的变量, 体现了这部分用户的消费倾向。

三、结论及应用

本文采用聚类分析对用户类型进行了划分, 使用5个变量 (市话费 (LOCAL_FEE) 、长途费 (TOLL_FEE) 、漫游费 (ROAM_FEE) 、短信费 (SMS_FEE) 、GPRS费 (GPRS_FEE) ) 将用户分为5类, 每一类体现了用户的消费倾向。各类的用户数百分比分布如图3所示, 其中市话型用户 (5类) 占总用户数的68.46%, 符合用户一般通话较多的实际经验;乐于发短信的用户占到了13.31%, 表明可以对这些用户推销短信优惠包, 提升短信指标;2类长途型用户占10.02%, 可以向这些用户推荐长途类优惠;漫游用户占3.59%, 表明该公司所处地域经常外出的用户不多, 可以推荐其使用具有漫游优惠的套餐包;4类为上网型用户, 可以推荐一些GPRS上网优惠包。根据模型得到的结果, 将其应用在自动外呼系统中向用户推荐短信、彩信等数据业务。经过多波次外呼营销, 外呼的接听率和成功率分别提高了5%和4%。

本文提取的数据为用户费用, 由于各用户使用的优惠不同, 相同时长所产生的费用可能不同。但是, 消费数据真实地反映了用户的实际消费, 满足了本文的需要。

摘要:本文采用聚类分析, 根据电信用户在几个关键指标上的消费情况, 将电信用户分为几种类型, 为针对性营销提供目标客户。

关键词:数据挖掘,聚类分析,用户类型,划分

参考文献

[1] SAS Institute Inc.SAS Data Mining Us-ing SAS Enterprise Miner-A Case Study Approach;

[2] SAS Institute Inc.Getting Started with SAS Enterprise Miner4.3;

[3] 张高峰, 段勇.移动用户细分及其应用探析.华院分析技术 (上海) 有限公司

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:医院医疗器械院内物流SPD系统的构建下一篇:关于对道路桥梁控制施工管理的探讨