基于模糊聚类的电子商务用户数据挖掘研究

2022-09-12

互联网经济时代背景下, 伴随着社交网络和移动网络的快速发展, 电子商务的用户数据规模不断扩大, 维度也不断增加。这些数据的类型十分复杂, 除了用户的基本信息数据, 还包含着电子商务平台的数据、用户使用移动终端信息等非结构化的过程性数据。其中蕴藏着巨大的商业价值是否能得到最大限度的利用, 取决于对用户数据的挖掘和分析的方式。因此, 找到一种行之有效的数据挖掘技术对电子商务用户数据进行高效处理, 是十分必要的。

一、互联网经济下电子商务用户数据特点

相比较于传统经济的数据, 互联网经济下电子商务用户数据体量极大, 每日产生的数据规模已达到TB级, 并且对时效性有着极高的要求;这些数据都是高速、实时的数据流, 蕴含着巨大的商业价值。可以看出, 电子商务用户数据具有大数据的特征。如何高效处理这些用户数据, 从中挖掘出有价值的信息, 从而实现精准营销, 成为了当前亟待解决的问题。

二、模糊聚类算法相关研究

聚类算法是一种自然进行、无需人工监督的学习过程, 在这个过程中, 不需要任何先验知识去指导, 仅通过数据的内在特点就可以对其进行聚类和分析。作为一种重要的数据挖掘技术, 聚类算法已经被广泛应用到了许多领域, 如文本分析、图像处理等。在电子商务用户数据的处理分析中, 也可以用到模糊聚类。

1965年, 美国数学家Zedeh教授首次提出了模糊集的相关理论, 之后就开始出现了运用模糊集理论解决的模糊聚类, 其中, 模糊C均值算法FCM (Fuzzy C-Means) 的应用最为广泛。FCM算法是指通过引入隶属度的概念, 各个样本的数据对象依据隶属度值的大小决定是否从属于某一个分类。简而言之, 它是一种基于模糊理论的柔性划分。

我们先将矢量Xi (i=1, 2, …, n) 分成c组V={V1, V2, V3, …, Vc}, 然后求出每组的聚类中心A={A1, A2, A3, …, Ac}, 对于其中每一个矢量Xi都有一个[0, 1]之间的值, 用于表示其从属于某一个聚类中心的程度。为得到模糊聚类的最优解, 要使目标函数在约束条件控制的前提下得到最小值, 因此, 整个聚类算法过程步骤如下:

Step1:初始条件下, 随机生成c个聚类中心A={A1, A2, A3, …, Ac};

Step2:计算所有样本数据的隶属度矩阵, 并且使该矩阵总能满足和恒等于1的约束条件;

Step3:计算目标函数值, 当其大小与设定阈值相比, 小于阈值则算法结束;

Step4:最后更新聚类中心A, 并且迭代整个算法 (返回Step2) 。

目前针对FCM算法的研究和应用已经有许多, 但是该算法存在着较为明显的缺陷:初始聚类中心是随机选取的, 且聚类的最终结果容易陷入局部最优。因此, 本文利用遗传算法GA的全局搜索, 优化FCM算法的随机初始聚类中心选取问题。作为一种群体搜索智能算法, GA算法通过一定的规则逐步迭代, 最终选取全局最优解。以该最优解作为模糊聚类算法的初始聚类中心, 可以较好地改善FCM聚类。

三、基于模糊聚类的用户数据挖掘流程

由于电子商务用户数据的高维度、快流转速度、大体量等特点, 普通人工数据分析已经无法满足需求, 因此, 我们将模糊聚类算法这种数据挖掘技术引入对电子商务用户数据的处理分析中, 以获得其中潜在的有价值的信息。其大致流程如下:

(1) 数据收集。根据用户的交易情况、互动情况对数据进行简单分类, 然后收集用户数据。

(2) 数据预处理。用户数据中存在着很多冗余和噪声数据, 影响了整个数据挖掘分析的结果。因此数据预处理的好坏, 很大程度上决定了数据挖掘的结果。在预处理中, 通过结构化和半结构化的方法对其进行过滤整理, 提升数据之间的关联性, 从而体现出更多的典型特征。

(3) 数据挖掘。在这一步中, 即通过FCM聚类算法对已经预处理过的数据进行聚类分析, 根据用户数据的共同特点将数据进行柔性分类, 简单将其划分为不同隶属度的几个大类。

(4) 数据应用。通过聚类分析得到的隶属度分类, 可以应用在用户的购买预测方面。其对用户共同特性的聚类如用户属性、购买力分析等, 可以将用户群体进行划分, 从而实现精准营销。

综合来看, 聚类分析作为一种重要的数据挖掘技术, 应用于电子商务用户数据的分析中, 可以对海量数据进行抽取、分类等处理, 从而挖掘出关键性信息帮助商家进行精准决策, 使电子商务更加顺利的开展进行, 实现更多的经济效益。

摘要:随着互联网经济产业的迅速发展, 电子商务呈现着爆炸式发展态势, 而电子商务用户数据也开始暴增, 这些由用户创造的数据远超出了当前人力能处理的范围。本文着重研究了模糊聚类算法在电子商务用户数据挖掘中的应用, 通过模糊C均值聚类, 处理庞大的电子商务用户数据, 挖掘电子商务核心资源的商业价值, 从而实现精准营销。

关键词:模糊聚类,电子商务,数据挖掘

参考文献

[1] 张永库, 尹灵雪, 孙劲光.基于改进的遗传算法的模糊聚类算法[J].智能系统学报, 2015, 10 (4) :627-635.

[2] 易新忠.数据挖掘技术在电子商务中的应用探析[J].现代经济信息, 2017 (12) :323.

[3] Pang-Ning Tan, Michael Steinbach, Vipin Kumar.数据挖掘导论[M].北京:人民邮电出版社, 2006.

[4] 高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社, 2004.

[5] 刘芬.计算机数据挖掘技术的开发及其应用探究[J].现代工业经济和信息化, 2018, 8 (6) :49-50.

[6] 李霏.Web数据挖掘技术在电子商务中的应用价值探析[J].电子技术与软件工程, 2016 (2) :198.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:高海拔地区混凝土面板堆石坝施工技术研究下一篇:企业财务管理中税收筹划的应用与相关问题分析