">
1改进模糊聚类算法
传统的模糊聚类算法也存在一些问题:①难以判断离群点的归属;②提前确定划分类别数目和权重因子;③因为FCM算法的收敛性,很容易陷入局部极小点或者鞍点,从而得不到全局最小值.减少离群点的作用为了减小离群点对聚类中心的干扰,给隶属矩阵添加一个权重因子,让隶属度低的点对聚类中心起的作用比较小,把隶属度调整为Nik=μik-(1-μik)×μik/2.对划分类别书的确定人为确定划分类别不太准确,有可能让聚类过程很缓慢.我们把聚类的有效性函数添加到FCM算法中,利用有效性函数来决定划分类别数的值.
2案例分析
数据是采用随机抽取的50个样本信息,由于客户的数据有17个参数:公司年龄、行业、规模、公司性质、盈利情况、员工数量、信誉度、年销售量、产品市场定位、新产品数量、流动资金、平均订购规模、年采购量、购买渠道、主要客户、对待产品的态度、对待服务的态度,这些参数的量纲不同,或者量纲相同,而数量级不同,直接用原始数据计算会出现“大数吃小数”的现象,所以,在实验之前,对数据进行标准化处理[4].应用改进模糊聚类算法,设定加权参数为2,停止阈值为0.0001,差异度采用欧几里得距离公式计算.表1列出了聚类中心阵和聚类结果的检测指标.实验得到的划分矩阵表明用户对各个类别的隶属程度,对其中两组用户数据分析:用户1:0.0013,0.9263,0.0722,0.0002,0.0000;用户2:0.1475,0.8451,0.0001,0.0056,0.0017.隶属度矩阵的每列数据表示该客户对一个类别的隶属程度,每一列之和为1,表示该客户对所有类别的隶属度之和为1.根据样本判定的选择原理,该客户数据对某个类别的隶属度大,我们就认为该客户属于这个类别.从上面数据可以看出.用户1对类别2的隶属度为0.9263,我们认为用户1属于第2类,样本2对类别2的隶属度为0.8451.我们认为用户2属于第2类,同时样本2对类别1有0.1475的隶属度,所以用户2还具有类别1的特征.
本实验把企业的客户划分成不同的种类,区别出不用种类的特点.对5类用户的特征进行了总结,如表2所示.对于表2的分析结果,我们可以看到采用进度、频率和金额度作为客户分类的参数,从划分出的类别能看出不同客户类别对企业的忠诚度,对企业利润的贡献大小和客户估计要流失的可能性.这次实验是根据客户的消费记录进行聚类的,客户最近的消费记录对结果的影响很大.
企业通过CRM,能挖掘出对企业利润贡献大的客户,对不同的客户类别,实施不同的经营策略,提高客户对企业的满意度,吸引能给企业带来巨大利润的客户,留住现有的客户,避免客户的流失,提高企业的经济效益.本文改进的模糊聚类算法能够实现初始化聚类类别参数自动生成,减少了人工干预初始化聚类数目的影响,有比较好的聚类结果和收敛速度.
作者:林辉 单位:渭南师范学院
相关专题:制约情绪的因素主要有 隧道溶洞处理