lda 聚类范文|基于LDA的改进K-means算法在文本聚类中的应用

时间:2015-01-07 20:49:16 作者:王春龙;张敬旭;

本文作者:王春龙;张敬旭;成功正常投稿发表论文到《计算机应用》2014年01期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含狄利克雷分布(LDA)主题概率模型的初始聚类中心选择算法。该算法选择蕴含在文本集中影响程度最大的前m个主题,并在这m个主题所在的维度上对文本集进行初步聚类,从而找到聚类中心,然后以这些聚类中心为初始聚类中心对文本集进行所有维度上的聚类,理论上保证了选择的初始聚类中心是基于概率可确定的。实验结果表明改进后算法聚类迭代次数明显减少,聚类结果更准确。
【论文正文预览】:0引言随着互联网的不断发展,网络上文本信息呈爆炸式增加,如何精准有效地发现、组织和利用海量文本背后的有用信息成为一个热门话题[1],文本聚类技术作为自然语言处理的预处理步骤[2],对文本进一步分析和处理产生了重要的影响。目前比较经典的文本聚类算法大致分为划分方法、
【文章分类号】:TP301.6;TP391.1
【稿件关键词】:主题模型K-means聚类中心文本聚类隐含狄利克雷分布
【参考文献】:
【稿件标题】:lda 聚类范文|基于LDA的改进K-means算法在文本聚类中的应用
【作者单位】:华北电力大学控制与计算机工程学院;甘肃省电力公司;
【发表期刊期数】:《计算机应用》2014年01期
【期刊简介】:《计算机应用》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,计算机应用杂志具有正规的双刊号,其中国内统一刊号:CN51-1307/TP,国际刊号:ISSN1001-9081。计算机应用杂志社由四川省科学技术协会主管、主办,本刊为月刊。自创刊以来,......更多计算机应用杂志社(http://www.400qikan.com/qk/5984/)投稿信息
【版权所有人】:王春龙;张敬旭;


更多科技类论文详细信息: lda 聚类范文|基于LDA的改进K-means算法在文本聚类中的应用 论文代写
http://m.400qikan.com/lw-16398 论文代发

相关专题:动力机制 金属功能材料

相关论文
相关学术期刊
《防灾博览》 《邯郸学院学报》 《农场经济管理》 《河南水利与南水北调》 《泸天化科技》 《气体分离》 《河北画报》 《技术经济》 《统计与信息》 《中国核电》

< 返回首页