文本聚类算法|一种面向聚类的文本建模方法

时间:2015-02-04 08:54:14 作者:唐晓丽;白宇;张桂平

本文作者:唐晓丽;白宇;张桂平;蔡东风;成功正常投稿发表论文到《山西大学学报(自然科学版)》2014年04期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:借鉴主题模型的思想,利用word2vec训练数据的高效性以及词聚类结果的有效性,提出了一种基于word2vec的文本建模方法。该方法以word2vec算法得到的词聚类结果为基础,统计文本在词聚类类别上的概率分布,获得文本在类别空间上的特征向量,完成文本建模。将其与两种经典的文本建模方法VSM和LDA进行比较,实验结果显示在聚类效果上F值分别提高6.01%、1.01%,在算法效率上有明显的提高。
【论文正文预览】:0引言随着Web信息的爆炸式增长,计算机的信息处理已进入大数据时代。信息融合技术为Web信息处理提供了新的方法。信息融合[1]借鉴人脑的工作原理,利用计算机对具有相似或不同特征的多源数据和信息进行处理,为用户提供统一的信息视图和可综合利用的信息。文本形式是Web信息呈现
【文章分类号】:TP391.1
【稿件关键词】:主题模型wordvec文本建模文本聚类
【参考文献】:
【稿件标题】:文本聚类算法|一种面向聚类的文本建模方法
【作者单位】:沈阳航空航天大学知识工程研究中心;
【发表期刊期数】:《山西大学学报(自然科学版)》2014年04期
【期刊简介】:0......更多山西大学学报(自然科学版)杂志社(http://www.400qikan.com/qk/5011/)投稿信息
【版权所有人】:唐晓丽;白宇;张桂平;蔡东风;


更多自然类论文详细信息: 文本聚类算法|一种面向聚类的文本建模方法 论文代写
http://m.400qikan.com/lw-22937 论文代发

相关专题:小说月报2010年精品集 数字图书馆

相关论文
相关学术期刊
《大众电影》 《司法业务文选》 《强激光与粒子束》 《北方文物》 《大气科学》 《信阳师范学院学报》 《中国优生与遗传杂志》 《杭州农业与科技》 《遵义医学院学报》 《环球军事》

< 返回首页