文本聚类以及文本分类的相关资料
谷歌新闻就是文本分类的应用体现,平时看着没发觉,去了解了才知道,这个东西属于BI方面,还有文本聚类,让机器实现无辅助的自动学习,
这几天在看这个东西,网络上大多是些理论资料,聚类是实现算法多是之前看到的K-Means,看来还是得去自己试验,用语言来实现资料上的理论。
下面是一些资料链接:
TD/IDF
zh.wikipedia.org/wiki/TF-IDF
空间向量模型VSM
zh.wikipedia.org/wiki/%E5%90%91%E9%87%8F%E7%A9%BA%E9%96%93%E6%A8%A1%E5%9E%8B
聚类分析在web文本挖掘中的应用
一种基于主题的文本聚类方法
http://www.docin.com/p-21089284.html
基于向量空间模型的文本聚类算法
edu.codepub.com/2009/0910/15270.php
文本自动聚类技术研究
www.griddss.cn/show.aspx?id=236&cid=35