文本分词质量、文本特征评价以及降维处理 2010/04/03 后端杂文hidehai发表留言 对于文本的聚类处理,普遍方法是使用数字来表示文本集合,然后通过算法来处理表示的文本数据。 我使用分词器对文本集合进行分词,然后使用TFIDF向量数字化文本,对于普通的网页数据,分次下…