Storm学习笔记二 2015/02/08 数据处理hidehai发表留言 前面了解了Storm的一些基本概念,这篇笔记来搭建一个日志收集系统,Storm在系统中充当一个管道和过滤器,实现从Redis上读取数据,并进行数据索引。 这是架构的一个演变,通过第一种方式,就能实现最…
Storm学习笔记一 2015/02/07 数据处理hidehai发表留言 基本概念: Topology(计算拓补): 一个实时计算应用程序的逻辑在storm里面被封装到topology对象里面,一个storm的topoloy会一直运行,直到显式的杀死它。 St…
文本聚类以及文本分类的相关资料 2010/03/30 后端杂文hidehai发表留言 谷歌新闻就是文本分类的应用体现,平时看着没发觉,去了解了才知道,这个东西属于BI方面,还有文本聚类,让机器实现无辅助的自动学习, 这几天在看这个东西,网络上大多是些理论资料,聚类是实现算…