标签: cluster

基于文件锁的ActiveMQ集群

目前的MQ服务使用了基于共享文件锁的集群方式,使用了主从两台机器进行主备的相互切换.
MQ的消息均使用了持久化配置,用于保证消息的可靠性.
最初使用了自身默认的KahaDB作为存储引擎,后来发现此种方式下日志文件过多,容易造成IO问题和达到操作系统的文件打开限制.
虽然可以加大限制的阀值,但终归不能很好的解决此问题.
阅读全文——共1738字

JAVA解决文本长度问题-标准化文本向量

     根据IFIDF对文本进行分词权重标记后,因为文本的长度各不一样,这就导致文本向量的数值差距明显,为了解决这个问题,我们可以将向量的长度都标准化为1,计算IFIDF后,根据公式:

就是分别对文本的分词计算如上公司,就将每个文本的分词表示成了模长都为1的向量。
下面是java代码:
阅读全文——共243字

文本聚类以及文本分类的相关资料

 
     谷歌新闻就是文本分类的应用体现,平时看着没发觉,去了解了才知道,这个东西属于BI方面,还有文本聚类,让机器实现无辅助的自动学习,
这几天在看这个东西,网络上大多是些理论资料,聚类是实现算法多是之前看到的K-Means,看来还是得去自己试验,用语言来实现资料上的理论。
下面是一些资料链接:
阅读全文——共429字