劳动节,边花钱边劳动边受罪 2010/05/01 生活杂文hidehai2条留言 其实,花钱、劳动和受罪是没有直接的因果关系的。 花钱,这个词比较中性,有钱人可以说是享受,没钱的伴随着心痛,一般人的感觉就还是感觉一般,不过这和受罪没有直接关系。对于劳动,…
辞职了,又是一个新的环境等待着自己 2010/04/30 生活杂文hidehai1条留言 今天把工作辞了,这份开发工作自己也干的有大半年了,回想起来收获和感触也是颇多。 在公司产品的不断开发和完善中,自己学习了很多以前不懂的知识,也体会了一个程序员今后…
昨天去面试了一个新的公司 2010/04/29 后端杂文hidehai发表留言 昨天去家公司面试,过去了后叫先写个程序,我听成了先走程序,迷茫后才知道是叫写个判断括号匹配的程序。 想了下没什么难度,应该是看怎么实现吧,看到机器上之前的代码,居然也是判断括号,不过…
Windwos 7远程桌面多用户连接设置 2010/04/23 操作系统hidehai2条留言 Windows7作为桌面操作系统,和以前的XP一样默认情况下只能通过一个用户进行远程连接,既然都用到了远程连接,1个用户我觉得肯定是不够的,微软也没有在高版本中改进这个东西,下面来看看…
昨天凌晨博客意外被黑,原因已经找到了。 2010/04/20 网络安全hidehai5条留言 昨天早上打开博客,居然是黑的,更诧异的是居然是一黑页。 打开FTP,数据没有被删除,只是替换了首页文件,自己马上也就恢复过来了,不过是谁干的呢?这么低调的站点、这么低流量的站点都能被黑,发生这样的事情…
发现瑞典歌手 Sophie Zelmani 的歌还很好听 2010/04/13 兴趣杂文hidehai发表留言 最近博客的垃圾评论那是相当的多,本来不想花时间来弄的,加个插件math comment spam protection,试试效果怎么样吧,插件加载完,需要在评论模板添加1个文本域和隐…
JAVA解决文本长度问题-标准化文本向量 2010/04/12 后端杂文hidehai9条留言 根据IFIDF对文本进行分词权重标记后,因为文本的长度各不一样,这就导致文本向量的数值差距明显,为了解决这个问题,我们可以将向量的长度都标准化为1,计算IFIDF后,根据公式: 就是分别对文…
用JAVA实现的一种改进的K均值聚类算法流程 2010/04/09 后端杂文hidehai3条留言 最近一直在搞这个改进算法,主要是涉及到特征降维和初始中心的选择。 通过分词的质量来实现降维在之前的博文中已经提到过了,用代码实现后,发现降维后的数据在时间上能提高…
JAVA通过搜狗词库过滤指定词性-51CTO荐 2010/04/09 后端杂文hidehai发表留言 在测试过程中需要从文本中拿到指定词性的词,比如名词或者动词,各种词性的定义我们可以依靠搜狗的语料库来实现,从搜狗实验室下载到词库后解压可以看到搜索词库的格式: 图中的数据表示:词、在互联网的词频…
JAVA取数组中指定数量的最大值 2010/04/09 后端杂文hidehai发表留言 _termsMax为各个分词的词频 通过循环取得最大词频的下标,在通过_terms就能得到词。 /** 阅读全文——共454字