给博客换了个简洁的皮肤,发现PR3了。 2010/04/04 生活杂文hidehai发表留言 翻了年开始上班,一直也没有好好的休息,还好清明节能放三天假,能好好的补下瞌睡,放假前还差点被公司忽悠,说星期一正常上班,以为都很傻了吧,不过听Boss说自己喜欢的这个项目月底就会结尾了…
文本分词质量、文本特征评价以及降维处理 2010/04/03 后端杂文hidehai发表留言 对于文本的聚类处理,普遍方法是使用数字来表示文本集合,然后通过算法来处理表示的文本数据。 我使用分词器对文本集合进行分词,然后使用TFIDF向量数字化文本,对于普通的网页数据,分次下…
文本聚类以及文本分类的相关资料 2010/03/30 后端杂文hidehai发表留言 谷歌新闻就是文本分类的应用体现,平时看着没发觉,去了解了才知道,这个东西属于BI方面,还有文本聚类,让机器实现无辅助的自动学习, 这几天在看这个东西,网络上大多是些理论资料,聚类是实现算…
quartz–Spring下的任务控制 2010/03/22 后端杂文hidehai发表留言 一个扯蛋很久的问题,使用spring配置的quartz一直不稳定,开始的内存溢出后来的SQL错误,今天上午又回过头去看了下代码,重新分析了自己写的JDBC工具类,把数据库连接的打开和关闭全部移动到了上…
Power Designer 12.5破解文件 2010/03/18 数据处理hidehai发表留言 这个建模软件的破解版还真不好找,把破解文件放上来备用,安装文件从官网下载就好。 直接安装文件,选择试用期15天,安装好好之后,替换DLL文件,然后从软件Tools菜单下导入许可证文件,然后没有了.. …
在Lucene中使用了庖丁解牛,效果还不错 2010/03/17 后端杂文hidehai发表留言 最近在搞Lucene,其中官方自带的中文分词器,对中文的支持我觉得相当的不好,只能说它支持,在分词上还不能满足应用的需要。 然后就寻觅到了这个庖丁解牛分词器,提供自定义字典、实现了L…
《血战太平洋》今天应该首播了吧,期待中.. 2010/03/14 兴趣杂文hidehai发表留言 《兄弟连》的姊妹篇,电影级的大制作,相信不会让人失望,现在还是只有预告片可以一睹为先,要下载还得等阵子。如果比兄弟连更精彩,估计央视也会引进的,不过自然等不到那个时候了..
这两个字很强大嘛,文章删了都还能带来IP 2010/03/12 互联网hidehai1条留言 查看了下流量记录,发现了之前删除的文章关键词,不说了,直接上图,不会先在技术优化到了连图片都还能过滤掉吧.? 哈..这个图片处理谷歌倒是在搞,不过效果不咋样..
宏基的F900 小评一下 2010/03/10 兴趣杂文hidehai3条留言 手机掉了还是真的很不方便,当然主要的还是体现在打电话上,入手这款貌似比较偏的机子还是因为它的大屏幕,3.8寸的屏,看东西还是很舒服的,其实自己对触屏不是很感冒,蛮喜欢Query键盘的手机的,比如HTC…
手机终于被小偷光顾了.. 2010/03/02 生活杂文hidehai2条留言 前天晚上看元宵灯会回来,手机被小偷光顾了,带走了包括SIM卡在内的物件,当时在挤公交车,从前门挤到后门就发现不见了。遂拿女朋友的手机拨打之,居然通了,不过直到完也没人接,然后打第二次,…