标签: 索引

在Lucene中使用了庖丁解牛,效果还不错

    最近在搞Lucene,其中官方自带的中文分词器,对中文的支持我觉得相当的不好,只能说它支持,在分词上还不能满足应用的需要。
     然后就寻觅到了这个庖丁解牛分词器,提供自定义字典、实现了Lucene接口的分次器,上手配置都是相当的容易,不过出现点问题在Windows下配置字典目录的环境变量貌似没效果,还是得去配置资源文件。
    先后使用了StandardAnalyzer/IKAnalyzer还有就是PaodingAnalyzer了,使用相同的查询器Query queryTitle = new QueryParser来实现这几个分词器,前两种在查询如“四川成都”这种多字的情况没有PaodingAnalyzer查的准确,但是感觉PaodingAnalyzer查询还是会慢一些,可能是因为跑字典的原因。
阅读全文——共679字