Apache Lucene 3.6 和 Solr 3.6 发布,基于Java的全文检索引擎

Apache Lucene团队今天发布了最新的3.6版本。

Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。

该版本中的主要特性如下:

  • 除了支持Java 5和Java 6外,该版本添加了对Java 7的完整支持。
  • 添加语音编码器:Metaphone、Soundex、Caverphone和Beider-Morse等。
  • 使用CJKBigramFilter和CJKWidthFilter取代CJKTokenizer。
  • QueryParser现在将范围查询中的“*”解释为一个开放符号。
  • FieldValueFilter排除了缺少指定字段的文档。
  • CheckIndex和IndexUpgrader允许通过新的命令行选项-dir-impl,来使用特定的FSDirectory实现。
  • 现在FSTs在某些情况下可以做反向查找,并可以压缩以减少大小。这是从FST中的一个开始节点检索N最短路径的一个方法。
  • 新增WFSTCompletionLookup suggester,支持搜索建议的细粒度排名。
  • 新的查询时(query-time)连接比索引时(index-time)连接更加灵活。
  • 新增HTMLStripCharFilter,用于分解HTML标记。
  • 安全修复:更好地预防使用MMapDirectory时的虚拟机SIGSEGV错误,避免应用受到DoS攻击。
  • 许多bug修复。

详细信息参阅:Apache Lucene 3.6 Changes

随着Lucene的发布,Apache同时也发布了Solr 3.6版本。

Solr是一个高性能、基于Apache Lucene项目、开源的企业搜索平台。它对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言。它的主要功能包括:强大的全文检索、结果高亮显示、分面搜索、动态聚类、数据库整合、富文档(如Word、PDF)处理和地理空间搜索等。Solr高度可扩展,具备分布式搜索和索引复制功能,为世界上很多大型网站提供了搜索和导航功能。

该版本中也包含了大量的bug修复,详细信息参阅:Apache Solr 3.6 Changes

下载地址:

, , , 相关的文章:

暂无评论

写评论