《Nutch搜索引擎_第2期_Solr简介及安装_V1.0》.pdf
文本预览下载声明
细细品味Nutch
——Nutch 搜索引擎 (第2 期)
精
华
集
锦
csAxp
/
2012 年4 月12 日
创建时间:2012/4/12 修改时间:2012/4/12 修改次数:0
目录
1、本期内容2
1.1 Solr 简介2
1.1.1 Solr 的特性2
1.1.2 Solr 的目录结构2
1.1.3 Solr 与Lucene 关系4
1.2 Solr 安装6
1.2.1 环境介绍6
1.2.2 安装Solr 6
1.2.3 结合Nutch 11
2 、参考文献 13
3、打赏小编 14
中国·北京——虾皮工作室( ) 编辑:虾皮 1
创建时间:2012/4/12 修改时间:2012/4/12 修改次数:0
Nutch 搜索引擎 (第2 期)
——Solr 简介及安装
1、本期内容
1.1 Solr 简介
Solr 是一个高性能,采用Java5 开发,基于Lucene 的全文搜索
服务器。同时对其进行了扩展,提供了比Lucene 更为丰富的查询语
言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提
供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
Solr 最初由CNET Networks 开发,2006 年初,Apache Software Foundation 在Lucene
顶级项目的支持下得到了 Solr。Solr 于2007 年 1 月酝酿成熟,在整个项目孵化期间,Solr
稳步地积累各种特性并吸引了一个稳定的用户群体、贡献者和提交人。Solr 现在是 Lucene
(Apache 的基于Java 的全文本搜索引擎库)的一个子项目。
1.1.1 Solr 的特性
Solr 是一个拥有像WebService 一样接口的独立运行的搜索服务器。你将能够通过HTTP
协议以XML 格式将文档放入搜索服务器 (这个过程叫做索引),你能够通过HTTP 协议的
GET 来查询搜索服务器并且得到XML 格式的结果。
Solr 的特性包括:
高级的全文搜索功能
专为高通量的网络流量进行的优化
基于开放接口 (XML 和HTTP )的标准
综合的HTML 管理界面
可伸缩性-能够有效地复制到另外一个Solr 搜索服务器
使用XML 配置达到灵活性和适配性
可扩展的插件体系
1.1.2 Solr 的目录结构
中国·北京——虾皮工作室( ) 编辑:虾皮 2
创建时间:2012/4/12 修改时间:2012/4/12 修改次数:0
Solr 程序包的目录结构:
client :包含了一些特定语言调用Solr 的API 客户端程序,目前只有Ruby 可供
选择,Java 客户端叫SolrJ 在src/solrj 中可以找
显示全部