Solr+Tomcat安装配置及二次开发使用说明.docx
文本预览下载声明
Solr+Tomcat安装配置及二次开发使用说明1. Solr介绍Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。可以使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。Solr的特性包括:高级的全文搜索功能专为高通量的网络流量进行的优化基于开放接口(XML和HTTP)的标准综合的HTML管理界面可伸缩性-能够有效地复制到另外一个Solr搜索服务器使用XML配置达到灵活性和适配性可扩展的插件体系2. Lucene 介绍Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是Apache Jakarta(雅加达)家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。目前已经有很多应用程序的搜索功能是基于Lucene ,比如Eclipse 帮助系统的搜索功能。Lucene能够为文本类型的数据建立索引,所以你只要把你要索引的数据格式转化的文本格式,Lucene 就能对你的文档进行索引和搜索。3. Solr vs LuceneSolr与Lucene 并不是竞争对立关系,恰恰相反Solr 依存于Lucene,因为Solr底层的核心技术是使用Lucene 来实现的,Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的建设,而Solr专注于企业应用。Lucene不负责支撑搜索服务所必须的管理,而Solr负责。所以说,一句话概括 Solr: Solr是Lucene面向企业搜索应用的扩展。Solr与Lucene架构图:Solr使用Lucene并且扩展了它!一个真正的拥有动态字段(Dynamic Field)和唯一键(Unique Key)的数据模式(Data Schema) 对Lucene查询语言的强大扩展!支持对结果进行动态的分组和过滤高级的,可配置的文本分析高度可配置和可扩展的缓存机制性能优化支持通过XML进行外部配置拥有一个管理界面可监控的日志支持高速增量式更新(Fast incremental Updates)和快照发布(Snapshot Distribution)4.Tomcat+Solr相结合配置4.1 安装虚拟机4.2下载Solr到Solr官方网站下载地址Solr最新版本:/solr/。该文档中使用的版本是Solr4.4.0。4.3Tomcat+Solr相结合apache-solr-dataimportscheduler-1.0.jar (调度重建索引 jar包 )/files/apache-solr-dataimportscheduler-1.0.jar准备:能运行 tomcat java环境此次部署采用 apache-tomcat-6.0.35开始部署:一部署 solr4.4解压 solr4.4.0.zip将 solr-4.4.0\dist\solr-4.4.0.war拷贝到 apache-tomcat-6.0.35\webapps下,重命名为 solr;在tomcat的目录conf/Catalina/localhost/solr.xml下创建该文件,若Catalina等文件夹不存在则手动创建文件内容如下Context docBase=d:/tomcat/webapps/solr.war debug=0 crossContext=true Environment name=solr/home type=java.lang.String value=d:/tomcat/solr override=true //ContextdocBase为solr的war文件,启动tomcat后会被解压到tomcat/webapps/solr下,Environment配置solr.home目录,从solr包中example文件夹下的solr配置文件拷贝过来既可。启动 tomcat,启动成功后停止 tomcat,并将 solr.war删除将 solr-server\solr-4.4.0\dist下的 jar拷贝到 apache-tomcat-6.0.35\webapps\solr\WEB-INF\lib下将 solr-server\solr-4.4.0\dist\solrj-lib下的 jar拷贝到 apache-tomcat-6.0.35\webapps\solr\WEB-INF\lib
显示全部