Lucene是一套全文检索的API.pdf
文本预览下载声明
Lucene 是一套全文检索的 API ,对其介绍的文章和应用的案例都多,可参考
lucene 及本文的参考文献。
此次学习,以实用为主,一是简单应用,二是 Web应用,三是汉化,四相关
应用( Lucene 主页上在 SandBox中)。
0、准备工作
去 Lucene 的主页 下载目前的稳定版本
lucene-1.2.tar.gz ,解压缩,将 lucene-1.2 目录下
的两个 jar 文件 lucene-1.2.jar 和
lucene-demo2-1.2.jar 放到适当的目录下后,并将其
加入到 CLASSPATH环境变量中。
tar zxvf lucene-1.2.tar.gz 解压缩
cd lucene-1.2
cp *.jar $DP 存放 jar 文件的目录,根据具体工
作要求用实际目录替换
CLASSPATH=$CLASSPATH:$DP/lucene-1.2.jar:$DP/lu
cene-demos-1.2.jar; export CLASSPATH
如果不想在每次都登录后,可以编辑 /etc/profile 或
自己目录下的 .profile ,将上面的最后一行加到文件
的最后一行。 Windows 的设置,右击桌面的“我的电
脑”,选“高级”->“环境变量”->选中
CLASSPATH->“编辑”, 在输入框中加入两个 jar 文
件的全路径名,注意分隔符是分号 (;) 。参见右图。
1、运行 demo
$ java org.apache.lucene.demo.IndexFiles /usr/local/man/man1/ -- 对 man
文件建立索引
adding /usr/local/man/man1/mysql.1
adding /usr/local/man/man1/cvs.1
1614 total milliseconds
$ java org.apache.lucene.demo.SearchFiles -- 进行检索
Query: password
Searching for: password
7 total matching documents
0. /usr/local/man/man1/mysql.1
6. /usr/local/man/man1/mysqlshow.1
Query:
OK!Lucene 自待的 demo运行成功
这个 demo程序调用的主要 API 函数 :
/* 关于索引的主要函数 */
File file=new File(argv[]);
IndexWriter writer = new IndexWriter(index, new StandardAnalyzer(),
true);
Document doc = new Document();
doc.add(Field.Text(path, file.getPath()));
doc.add(Field.Keyword(modified,DateField.timeToString(file.lastModi
fied())));
FileInputStream is = new FileInputS
显示全部