教程集 www.jiaochengji.com
教程集 >  脚本编程  >  php  >  正文 Drupal 7结合Apache Solr 4.7实现中文分词教程

Drupal 7结合Apache Solr 4.7实现中文分词教程

发布时间:2016-11-30   编辑:jiaochengji.com
教程集为您提供Drupal 7结合Apache Solr 4.7实现中文分词教程等资源,欢迎您收藏本站,我们将为您提供最新的Drupal 7结合Apache Solr 4.7实现中文分词教程资源
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

Solr的版本升级较快,目前已经到5.x的版本,但是drupal的版本升级比较慢,因此关于Drupal升级使用solr高版本的问题,进展也比较慢,另外一个原因是Drupal的apachesolr模块是否支持也是一个问题,所以作者建议不要盲目的升级使用高版本,一定要测试之后才能在正式服务器上使用。

 

\'Drupal

 

这次是参考网上的一些教程,把Apache Solr整合了中文分词,然后配合了Drupal的schema设置步骤,已经添加了自定义的中文分词器,对Drupal7以及中文分词做了支持。

Solr4.x增加了collection的概念,其实collection就是一个数据库的table的概念,这样一个core就可以有多个collection,solr的存储基本跟数据库就类似了。core等于数据库、collection等于数据表。

由于Jetty的版本不一样,导致配置文件的修改也有不同,因此jetty也做了适当修改,比如context.xml中把war文件改成了resourceBase的设置模式,以至于每次war文件解压不会覆盖work目录的修改。

第二个就是solr/drupal7/conf/solrconfig.xml文件中会引用很多相对路径的jar包文件,这些文件原本在solr- example中工作正常,但是单独拿出来就报错,因此作者把solr包里面的contrib文件夹复制到了solr(jetty)的根目录,并做了适当修改。

详细的使用还是跟之前的solr4z类似,只是这次只支持Drupal7,没办法支持Drupal6了。

#简单的启动请使用:(window/linux)

#端口号是:8983

java -jar start.jar

#使用辅助solrd (linux only)

#端口号: 8993

./solrd start #启动

./solrd startx #前端启动

./solrd stop #停止solr

Drupal里面设置url的时候,注意一下,直接使用corename/collection-name 就可以,具体参考Drupal大学这个问题:

在drupal中Solr4如何配置url?

 

\'Drupal

您可能感兴趣的文章:
Drupal 7结合Apache Solr 4.7实现中文分词教程
专家教你如何有效的学习Drupal - Drupal问答
强大的Drupal有什么缺陷与不足?
solr学习笔记之solr查询语法
Drupal的缓存技术应用-让你的网站飞起来
Drupal7配合Varnish使用及整合drupal模块的详细教程
solr从数据库导入数据的例子
solr中DirectoryFactory学习笔记
Drupal配置迁移详细讨论
工作中的几个Drupal小问题记录总结

[关闭]
~ ~