首页 > 其他 > 详细

Solr的安装以及中文分析器的配置

时间:2019-11-29 21:20:08      阅读:77      评论:0      收藏:0      [点我收藏+]

一丶Solr简介 

  Apache Solr是一个流行的开源搜索服务器,它通过使用类似RESTHTTP API,这就确保你能从几乎任何编程语言来使用solr。Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能支持并行SQL查询的执行.Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。

总之,Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据

二丶Solr的安装

1:安装 Tomcat,解压缩即可。

 

2:解压 solr

 

3:把 solr 下的dist目录solr-4.10.3.war部署到 Tomcat\webapps(去掉版本号)

 

4:启动 Tomcat解压缩 war

 

5:把solrexample/lib/ext 目录下的所有的 jar 包,添加到 solr 的工程中(\WEB-INF\lib目录下)

 

6:创建一个 solrhome solr 下的/example/solr 目录就是一个 solrhome。复制此目录到D盘改名为solrhome  

 

7:关联 solr solrhome。需要修改 solr 工程的 web.xml 文件。

 

    <env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>d:\solrhome</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

    </env-entry>

 

8:启动 Tomcat

 

http://IP:8080/solr/

三丶配置中文分析器(中文分词,以便用来进行分词查询)

  1 IK Analyzer简介

 

IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 200612 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化

 

  2 IK Analyzer配置   

1IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下

 

2创建WEB-INF/classes文件夹  把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。

 

3修改 Solrhome  schema.xml 文件,配置一个 FieldType,使用 IKAnalyzer,这样才能在查询的时候使用中分分词(分词解析)

 

<fieldType name="text_ik" class="solr.TextField">

     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

      

四丶配置域

相当于数据库的表字段,用户存放数据,因此用户根据业务需要去定义相关的Field(域),一般来说,每一种对应着一种数据,用户对同一种数据进行相同的操作。

    域的常用属性:

        • name指定域的名称
        •     type指定域的类型
        •     indexed是否索引
        •     stored是否存储
        •     required是否必须
        •     multiValued是否多值

     2.举例子定义域    

        修改solrhomeschema.xml 文件  设置业务系统 Field

<field name="item_goodsid" type="long" indexed="true" stored="true"/>

<field name="item_title" type="text_ik" indexed="true" stored="true"/>

<field name="item_price" type="double" indexed="true" stored="true"/>

<field name="item_image" type="string" indexed="false" stored="true" />

<field name="item_category" type="string" indexed="true" stored="true" />

<field name="item_seller" type="text_ik" indexed="true" stored="true" />

<field name="item_brand" type="string" indexed="true" stored="true" />

    2.复制域

        复制域的作用在于将某一个Field中的数据复制到另一个域中,可用于多条件查询

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

<copyField source="item_title" dest="item_keywords"/>

<copyField source="item_category" dest="item_keywords"/>

<copyField source="item_seller" dest="item_keywords"/>

<copyField source="item_brand" dest="item_keywords"/>

    3.动态域

    

      当我们需要动态扩充字段时,我们需要使用动态域。对于品优购,规格的值是不确定的,所以我们需要使用动态域来实现。需要实现的效果如下:

      配置:

<dynamicField name="item_spec_*" type="string" indexed="true" stored="true" />

 

 

 

 

 

Solr的安装以及中文分析器的配置

原文:https://www.cnblogs.com/hanpi/p/11959826.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!