首页 > Web开发 > 详细

Solr建立索引时,过滤HTML标签

时间:2015-09-09 17:04:46      阅读:392      评论:0      收藏:0      [点我收藏+]

原文地址  http://www.joyphper.net/article/201306/188.html

 

1、在数据库的读取文件data-config.xml 中的entity 标记里边添加 transformer=”HTMLStripTransformer” 代码。

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description  from table">
            <field column="description" name="description" stripHTML="true"/>
</entity> 

2、在field 字段需要过滤html代码的字段添加 stripHTML=”true”

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">
             <field column="description" name="description" stripHTML="true"/>
</entity>

3、修改schema.xml文件中的fieldType标记中的内容,添加如下代码<charFilter class=”solr.HTMLStripCharFilterFactory” />

<analyzer type="query">
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"  mode="simple" reload="true" />
    <filter class="solr.LowerCaseFilterFactory" />
    <charFilter class="solr.HTMLStripCharFilterFactory" />
</analyzer>

Solr建立索引时,过滤HTML标签

原文:http://www.cnblogs.com/fengh/p/4795126.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!