登录注册写文章

Solr中文分词

Solr中文分词

导入相应的jar包。添加到WEB-INF/lib下
在需要使用中文分词的core下的managed-schema文件定义一个关于分词的字段类型<fieldType>
把需要使用的字段的type属性替换成自定义的字段类型的name

例如：使用solr自带的中文分词

导入jar包
将D:\solr-6.6.1\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-6.6.1.jar添加到WEB-INF/lib下
在managed-schema文件中定义

<fieldType>
    <fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="0">
      <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
    </fieldType>

在需要的字段中使用
<field name="content" type="text_smartcn" indexed="true" stored="true"/>

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Django笔记（五）搜索 django-haystack + solr中文分词配置
haystack haystack 2.5 暂时支持到solr 4.10 （记笔记当时情况） solr 4.10 ...
今夕何夕_walker阅读 1,388评论 0赞 2
全文搜索引擎—Solr入门浅析
一.简介 Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的API接口。用户可以通...
泰安青年阅读 3,703评论 0赞 37
Solr 6.5.1集群部署和后台管理
两年前用过solr5.1版本的，当时只是简单入个门，拿来在项目里建个全文索引，然后再query，其他什么也没做，还...
Coselding阅读 3,126评论 3赞 22
Solr中文分词器配置及数据检索
导入MySQL数据 *首先：在做检索数据之前，先将数据导入到Solr中，根据http://www.jianshu....
孝为先阅读 3,056评论 1赞 0
一眼万年
有没有那么一个人，是这辈子都不可能在一起的？
木子漫阅读 156评论 0赞 0

赞1赞

赞赏

手机看全文