Solr实战

本文的示例代码参考SolrPractice

目录

环境

  • Solr
brew install solr

brew services start solr

brew services list

docker run --name solr -p 8983:8983 -d solr

solr create -c core-practice
  • MySQL驱动
wget http://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.tar.gz

tar xf mysql-connector-java-5.1.46.tar.gz

cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /usr/local/Cellar/solr/$(solr -v)/libexec/dist
  • solrconfig.xml
vim /usr/local/Cellar/solr/$(solr -v)/server/solr/core-practice/conf/solrconfig.xml
# 添加以下配置

<lib dir="${solr.install.dir}/libexec/dist/" regex="mysql-connector-java-5.1.46-bin.jar" />
<lib dir="${solr.install.dir}/libexec/dist/" regex="solr-dataimporthandler-.*\.jar" />

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
        <str name="config">data-config.xml</str>
    </lst>
</requestHandler>
  • data-config.xml
vim /usr/local/Cellar/solr/$(solr -v)/server/solr/core-practice/conf/data-config.xml
<dataConfig>
    <dataSource type="JdbcDataSource" 
                driver="com.mysql.jdbc.Driver"
                url="jdbc:mysql://120.55.98.237:3306/zhg" 
                user="root" 
                password="***"/>
    <document>
        <entity
            name="article"  
            pk="id"
            query="select * from article"
            deltaImportQuery="SELECT * from article WHERE id='${dih.delta.id}'"
            deltaQuery="SELECT id FROM article WHERE updated_at > '${dih.last_index_time}'"
            >
                <field column="id" name="id"/>
                <field column="title" name="title"/>
                <field column="content" name="content"/>
                <field column="updated_at" name="updated_at"/>
            </entity>
    </document>
</dataConfig>
  • managed-schema
vim /usr/local/Cellar/solr/$(solr -v)/server/solr/core-practice/conf/managed-schema
# 添加以下配置

<field name="title" type="string" indexed="true" stored="false" />
<field name="content" type="string" indexed="true" stored="false" />
<field name="updated_at" type="pdate" indexed="true" stored="false" />
brew services restart solr
  • 全量导入数据
curl http://localhost:8983/solr/core-practice/dataimport?command=full-import
  • 增量导入数据
curl http://localhost:8983/solr/core-practice/dataimport?command=delta-import
  • 查询导入数据
curl http://localhost:8983/solr/core-practice/select?q=*:* | json

这里使用nodejs的json工具格式化数据: npm i -g json、

Startup

spring init -dweb,data-solr --build gradle SolrPractice
# cd SolrPractice
mv src/main/resources/application.properties src/main/resources/application.yml
vim src/main/resources/application.yml
spring:
  data:
    solr:
      host: http://127.0.0.1:8983/solr/
vim src/main/java/com/example/SolrPractice/ArticleController.java
package com.example.SolrPractice;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@RequestMapping("/articles")
public class ArticleController {
    @GetMapping
    public String getArticles() {
        return "getArticles";
    }
}
  • 测试
./gradlew bootrun

curl localhost:8080/articles # 返回"getArticles"

Model

vim src/main/java/com/example/SolrPractice/Article.java
package com.example.SolrPractice;

import org.apache.solr.client.solrj.beans.Field;
import org.springframework.data.annotation.Id;
import org.springframework.data.solr.core.mapping.SolrDocument;

@SolrDocument(solrCoreName = "core-practice")
public class Article {

    @Id
    @Field
    private int id;
    @Field
    private String title;
    @Field
    private String content;

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getTitle() {
        return title;
    }

    public void setTitle(String title) {
        this.title = title;
    }

    public String getContent() {
        return content;
    }

    public void setContent(String content) {
        this.content = content;
    }
}

Repository

vim src/main/java/com/example/SolrPractice/ArticleRepository.java
package com.example.SolrPractice;

import org.springframework.data.solr.repository.SolrCrudRepository;

import java.util.List;

public interface ArticleRepository extends SolrCrudRepository<Article, Long> {
    List<Article> findAllByContentContains(String query);
}

Controller

vim src/main/java/com/example/SolrPractice/ArticleController.java
package com.example.SolrPractice;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;

import java.util.List;

@RestController
@RequestMapping("/articles")
public class ArticleController {
    @Autowired
    private ArticleRepository articleRepository;

    @GetMapping
    public List<Article> getArticles(@RequestParam String query) {
        return articleRepository.findAllByContentContains(query);
    }
}
  • 测试
curl localhost:8080/articles?query=5000 | json
curl localhost:8080/articles?query=%e6%88%aa%e8%87%b3%e7%9b%ae%e5%89%8d | json

上述query=截至目前 urlencode编解码可以参考UrlEncode编码/UrlDecode解码- 站长工具

中文分词

solr_practice_01.png
cp /usr/local/Cellar/solr/$(solr -v)/libexec/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn* /usr/local/Cellar/solr/$(solr -v)/server/solr-webapp/webapp/WEB-INF/lib/
vim /usr/local/Cellar/solr/$(solr -v)/server/solr/core-practice/conf/managed-schema
# 添加以下配置

<fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="0">
    <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

# 修改之前配置

<field name="content" type="text_smartcn" indexed="true" stored="false" multiValued="true"/>
brew services restart solr
solr_practice_02.png

参考

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,427评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,551评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,747评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,939评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,955评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,737评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,448评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,352评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,834评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,992评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,133评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,815评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,477评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,022评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,147评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,398评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,077评论 2 355

推荐阅读更多精彩内容

  • 两年前用过solr5.1版本的,当时只是简单入个门,拿来在项目里建个全文索引,然后再query,其他什么也没做,还...
    Coselding阅读 3,095评论 3 22
  • 1 准备工作及相关介绍 solr和lucene的版本是同步更新的,最新版本是6.5.0。本案例使用4.10.3 j...
    阿太哥阅读 2,338评论 1 5
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,669评论 18 139
  • 一.简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通...
    泰安青年阅读 3,667评论 0 37
  •   Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Luc...
    缱绻离愁阅读 1,134评论 0 0