solr 7.0 与spring-data 3.0整合 --(3)中文分词搜索

前面发现的问题

之前的使用的版本信息为
solrj 7.3.0
spring-data-solr 3.0.6 RELEASE
在进行输入插入时

@Test
    public void save(){
        Music music = new Music();
        music.setResId(12345555L);
        music.setSongId(1234555L);
        musicRepository.save(music);
    }

会抛出异常

java.lang.NoSuchMethodError: org.apache.solr.common.SolrInputField.setValue(Ljava/lang/Object;F)V

原因是spring-data-solr是基于底层封装solrj来进行的架构,但是当前版本的spring-data-solr并不支持solrj 7.0.0以上的版本,会导致找不到方法,因此需要将solrj进行降版本处理,降至6.6.3后问题得到解决,能成功进行数据插入。

<dependency>
      <groupId>org.apache.solr</groupId>
      <artifactId>solr-solrj</artifactId>
      <version>6.6.3</version>
    </dependency>
    <dependency>

中文分词

在spring-data-solr中并未找到分词的功能,因此需要使用solrj来实现分词功能。
MusicRepositoryImpl中加入以下方法:

/**
/**
 * @Author Alistair.Chow
 * @Description 中文分词
 * @Date 11:11 2018/6/29
 * @Param [sentence]
 * @return java.lang.String
 **/
public String getAnalysis(String sentence) throws IOException, SolrServerException {
    FieldAnalysisRequest request = new FieldAnalysisRequest("/analysis/field");
    // 字段名,随便指定一个支持中文分词的字段
    request.addFieldName(Music.FIELD_KEYWORDS);
    // 字段值,可以为空字符串,但是需要显式指定此参数
    request.setFieldValue("");
    request.setQuery(sentence);

    FieldAnalysisResponse response = null;
    response = request.process(solrTemplate.getSolrClient(), Music.CORE_NAME);

    String results = "";
    Iterator<AnalysisResponseBase.AnalysisPhase> it = response.getFieldNameAnalysis(Music.FIELD_KEYWORDS)
            .getQueryPhases().iterator();
    while(it.hasNext()) {
        AnalysisResponseBase.AnalysisPhase pharse = (AnalysisResponseBase.AnalysisPhase)it.next();
        List<AnalysisResponseBase.TokenInfo> list = pharse.getTokens();
        for (AnalysisResponseBase.TokenInfo info : list) {
            results += " " + (info.getText());
        }

    }

注意:其指定的字段必须要支持中文分词,在solr中的配置不能为string或其他类型。
如以上keywords在music中的定义为:

public static final String FIELD_KEYWORDS = "keywords";

@Indexed(name = FIELD_KEYWORDS, type="text_ik")
private String keywords;

在solr中的配置为:

<field name="keywords" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<copyField source="singer_name" dest="keywords"/>
<copyField source="music_name" dest="keywords"/>

添加测试代码:

@Test
public void analysis() throws IOException, SolrServerException {
    System.out.println(musicRepository.getAnalysis("我要听刘德华的歌"));
}

执行结果为:

 要听 刘德华 歌

由于使用了ik中文分词,所以分词后去除了一些定冠词。

分词搜索

分完词,搜索就简单了。因为之前的代码,就使用了按空格拆分词语(空格可以适用于英文),因此只需要简单封装一下,调用前面的方法就行了。

增加一个关键字搜索和分词搜索的接口
CustomRepository接口中加入:

public ScoredPage<Music> searchByKeyword(String searchTerm, long pageIndex, int pageSize);

public ScoredPage<Music> searchBySentence(String sentence, long pageIndex, int pageSize) 
            throws IOException, SolrServerException;

MusicRepositoryImpl中实现:

    /**
     * @Author Alistair.Chow
     * @Description 关键字搜索
     * @Date 10:07 2018/6/28
     * @Param [searchTerm, pageIndex, pageSize]
     * @return org.springframework.data.solr.core.query.result.ScoredPage<hk.reco.media.music.res.solr.model.MusicSolr>
     **/
    @Override
    public ScoredPage<Music> searchByKeyword(String searchTerm, long pageIndex, int pageSize) {
        String[] words = searchTerm.toUpperCase().split(" ");
        String[] contidionFields = new String[]{Music.FIELD_KEYWORDS};
        Criteria conditions = createSearchConditions(contidionFields, words);
        SimpleQuery search = new SimpleQuery(conditions);
        search.setOffset(pageIndex);
        search.setRows(pageSize);
        ScoredPage<Music> page = solrTemplate.queryForPage(Music.CORE_NAME, search, Music.class);
        return page;
    }
 
/**
 * @Author Alistair.Chow
 * @Description 语句搜索
 * @Date 10:13 2018/6/28
 * @Param [sentence, pageIndex, pageSize]
 * @return org.springframework.data.solr.core.query.result.ScoredPage<hk.reco.media.music.res.solr.model.MusicSolr>
 **/
 @Override
 public ScoredPage<MusicSolr> searchBySentence(String sentence, long pageIndex, int pageSize) throws IOException, SolrServerException {
     String words = getAnalysis(sentence.toUpperCase());
     return searchByKeyword(words, pageIndex, pageSize);
 }

测试一下:

@Test
public void searchByKeywords(){
    ScoredPage<Music> musicList = musicRepository.searchByKeyword("赵传", 0, 10);
    for (Music music : musicList.getContent()) {
        System.out.println(music);
    }
}

@Test
public void searchBySentence() throws IOException, SolrServerException {
    ScoredPage<Music> musicList = musicRepository.searchBySentence("我要听刘德华的歌", 0, 10);
    for (Music music : musicList.getContent()) {
        System.out.println(music);
    }
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,192评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,858评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,517评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,148评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,162评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,905评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,537评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,439评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,956评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,083评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,218评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,899评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,565评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,093评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,201评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,539评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,215评论 2 358

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,675评论 18 139
  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 46,833评论 6 342
  • 昨天写没,昨天好像没写,不过看了挺久的,看别人写的。不过我觉得我记忆力好像有点问题,一点也记不起来昨天看了些啥的,...
    Lww酱阅读 253评论 0 0
  • 《缺失》 总是这样的开端 不合时宜的拳头、玻璃渣 一场战争在相同的血液里展开 各自为敌 而后 不遗余力的保持距离 ...
    却悔阅读 636评论 8 11
  • 每天,迷迷糊糊的睁开眼睛,匆匆忙忙的秉烛入睡,一切似乎都如走马观花,就过完了一天的繁华与琐碎。有时候,静然回首却不...
    空影疏淡阅读 186评论 0 0