Elasticsearch 搜索


这里简单记录一下elasticsearch java api 的调用。
首先,初始化一个client.

public TransportClient initClient() {
      Settings settings = Settings.settingsBuilder().put("cluster.name", cluster)
              .put("client.transport.ignore_cluster_name", false).put("node.client", true)
              .put("client.transport.sniff", true).build();

      TransportClient client = null;
      try {
          client = TransportClient.builder().settings(settings).build()
                  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("192.168.0.70"), 9300));
          if (client == null) {
              LOGGER.info("Init Elasticsearch client failed!");
          } else {
              LOGGER.info("Init Elasticsearch client successul!");
          }
      } catch (UnknownHostException e) {
          LOGGER.error("client initlization failed!");
          LOGGER.error(e.toString());
      }

      return client;
  }

初始化client的时候记得加上cluster,这个表示你elasticsearch的cluster,可以在配置文件里面找到,如果你elasticsearch安装了head插件,直接可以在网页上看到。

Paste_Image.png

然后,可以加上你的定制条件进行查询。

res = client.prepareSearch(index).setTypes().setQuery(query).setPostFilter(filter)
                  .setSearchType(SearchType.DFS_QUERY_THEN_FETCH).setFrom(from).setSize(count).setExplain(true)
                  .execute().actionGet();

关于查询可以定制一个 setQuery(QueryBuilder) 和 setPostFilter(filter) 。当然还可以根据需要添加排序,分页等参数。这里主要谈一下query和filter.
query的作用是根据条件创建搜索规则。
postFilter的作用是在搜索的结果的基础上过滤结果。
elasticSearch 2.4 以后没有filter相关概念,所以构建query和filter都用QueryBuilder。简单举几个例子

QueryBuilder query = QueryBuilders.matchAllQuery(); //全部查询
QueryBuilder query = QueryBuilders.queryStringQuery(key);

//filter
QueryBuilder  timeFilter = QueryBuilders.rangeQuery("doc.create_time").from(begin_time).to(end_time);
QueryBuilder  channelFilter = QueryBuilders.termsQuery("doc.channel", channel_list);

elasticsearch提供了boolQuery来代替filter的or, and, not等操作。如果想要把上面的filter关联起来需要用must, mustNot, should等操作。

filter = QueryBuilders.boolQuery().must(timeFilter).must(channelFilter);

must可以理解为and, mustNot可理解为not, 但should不能理解为or,这个对查询的结果相关性有影响。
elasticsearch post filter可以作简单的yes/not过滤,但是无法对复查结果进行过滤,至少我没发现。比如下面这种情况。

  1. 我有两种类型的文档,type =1/2;
  2. 我不要两天以外的type=1的文档;
    QueryBuilder typeFilter = QueryBuilders.termQuery("doc.media_type", 2);
    QueryBuilder timeFilter = QueryBuilders.rangeQuery("doc.create_time").lt(TimeUtil.getDaysBefore(2));

    QueryBuilder wFilters = QueryBuilders.boolQuery().must(typeFilter).must(timeFilter);

    filter = QueryBuilders.boolQuery().mustNot(wChatFilters);

这种是没办法做到的,这样只会过滤掉所有type=2的文档以及所有两天以外的文档。
继续探索。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 批量操作 首先创建一个用于演示的索引 _mget批量查询 也可以这样写 bulk批量导入 批量导入可以合并多个操作...
    眼君阅读 5,319评论 0 4
  • URL querystring语法 全文检索: 单字段全文检索: 条件组合 单字段精确检索: 多个检索条件的组合:...
    壹点零阅读 4,831评论 0 2
  • 一、环境搭建 软件版本: Linux:centos7 64bit JDK:1.8.0 elasticsearch:...
    lailai900201阅读 8,922评论 0 12
  • 搜索数据建立 ElasticSearch最诱人的地方即是为我们提供了方便快捷的搜索功能,我们首先尝试使用如下的命令...
    lookphp阅读 2,934评论 0 1
  • 今天挂蛋,一件衣服都没有卖出去,下午的大客L姐一共买了28件,将近6万块钱,我们店一件都没有,全是年轻活力的中性色...
    往后只求己阅读 2,688评论 0 0