240 发简信
IP属地:江西
  • script在 score的流程是对每个docid进行评分, 调用 ScoreScript.setDocument(docid)-> ScoreScript.execute(explanation)。
    setDocument正常应该只记录docid,execute方法中进行操作,当时的代码是初稿,所以没有调整。

    “我的已解是一个doc对应的tag字段有多个分词结果,然后遍历处理分词结果”,其实到这里跟分词完全没有关系了,分词是检索的第一步应该做的事情,这里是直接获取分词的结果,比如某个tag对应的分数

    ES插件---payload检索

    背景 之前公司有个需求,需要存储多值的标签+分值类型的数据,并用来检索,其中标签是有限的,分值最大为1,示例数据如下: id字段值doc1(标签1,0.95) (标签2,0....

  • 多谢指正

    Elasticsearch7源码启动

    环境及工具 JDK12 Gradle5.4.1 GIT 源码及预处理 到github将代码clone下来,可以根据自己的需求来获取版本。 不同的IDE使用不同的方式编译,这里...

  • ES插件---payload检索

    背景 之前公司有个需求,需要存储多值的标签+分值类型的数据,并用来检索,其中标签是有限的,分值最大为1,示例数据如下: id字段值doc1(标签1,0.95) (标签2,0....

  • 一个非常hao用的elasticsearch中文分词器插件 HaoAnalyzer

    首先上地址 elasticsearch (es) hao 分词器 中文分词器elasticsearch-analysis-hao[https://github.com/ten...

  • 120
    不看技术看关系-史上最黑的评绩效制度

    2020年6月 一场疫情闹得北京丰台 大兴区成重灾区了,公司执行密切接触过去过新发地的在家隔离2周 A同事去过新发地,我们组同事BCD还有我密切接触过A,非得让我们来上班,狗...

  • Elasticsearch新的Discovery---Coordinator

    简介 Elasticsearch目前在使用的服务发现算法,是基于zen的服务发现的第二代实现 节点模式 节点有三种模式,分别是CANDIDATE, LEADER, FOLLO...

  • Elasticsearch索引的数据存储路径是如何确定的

    Elasticsearch中,在node的配置中可以指定path.data用来作为节点数据的存储目录,而且我们可以指定多个值来作为数据存储的路径,那么Elasticsearc...

  • Canal数据堆积

    记录一下canal的问题。数据同步一直使用阿里开源的canal,最近使用过程中遇到一些问题,在这里记录一下。 原因 我们使用canal监听MySQL,然后通过client获取...

  • Elasticsearch内存

    核心概念 基于Lucene Java应用 内存使用分析 Lucene的内存消耗 倒排索引。(堆内存)Lucene中,索引是存储在磁盘中,一个索引(Index)由多个段(Seg...

  • Lucene 搜索过程记录

    介绍 今天记录一下Lucene的搜索过程,基于自己的理解吧。 概要 获取词典及词典的文档号倒排表 解析Query语句,转为一棵Query查询树 根据Query构建Weight...

  • Java线程池的理解的记录

    为什么要使用线程池 降低资源消耗重复利用已创建的线程降低线程创建和销毁造成的消耗。 提高响应速度当任务到达时,任务可以不需要等到线程创建就能立即执行。 提高线程的可管理性线程...

  • Elasticsearch的Ping机制

    简介 在1.x的时候,Elasticsearch默认的集群通信是多播方式,也支持单播,而从2.x开始,默认是单播模式。到目前的7.x,多播模式以及不再使用,而且源码中不再包含...

个人介绍
程序员一枚,给自己走过的路留点记忆。