IP属地:贵州
背景:IK分词器分为两种,粗粒度分词和细粒度分词,粗粒度会分为长词,细粒度分出的词比较多,会分出与词库中所有可匹配的词,现在我们想要这样的分词效...
背景:有没有遇到某条件下搜索结果变少,多个搜索条件组合后结果变少或无结果的显现,这种问题怎么办?相信你们产品应该有很多种补充或删减搜索条件的逻辑...
背景:ES5及后面版本使用的Lucene6.2,所以默认使用的BM25评分公式,我们实践一下,看看BM25公式对打分的影响。 1、BM25配置实...
背景:最近想起搜索评分这块,之前对Lucene评分公式调整很多,有一些经验,所以想把了解的公式和大家分享一下,Lucene6.0之前默认的排序使...
背景:延续上篇写了TF/IDF的公式解析,本篇为BM25解析简单介绍。BM25起源于 概率相关性模型,而不是矢量空间模型,但是该算法与Lucen...
背景:最近要重启在集群更新些功能和插件,所以整理下集群不合理的配置一起改了,无意间发现一个Index 的 Cache命中居然为0,以为是限制了,...
在观察索引时一般习惯用es-head,如果你的运维加了安全限制你该怎么办?1、ES安全主要是加xpack,这个需要我们在使用访问es-head:...
背景: 默认使用es做检索服务时 只是针对某个字段做检索,传入关键词调用检索服务,检索过程中ES分词部分我们无法控制细节和逻辑,从而影响检索效果...