搜索功能的产品逻辑

如果老板扔一个需求:做个搜索的功能。作为一名产品经理,千万不要只画一个搜索框、一个“搜索”按钮,然后交给开发:一周内把这个功能做出来! 一头雾水的程序猿问:搜索的结果该怎么呈现?结果该怎么排序? 作为功能的设计者,如果你没深入的思考搜索功能的产品逻辑,被鄙视、被喷、被嘲讽在所难免!

那搜索功能的原理是怎样的呢?

对用户来说,在什么情况下需要搜索呢?根据实际使用场景,无非两种:1.用户明确知道自己要什么内容,直奔主题快速搜索自己想要的内容;2.不清楚或者大致知道自己想要什么内容,通过搜索筛选出自己目标内容。不管何种场景,搜索满足了用户快速寻找自己感兴趣内容的需求。用户输入一个query,一般系统会做出如下的处理流程:

      第一步:系统对用户输入的信息进行解读

      第二步:根据用户输入信息对内容进行筛选

      第三步:对筛选的结果进行排序

这是三个步骤是搜索机制的核心,可以通过服务端和系统的角度对搜索的原理进行解读。我们先看一下数据的存储逻辑:以一个电商平台的搜索功能举例来说,平台内会有多种分类或品牌,如下:

数据库的存储结构就是类似于这个样子的,左边就是所谓的“词库”:只要一次搜索的输入词能匹配到词库,就可以快速的查找词库到对应的内容;右边就是具体的内容索引库。这种搜索模式就像图书馆的索引结构,一步一步的引导,找出用户想要的内容。所以用一句话归纳:一个系统词库,一个内容索引库,而且词库和索引库是相互关联的。

 根据这个原理,我们对上面的搜索核心步骤一步步进行解读。

 第一步:系统对用户输入的信息进行解读

通过词库找与之对应的内容,再把内容呈现给用户,这当然是一个比较理想的状态。但现实问题来了,我们系统不可能限制用户的输入行为,而我们系统的词库是有限的。比如,用户输入“我的滑板鞋子”,系统里不可能有这个词,直接的结果就是搜索结束,用户搜不到自己想要的结果。对于这种特殊情况,怎么才能展现结果呢?那就是分词!   何为分词,就是把用户输入的关键词(字符串)进行拆分,比如用户输入的“我的天啊鞋子”可以进行如下拆分:“我的”  “滑板鞋”,经过这样的处理,用户非标准的query就变成了标准的词库,可以进行下一步的流程处理了。

 第二步:根据用户输入信息对内容进行筛选

对用户的query进行解读之后,会得到一些标准化的词,这些词会对应一些内容,接下来就是对内容进行筛选了,对内容的筛选会涉及到两个概念:召回率和准确率,看如下矩阵:

准确率指的是搜到内容中相关内容的比例;召回率指的是搜索到内容中,真正被搜索出来的比例。这两个指标的比例越靠近1,效果越好,但是有些情况下,准确率和召回率是一组相互矛盾的指标,比如我们只搜索出一个搜索结果,且是正确的,那准确率就达到了100%,但是召回率却很低。这两个概念在搜索优化中是关键性指标,涉及到更高级的搜索机制,这里不做深入探讨。这里需提醒一点,不是所有包含用户query关键词的结果都应该被召回。

 第三步:对搜索的结果进行排序

其实搜索的逻辑应该是通用的:用户输入一个文本(字符串),该文本会转化为标准词库中的词,搜索系统根据每个具体内容是否包含这些词来决定是否展示这些内容,同时搜索系统根据文本的相关性给这些展示的内容一个分数,分数的高低决定的排序的先后。

因此,对搜索结果进行排序十分关键,排序位置的高低决定了点击率、转化率等一系列关键性运营指标,很显然排序越靠前的结果更容易获得用户的点击。好的搜索不仅仅是把应该搜索的内容尽可能的搜索出来,同时还要考虑应该把容易吸引用户的内容展示在前面。但是如何对筛选出来的内容进行排序呢?这里涉及到了较复杂的算法规则。

下面这个Lucene的核心排序公式的原理,有专业文章详细介绍:

(http://www.cnblogs.com/ibook360/archive/2011/10/19/2217638.html)

当然还有很多这种公式的变形式,所有的变形式都基于这个准则:赋予每个因子不同的权重,所赋予权重的值直接影响排序的先后。如搜索出来的商品,价格、销量等元素都可作为排序的因子,如果把“销量”这个因子赋予较高的权重,那么销量较大的商品搜索出来会靠前。当然,对某个因子赋权的大小视业务的需求而定。

搜索的原理基本是这样的,其中涉及到的一些复杂算法不在此篇文章的探讨范围之内,也无法进行深度探讨。了解了搜索的原理,下次我们设计搜索系统、碰到搜索相关的功能时,脑子里就会有一个清晰的逻辑。原理了解了,那设计搜索功能还会遇到一些搜索的交互以及界面细节问题,下回找时间写一篇文章介绍如何对搜索功能进行界面设计以及用户体验提升的细节。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容

  • 最近由于工作需要,调研学习各类产品的搜索功能,于是准备做个笔记和大家分享,也督促自己总结抽象。 首先思考一个问题,...
    兔子的产品实验田阅读 7,443评论 11 70
  • 不知不觉,岁寒输入法的更新历史已经可以列出这么一长串来了。从中可以看出,岁寒的发展过程也是一个不断试错的过程,其中...
    临岁之寒阅读 33,929评论 1 6
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,870评论 25 707
  • 概述及标签体系搭建 1 概述 随着信息技术的迅速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,愈发带来很大...
    JinkeyAI阅读 22,771评论 10 241
  • (严重剧透,多图。) 中国的同性电影我看得不多,细想来,印象深刻的有《美少年之恋》《蓝宇》《春光乍泻》《安非他命》...
    飕飗红叶阅读 1,885评论 13 21