1天,1个词,百度100000次,会发生什么?

在知乎看到一个有趣的问题:

一天内百度一个词一万遍,能否变成热词?
搜索一个网站几万次,能否提高搜索排名?
反复搜索几万次,对搜索引擎有什么影响?

想回答上述问题,需要一点搜索引擎的知识。

以下都用百度代指搜索引擎吧。

按下搜索按钮后,发生了什么

和Word直接进行查找不同,我们输入的搜索词,百度不会直接用于检索,而是先分词。

分词

比如,搜索“小曹同学的学习笔记”,百度可能分成

小曹、同学、学习、笔记

4个词去检索。

下面的图片就是分词检索的结果:

因为包含了4个检索词,所以这个网页能被检索到。

分词,是为了快速检索。

百度抓取的网页,每一个都和很多个词建立了对应关系,就像配对连线一样。

这样,只要找到对应的词,就找到了对应的网页。

分完词就进行检索么?不是的。

缓存

Google平均每秒要处理63000多次搜索请求。

百度没有比较准确的数据,但2018年4季度的财报显示,百度APP每天有1亿6千万的活跃用户。

假设这些用户每人搜索一次,平均下来,百度每秒要处理1900多次搜索请求。

想要快速的满足这么大量的搜索请求,实时计算是不可能的,需要通过缓存。

网络上有很多重复的搜索,比如,搜索天气、搜索菜谱、搜索放假安排等等。

你搜索一次“清明节放假”,和我搜索的结果应该是一样的。那么,百度就可以把“清明节放假”的搜索结果,做成固定页面,存到缓存里面。

有人搜索的时候,百度一看,缓存里面有,直接提取这个页面。这样就减轻了服务器的资源消耗。

然后定期更新缓存,就可以保证搜索结果不会过时。

那,缓存里没有呢?

排序

缓存里面没有,百度也不能说找不到网页呀,那多尴尬。

这时就得现找网页、现排序。

网页从索引里面找。索引,就是分词那一节说的词和网页的对应关系。

从索引里面找相关的网页,就是在做连线配对,找到和检索词对应的网页。

然后是排序。

这步比较复杂,可以理解成,百度有一套公式,把网页内容、链接关系输入进去,就能算出一个排序结果。

排序完成,就可以生成搜索结果页,返回给我们了。

基本流程是这样。

不过想要回答开头的问题,还得增加两个环节。

用户行为和反作弊

百度也不知道自己的排序结果是不是最好的,能不能满足我们的搜索需求。这就需要用户来给他打分。

怎么打分呢?通过我们的行为,比如点击。

假设,百度下“清明放假”,第一条是放假时间的网页,第二条是放假通知模板的网页。

网页修改过,真实搜索结果不是这样的。

如果每个搜索“清明放假”的用户,都不点第一条,而是点第二条,那么,百度就会认为,我们只想找通知模板。

搜索并点击第二条的用户多了之后,百度就会修改排序,把通知模板网页排到第一名。

既然百度会调整排序结果,很多人就动了歪脑筋。

他们网站的内容不怎么样,但想通过百多获取大量的流量,就会通过各种手段去作弊,影响排序结果。

作弊的手段之一,就包括伪造用户行为。

百度为了排序结果不被这些网站干扰,就需要反作弊系统。

至此,搜索引擎的检索排序系统基本完善了,可以回答开头的问题了。

一天内百度一个词一万遍,能否变成热词?

不能。

如果热词指的是上热搜榜,比如下图:

答案是不能。因为这样的词,

  • 不单单是搜索量大、爆发式增长,
  • 同时,搜索行为是在大范围内产生的,
  • 并且,相关内容的网页也在爆发式增长。

所以,单纯依靠个人的力量,搜索某个词一万遍,是变不成热词的。

如果热词指的是百度指数比较大的词,在一天之内是不行的。

因为昙花一现的词,只能算是长尾词,比如下图:

想要维持词的搜索指数,需要持续的搜索。

一个人,一台电脑,做不到。因为,短时间内搜索次数过多,百度会要求输入验证码:

如果是通过技术手段,或者其他方式去持续产生大量的搜索,那么是可行的。

很多公司、明星刷指数,就是这么做的。

搜索一个网站几万次,能否提高搜索排名?

如果自己搜索,很快会遇到验证码等防范机制。

如果通过其他手段:

  • 单纯搜索,不点击,不能。
  • 搜索几万次,并进行点击等行为,需要考虑百度的反作弊系统。

如果暂时没被反作弊系统监控到,那么在搜索的词上面,网站的排名会暂时上升。

一旦被反作弊系统监控到,那么排名必然下降。

但是反作弊系统是有漏洞的,或者百度懒得搭理一些小虾米,所以总有人在刷指数、刷排名。

比如在《SEM M 8 note:通过搜索分析需求的弊端》中提到的例子:

不过,短时间内排名提升后,想要维持排名,需要能吸引并留住自然流量,也就是真实用户。

比如,用户真的喜欢这个网站,愿意点击、浏览、分享等等。

如果用户不喜欢,百度就能统计到用户的行为,网站的排名依旧会下降。

除非一直刷流量,维持排名。

需要注意的是,真实的用户群体不会只搜索1个词、2个词,而是各种各样的相关词都会搜索。

作弊网站的搜索词组成,和真实的搜索词必然是不一样

所以百度想查作弊网站,还是比较容易的,就看想不想查,想不想处理。

反复搜索几万次,对搜索引擎有什么影响?

不会有任何影响。

同前面两个问题,自己搜索,会遇到各种防范机制。

如果通过其他手段,成功产生了几万次搜索……也没什么影响。

因为搜索引擎进行检索排序之前,有缓存系统,直接提取一个网页给我们就可以,而一个搜索结果的体积太小了。

比如,百度下“知乎”,然后保存下来,会发现网页不超过250KB:

加上网页的其他文件,总共也不过795KB。其中还有很多是保存在浏览器的缓存里面的。

我们按1M来计算,10万次搜索也不过10万M的流量,也就是不到100G……

如果当成一次DDoS攻击的话,都不需要百度,百度云加速就可以轻松应对:

百度云加速是给其他公司提供网络加速服务的,如果是百度自己用,怎么着也得是旗舰版定制下吧。

缓存里面没有对应的搜索结果时,百度才会进行检索和排序计算

如果搜索次数多,这个结果也会进入缓存里面。

如果这几万次搜索是大范围产生的,并且没被反作弊系统监控,那么也只是暂时改变了一下这个词的搜索结果排序,而已。

其实,开头3个问题的情形,百度、Google等每时每刻都在经历。

什么时候人们不用搜索引擎了,搜索作弊才会真正消失。

但那一天永远不会有。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容