建立有效页面数据库:目的、定义、流程、应用

原文出处我的公号:运营黑客。

你需要建立有效页面数据库

之前写过一篇文章《谈点 SEO》

关于 SEO 运营观,我简明提到,好的 SEO 工作开展,是需要从「需求形成产品」再到「流量获取及转化」贯穿始终的。文中有这么一段话:

SEO 运营观(传递价值,变现产品)
SEO运营公式:有效查询覆盖 × 有效抓取 × 有效收录 × 展现 × 点击 × 转化
「有效」界定了目标性,尤其需要对查询、抓取、收录做界定

一个公式的成立,常识是默认为任何一个环节都是有效。我之所以在「查询覆盖」、「抓取」、「收录」前面特意加上了「有效」二字。是这三个环节是绝大多数 SEOer 常识盲区。谈查询覆盖、抓取、收录,往往理所当然地认为是在不加以有效与无效区分得谈总量。于是,把查询覆盖搞得多多的,把抓取搞得多多的,把收录搞的多多的,是用功所在。

这种不对有效无效做区分带来的影响是恶劣的。如同二八定律,一个网站的有效页面占据整个网站可能的页面,可能只有 20%,甚至更少。这个数据我没有做测量,但意思很清楚,大部分页面是属于无效页面的。如果都不加以区分地去做功课,那么这些功课可能有 80% 是无效的。

80% 的无效抓取,无效用功!80% 的无效收录,无效用功!这只是对搜索引擎资源的浪费。更不好的是,你的工作对象 80% 是无效的。

如果网站页面数量不超过 1000 个,或者网站结构很简单,就算 80% 的无效,也浪费不了多少时间与精力。这不是说小网站不需要做有效与无效区分,只是做了区分,带来好处相对于中大型站点不那么明显而已。

网站上了一定量级,比如上万;或者典型页面较多,比如超过 10 个,这时候就需要考虑一个建立有效页面数据库了。(注:本文不谈及有效查询数据库建立)

建立有效页面数据库目的

SEO 处理对象更加清晰明确,有的放矢,尽可能规避无效功课。

有效页面数据库,你只需要关注有效页面的抓取情况,有效页面的收录情况。你要做的都是针对有效页面做页面增长、页面改进。不属于有效的页面的抓取、收录,都是你要摒弃的。

搜索引擎分配给你网站的抓取量是相对恒量的。从常识出发,很容易就理解到建立有效页面数据库的意义。

另外,有效页面数据库的建立,对新人快速熟悉上手有很好的帮助,也是团队良好协作的一个基础。这种好处,在大型网站表现的尤为突出。

有效页面的定义

定义:有效页面就是有收录价值的页面。

定义标准

  1. 有(强)排名价值的。一个页面可以过排名获取流量,就必然有收录价值。也就是说排名价值是判定其是否有收录价值的充分条件。
    典型类型有:网站首页、专题页、列表页、详情页等。
    如:http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html
  2. 无(弱)排名价值,但可以帮助搜索引擎直接或间接抓取其他排名价值页面。关键特征:页面上有大量指向其他页面的链接,但自身没有显著的排名意图。
    典型类型有:列表页、索引页,栏目页等。
    如:http://www.mafengwo.cn/mdd/
  3. 无(弱)排名价值,但可以提升整站权重。这类页面常见于海量文章页、贴子等。通过 UGC 创造的页面大多数可以归为此类。不过,这些海量的页面,除了可以极大提高整站权重,其整体排名价值又往往超过了网站其他所有有效页面。这是非常有意思的现象。页面数量越多的网站,这个表现越明显——很多你压根想不到的词,这些词大部分只被检索过一次,带来的流量超过了整体的一半。
    典型的类型有:详情页。
    如:http://www.mafengwo.cn/i/7127948.html

建立有效页面数据库的流程

关于有效页面数据库搭建流程,可以单独写一篇比较长的文章。这里做框架性阐述。

1 . 确立有效页面规则

主体、意图、属性A(可能还有 B、C、D等)、记录A(可能还有 B、C、D等)、页面类型以及 URL。
仍然拿蚂蜂窝的页面举例:

http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html

大概可以设计下面这个样子。

主体 意图 属性 记录 URL
目的地 攻略 国家 菲律宾 http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html

拿到一个有效页面规则,其他目的地国家都同理得到。

2 . 拿到字典表

页面各个字段参数与记录对应关系构成了字典表。

大概可以设计下面这个样子。

主体 意图 属性 记录 参数
目的地 攻略 国家 菲律宾 10067

注意:最好加上主体、意图、属性这三个字段。随着网站结构复杂,记录上完全一样的词,对应的参数很可能不一样。所以需要加上主体、意图、属性来加以细分。

3 . 组合「有效页面」

接下来,我们要拿到有效页面了。
有效页面有三种:

  1. 应当有效页面。与查询覆盖完全匹配的理想页面,也是我们最终想要拿到的。实际操作中,无法一蹴而就得到。
  2. 组合有效页面。通过字典结合规则组合得到。应当有效页面和现存有效页面都是其子集。但是组合有效页面往往会出现一个问题,由于规则很难以过于精细,组合出来的会产生超出查询覆盖边界。
  3. 现存有效页面。网站数据库现有的有效页面。这部分页面有两个的局限性表现。
    1. 可能各种各样的原因,比如由于数据不全,会导致现存有效页面往往小于应当有效页面。
    2. 这部分有效页面是遵循组合规则生成,也会出现现存有效页面超出应当有效页面的情况。

三者关系见下图:


关系图

拿到最终的应当有效页面,需要建立在组合有效页面和现存有效页面的基础上。

  1. 通过规则和字典,拿到组合有效页面。
  2. 采集或从数据库拿到现存有效页面。
  3. 结合组合有效页面、现存有效页面以及内容数据,补全现存页面缺少部分,剔除现存页面超出部分。

有效页面数据库的应用

前面说过,最终是要拿到应当有效页面数据。但从动态的角度来看,应当有效页面数据是没有最终静止形态。因此,有效页面数据的应用,除了是为了不断逼近应当有效页面,更多的是在逼近过程中的应用。

拿到有效页面数据,大家可以尽情的发挥自己的想象力,怎么用得效率高,怎么用得爽,就怎么来。只要在整个 SEO 运营公式的框架下,结合实际情况,可以通过各种各样的方式利用起来。

在主体、意图、属性、记录、URL 的基础上,继续增加想要关注的字段。比如 Title、H1、状态码、关键词、收录等。

应用主要有三个方面

  1. 记录
    有的放矢地记录,每个版本都可以往回查找。记录是复盘的前提。
  2. 监测
    尽早发现变化,如内容的修改,收录排名变动等。
  3. 优化
    结合记录和监测,可以预知趋势,可以总结操作得失。基于未来和过去,才能做出合理的优化判断。

举个监测规避风险的场景

大中型网站,由于其复杂性以及数据量大,一些对 SEO 影响不好的操作,往往会等等实质性结果出来了,才后知后觉。

比如程序的一个小操作,导致了某类页面的 Title 变了个样,H1 标签丢失等等。看到这里,真让人有点怕怕。

如果某类页面状态码都变成了 404,看到这里,已经恐怖如斯了,这 SEO 工作真心没法搞了。

所以需要一些监测机制来预防和提前发现。前面说到的添加更多需要关注的字段,就是形成机制的若干要点。

最后,无有效页面数据,不优化。人话就是,甭做了,浪费感情。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,996评论 25 707
  • 毋庸讳言,当代女性文化正走向颓败。这种颓败与女性主体的放逐、精神含量短缺、生存理想粗陋有关,与女性欲望和女性价值的...
    敏而好学w阅读 596评论 0 3
  • 新员工培养方法,满满干货! 培养新员工的正确方式, 不仅仅是工作上的培养,还有员工应具备的素质。 明确培养新员工的...
    闻方培训师阅读 972评论 0 2
  • 2009年6月26日 阴 亲爱的女儿,今天爸爸的心情糟糕透了。 不过还是要向你坦诚前两天爸爸忙...
    玄梦仁者阅读 457评论 0 1
  • 人要接触不同的朋友,去见不同的人,有时候不是因为要让自己交友广阔或者说让自己增长什么见识,仅仅只是因为不同的朋友可...
    鳕零kelsey阅读 405评论 0 0