因百度对时效性内容识别技术升级,原独立新闻源数据库的形式已不再适合使用,故取消新闻源数据库。
一群站长在QQ群里炸窝,探讨关于百度取消新闻源数据库的事儿,做为一个老站长,跟着新闻源十多年了,深知拿了新闻源就等于往手里送流量一般,自然这个声音出来后,很多人都会开始叫苦。
丁道师在文章里说:“曾几何时,网站或者媒体成为百度新闻源,远比在北京买一套房子价值大。”
我想说:“挺好的,毕竟从今天开始新闻领域可以出现公平的竞争”。
不公平的竞争格局
新闻源时代,其实本是一个不公平的竞争格局,虽然以优质内容为标准,但是对个人站长来讲,其实获取优质新闻源的门槛是特别高的,要坚定不移的保持原创,但是界定原创的标准其实很模糊,假设A站点是一个未获得新闻源的站点,B站点获取了新闻源,当A站点进行原创,而B站点持续转载A站点的原创文章时,那么B站点就可以获取海量流量,而像B这样的站点转载内容源的变多,那么A申请新闻源就不一定成功。
那些年,WEB2.0时代,说实话我们被地方性的新闻站点没少欺负。
新闻源没了怎么玩?
自新媒体时代来临,今日头条、百度百家、搜狐自媒体、一点资讯、北京时间、微信公众号等内容平台的衍生,流量已经分散了,百度新闻源的内容其实并没有原本那么重了,既然目标是更好的获取流量,所以不如去好好的想想,自己的站点入口到底在哪,要更好些。
我很庆幸,能遇到阿喵她们这样专业的算法团队,因为在一年前,为了提升我们的新闻源我们的内容运营团队,制定了一系列机制,来保证站点的收录率,结果现在到正好是更好的运营的契机。
不卖关子,围绕我们爱尖刀科技媒体运营团队,去年开始建立的这些机制给大家一点思路。
蜘蛛池
蜘蛛是一群管不住的孩子,一直都是基于URL在互联网上面漫无目的的奔走,站群跨了以后很多人开始考虑如何通过N个站点去养一个站点的玩法,于是就出现了蜘蛛池,蜘蛛池原理是很粗暴,从站群方式衍生,大量采集数据建立站点,前台用动态模式来欺骗蜘蛛,当蜘蛛每次进入站点一个页面的时候,网站程序会自动随机页面给它抓取,从而让蜘蛛不停的在网站内抓取新类容。
繁殖池
还是依靠站群的模式,通过大量网站将蜘蛛引导到一个集成的池,通过程序控制自动繁殖外链地址给蜘蛛,不管蜘蛛从哪个子站走进来,最终都引导到一个目标站点,如果你有很多站,你也可以为这些大量的蜘蛛定制任务,分发到N个站。
蜘蛛识别系统
不同的蜘蛛,他们的使命是不同的,比如新闻源、网页、图片这些蜘蛛的属性都是不同的,挂好钩子识别这些蜘蛛是干嘛的,为每个蜘蛛建立一个档案库,与繁殖池进行联动,精准分发让他去干他该干的事儿。
技术驱动新格局
外面一堆关于大数据、区块链、AI的声音,但是看了很多产品确实LOW的一笔,在鱼龙混杂的互联网行业,TO VC、TO G的企业大有人在,抱怨的同时未尝不是一个好的机会。
新的竞争格局不在是基于资源,而是基于技术,这会是公平的竞争,因为在这个时代,一定是数据和结果说话的。
不要在谈什么SEO,在站长领域里已经是个最基础的配置,SEO层面很多事情都没有什么竞争优势了,外链?内连?权重?
自己想想该如何发挥。
顺便show一下爱尖刀科技媒体的爬取频次吧,日爬取量平均差不多在30万左右。
上面的几项技术,并未用于爱尖刀,我们用的是另外一种思路,毕竟技术要向前看嘛。
来自:爱尖刀科技媒体,原帖:http://www.ijiandao.com/2b/marketing/48977.html