原创: 精进学思行
工作中,常有同事提及我比较擅长检索信息,特别是与专业相关的内容,我并没有掌握很多很高级的检索技巧,但我觉得一些基本的方法可能会对你有些帮助,本文予以分享,重点介绍信息和信息检索的概念,检索的策略以及常用的技巧。
1 什么是信息?
劳德.艾尔伍德.香农(Claude Elwood Shannon),信息论的创始人,他对信息的定义是:
“Information is the resolution of uncertainy.”直译过来,就是“信息是用来消除不确定性的东西”。
还是很难理解,什么叫做不确定性呢?它指的是一个事情既有这种可能,也会有另外一种可能,在信息很少的时候,你不知道各种可能性的比例。比如让你猜一个你完全陌生城市的天气情况,没有历史数据和天气预报,估计你只能蒙,而如果告诉你这个城市过去10年,每天的天气情况,你就能提高一些猜中的概率,而如果有比较精准的天气预报,就能增加你猜中的信心。
所以,反过来说“信息是用来增加确定性的东西”,比如在一个产品开发中,如果你完全不懂背后的原理,也没有过往的经验,那么你可能通过试错法不断去各种可能的方案,最后可能也可以找到解决方法,但是成本太高,或者下次就不灵了,而如果你知道过去的设计经验,那么你可以很快排除了明显不合理的方案,而如果你懂得它背后的原理,甚至会优化设计,你就能进一步消除设计中的不确定性,进而提高成功率的概率。
你可能会说,光有信息还不行,必须要有知识。这就是语言的模糊性,我理解,在香农的定义中,信息是比较宽泛的,甚至可以是没有具体含义的。同时,我们日常生活中常常会碰到相似的概念,比如数据、知识、智慧等,它们又是什么关系?我见到的一个比较好的模型是David MacCandless在2010提出了,它将数据、信息、知识和智慧按照组织化和意义的递进关系展示如下:
在这个结构中,它的描述如下
数据:分散的要素,如单词、数字、代码等;
信息:产生一定连接的要素,比如句子,方程、点子等;
知识:组织化的信息,比如概念结构、复杂故事等;
智慧:对知识的应用,比如完成一个项目等。
从定义上看,信息可以消除不确定性,那么它还有什么用途,或者我们为什么要去了解和应用它,我理解至少有如下三个方面的原因:
①信息和能量是理解人类科技和文明发展的两条主线。关于这个观点,推荐看吴军写的《全球科技通史》,有详细的介绍。为什么没有"物质"?因为最新的物理学研究发现,物质本质上也是能量的,这个我目前无法解释清楚。
②信息是公司创造和传递价值的关键。这个比较容易理解,芯片的主要原材料是沙,但因为物质排列方式不同,其价值发生重大变化。一台全新布加迪威龙跑车,新车很贵,但经过强烈的撞击后,组成它的物质没有发生太大的变化,而其排列方式发生了改变,导致价值大幅降低。
③信息的处理是知识性工作者的核心能力。我们现在很多职场人,其实不需要从事很高强度的体力脑洞,我们大部分工作本质上都是在处理信息,把接收到的信息,经过加工成成品或半成品,以某种载体的方式传递出去,构成价值创造的某一环,而我们的信息处理能力,很大程度上就决定了在我们这一环上能创造的价值。
2 为什么要掌握信息检索?
在我看来,有三个原因需要我们掌握信息检索的方法。
首先,随着时间的发展,我们这个星球上的信息的量越来越大,无论是书籍、论文还是网页,甚至是视频内容,都随着指数级增长,我们无法穷尽;其次,我们碰到的很多工作和生活问题,99%都有人碰到过,甚至是总结出来的,对我们很有价值;最后,如何从海量信息中找出对我们有帮助信息的工具和方法就在那里。
于以上考虑,我们只需要掌握初步的检索方法(就是我本文介绍的),就能解决很大部分的问题。而生活中有些人,稍微碰到问题就认为很难解决,或者是直接向别人要答案,素不知,身边随时都有一个知识渊博的老师在身边。这就好像坐在一个装满黄金的箱子上乞讨一样。
3 如何进行检索?
那检索的基本方法是什么呢?我把它总结为如下这张图,通过设计一种包含了关键词和运算符两个部分的检索式,我们就能从大量的信息(信息源)当中过滤出我们想要的信息。当然,通过对结果的评估,我们可能需要不断修正我们检索的数据库以及我们的检索式。
3.1 选择信息源
检索源决定了我们能够获得想要信息的基础概率,比如你想去找一些权威的研究论文,那么你大概你不会去微信上去找,而如果你想知道附近哪个地方比较好吃,你大概你也不会去上所谓的专利网站,对不对?这虽然说是比较极端的例子,但我想说的是,我们要在正确的地方找东西。基于信息源的类型,我将其归为了这样几类:
①研究类,如专业期刊,专利网站等,每个行业都有自己的专业期刊,而对于期刊类还有专门的论文检索方法;
②通用类,像谷歌,必应以及百度这样的搜索工具,它们背后链接了大量的信息,且自身自带一些很好的检索式,后面我要介绍的检索式,也主要是基于这三大搜索引擎。
③生活类,如各种生活类APP等~
3.2 构建检索式-关键词
选对了源头,成功了1/3,接下来就是,使用什么样的关键词去搜索,所谓关键词,就是和你想检索内容有很强相关性,且具有实质意义的词,这里不建议使用句子去搜索,虽然现在智能算法经常能识别你的意思,但是这样容易带来很多的噪音。怎么去确定关键词,保证结果尽量准确、全面呢?有以下几个原则:
①关键词通常要具有较高的"特异性"和"指向性",也就是说和普通的词有较高的区分度,对于一些你比较陌生的领域,不知道用哪个词,可以先找一篇相关的内容,从它的题目和摘要中提取。
②注意关键词相似的表达方式。比如对于我的专业——声学,检索中可能就会用到Sound、Acoustic、Sonic,Audio……,
③关键词不局限在词语,还以是图片和声音等。
3.3 构建检索式-运算符
确定了关键词(可能是好几个),第三步就是通过运算符,将这些关键词进行组合,从而提高检索的精度和效果,运算符有很多种,这里我介绍我常用的,且觉得很有效的5种。
①布尔运算-AND/OR/NOT
这是最常用的,也是机会所有的搜索引擎和检索系统都会有的功能,它的意思如下表所示。
②完整包含-“”
如果你想让某段话“完整复现”在检索结果中,就加上双引号,注意大部分情况是需要是英文的双引号。
③文档类型-filetype
如果你想直接找相关文档,这个很有效,这也是我找专业文档用的最多的,我经常会用 filetype:pdf,这样找的都是PDF
④标题包含-intitle:
如果你想让标题中包含你的关键词,你可以使用intitle,这样找的主题和你的关键词更接近。
⑤网站-site:
如果你想在特定的网站搜索,可以使用site,比如只是新浪的新闻
这只是我常用的一些,而如果你想知道更多的检索方法,提高自己的检索技能,你完全可以在检索中输入how to search,这样的方式来获得更多的检索技能,也是实现
"授人以鱼,不如授人以渔”,而对于特定的检索,比如说像专利还有论文,还有更系列的检索技术,如有兴趣,可以专门学习。
总结
以上就是今天想和大家分享的关于检索的一些初级方法,希望对你有帮助,如果想掌握更深入的方法,可以搜索一下,同时,在检索中还有如下几个心得:
1 你所碰到的问题其实99%都有人碰到过,而且很多都有很好的解决,而且身边一直有这样一个很博学的老师,你可以多和他请教;
2 在这个时代是很幸运,如果你想去了解一个东西,通过搜索引擎,你总是可以找到相关资料;
3 能够用搜索引擎解决的问题就尽量少去问别人;
4 检索到结果只是开始,检索的目的是解答疑惑和解决问题,这才是我们最终的目的;
5 你也可以创造信息,从而被他人检索到,给他人提供价值,比如我现在所写的这些文章,如果对你有一点帮助,就值了。