【Python编程】---数据收集:案头研究

关于数据:没做过行研的人会有一个误区,以为数据就是0-9组成的数字,实则不然。广义的数据(也就是行研工作中经常提到的)不仅仅是数字,而是信息,是可加工组合的信息。当然,不管是描述市场规模、公司规模还是各种结构(占比)、增速(增长率),免不了对数字的收集和整理。数字只是数据的一个重要部分:数据是信息,数字是量化的信息。本篇分享将基于这种界定展开。

数据收集与获取结论之间的关系:为了循序渐进、且在一篇文章尽量讲细,我们今天先不讲如何基于既有数据得出结论,只是先讲信息的收集和整理,集中在基本的数据收集思维和最常见信息源的分享上。当然,有效的信息收集、专业的信息整理,一定是更有助于得出结论、辅助判断的。

数据收集常见方法

如上所示,根据信息获取方式的不同,数据收集主要有两大方式:基于一手信息的研究和基于二手信息的研究。

基于一手信息的研究,也可以叫直接研究,主要是通过访谈(业内人士)和实地调研。

基于二手信息的研究,也可以叫间接研究,主要是通过案头研究和访谈(相关业内人士)。

案头研究123

咱还是要啰嗦下更偏 “道”层面的一些东西,因为道(思维能力)比术(方法工具)有用一万倍。

  1. 态度:“不卑不亢”

一方面,研究不仅仅是数据的收集整理,但是有效扎实的数据整理是好的研究的基础。所以,这是一项基础工作,要踏实积累打磨。

另一方面,不要指望着靠案头研究彻底解决一切问题,就好比做再多文献研究也写不出一篇有价值的论文。所以,不要以为了解了很多信息就是真正懂行了,还差得远。

  1. 思维:需要天赋,也需要训练

研究是一个不断建立假设、验证、推翻、建立新假设的过程,特别像写论文。其实学术研究和行业研究本就都是研究范畴嘛。做研究切忌先入为主。是要有观点,但前提是客观呈现。

Structure your mind before diving deep,尤其是在信息爆炸的今天。独立思考的能力比一开始就急着打开搜索引擎重要也更有效。相信自己朴素的思维能力,并且用正确的方法不断练习和矫正。我通常是拿一张大白纸,先放空硬想的。

  1. 方法:别盲目,别路人

从方法的选择的角度上看,再强调下,搜索引擎是万能的,只用搜索引擎是万万不能的。方法不对,说到底还是思维习惯的问题。

另外,每个人可以逐渐形成适合自己(习惯的信息获取方式和所处行业)的一套方法,按照自己最熟悉的方式和长期形成的某些感觉去做。方法工具熟悉了,就不一定非要每次都执行标准动作了。这就好比那些老司机驾驶动作十分连贯,然而他们并不需要按照驾校教我们的那样去记动作、记位置,靠的是经验判断。行研某种程度上也是个熟练工种。

案头研究常用信息源

阅读此部分需要耐心和实践哦。

各行业通用

  1. 人口统计数据(Demographics****)

中国国家统计局

美国人口普查局

美国劳工部劳动统计局

皮尤研究中心Pew Research Center www.pewresearch.org(无党派研究机构,不仅涉及人口统计相关的数据和报告,还涉及一些社会经济专题,比如对Social Media的研究)

  1. 宏观经济数据(Macro Economy****)

政府门户(你总能找到一些有用的,政策和基础数据)

China Infobank www.infobank.cn(新闻报告,txt,收费)

SOSHOO www.soshoo.com (Excel,收费)

  1. 行业数据(Industry Check****)

政府门户(行业政策法规)

金融监管机构

  • CBRC银监会
  • CIRC保监会
  • CSRC证监会

IT/TT

专业机构

  • 咨询公司报告(MBB、Accenture、DTT、PwC、ATK)

注意:咨询公司是分级的哦,外资和本土有差别,外资中MBB(McKinsey\BCG\Bain)是普遍认为最顶级的,各家公司各有专长,请注意区分哈。

  • 券商二级市场行研报告(慧博智能策略终端,前迈博汇金Microbell)

强烈推荐!原因不多说了

  • 第三方研究报告(每个行业都有自己的第三方)

图书/****论文

  • Google学术
  • 国外大学网站

行业协会

  • 医疗行业协会
  • 汽车行业协会

不是所有行业的行业协会都靠谱哦,前几天国家某机构出了一个“骗人协会清单”;如何区分呢?基本上,一些受监管、需要制定标准的行业的行业协会比较厉害,比如医疗,因为大家要抱团讨论如何游说政府啊!

行业蓝皮书

蓝皮书怎么说呢,作为基本的入门级别还是很好的

招股说明书

招股书是好东东啊,很多人都是研读招股书去了解行业的,如果你正在研究的行业有近年上市的公司,拿来招股书好好读一遍,用它替代万(wan)能(e)的搜索引擎吧!

垂直信息网站及相关报告产出

  • 比如电影:艺恩网、Box Office Mojo;比如IT:CNNIC、199it、艾瑞、易观、Talking Data;比如教育:芥末堆、多知网;比如创投相关:IT桔子
  • 可以从相关报告的“数据来源”入手(各种cross ref)

学会cross reference,会让工作事半功倍。意思就是,你看到一份特别好、特别清楚、数据特别给力的报告,通常都要标示“数据来源”,你就可以顺着去看数据来源提到的那个报告或者机构,一般都有惊喜发现,尤其是被多个报告多次refer的数据来源。

  1. 企业数据(Company Profiles****)

上市公司(listed****)

  • 官方网站IR(投资者关系频道)

各家公司IR的诚意千差万别,有的几乎找不到财报、有的不仅能找到历年财报和press release,还会用H5呈现重要数字一目了然(比如阿里),有的除了披露财报信息外,还披露年度报告视频(如万达),披露CSR report(企业社会责任,也就是公益相关的事情,这个在欧洲企业中非常明显),有些非上市公司也会比较详细的披露重要信息(比如华为)。这些特别良心的IR,宝宝都记在心里,哈哈。

  • 证监会csrc.gov.cn
  • 巨潮资讯网 cninfo.com.cn (A股上市公司,PDF格式):比证监会网站更user-friendly。
  • 港交所HKEX hkex.com.hk (香港上市公司)
  • 美国证券交易所SEC sec.gov (NYSE、NASDAQ上市公司,html格式)
  • 二级市场研究报告(慧博客户端,PDF格式)
  • 全国企业信用信息公示系统

非上市公司(private****)

  • 官方网站(有时候也自愿披露年报,比如小米、华为)
  • IT桔子 itjuzi.com (TMT领域创投数据)
  • Bizteller bizteller.cn (付费)
  • CVSource cvsource.com.cn (付费)
  1. 新闻(News Check****)

商业纸媒:福克斯、哈佛商业评论、经济学人… …

商业新媒体:虎嗅网、36Kr… …

如果你是insider,微信就够了,所以“混”入你要研究的领域的圈子很重要。这一点后续我们讲到访谈的时候会着重讲哪里找到圈子,如何混入圈子。

  1. 搜索引擎(SE****)

Google:怎么翻墙?表问我…

Baidu(插播今天重磅消息:百度宣布业务架构重组,成立“搜索公司”):至于Google/Baidu哪家强?表问我…

Wikipedia:直接用英文版本吧

用搜狗搜微信长文:这个是俺老板告诉我的小tip,解决了困扰我多年的难题。

移动端有道笔记可以关联微信直接存好文章:这样也可以PC进行深度阅读、标记、保存。

搜索词要尽量简短,除非你确定长词组存在;不要只看第一页搜索结果,因为很可能是广告。

  1. 高质量自媒体

政治经济:占豪,小编老公的最爱~

商业解读:罗胖、冬吴相对论,小编老公玩腻的~

文化趣味:晓松奇谈…

太多了!后续如果大家感兴趣,小编也可以吐血整理下我自己觉得很不错的微信公众账号和收藏的网站。

互联网行业常用

  1. 行业数据

互联网全行业

  • CNNIC:官方,基础
  • 199IT:真的很全、很快、很多最新报告下载资源~
  • 艾瑞咨询:独立研究机构
  • 易观国际:独立研究机构
  • Talking Data: 独立研究机构&数据解读
  • KPCB Mary Meeker 互联网趋势报告:每年必读哦~

垂直行业

  • 近3年上市企业的招股说明书

~其中最重要的是mkt overview,risks

~三张表:I/S(Income Statement损益表)、B/S(Balance Sheet资产负债表)、CFS(Cash Flow Statement,现金流量表)

~组织架构、高管履历

  • 垂直门户研究网站:教育(多知网)、游戏(游戏工委、魔方网)、彩票(乐刨网、搜博网)… …
  1. 企业/APP****数据

VC网站:各家网站上肯定会在最显眼的地方披露自己骄傲的Portfolio哒,而且这几乎是他们披露的唯一内容…

App Annie:iOS相关数据

  1. 公司内部资源

采购数据库:这个主要是研究机构会用到,可以的话真的不错,能省掉好多dirty work

  1. 高质量自媒体/****业内人士

自媒体:人人都是产品经理(产品相关分享和培训),风吹江南(互联网金融)… …

专家:专家一席话,胜读十年书!

今儿就讲到这吧,希望对大家有帮助。

参考链接:数据收集这件小事:案头研究

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354