前言:最近忙的不行,也一直没有坚持写公开文章的习惯,但最近人越来越唠叨,很多东西不写出来估计大家都烦了。结合近期的一些工作内容,写些关于标签的理解,也算磨磨性子。
之前做技术开发时看了很多名叫《深入浅出xxx》的书,但我想这个系列也许做不到深入,至少从些简单的故事出发大家都能看明白。至于能否浅出就不知道了,说不定太监了呢?但愿吧!
时逢《神奇动物在哪里》上映,作为一个伪哈迷本想带着孩子去饱饱眼福,无奈只有英语版本。于是同期另一部迪斯尼的片子成了我的唯一选择-Moana,中文落了个很俗套的名字《海洋奇缘》。
这是一部很精彩但不出彩的迪斯尼经典动画片,该有的元素一个不落,处处到位,比如:
- 落寞的英雄 + 被选中的孩子 的组合
- 逗逼的配角
- 看完被洗白白的大Boss
- 翻译后不堪入耳的插曲
- 天堂般的原画
- 简单却不易做到的价值观
码了这么多字,还是看几张图吧,不然估计大多人都跑掉了...
电影海报
电影剧透
- 一个英雄受到了挫败,不知所踪
- 一个平凡的孩子被大海选中
- 一片祥和的大环境和一个与众不同的奶奶
- 孩子向往大海被族人拒绝
- 奶奶支持但体力不支倒下了,变成图腾继续支持
- 孩子出走,找寻英雄
- 英雄不屑,企图逃走
- 孩子纠缠
- 无限循环上述两步,英雄与孩子达成一致
- 谁都能想到的大结局
不得不说剧情没有太大的起伏,但这才是本文的开始......
终于开始了
之前和朋友聊天,谈起一个有趣的话题:<pre><code>给你一个剧本,怎么测算它是否卖座?</code></pre>
一开始只是觉得这个命题很新颖,初想很难,再想现在大数据啥不能做,再想要是自己做会怎么做?
由于自己做了多年的基于模型的开发和设计工作,所以习惯了拆解再构建模型的思路,虽不说万能,但至少个人觉得很好用:
定义领域模型的概念
- 电影
- 影评
- 上映时间及场次
- 同期电影
- 政策舆论
- 突发事件
- 目标人群特征
- 评分模型
其实也没做过这个领域,只是从自己的理解不断延伸,自然就会产生一个相对完整且统一的思路。脑图 的作用在此一览无余!
设定相关流程
- 找出以往类似电影
- 出品方 - 迪斯尼
- 人物设定 - 主角、配角、反派、客串
- 剧情设定 - 主线、分支
- 背景设定 - 文化历史、知识领域
- 电影类型 - 3D/2D、英语/国语
- ...
- 收集成绩及影评
- 票房统计
- 主流网站口碑及影评
- 社交媒体评论及话题
- 得出历史同类电影参考分数
- 此处忽略各种评分模型
- 找出近期有竞争的电影
- 设定预计上映时间
- 搜寻可能同期电影
- 估算目标人群交叉率
- 估算本电影竞争力
- 确定场次和时间
- 解决时间冲突
- 解决影院冲突
- 预设票价及放票数量
- 其他种种
- 规避政策风险
- 设置解决突发事件的手段
- 设定营销策略
- ...
- 综合评分
- 此处再次忽略各种评分模型
小结
越写越复杂,想想还是打住,不然专家看见就得露馅了...这些其实不过是个人惯用的一种思维逻辑,我相信条条大路通罗马,大家坚持自己就好了。
大家看看,这么多不同类型的数据需要收集、处理、分析、构建模型,在大数据时代似乎都能做到,但似乎也不知道从何下手?!
为什么?
标签,数据降维的产物
从上个章节看到,数据很复杂,即便收集了也很难处理,那么把复杂的问题简单化就是一种思路。
此处引用《三体》的降维攻击,<pre><code>二向箔</code></pre>
如果在大数据时代,所有数据都被处理成标签,那么针对标签本身的查询、分析、加工就能替代与之相同的数据操作,让人人都参与到大数据中来。这个想法也许在某些人看来很幼稚很荒谬,但本文的目的就是抛砖引玉,还请不吝赐教!
不知不觉,写了这么多还是个开头,看来此系列注定是个长篇连载,不知道我这种拖延症患者能否坚持下去,是为序。