用树形结构做决策
生活中是有很多场景是需要做决策的,但是生活中做决策更多的是凭感觉去决策
就比如说:
早上起来看天色不好, 走的时候带了把伞
这队动得好慢,隔壁那队虽然人多,但我感觉换过去更快
高速公路前方前方突然出现了行人, 我决定猛踩刹车
游戏里面感觉当前位置有点危险, 赶紧跑到队友旁边保持安全站位
凭感觉去做决策大多数情况下是没问题的, 而且是非常重要的
就比如上面的两个需要快熟决策的场景, 是及其依赖个人的感觉的(不过这两种感觉,是长期大量训练后可以相信的感觉)
但是凭感觉做决策也必须明白是存在很多问题的,存在的问题包括
- 感觉有的时候是错误的
以打fps游戏为例: 本是劣势对枪的场景, 但是你的本能感觉驱使自己出去对枪,导致失败 - 没办法准确说出自己为什么做出某种决策,不管决策是对的还是错的,都只能停留在只可意会不可言传的层面
继续用fps游戏为例: 事后反省自己,为什么劣势情况下你想出去对枪, 自己是没法说出具体原因的, 你只会说我自己感觉想出去对枪
再来一个正确的感觉的例子: 很多绘画较好的人, 如果问他具体怎么做才能画得和他一样有飘逸感, 往往得到的答案是凭感觉
这是凭感觉去做决策的弊端, 那么应该如何建立一套有据可循的方法去做决策呢?
其实就可以使用离散中的树这个章节中的内容,
我们这里把用树形结构的方式去做决策的方法叫走决策树
决策树具体做法如下:
- 将树的内容中的根节点理解为
当前状态, 并且需要有一组在当前状态下,不同结果的好坏顺序 - 将第二层级理解当前可选的的
决策内容 - 将第二层
决策内容当成已知前提, 结合当前状态推导出每个决策内容对应的可能决策后的结果,作为第三层节点 - 如果
决策结果还不足以判断好坏, 则继续将决策结果作为第一步的根节点,继续重复前三步骤往后推导下一层节点; 反之则停止
图示
一在当前状态下,不同结果的好坏顺序: 结果1 > 结果2 > 结果3 > 结果4
根节点:当前状态
│
├── 第二层: 决策A
│ ├── 第三层:结果1(概率0.8)
│ └── 第三层:结果2(概率0.9)
│
├── 第二层: 决策B
│ ├── 第三层:结果2(概率0.9)
│ └── 第三层:结果3(概率0.3)
│
└── 第二层: 决策C
└── 第三层:结果D(无法判断)
├── 第四层:结果2
└── 第四层:结果E ........
........
结果1(概率0.8) 表示: 做了决策A后, 结果1 大致会有0.8的几率会出现
就上述已经罗列出来的部分内容
决策A明显更优秀
有了以上的具体可操作的方法之后,我们可以用它来分析上面已经提过的一些例子
不过上述例子留给大家自己尝试分析, 因为他们相对简单,
接下来分析一个生活中常会提到的词语: 游戏意识
打moba游戏的时候,经常会听到队友或者朋友提到: 你需要提高游戏意识, 你的游戏意识怎么这么差?
那游戏意识是什么呢?
其实就是玩家在 游戏中不同时间段和基于当前已经获取的信息 去展开的一颗又一颗决策树
游戏意识好, 就可以理解为 这颗决策树绘制正确且快速 在各种不同状态下,不同结果的好坏顺序判断准确 快速排除明显劣解
游戏意识差, 就自然和上面相反了
职业选手,他们往往就具备非常优秀的上述能力, 个人认为是天赋占比最多, 努力当然不可忽略
不过感觉也很重要, 在长期大量游玩过程中, 自己能将一些常见的过程转化为一种感觉, 不用思考就能做出正确决定
还有,如果每一步都按上述方式思考, 那肯定游戏玩下来回比别的玩家慢半拍,而且更累,可以更多的根据感觉来
游戏嘛开心更重要,只是说,当自己想要停下来冷静思考时,可以用决策树
具体的模型图示例:
假设你在玩一个 MOBA 游戏(如LOL),你是一个打野英雄,在 7分30秒 时出现在敌方红BUFF附近。
根节点 [7:30, 位置:敌方红BUFF附近, 己方下路压线]
|
├── 决策1:反红BUFF
│ ├── 子结果1a:成功拿到红,安全撤离 → +200金币,敌方打野慢60秒
│ ├── 子结果1b:被发现,被围剿 → 死亡,敌方推线
│
├── 决策2:回自家野区刷F6
│ ├── 子结果2a:安稳发育 → +120金币
│ ├── 子结果2b:敌方趁机控龙 → 敌方得龙,+团队经验
│
├── 决策3:去下路Gank
│ ├── 子结果3a:配合击杀下路 → 推塔,控视野
│ ├── 子结果3b:敌人有防备,空技能死亡 → 节奏崩盘
│
└── 决策4:插眼控视野(不做行动)
├── 子结果4a:获取关键信息 → 下一轮决策更优
└── 子结果4b:浪费时间,错失机会
这棵决策树的每个节点代表一个状态,每条边代表一个动作,每个叶子节点代表一个可能的结果。
最后回归本文
决策对我们自己看待问题有什么用?
前文提到过, 每个人都有自己的规定, 这种规定某种意义上就是一种个人系统的好坏顺序排序
那么在询问自己一件事该做还是不该做的时候, 就可以用上述决策树的方式,得出这件事做了之后产生的结果,是否与 个人系统的好坏顺序排序吻合
如何吻合就可以做, 如果不吻合就决不能做
还有,如果在用决策树的方式去得出了多种结果后, 没法用自己的已有规定去判断好坏
这个时候,就意味着,你可能需要制定新的规定了
因为这个时候就相当于旧规定无法解释新现象, 需要指定新规定来约束自己,或者说成解释该现象
但是规定的更新一定还要自己更谨慎的思考, 这里只是说可能需要更新, 除非这类现象众多且影响到自己, 且旧规定无法解释新现象