形式化定义不太好理解,给出直观:
(先解释下,这里的”获知“是指主观概率中知道了某个变量,在这个条件之下其他以此为条件的条件概率会变化。这里是考察相关与独立这种变化。还不习惯数学语言的话,应该首先用日常语言做一个完整理解)
1.path上除去起始结点之外每种结点都有四种方向模式,不再列举,其中v-structure被获知时使得原来的独立性消失变得相关,其他三种正好相反,使得相关性消失变成独立。这个机制的原因在这里也不做进一步解释,但它很重要,必须先理解。
2.对于v-structure来说,获知它的后代节点也会引发相关性
3. 对于一条路径,或者他有非v-structure结点,这时取任何一个这种节点进行获知。或者它有v-structure,这时这个v-structure本身已经使得起始结点独立,一定不要对它做获知,获知了反而使得本来独立的变得相关了。也就是获知集合为空即可。
4.对于多条路径,他们之间就互相影响,一条路径的非v-structure可能是另一条路径的v-structure或其后代。排除这种冲突是算法问题。但是有时排除不了,比如一条路径有唯一的非v-structure结点,并且也没有v-structure,而它又是另一条路径的唯一的v-structure,而且这个”另一条“路径也只有这一个v-structue,再没有其他节点了(听起来复杂,其实就是X结构)这时对这个结点获知截断了一条路径的相关性,引发了另一条的相关性,因此算法失败,找不到一个获知集合使得所有路径被截断而使起始结点独立。