Press "Enter" to skip to content

概率图模型基础(6)——无向图模型(马尔可夫随机场)基本概念

前文提到,贝叶斯网络最大的特点就是能够人为指定各个因素的影响方向,但是实际生活中并非如此,生活中的变量更多是相互影响的,因此,便有了 无向图 上的图模型——无向图模型,又叫 马尔科夫网 。

 

2. 参数化

 

2.1 示例

 

目前有四个学生a、b、c、d。a只跟b、d玩,b跟a、c玩,c只跟b、d玩,d只跟a、c玩。此时大家同时对一个解法的正确性产生了不同的见解,都试图想要说服对方。0代表同意,1代表否定,degree代表同意或者否定的程度,越大表示程度越强。关系网如下如所示:


只看a、b,可以发现二人勉强能统一意见;
只看b、c,二者基本上能够统一意见;
只看c、d,二者存在很大的分歧;
只看a、d,二者基本上能够统一意见。

由于四个人的关系a不跟c玩,b不跟d玩,很难综合考虑四个人的意见,仿佛中了诅咒,那幺,怎幺才能打破这个诅咒呢?

 

于是上帝出手制定了如下规则:

 

rule 1:

 

把几个人之间的同意或者否定的程度定义为一个 因子 ,用 表示,考虑了几个人的态度就把这几个人放到一起,用 表示。 例如, 表示考虑了a、b的意见。

 

rule 2:

当考虑3个人时(以 )为例,必须按照一下的规则计算。 , 代表 的状态。

当考虑4个人时,必须按照一下的规则计算。

rule 3:

 

考虑完所有人的意见之后,需要将其归一化。

 

根据上述三条规则:

若四个人都同意该解法 ,则有: ;
若四个人状态为: ,则有: 以此类推。

最后考虑完所有的人意见后,需要进行归一化处理

 

,即每个概率除以其加和,于是有:

此时再看AB的意见,已经变成了:

由此可见,在考虑了四个人的大背景下,其实a、b两个人的意见是相左的。

 

2.2 因子

 

在2.1节中,把几个重要的概念定义一下:

a,b,c,d就是变量的集合 ;
a,b,c,d每个人的态度叫做
能够将不同人的意见联系起来的东西,叫 因子 ,它能够把程度变成一个量化的数字;
某个因子中考虑的人称为该因子的 辖域 。

概念:

 

 

    1. 假定 表示随机变量的集合, 因子 定义为从 映射到实数域 的一个函数,假如因子中所有的值均为非负,则该因子为 非负的 。

 

    1. 变量集 称为因子的 辖域 ,记为 。

 

    1. 分配函数 ,用作归一化。

 

    1. 因子的操作 :令 是三个不相交的变量集,且令 和 是两个因子,定义其乘积为新的因子 。

 

2.2.1 因子的实际意义

 

利用该分布回答查询,例如在a,b,c上求和,可以得出 ,其意义为:B同学有26%的几率同意,如果我们知道c同学同意的情况下( ),那幺

 

注意:

2.2.2 打破诅咒的方法

 

从下图右侧可以看出,b与c,c与d,d与a的联系性最强,而ab之间稍弱,因此,若要打破这个无向图,需要从ab之间的关系下手。

3. 吉布斯分布

 

3.1 吉布斯分布定义

 

假如分布 定义如下:

 

其中

 

 

分布 就称为 吉布斯分布 。

 

4 马尔科夫网

 

4.1 团

在无向图中 任何 两个结点均有边连接的结点子集称为 团 ,例如,在下图中,假设有随机变量 ,则 构成了一个 团 , 未构成团。

 

此时,再往 团 中加入 任意 一个结点,若集合不满足成 团 的条件,则称加入结点之前的 团 为 最大团 。如,往集合 中加入 ,依然满足成 团 的条件,继续加入结点 ,由于 不与 相连,故而 为 最大团 。

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注