Press "Enter" to skip to content

随机图模型

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

 

数学家是一种把咖啡变成定理的机器。

 

Alfred Renyi

A mathematician is a machine for turning coffee into theorems.

 

Alfred Renyi

 

随机图的历史

 

在 1959 和 1968 年期间,数学家 Paul Erdos 和 Alfred Renyi 发表了关于随机图( Random Graph )的一系列论文,在图论的研究中融入了组合数学和概率论,建立了一个全新的数学领域分支—随机图论。

随机图的案例 p=0.01

随机图的定义

 

本文只关注无向图的场景。顾名思义, 随机图(Random Graph) 就是将一堆顶点随机的连接上边。好比在地上撒了一堆豆子,而豆子之间是否用线来相连是根据某个概率值来确定的。通常来说,对于随机图而言有两种定义方式

 

 

    1. 【定义一】给定

    1. 的定义是随机从

    1. 个顶点和

    1. 条边所生成的所有图集合中选择一个。其中,这样的图集合的势是

    1. 因此获得其中某一个图的概率是

    1. 【定义二】给定

    1. 和 ,

    1. 的定义是有

    1. 个顶点,并且两个顶点之间以概率

    1. 来决定是否连边。

 

 

事实上,这两个定义是等价的, 个顶点的图最多拥有的边数是 恰好有 条边,并且它们分配的概率是均等的,因此两个顶点之间是否存在边的概率就是 这里的 指的是组合数。i.e.

 

 

另一方面,对于 而言,顶点两两之间是否存在边的概率是 而 个顶点的图最多拥有 条边,于是边数为 i.e.

 

 

进一步地,通过以上两个公式可以得到:

 

 

在定义一中,可以直接算出所有顶点的平均度是 但如果要计算图的其余指标,用第二种定义 反而更加容易,因此后续将会重点关注第二种定义,为方便起见,记号简化为

 

随机图的度

 

图的 度(degree) 指的是对于某个顶点而言,与它相关联的边的条数。对于随机图 而言,它的边数大约是 最多与该节点相连接的顶点数为 整个图的顶点平均度是(边数 * 2) / 顶点数,用记号 来表示,意味着顶点平均度是 充分大的时候成立。换言之,

 

顶点上的值就是该顶点的度

对于随机图 中的一个顶点 而言,我们想计算它恰好有 条边的概率值。事实上,对于除了 之外的 个点而言,有 个顶点与 相连, 个顶点与 不相连,其概率是 同时需要从这 个点中选择 个点,因此, 的度恰好是 的概率是

 

 

特别地,当 时,上述概率近似于泊松分布(Possion Distribution)。事实上, 并且

 

 

 

因此,在 时, 近似于泊松分布,

 

 

随机图的连通分支

 

对于随机图 而言,它的连通分支个数是与顶点的平均度 息息相关的。特别地,当 时,每个顶点都是孤立的,连通分支个数为 时,任意两个顶点都有边相连接,整个图是完全图,连通分支的个数是 顶点的平均度从 到 的过程中,连通分支的个数从 演变到 最大连通分支顶点数从 演变到 那幺在这个变化的过程中,最大连通分支的顶点数究竟是怎样变化的呢?是否存在一些临界点呢?数学家 Erdos 和 Renyi 在 1959 年的论文中给出了答案:

 

对于随机图 而言,用 表示最大连通分支的顶点个数,那幺对于图的平均度 而言,

 

 

    1. 那幺

    1. 那幺

    1. 那幺巨连通分支(Giant Component)存在,同时存在很多小的连通分支,在临界点 的附近时,

    1. 这里

    1. 那幺图

    1. 是全连通图,i.e.

 

在这个定理中,对于顶点的平均度 而言,存在两个临界点,分别是 和 时,巨连通分支不存在,所有连通分支的量级都在 以下;当 时,巨连通分支开始出现,量级大约是 时,随机图存在一个巨连通分支和很多小的连通分支;当 时,图是连通图。

图的平均度的临界点

整个定理的证明有点复杂,但本文将会介绍 两个临界点 的计算。先来考虑第一个临界点 的情况:

 

来表示随机图 中的最大连通分支的顶点个数, 表示图 中不在最大连通分支的顶点比例,i.e.

 

图的顶点不在最大连通分支的概率。

 

对于不在最大连通分支的顶点 而言,其余的 个顶点分成两种情况,Case(1):要幺 与之不相连,此时概率是 Case(2):要幺 与之相连,但此时的顶点不能在最大连通分支中,那就只能在剩下的 个顶点中,其概率是 于是,对于所有顶点而言,它不在最大连通分支的概率是 于是,

 

 

根据 可以得到当 充分大时,有

 

 

它表示最大连通分支的顶点个数在所有顶点个数的占比,从而可以得到 近似方程 :

 

 

它的导数是 通过计算可以得到:

 

 

    1. 时,

    1. 上成立,i.e.

    1. 上的唯一解是

    1. 换言之,

    1. 时,

    1. 成立,

    1. 成立。换言之,

    1. 上除了零之外还有解

    1. 此时会存在巨连通分支,

    1. 是解。

 

 

因此,最大连通分支的顶点数在这个点会出现突变, 是该方程的第一个临界点,并且是出现巨连通分支的临界点。

 

再来考虑第二个临界点 的情况。对于极限状况而言,假设仅有一个顶点不在最大连通分支中,那幺 此刻,

 

 

两边求对数可以得到 因此, 也是一个临界点,并且是出现全连通图的临界点。

 

随机图的六度分离

 

六度分离又称为 小世界现象 ,它的含义是在地球上任意选择两个人,他们之间最多相隔 个相识关系。换言之,来自世界上任何地方的两个人都可以通过不超过 个相识关系所连接起来。

The Six Degrees of Larry Stone

图中两个顶点的距离定义为两个顶点之间的最短路径长度,图的直径就是图中任意两点的距离的最大值。对于随机图 而言,如果 则是不连通的,因此通常只需要考虑 的情况,甚至只考虑 的全连通图。任取一个顶点 ,则有

 

    1. 个距离为 的顶点;

    1. 个距离为 的顶点;

    1. 个距离为 的顶点;

    1. 个距离为

    1. 的顶点;

 

 

同时, 而言,顶点的个数为 这意味着 通过等比级数的公式可以得到 因此,

 

 

而随机图的直径的量级是与 成正比的,因此,随机图的直径量级同样是 如果 并且每个人认识 个人,于是随机图的直径量级是

 

参考文献

 

 

    1. Erdos Renyi Model:https://en.wikipedia.org/wiki/Erd%C5%91s%E2%80%93R%C3%A9nyi_model

 

    1. Giant Component:https://en.wikipedia.org/wiki/Giant_component

 

    1. Erdős P, Rényi A. On the evolution of random graphs[J]. Publ. Math. Inst. Hung. Acad. Sci, 1960, 5(1): 17-60.

 

    1. Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Reviews of modern physics, 2002, 74(1): 47.

 

    1. 《巴拉巴西网络科学》,艾伯特-拉斯洛·巴拉巴西(Albert-LászlóBarabási),2020.

 

Be First to Comment

发表评论

电子邮件地址不会被公开。 必填项已用*标注