Press "Enter" to skip to content

不等概率的负二项分布(帕斯卡分布)

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

这是我在研究生期间的一个小发现。背景是攻克软件工程领域的一个理论证明。我把这个发现抽象为“不等概率的负二项分布”。

 

考虑一连串伯努利实验,每次成功的概率是 。当实验次数为 时,成功次数 服从二项分布;反过来,当成功次数为 时,实验次数服从负二项分布。

 

比如不断抛骰子,抛了 次骰子,1点向上的概率为 ,1点向上的次数为 , 服从二项分布,即

 

 

概率分布率为

 

反过来,出现了 次1点向上,那幺抛骰子的次数 服从帕斯卡分布

 

 

概率分布率为

 

我的发现是:考虑一连串伯努利实验,每次成功的概率从概率列表 中等可能选择一个。当成功了 次时,总实验次数 的概率分布律是什幺?

 

负二项分布是其中的特例,即概率列表为

 

为了方便理解,先以一个简单的例子作引子:

 

假设概率列表中一共有三个元素 ,随机从列表中挑一个元素出来,然后进行实验,实验成功的概率是该元素的值。在实验成功2次的情况下,求总实验次数为3次的概率:

 

总的来说,要分两种情况:(第一次成功、第二次失败、第三次成功)和(第一次失败、第二次成功、第三次成功)。为了层次分明,我定义这两种情况为“大情况”。

 

先看第一种大情况:(第一次成功、第二次失败、第三次成功)。

 

在三次试验中,每次试验有三个可供选择的元素,那幺一共有27种情况:(第一次选择了第一个元素、第二次选择了第一个元素,第三次选择了第一个元素)……我把这27种情况定义为27种小情况。

 

第一个元素实验成功的概率是第一个元素的值,即 。同理,第一个元素失败的概率是

 

那幺在第一种大情况(第一次成功、第二次失败、第三次成功)中,每一种小情况发生的条件下,总试验次数为3次的概率穷举如下:

 

 

以上27个概率相加,恰等于:

 

 

记事件A=总试验次数为3次,且满足第一种大情况。

 

则P(A)

 

=P(A|小情况1)P(小情况1)

 

+ P(A|小情况2)P(小情况2)

 

+……

 

+ P(A|小情况27)P(小情况27)

 

由于每一种小情况的概率相等,都是

 

所以

 

同理,在第二种的大情况(第一次失败、第二次成功、第三次成功)下,结果与第一种大情况一样。

 

因此P(总试验次数=3次)=

 

以上是简单的一个特例。一般地:一共有 个元素(对应于概率列表中一共有 个元素),试验成功的次数为 ,则总试验次数的概率分布是怎样的?或者总试验次数为 的概率是多少?

 

首先对大情况进行分类:“试验成功 次,总试验次数为q”,当且仅当“前q-1次试验验成功了 次,且最后一次试验成功”。

 

在前 次试验中成功了 次,这样的可能性有 种,那幺一共有 种大情况。

 

先对第一种大情况进行讨论。我把第一种大情况定义为前 次成功、接着 次失败、最后一次成功。如下图所示。

这个大情况又可以分为 个小情况。因为一共有 次试验,每次试验有 个元素可供选择。每个小情况的发生概率都是一样的,即

 

对这 个小情况进行穷举是不现实的。不过可以参考上面特例的穷举思路。首先考虑第一种小情况(我把第一种小情况定义为每次都恰好选到了第一个元素)的概率。下图表示第一种大情况中,在第一种小情况的条件下,总试验次数为q的概率:

在第一种大情况中,这样的式子有 个。每个式子都是这样的结构(即: 个因子的乘积中,前c-1个因子是 的形式,中间 个因子是 的形式,最后一个因子是 的形式)。这 个式子中,虽然结构不变,但是各个因子的下标是改变的。根据二项式定理,这 个式子的概率之和为(其中 ):

记A=总试验次数为 次,且满足第一种大情况。

 

则由全概率公式:P(A)

 

= P(A|小情况1)P(小情况1)

 

+ P(A|小情况2)P(小情况2)

 

+……

 

+ P(A|小情况 )P(小情况 )

 

=

 

又因为总共有 种大情况。每种大情况都是对称且互斥的,所以P(总试验次数为 次) =

 

这个式子有些出乎意料,它仅仅需要所有 的和,而并不需要每个 的特定的值。

 

 

上式还可化简为

 

这个形式正是负二项分布的结构。负二项分布中,每次试验成功的概率都是同一个值。但是在本文的模型中,每次试验的成功概率不完全相同。有趣的是,只需要算得所有成功概率的平均值,就能算出总试验次数的概率分布。

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注