概率论
预备知识
1 | 加法原理 北京->上海(火车3种,飞机2种) 3+2 |
一 随机事件与概率
1 | 随机试验的性质:可重复性、多结果性、不确定性 |
事件运算
1 | 1事件的包含A ⊂ B,A发生则B必发生 |
频率概率
1 | 频率:100次扔硬币,45此朝上,则频率 = 45/100 |
古典概率模型
特点:有限个样本点、等可能性
例题:n个人住N间房,总的可能性为S = N的n次方
1 指定的n间房各住1人的概率 n!/S
2 任意的n间房各住1人的概率,先选n个房 CnN * n!/S
3 指定的某间房里有k个人的概率,先选k个人Ckn,其余人在N-1个房里随便住P = (N-1)的(n-k)次方,因此概率为Ckn * P / S
几何概型
和长度、面积、体积相关的概率:一个圆,扔进左半圆的概率1/2
A、B约好在一个小时内见面,先到的人会等15分钟,之后就离开了,假设来的时间上是等可能的,求能见到面的概率
解:x轴是A到的时间、y轴是B到的时间,求|x-y|<15的面积(构建几何模型)
条件概率
在A已发生的条件下,求B的概率 P(B/A) = P(AB)/P(A)
扔3次硬币,A:扔了1次正,B:求至少2次正的概率
(A通常会对B造成影响,B原来样本空间是1,但由于A发生导致样本空间变少)
P(B/A)>=0废话 p(Ω/A)=1废话
B、C不相容时,P(B+C)/P(A) = P(B/A) +P(C/A)
没说不相容时,P(B+C)/P(A) = P(B/A) +P(C/A) - P(BC)/P(A)
乘法公式
P(AB) = P(A)P(B/A)
求AB同时发生的概率,可以拆成求2步的概率
P(ABC) = P(A)P(B/A)(C/AB)
总共扔3个硬币,
有1枚朝上的概率是3/8,有2枚朝上的概率也是3/8,注意这里1枚和2枚不是A、B这种先后发生的情况,而是结果,1枚和2枚属于互斥事件,因此不适用乘法公式
第1枚朝上的概率为1/2,在已发生情况下,第2枚朝上的概率1/2,因此前2枚朝上的概率满足乘法公式2/8 = 1/2 *1/2
这里B是独立事件P(B/A) = P(B),此时P(AB) = P(A)P(B),如果不是独立事件,则不成立
全概率公式
A、B、C是完备事件组,D是求的全概率,D可以理解为矩形分了3块,求D和A、B、C分别相交的和
P(D) = P(A)P(D/A) +P(B)P(D/B) + P(C)P(D/C)
甲生产60%良品率90%,乙生产40%良品率80%,求总的良品率
理解:甲生产为A,乙生产为B, D和A相交的部分占A的90%,D和B相交的部分占B的80%
P(D) = 0.60.9 +0.40.8
ps:P(D/A)表示AD相交的块占A的概率,P(A/D)表示AD相交的块占D的概率
贝叶斯公式
A1、A2、A3完备事件组,D是全概率 ,K表示A1A2A3中任意某个事件
P(K/D) = P(KD)/P(D) = P(K)P(D/K) / [P(A1)P(D/A1) +P(A2)P(D/A2) + P(A3)P(D/A3)]
例题:检验单误差是0.95(有病0.95阳性,无病0.95阴性的准确率),该地区发病率是0.005,
问检查出阳性时,1他确实有病的概率 2他复查还是阳性的概率 3如果复查还是阳性,他真有病的概率 (假设检查1000个人)
有病的概率P(A1) = 0.005,5个人;无病的概率P(A2) = 0.995,995个人
检查阳性的概率P(B) = 0.0050.95 + 0.9950.05 ,分别会查出4.75和49.75个阳人
求他有病的概率P(A1/B) = P(A1B)/P(B) = P(A1)P(B/A1)/P(B) = 4.75/(4.75+49.75) = 8.7%
复查阳性概率8.7% *0.95 + 91.3%*0.05 = 12.8%
复查阳性时他真有病的概率8.7% *0.95 / 12.8% = 64.5%
全概率公式用于 “由因求果”(已知原因概率,求结果概率),贝叶斯公式用于 “由果求因”(已知结果概率,反推原因概率)
事件的独立性
A发生情况下,P(B)=P(B/A),称B对A独立 (A对B造不成影响)
如果A、B相互都独立,则称为独立事件 P(AB) = P(A)P(B)
1 不可能事件∅与任意事件互相独立
2 Ω与A是相互独立的
3 A、B独立,则A与B否,A否与B否都是独立的
4 A的概率为1,则与B是独立的 (概率是1不一定是Ω,直线可以少个点)
A、B互不相容是交集为空,但A、B独立可以同时发生,只是相互不影响
A、B互斥 => A、B肯定不独立,互相会造成影响
A、B独立 => A、B肯定是相容的,能同时发生
A、B、C两两独立 P(AB)=xx P(BC)=xx P(AC)=xx
A、B、C相互独立,在两两基础上,再满足P(ABC) = P(A)P(B)P(C)
伯努利模型
扔硬币,n次试验,只有2种结果,正面的概率为P
则K次正面的概率是Ckn * P^K *(1-P)^(n-k) 从n次中选出k次,k次是正的,其余的必须是反的
二 随机变量及分布
随机变量:把扔硬币这种正反面的样本点,用变量表示 X={0,1}
概率分布:用来表示离散型随机变量的概率
假如k可以取1,2,3…,则P{X = k} = Pk,也能用表格来表示
{X=k1}、{X=k2}…这些事件是完备事件组,概率和为1
例题 P{X=k} = (1/2)^k能不能写成概率分布,(证明概率和为1)
常见的离散分布
0-1分布:
扔硬币这类只有2种结果的
二项分布:
伯努利模型中,n次发生k次的概率P(k)满足二项式公式 ,记作XB(n,p),如XB(5,0.1)有2个参数做n次,每次发生的概率0.1
1 当n = 1时,只有P(0)和P(1)2种结果,是0-1分布
2 概率和 = (p+q)^n = 1 (二项式的和就是p+q的n次方的展开式)
3 概率取最大值的项是中间项
泊松分布
X~P{X=k} = λ^k * e^-λ /k! 其中λ>0,只有这1个参数
1 概率和是 1
例题,医院平均每小时来电λ=5个,而每个人打进电话是独立的,那么就可以计算某一小时内接到k=3个、k=10个的概率
2 泊松定理
由于二项分布难计算,当二项分布满足n>100,p≤0.05时,可以用泊松分布近似计算,λ=np
当n越大,p越小,且np稳定时,二项分布的概率计算会无限接近泊松分布
几何分布
射箭,第k次射中的概率
P(k) = (1-p)^(k-1) * p 这本质上是一个等比数列
等比数列求和Sn = a1 * (1-r^n) / (1-r)
等比数列最早被称为几何级数
超几何分布
N分2类N1,N2,从中选n个,事件X:从N1中选k个的概率,可知k<=min{n,N1},(其实k<=n即可,超过N1时概率都是0而已)
P{X=k} = CkN1 * C(n-k)N2 /CnN
该计算较难,用二项分布来近似计算,当N越大,n越小时,可以近似计算
超几何分布的本质是 “不放回抽样”,因此每次试验的概率不独立(比如抽走 1 粒不发芽种子后,下一粒不发芽的概率会略微下降)
;而二项分布的本质是 “有放回抽样”,每次试验概率独立。
但当 总体规模 N 远大于样本规模 n 时(通常要求 N≥10n ),“不放回” 对概率的影响会小到可以忽略
分布函数
X是随机变量,F(x) = P{ X<x }是分布函数
性质(对离散型和连续型都成立)
1 0 ≤ F(x) ≤ 1
2 是不减函数,任取x1<x2,则 F(x1) ≤ F(x2)
3 F(x)是右连续的,F(x+0) = F(x)
注意≤和<,离散型包含和不包含至关重要
若a<b,则
P{a< x ≤b} = F(b) - F(a)
P{ x>a } = 1- P{x≤a} = 1-F(a)
P{ x<a } = P{x≤a} - P{x=a}
三 多维随机变量及分布
四 随机变量的数字特征-期望方差相关系数
五 大数定律和中心极限定理
六 数理统计-样本抽样
七 参数估计
八 假设检验
