预备知识

1
2
3
加法原理 北京->上海(火车3种,飞机2种) 3+2
乘法原理 北京->上海->广州(北上3种,上广2种) 3*2
排列组合(从n个不同数中选m个,排列成一个数字) 排列Amn=n(n-1)...(n-m+1) 组合Cmn=Amn/m!

一 随机事件与概率

1
2
3
4
5
随机试验的性质:可重复性、多结果性、不确定性
样本空间:可能出现的结果的集合Ω
样本点:某个结果元素ω
必然事件-筛子得到1-6、基本事件-筛子得到1、
随机事件-筛子得到123(是Ω的子集)、不可能事件-筛子得到7
事件运算
1
2
3
4
5
6
7
1事件的包含A ⊂ B,A发生则B必发生
A ∪ B, A或者B发生
事件的并A+B、交AB、差A-B = A-AB = A(B否) ,B否是B上一个横线,表示全集中不包含B的其他部分
5事件的互斥(不相容)AB=∅,A和B不会同时发生
6对立事件 A∪B = Ω 且 A∩B = ∅ ,A的对立事件即 A否 = Ω-A
7完备事件组 A B C 互斥 且 A∪B∪C = Ω
集合的运算律:交换律、结合律、分配律、对偶律
频率概率
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
频率:100次扔硬币,45此朝上,则频率 = 45/100
概率:对应随机事件E,样本空间Ω,对于基本事件A对应的实数(发生几率) 即概率P(A)
概率的性质:
非负性、规范性P(Ω)=1、事件互斥
1 不可能发生的事件 => P(∅)=0,反之不成立,概率为0的事件也有可能发生,如0-1有无穷多个点,出现在0.8的概率为无穷小0,但还是有可能出现在0.8
2 A、B不相容 => P(A+B) = P(A) + P(B),反之不成立
证明:不管A、B是否不相容,P(A+B) = P(A) + P(B) - P(AB)是始终成立的
当P(A+B) = P(A) + P(B)时,P(AB)=0
由于P(AB) = 0 推不出AB是不可能发生的事件,因此推不出A、B互斥
3 P(A) + P(A否) =1
4 A⊃B => P(A-B) = P(A) - P(B) 或 P(A-B) = P(A) - P(AB)
5 P(A∪B) = P(A) + P(B) - P(AB)
P(A∪B∪C) = P(A) + P(B) +P(B) -P(AB)-P(BC)-P(AC) + P(ABC)
这些都和集合运算一样,只需要记住P(∅)=0概率为
0推不出是必不可发生的事件
古典概率模型

特点:有限个样本点、等可能性
例题:n个人住N间房,总的可能性为S = N的n次方
1 指定的n间房各住1人的概率 n!/S
2 任意的n间房各住1人的概率,先选n个房 CnN * n!/S
3 指定的某间房里有k个人的概率,先选k个人Ckn,其余人在N-1个房里随便住P = (N-1)的(n-k)次方,因此概率为Ckn * P / S

几何概型

和长度、面积、体积相关的概率:一个圆,扔进左半圆的概率1/2
A、B约好在一个小时内见面,先到的人会等15分钟,之后就离开了,假设来的时间上是等可能的,求能见到面的概率
解:x轴是A到的时间、y轴是B到的时间,求|x-y|<15的面积(构建几何模型)

条件概率

在A已发生的条件下,求B的概率 P(B/A) = P(AB)/P(A)
扔3次硬币,A:扔了1次正,B:求至少2次正的概率
(A通常会对B造成影响,B原来样本空间是1,但由于A发生导致样本空间变少)

P(B/A)>=0废话 p(Ω/A)=1废话
B、C不相容时,P(B+C)/P(A) = P(B/A) +P(C/A)
没说不相容时,P(B+C)/P(A) = P(B/A) +P(C/A) - P(BC)/P(A)

乘法公式

P(AB) = P(A)P(B/A)
求AB同时发生的概率,可以拆成求2步的概率
P(ABC) = P(A)P(B/A)(C/AB)

总共扔3个硬币,
有1枚朝上的概率是3/8,有2枚朝上的概率也是3/8,注意这里1枚和2枚不是A、B这种先后发生的情况,而是结果,1枚和2枚属于互斥事件,因此不适用乘法公式
第1枚朝上的概率为1/2,在已发生情况下,第2枚朝上的概率1/2,因此前2枚朝上的概率满足乘法公式2/8 = 1/2 *1/2
这里B是独立事件P(B/A) = P(B),此时P(AB) = P(A)P(B),如果不是独立事件,则不成立

全概率公式

A、B、C是完备事件组,D是求的全概率,D可以理解为矩形分了3块,求D和A、B、C分别相交的和
P(D) = P(A)P(D/A) +P(B)P(D/B) + P(C)P(D/C)

甲生产60%良品率90%,乙生产40%良品率80%,求总的良品率
理解:甲生产为A,乙生产为B, D和A相交的部分占A的90%,D和B相交的部分占B的80%
P(D) = 0.60.9 +0.40.8

ps:P(D/A)表示AD相交的块占A的概率,P(A/D)表示AD相交的块占D的概率

贝叶斯公式

A1、A2、A3完备事件组,D是全概率 ,K表示A1A2A3中任意某个事件
P(K/D) = P(KD)/P(D) = P(K)P(D/K) / [P(A1)P(D/A1) +P(A2)P(D/A2) + P(A3)P(D/A3)]

例题:检验单误差是0.95(有病0.95阳性,无病0.95阴性的准确率),该地区发病率是0.005,
问检查出阳性时,1他确实有病的概率 2他复查还是阳性的概率 3如果复查还是阳性,他真有病的概率 (假设检查1000个人)
有病的概率P(A1) = 0.005,5个人;无病的概率P(A2) = 0.995,995个人
检查阳性的概率P(B) = 0.0050.95 + 0.9950.05 ,分别会查出4.75和49.75个阳人

求他有病的概率P(A1/B) = P(A1B)/P(B) = P(A1)P(B/A1)/P(B) = 4.75/(4.75+49.75) = 8.7%
复查阳性概率8.7% *0.95 + 91.3%*0.05 = 12.8%
复查阳性时他真有病的概率8.7% *0.95 / 12.8% = 64.5%

全概率公式用于 “由因求果”(已知原因概率,求结果概率),贝叶斯公式用于 “由果求因”(已知结果概率,反推原因概率)

事件的独立性

A发生情况下,P(B)=P(B/A),称B对A独立 (A对B造不成影响)
如果A、B相互都独立,则称为独立事件 P(AB) = P(A)P(B)
1 不可能事件∅与任意事件互相独立
2 Ω与A是相互独立的
3 A、B独立,则A与B否,A否与B否都是独立的
4 A的概率为1,则与B是独立的 (概率是1不一定是Ω,直线可以少个点)

A、B互不相容是交集为空,但A、B独立可以同时发生,只是相互不影响
A、B互斥 => A、B肯定不独立,互相会造成影响
A、B独立 => A、B肯定是相容的,能同时发生

A、B、C两两独立 P(AB)=xx P(BC)=xx P(AC)=xx
A、B、C相互独立,在两两基础上,再满足P(ABC) = P(A)P(B)P(C)

伯努利模型

扔硬币,n次试验,只有2种结果,正面的概率为P
则K次正面的概率是Ckn * P^K *(1-P)^(n-k) 从n次中选出k次,k次是正的,其余的必须是反的

二 随机变量及分布

随机变量:把扔硬币这种正反面的样本点,用变量表示 X={0,1}

概率分布:用来表示离散型随机变量的概率
假如k可以取1,2,3…,则P{X = k} = Pk,也能用表格来表示
{X=k1}、{X=k2}…这些事件是完备事件组,概率和为1
例题 P{X=k} = (1/2)^k能不能写成概率分布,(证明概率和为1)

常见的离散分布

0-1分布:

扔硬币这类只有2种结果的

二项分布:

伯努利模型中,n次发生k次的概率P(k)满足二项式公式 ,记作XB(n,p),如XB(5,0.1)有2个参数做n次,每次发生的概率0.1
1 当n = 1时,只有P(0)和P(1)2种结果,是0-1分布
2 概率和 = (p+q)^n = 1 (二项式的和就是p+q的n次方的展开式)
3 概率取最大值的项是中间项

泊松分布

X~P{X=k} = λ^k * e^-λ /k! 其中λ>0,只有这1个参数
1 概率和是 1
例题,医院平均每小时来电λ=5个,而每个人打进电话是独立的,那么就可以计算某一小时内接到k=3个、k=10个的概率
2 泊松定理
由于二项分布难计算,当二项分布满足n>100,p≤0.05时,可以用泊松分布近似计算,λ=np
当n越大,p越小,且np稳定时,二项分布的概率计算会无限接近泊松分布

几何分布

射箭,第k次射中的概率
P(k) = (1-p)^(k-1) * p 这本质上是一个等比数列
等比数列求和Sn = a1 * (1-r^n) / (1-r)
等比数列最早被称为几何级数

超几何分布

N分2类N1,N2,从中选n个,事件X:从N1中选k个的概率,可知k<=min{n,N1},(其实k<=n即可,超过N1时概率都是0而已)
P{X=k} = CkN1 * C(n-k)N2 /CnN
该计算较难,用二项分布来近似计算,当N越大,n越小时,可以近似计算

超几何分布的本质是 “不放回抽样”,因此每次试验的概率不独立(比如抽走 1 粒不发芽种子后,下一粒不发芽的概率会略微下降)
;而二项分布的本质是 “有放回抽样”,每次试验概率独立。
但当 总体规模 N 远大于样本规模 n 时(通常要求 N≥10n ),“不放回” 对概率的影响会小到可以忽略

分布函数

X是随机变量,F(x) = P{ X<x }是分布函数
性质(对离散型和连续型都成立)
1 0 ≤ F(x) ≤ 1
2 是不减函数,任取x1<x2,则 F(x1) ≤ F(x2)
3 F(x)是右连续的,F(x+0) = F(x)

注意≤和<,离散型包含和不包含至关重要
若a<b,则
P{a< x ≤b} = F(b) - F(a)
P{ x>a } = 1- P{x≤a} = 1-F(a)
P{ x<a } = P{x≤a} - P{x=a}

三 多维随机变量及分布
四 随机变量的数字特征-期望方差相关系数
五 大数定律和中心极限定理
六 数理统计-样本抽样
七 参数估计
八 假设检验