(已完结)概统笔记
顺便用作练习.
成绩分布
卷面成绩:50%
平时成绩:50%
特点
概率部分
概率论基础
用等表示事件
表示A的对立事件(对立是互斥的充分条件)
发生B后再发生A的概率,其中
全概率公式:设为完备事件组,则
贝叶斯公式:设为完备事件组,则,即贝叶斯公式是乘法公式与全概率公式的组合。
若,则独立,同时、、也独立。
二项分布概率:
多项分布:某随机实验如果有种可能的结果,它们出现的概率是。在N随机试验的结果中,分别将的出现次数记为随机变量,那么出现次、出现次……出现次这种事件发生的概率是
,其中
随机变量及其分布(背)
随机变量是一个函数,其中是样本空间,是样本空间到实数的映射。
分布函数,其定义域为,非严格单增(左极限为0,右极限为1),右连续。
密度函数 满足
当连续时,可简化为。有且.
求概率的问题可以转化为概率密度函数的积分:.
非连续分布
几何分布与超几何分布略去.
二项分布:,
二项分布的图像是单峰的,由于
,故最靠近时易得最值.
泊松分布:,
泊松分布相当于对的泰勒展开各项之和归一化.
泊松定理:二项分布以泊松分布为极限分布.具体而言, 对于,当n足够大时(>=100),我们可以近似把它看作,其中
连续分布
均匀分布(uniform distribution)
指数分布(exponential)
伽马分布(gamma distribution)
随机变量函数的分布Y=f(X)型题目的做法
以求密度函数为例:
- 求出对应的值域
- 将用解出,把替换成
- 对求导得到
对于某些需要分类讨论的题目:
- 求出对应的值域,并找到分段点
- 在该区间内解不等式,解得,解
- 对求导得到,汇总结果
注意求积分时需要注意一下分布函数的连续性.
多(二)维随机变量及其分布
二维离散型随机变量分布
就是一个所有项和为1的表,没啥说的,求概率就是把对应位置的概率加起来就行。
边缘分布:
条件分布律:
-
-
二维连续型随机变量分布
相当于求二重积分,需要注意积分的定义域。
通常会利用定义域内积分和为1的性质求参数,然后重新求指定区域的二重积分来求概率。
二维分布函数与密度函数:
边缘密度:
条件分布函数:
-
(另一半懒得写了)
-
常见题型:
一个密度、两个条件、两个边缘
- 已知一个密度,求剩下四个。
- 已知一个条件与对应的边缘,求剩下三个。
已知二维密度函数,,求的密度函数
- 确定的有效区间
- 计算,注意分类讨论
- 对求导得到密度函数
卷积再见
若且独立,则
若且独立,则
数学期望
数学期望的定义
离散变量的期望:
连续变量的期望:
当级数的和(或积分)绝对收敛时,数学期望存在。
对于二维的情况,还可以这样算:
随机变量函数的期望
数学期望的性质
若与独立,则
方差
方差的定义
设,
标准差为
方差的性质
当独立时,
当独立时,
,但这不意味着(同:概率为1的事件不一定是必然事件)
变异系数:
常见分布的期望与方差(背)
原点矩与中心矩
因此方差是二阶中心矩。
协方差与相关系数
协方差的定义
证明与方差类似,此略
协方差的性质
若与独立,则
证明:显然由期望的性质可得。
由此可证若与独立,
随机变量的标准化
其期望为0,方差为1,没有量纲。
相关系数的定义(背)
相关系数
显然不能为常数
相关系数需要计算五个期望:
即
相关系数的性质
当时,,即正相关。
当时,,即负相关。
表明不相关,是独立的必要条件。
如果要证明不独立,应选取合适的区间,使
正态分布
标准正态分布
偶函数,钟形曲线。
考试算概率时经常用这两个性质,并且应保留而不是作为答案(或查表)。
正态分布
因,则,故
求导可得
关系到图象的左右平移(期望),关系到图象“尖”的程度(标准差)。
多个独立正态分布的线性组合还是正态分布。
特别的,如果它们都是,其平均值为
二维正态分布
特殊情况:
一般情况(含相关系数):
对二维正态分布而言,其边缘分布与条件分布是正态分布。同时,不相关与独立性是等价的。
自然指数分布族
常见分布中除了均匀分布均可化成这种形式。
其均值参数(期望)为,方差函数为
极限定理
切比雪夫不等式
大数律
随机变量序列,考虑均值,
若 ,则服从大数律。
充要条件是随机变量的方差一致有界,即有常数,使 即可满足符合大数律。
只要独立同分布,且,即可保证符合大数律。
,则
中心极限定理
独立同分布,则 近似服从正态分布。
可得近似服从,近似服从
设,若
即近似服从
统计部分
常见分布
卡方分布——正态平方和
正态分布的平方和。
服从自由度为的分布,即
,故
卡方分布满足可加性。
t分布——正态比一个数
分布与正态分布相似,但尾巴比正态分布更厚。
F分布——正态平方和相比
常见统计量
样本均值
样本方差
(注意是n-1,不是n)
抽样分布定理
其一(已知方差)
样本来自,则
且与独立。
其二(已知均值)
样本来自,则
其三(多个整体)
概统成功变成了文科
若则,
其中
若则,
点估计
矩估计
设样本均值与期望函数(也可以是平方期望)相等,把期望函数的参数用期望值表示得到,然后将代入得到。
极大似然估计
离散型:写出观测事件发生概率关于参数的函数(通常是某种离散分布的乘积),假设该函数为函数的最大值。通过求解对数极大似然方程的解得到对应的参数.
连续型:取的函数应为,注意这里把按常数看待,以下步骤相同。
极大似然估计值是的最大值,极大似然估计量是的最大值。
估计量评选标准
无偏估计量:估计值的平均值,反之为有偏估计量。
渐进无偏估计量:
有效性标准:若则比更有效。
一致性标准: 则称为是的一致估计量。
均方误差标准:则在均方误差下比更有效。
具体而言,在均方误差下比更有效。
区间估计(背)
只针对正态分布
双侧置信
估计的的置信区间。
若已知,则为
若未知,则为
估计的的置信区间。
单侧置信
估计的的置信区间。
若已知,则单侧置信下限为,上限为
若未知,则单侧置信下限为,上限为
估计的的置信区间。
单侧置信下限为,上限为
假设检验
过程
带有概率性质的反证法
- 先写出原假设和备择假设。
- 在成立的前提下,构造样本满足的分布。
- 通过的值求出对应的拒绝域。
- 代入观测值,如果,就拒绝原假设。
弃真取伪及概率计算
- 弃真:成立时,样本值。
- 取伪:成立时,样本值。
第一类错误的概率小于等于。
第二类错误的概率为。
与不能同时减小。但可以通过固定其中一个,增加样本量,减小另一个。具体减小哪一个取决于后果的严重程度。