(已完结)概统笔记
顺便用作
成绩分布
卷面成绩:50%
平时成绩:50%
- 平时作业
- 期中+小测
- 非标
- 随堂表现
特点
理解性、记忆性
微积分功底
题型固定
概率部分
概率论基础
用
发生B后再发生A的概率
全概率公式:设
贝叶斯公式:设
若
二项分布概率:
多项分布:某随机实验如果有
种可能的结果 ,它们出现的概率是 。在N随机试验的结果中,分别将 的出现次数记为随机变量 ,那么 出现 次、 出现 次…… 出现 次这种事件发生的概率是
, 其 中
随机变量及其分布(背)
随机变量
分布函数
密度函数
当
求概率的问题可以转化为概率密度函数的积分:
非连续分布
几何分布与超几何分布略去.
二项分布:
二项分布的图像是单峰的,由于
,故 最靠近 时易得最值.
泊松分布:
泊松分布相当于对
的泰勒展开各项之和归一化. 泊松定理:二项分布以泊松分布为极限分布.具体而言, 对于
,当n足够大时(>=100),我们可以近似把它看作 ,其中
连续分布
均匀分布(uniform distribution)
指数分布(exponential)
伽马分布(gamma distribution)
随机变量函数的分布Y=f(X)型题目的做法
以求密度函数
- 求出
对应的值域 - 将
用 解出,把 替换成 - 对
求导得到
对于某些需要分类讨论的题目:
- 求出
对应的值域,并找到分段点 - 在该区间内解不等式,解得
,解 - 对
求导得到 ,汇总结果
注意求积分
多(二)维随机变量及其分布
二维离散型随机变量分布
就是一个所有项和为1的表,没啥说的,求概率就是把对应位置的概率加起来就行。
边缘分布:
条件分布律:
二维连续型随机变量分布
相当于求二重积分,需要注意积分的定义域。
通常会利用定义域内积分和为1的性质求参数,然后重新求指定区域的二重积分来求概率。
二维分布函数与密度函数:
边缘密度:
条件分布函数:
(另一半懒得写了)
常见题型:
一个密度、两个条件、两个边缘
- 已知一个密度,求剩下四个。
- 已知一个条件与对应的边缘,求剩下三个。
已知二维密度函数
, ,求 的密度函数
- 确定
的有效区间 - 计算
,注意分类讨论 - 对
求导得到密度函数
卷积再见若
且 独立,则 若
且 独立,则
数学期望
数学期望的定义
离散变量的期望:
连续变量的期望:
当级数的和(或积分)绝对收敛时,数学期望存在。
对于二维的情况,还可以这样算:
随机变量函数的期望
数学期望的性质
若
方差
方差的定义
设
,
标准差为
方差的性质
当
当
变异系数:
常见分布的期望与方差(背)
原点矩与中心矩
因此方差是二阶中心矩。
协方差与相关系数
协方差的定义
证明与方差类似,此略
协方差的性质
若
证明:显然由期望的性质可得。
由此可证若
与 独立,
随机变量的标准化
其期望为0,方差为1,没有量纲。
相关系数的定义(背)
相关系数
显然
相关系数需要计算五个期望:
即
相关系数的性质
当
当
如果要证明
正态分布
标准正态分布
偶函数,钟形曲线。
考试算概率时经常用这两个性质,并且应保留
而不是 作为答案(或查表)。
正态分布
因
求导可得
关系到图象的左右平移(期望), 关系到图象“尖”的程度(标准差)。
多个独立正态分布的线性组合还是正态分布。
特别的,如果它们都是
,其平均值为
二维正态分布
特殊情况:
一般情况(含相关系数):
对二维正态分布而言,其边缘分布与条件分布是正态分布。同时,不相关与独立性是等价的。
自然指数分布族
常见分布中除了均匀分布均可化成这种形式。
其均值参数(期望
极限定理
切比雪夫不等式
大数律
随机变量序列
若
- 切比雪夫大数律:
充要条件是随机变量的方差一致有界,即有常数
- 独立同分布大数律:
只要
- 伯努利大数律:
中心极限定理
可得
设
,若
即
近似服从
统计部分
常见分布
卡方分布——正态平方和
正态分布
卡方分布满足可加性。
t分布——正态比一个数
分布与正态分布相似,但尾巴比正态分布更厚。
F分布——正态平方和相比
常见统计量
样本均值
样本方差
抽样分布定理
其一(已知方差)
样本
且
其二(已知均值)
样本
其三(多个整体)
概统成功变成了文科
若
若
点估计
矩估计
设样本均值与期望函数(也可以是平方期望)相等,把期望函数的参数
极大似然估计
离散型:写出观测事件发生概率关于参数
连续型:取的函数应为
极大似然估计值是
估计量评选标准
无偏估计量:估计值的平均值
渐进无偏估计量:
有效性标准:若
一致性标准:
均方误差标准:
具体而言,
在均方误差下比 更有效。
区间估计(背)
只针对正态分布
双侧置信
估计
若
若
估计
单侧置信
估计
若
若
估计
单侧置信下限为
假设检验
过程
带有概率性质的反证法
- 先写出原假设
和备择假设 。 - 在
成立的前提下,构造样本满足的分布。 - 通过
的值求出对应的拒绝域 。 - 代入观测值
,如果 ,就拒绝原假设。
弃真取伪及概率计算
- 弃真:
成立时,样本值 。 - 取伪:
成立时,样本值 。
第一类错误的概率
第二类错误的概率为