(已完结)概统笔记

顺便用作练习.

成绩分布

卷面成绩:50%

平时成绩:50%

  • 平时作业
  • 期中+小测
  • 非标
  • 随堂表现

特点

  • 理解性、记忆性

  • 微积分功底

  • 题型固定

概率部分

概率论基础

等表示事件

表示A的对立事件(对立是互斥的充分条件)

发生B后再发生A的概率,其中

全概率公式:设为完备事件组,则

贝叶斯公式:设为完备事件组,则,即贝叶斯公式是乘法公式与全概率公式的组合。

,则独立,同时也独立。

二项分布概率:

多项分布:某随机实验如果有种可能的结果,它们出现的概率是。在N随机试验的结果中,分别将的出现次数记为随机变量,那么出现次、出现次……出现次这种事件发生的概率是

随机变量及其分布(背)

随机变量是一个函数,其中是样本空间,是样本空间到实数的映射。

分布函数,其定义域为,非严格单增(左极限为0,右极限为1),右连续。

密度函数 满足

连续时,可简化为。有.

求概率的问题可以转化为概率密度函数的积分:.

非连续分布

几何分布与超几何分布略去.

二项分布:,

二项分布的图像是单峰的,由于

,故最靠近时易得最值.

泊松分布:,

泊松分布相当于对的泰勒展开各项之和归一化.

泊松定理:二项分布以泊松分布为极限分布.具体而言, 对于,当n足够大时(>=100),我们可以近似把它看作,其中

连续分布

均匀分布(uniform distribution)

指数分布(exponential)

伽马分布(gamma distribution)

随机变量函数的分布Y=f(X)型题目的做法

以求密度函数为例:

  • 求出对应的值域
  • 解出,把替换成
  • 求导得到

对于某些需要分类讨论的题目:

  • 求出对应的值域,并找到分段点
  • 在该区间内解不等式,解得,解
  • 求导得到,汇总结果

注意求积分时需要注意一下分布函数的连续性.

多(二)维随机变量及其分布

二维离散型随机变量分布

就是一个所有项和为1的表,没啥说的,求概率就是把对应位置的概率加起来就行。

边缘分布:

条件分布律:

二维连续型随机变量分布

相当于求二重积分,需要注意积分的定义域。

通常会利用定义域内积分和为1的性质求参数,然后重新求指定区域的二重积分来求概率。

二维分布函数与密度函数:

边缘密度:

条件分布函数:

  • (另一半懒得写了)

常见题型:

一个密度、两个条件、两个边缘

  • 已知一个密度,求剩下四个。
  • 已知一个条件与对应的边缘,求剩下三个。

已知二维密度函数,求的密度函数

  • 确定的有效区间
  • 计算,注意分类讨论
  • 求导得到密度函数

卷积再见

独立,则

独立,则

数学期望

数学期望的定义

离散变量的期望:

连续变量的期望:

当级数的和(或积分)绝对收敛时,数学期望存在。

对于二维的情况,还可以这样算:

随机变量函数的期望

数学期望的性质

独立,则

方差

方差的定义

标准差为

方差的性质

独立时,

独立时,

,但这不意味着(同:概率为1的事件不一定是必然事件)

变异系数:

常见分布的期望与方差(背)

原点矩与中心矩

因此方差是二阶中心矩。

协方差与相关系数

协方差的定义

证明与方差类似,此略

协方差的性质

独立,则

证明:显然由期望的性质可得。

由此可证若独立,

随机变量的标准化

其期望为0,方差为1,没有量纲。

相关系数的定义(背)

相关系数

显然不能为常数

相关系数需要计算五个期望:

相关系数的性质

时,,即正相关。

时,,即负相关。

表明不相关,是独立的必要条件。

如果要证明不独立,应选取合适的区间,使

正态分布

标准正态分布

偶函数,钟形曲线。

考试算概率时经常用这两个性质,并且应保留而不是作为答案(或查表)。

正态分布

,则,故

求导可得

关系到图象的左右平移(期望),关系到图象“尖”的程度(标准差)。

多个独立正态分布的线性组合还是正态分布。

特别的,如果它们都是,其平均值为

二维正态分布

特殊情况:

一般情况(含相关系数):

对二维正态分布而言,其边缘分布与条件分布是正态分布。同时,不相关与独立性是等价的。

自然指数分布族

常见分布中除了均匀分布均可化成这种形式。

其均值参数(期望)为,方差函数为

极限定理

切比雪夫不等式

大数律

随机变量序列,考虑均值

,则服从大数律。

  • 切比雪夫大数律:

充要条件是随机变量的方差一致有界,即有常数,使 即可满足符合大数律。

  • 独立同分布大数律:

只要独立同分布,且即可保证符合大数律。

  • 伯努利大数律:

,则

中心极限定理

独立同分布,则 近似服从正态分布。

可得近似服从近似服从

,若

近似服从

统计部分

常见分布

卡方分布——正态平方和

正态分布的平方和。

服从自由度为分布,即

,故

卡方分布满足可加性。

t分布——正态比一个数

分布与正态分布相似,但尾巴比正态分布更厚。

F分布——正态平方和相比

常见统计量

样本均值

样本方差

(注意是n-1,不是n)

抽样分布定理

其一(已知方差)

样本来自,则

独立。

其二(已知均值)

样本来自,则

其三(多个整体)

概统成功变成了文科

则,

> 其中

则,

点估计

矩估计

设样本均值与期望函数(也可以是平方期望)相等,把期望函数的参数用期望值表示得到,然后将代入得到

极大似然估计

离散型:写出观测事件发生概率关于参数的函数(通常是某种离散分布的乘积),假设该函数为函数的最大值。通过求解对数极大似然方程的解得到对应的参数.

连续型:取的函数应为,注意这里把按常数看待,以下步骤相同。

极大似然估计值是的最大值,极大似然估计量是的最大值。

估计量评选标准

无偏估计量:估计值的平均值,反之为有偏估计量。

渐进无偏估计量:

有效性标准:若更有效。

一致性标准: 则称为的一致估计量。

均方误差标准:在均方误差下比更有效。

具体而言,在均方误差下比更有效。

区间估计(背)

只针对正态分布

双侧置信

估计的置信区间。

已知,则为

未知,则为

估计的置信区间。

单侧置信

估计的置信区间。

已知,则单侧置信下限为,上限为

未知,则单侧置信下限为,上限为

估计的置信区间。

单侧置信下限为,上限为

假设检验

过程

带有概率性质的反证法

  1. 先写出原假设和备择假设
  2. 成立的前提下,构造样本满足的分布。
  3. 通过的值求出对应的拒绝域
  4. 代入观测值,如果,就拒绝原假设。

弃真取伪及概率计算

  • 弃真:成立时,样本值
  • 取伪:成立时,样本值

第一类错误的概率小于等于

第二类错误的概率为

不能同时减小。但可以通过固定其中一个,增加样本量,减小另一个。具体减小哪一个取决于后果的严重程度。