编辑点评:应用数理统计施雨课后题答案
应用数理统计本书比较系统地介绍了数理统计的基本概念、原理和方法。全书分为6章,内容包括数理统计的基本概念、参数估计、假设检验、方差分析和正交试验设计等内容,小编今天给大家带来的是本书的课后习题答案,有需要的欢迎下载借鉴
相关内容部分预览
内容简介
本书比较系统地介绍了数理统计的基本概念、原理和方法。全书分为6章,内容包括数理统计的基本概念、参数估计、假设检验、方差分析和正交试验设计,
回归分析以及统计决策理论与贝叶斯推断中的基本知识。各章均配有适量的习题。
本书适合作为高等院校工学、经管学科的研究生教材、也可作为理科高年级本科生教材。
数理统计知识点概要
大数定律
假设每次独立重复的去做一个试验(比如掷骰子)当试验次数足够大的时候,每一个子事件发生的频率都会无限的接近它的概率(比如扔了100000次骰子,那么你扔出1的次数估计在16666次左右)。大数定律证明了这种现象的客观真实性。
下面是两种大数定律。
弱大数定理(Khinchin):
设 [公式] 为相互独立且服从同一分布的随机变量序列,且具有数学期望 [公式] ,作前n个变量的算术平均值 [公式] ,那么对于 [公式] ,有
[公式]
这个公式的字面意思非常好理解,就是说n无穷大的时候,这个统计量(统计量的定义在之后会提到)会和 [公式] 无限接近。毕竟 [公式] 是 [公式] 的无偏估计(简单理解为就是具有无偏性,无偏性是一个我们可以使用这个统计量来估算一个概率分布中的 [公式] 的理由。)。
如果这么解释没看懂的话,你可能需要复习一下极限的定义和关于均值等的一些定义。
我们给出它的证明,进而复习一下期望和方差函数。
且慢!我们要先给个之后要用到,本身也比较重要的引理。
[公式] [公式] [公式] [公式] [公式][公式] [公式]
回到原来的证明。
首先我们需要假设方差存在(统一的证明方法需要采用特征函数法和泰勒公式(需要用一些傅里叶分析)),设 [公式] ,那么由于
[公式]
(其中用到的性质有 [公式] )
所以我们结合Chebyshev不等式,有
[公式]
所以我们只需要令 [公式] ,就可以得到我们的结论(夹逼定理),证毕。
对更加统一的证明方法感兴趣的可以参考
Law of large numbers
根据第一个定理就可以得到下面的推论
Corollary:Bernoulli大数定理:
设 [公式] 为n次独立重复试验中事件A发生的次数,p为事件A在每次试验中发生的概率,那么对于 [公式] ,有
[公式]
这里不再证明。
中心极限定理
这个定理是想告诉我们:大量的相互独立的随机因素的综合影响形成的结果往往近似的服从正态分布。由于证明需要特征函数法,这里略去不谈。
独立同分布的中心极限定理:
设随机变量 [公式] 相互独立且服从统一分布,有 [公式] ,那么随机变量之和 [公式] 的标准化变量 [公式] 的分布函数 [公式] 有
[公式]
(标准化: [公式] ,比如服从正态分布 [公式] 的random variance标准化后服从 [公式] )
下面是一个推论
De Moivre-Laplace Theorem:
设随机变量 [公式] 服从参数为n,p(0<p<1)的二项分布,则对于任意x,有
[公式]
联想一下二项分布的均值和方差,就不难理解这个公式了。
这一方面的统一证明可以参考这个
Central limit theorem
分位数和异常值
我们在之前和大家说过箱线图,箱线图涉及到的两个概念这里和大家再解释一遍。
我们假设存在一个样本 [公式] ,样本p分位数(0<p<1)我们记为 [公式] ,我们要求它具有以下的性质。
至少有np个观察值小于等于 [公式]
至少有n(1-p)个观察值大于等于 [公式]
根据这个要求,我们数学上规定
[公式]
比如说一个样本有18个元素,那么 [公式] 就是第4个元素(因为18*0.2=3.6,[3.6]+1=4), [公式] 就是第9和第10个元素的平均值(也就是中位数)。
所以箱线图的几个数据就是 [公式] , [公式] , [公式]
异常值在箱线图中被定义为小于 [公式] 和大于 [公式] 的数据,其中 [公式] 。在箱线图中会被以特殊符号标记。
常见统计量一览
我们首先给出统计量的定义。
Definition: 设 [公式] 为来自于总体X的一个样本, [公式] 为 [公式] 的函数,如果g中不含未知参数,则其被称为是一个统计量。
常见的统计量列举如下
[公式] (样本平均值)
[公式] (样本方差)
[公式] (样本标准差)
[公式] (k阶原点矩)
[公式] (k阶中心矩)
我们只需要把对应的观察值 [公式] 替换回去,就可以得到每一个统计量的对应的样本观察值的表达式,此处略。
很多人可能会问样本方差的分母为什么会是n-1,这与我们高中学的那种方差似乎不太一样,这里主要是考虑到无偏性。
无偏性:
对于一个参数 [公式] 的估计量 [公式] ,如果满足条件 [公式] ,那么就说这个估计是无偏的。
在工业上我们可以理解为无系统偏差。
那么对于样本方差,我们取均值看一下
[公式]
[公式]
(其中根据均值与方差的关系和中心极限定理,有
[公式] )
这就是样本方差的由来。
也有老师(比如我们的萌萌的概统老师)会使用自由度的方法来解释n-1这个分母的由来。anyway,关键是理解,理解就好。
三大抽样分布
我们在做统计推断的时候,总是不可避免的需要使用这些抽样统计量,来描述样本的分布。常见的抽样分布都是基于正态分布的样本的。
卡方分布( [公式] )
Definition:
设 [公式] 为来自总体N(0,1)的样本,则称统计量
[公式]
服从自由度为n的 [公式] 分布(念为卡方分布),记为 [公式]
这里给出卡方分布的密度函数图像
我们不加证明的给出它的一系列性质
可加性:设 [公式] 且 [公式] 相互独立,那么有 [公式]
假设 [公式] ,那么[公式]
上 [公式] 分位点:对于给定的正数 [公式] , [公式] ,称满足条件 [公式] 的点 [公式] 为分布的上 [公式] 分位点。
Fisher:当n充分大的时候,近似的有 [公式] ,其中 [公式] 为标准正态分布的上 [公式] 分位点。实际情况下一般在n>40的时候使用。
t分布
Definition: 设 [公式] ,且 [公式] 相互独立,那么我们称随机变量
[公式] 服从自由度为n的t分布,也叫学生氏分布。
这个公式可以理解为:分子服从正态分布,分母服从标准化后的卡方分布。
我们也可以同理定义t分布的分位点。这里不再详述
这里给出t分布的密度函数图像
下面是它的主要性质:
[公式]
[公式]
[公式]
F分布
Definition:
设 [公式] ,且 [公式] 相互独立,则称随机变量
[公式] 服从自由度为 [公式] 的 [公式] 分布,记为 [公式]
这个公式相当于在t分布的基础上又增加了一步:分子是标准化的卡方分布,分母也是标准化的卡方分布。
下面为F分布的图像
我们同理可以定义F分布的分位点。
下面给出F分布的性质
[公式]
[公式]
小结
本节中主要概述了统计学的奠基——大数定律与中心极限定理,以及一些基本的概念,最后还引入了抽样统计量和三大抽样分布。
事实上三大抽样分布可以使用R语言计算对应的数值,同样也是之后抽样分布定理的基础,也是之后引入F,t检验等的内容。
如何学好数理统计?
个人觉得,想学好数理统计,特别是对于程度不深的学习者,最重要的不是掌握一些定理的推导证明,而是切实厘清统计的概念,搞清楚这到底是在说一个什么事,先做到这一点,再谈之后的挖深或者进阶。
上面提到的统计推断中的那些概念,很多时候乍一看都会觉得摸不着头脑,甚至觉得很突然,可梳理思考弄清楚之后,就会觉得其实背景、框架都比较明白,思想也比较直观。初级的数理统计教材若能将概念解释清楚就很不错。
在这方面,我觉得已故的陈希孺院士为本科非数学、统计类专业编写的《概率论与数理统计》(中科大版)和华东师范大学的茆诗松、程依明和濮晓龙三位老师为本科数学、统计类专业编写的《概率论与数理统计教程》
(高教版)就做得非常好。前者不用多说,目前最高票的 @卡卡 答案已经引用了陈院士的一些原话,的确是语重心长,陈老在这本教材的写作当中真正是处处都注意用最直白甚至最日常的语言解释统计概念与思想,
也尽量兼顾了广度与深度;后者的数理统计部分对很多统计概念的引入与介绍都比较明了,不突然,不模糊,概率论部分感觉没有数理统计部分写得好,不过基本的内容都覆盖到了。
Comments