新書推薦:
《
地理计算与R语言
》
售價:HK$
124.2
《
沈括的知识世界:一种闻见主义的实践(中华学术译丛)
》
售價:HK$
89.7
《
大思维:哥伦比亚商学院六步创新思维模型
》
售價:HK$
74.8
《
宏观经济学(第三版)【2024诺贝尔经济学奖获奖者作品】
》
售價:HK$
159.9
《
UE5虚幻引擎必修课(视频教学版)
》
售價:HK$
113.9
《
真需求
》
售價:HK$
113.9
《
阿勒泰的春天
》
售價:HK$
51.8
《
如见你
》
售價:HK$
52.7
|
編輯推薦: |
《应用统计学》可作为经济学和管理学研究生的应用统计学教材,也可作为从事相关专业教学和研究的教师参考用书。
|
內容簡介: |
《应用统计学》介绍经济与管理学科中常用的统计分析理论与方法。《应用统计学》分七章。第1章为统计推断的基本内容,主要包括参数估计与检验,方差分析;第2章较为系统地介绍非参数统计检验的基本方法和原理;第3章主要介绍线性回归分析的理论和方法;第4章简要介绍非线性回归分析的基本原理和方法;第5章介绍主成分分析;第6章介绍因子分析模型;第7章介绍马尔可夫链的基本内容。
|
目錄:
|
目录
前言
第1章统计推断1
1.1随机变量及其分布1
1.1.1常用的随机变量及其分布2
1.1.2随机变量的矩6
1.1.3分位点8
1.2抽样分布及其常用统计量的分布9
1.2.1简单随机样本9
1.2.2抽样分布10
1.3参数估计与假设检验17
1.3.1参数估计18
1.3.2参数假设检验30
1.3.3假设检验中的两个问题46
1.4方差分析49
1.4.1单因素试验的方差分析50
1.4.2双因素试验的方差分析63
1.5本章小结72
问题与思考73
第2章非参数统计分析74
2.1符号检验75
2.1.1两个总体分布是否相同的符号检验75
2.1.2总体中位数Me的检验79
2.1.3数据序列的趋势存在性检验80
2.1.4威尔科克森符号秩和检验83
2.2秩和检验法84
2.3多个样本的检验87
2.3.1克鲁斯凯沃利斯单向方差秩检验87
2.3.2费里德曼双向方差分析90
2.4秩相关分析94
2.4.1斯皮尔曼秩相关系数94
2.4.2肯德尔 τ相关系数97
2.5χ2检验法99
2.5.1拟合优度检验99
2.5.2独立性检验(列联表分析)103
2.6正态性的检验法106
2.7本章小结107
问题与思考107
第3章线性回归分析108
3.1一元线性回归分析110
3.1.1参数β0,β1的估计112
3.1.2误差项ε的方差σ2的估计113
3.1.3拟合回归线的性质114
3.1.4正态误差回归模型114
3.1.5线性回归模型中自变量与因变量之间联系的描述测度118
3.1.6一元线性回归建模流程118
3.2多元线性回归模型119
3.2.1多元回归模型119
3.2.2回归系数的涵义121
3.2.3回归分析推断121
3.2.4预测与控制125
3.2.5自变量与因变量线性相关程度的度量指标126
3.2.6多元线性回归模型中自变量的选择问题129
3.3回归诊断136
3.3.1残差及其性质136
3.3.2误差项的异方差137
3.3.3误差序列自相关性139
3.3.4自变量的多重共线性140
3.3.5异常点与强影响点143
3.4含定性自变量的回归模型145
3.4.1仅含定性自变量的回归模型145
3.4.2对一个定量自变量和一个二值定性自变量的回归146
3.4.3对于一个定量自变量和一个多值定性自变量的回归150
3.4.4对于一个定量自变量和两个定性自变量的回归151
3.5本章小结152
问题与思考152
第4章非线性回归分析153
4.1可线性化的非线性回归模型154
4.2多项式模型161
4.2.1一元多项式模型161
4.2.2二元多项式模型163
4.3因变量为指示变量的回归165
4.3.1回归模型165
4.3.2关于误差项问题166
4.3.3参数估计166
4.4逻辑斯蒂回归模型169
4.5本章小结173
问题与思考173
第5章主成分分析174
5.1随机矩阵和随机样本174
5.1.1随机矩阵174
5.1.2随机样本176
5.2总体主成分177
5.2.1一般形式177
5.2.2标准化变量的主成分179
5.3样本主成分181
5.4举例183
问题与思考184
第6章因子分析185
6.1正交因子模型185
6.2参数估计187
6.2.1主成分法187
6.2.2主因子法189
6.2.3极大似然估计法190
6.3因子旋转190
6.3.1基本原理190
6.3.2计算过程191
6.4因子得分194
6.4.1加权*小二乘法194
6.4.2回归分析法195
6.5应用举例196
问题与思考200
第7章马尔可夫链201
7.1随机过程的基本概念201
7.1.1随机过程的定义201
7.1.2有限维分布族202
7.1.3独立增量过程与平稳过程202
7.2泊松过程204
7.2.1计数过程204
7.2.2泊松过程的定义204
7.3马尔可夫链208
7.3.1马尔可夫性208
7.3.2马尔可夫链的定义208
7.3.3C-K方程212
7.3.4遍历性213
问题与思考215
参考文献216
附录217
|
內容試閱:
|
第1章统计推断
房价问题是当前*热门的话题之一。一个城市房价的均价总是扑朔迷离。一个房价均价每平方米8千元的经济较为发达的省会城市,可能对于年轻人具有较大的吸引力。现实却是想要购买每平方米1万元房子的愿望,也可能只有在城郊结合部才能实现。事实上,需要弄清楚的是这个城市房子均价的变化区间、不同楼盘均价之间的差异程度、在某一价位以上的楼盘占比多少、不同区位楼盘均价之间的差异及其差异的变化趋势等。当不能获得全部楼盘销售均价的数据时(实际上难以得到真实的数据),你如何来解决刚才提到的问题呢?
1.1随机变量及其分布
随机试验的结果未必都是数量化的,如检验产品是合格品还是不合格品,调查居民对某一改革措施赞成还是反对等,这些实验的结果并不是一个数值。为了全面研究随机实验的结果,揭示随机现象的统计规律性,需要将随机实验的结果数量化,即需要引入随机变量概念。
为理解随机变量的涵义,从一个统计学文献中常用的一个例子,即抛掷硬币以观察正反面出现情况的这一试验开始。例如,将硬币连续抛掷三次(看成一次随机试验),则所有可能结果的集合为这里,用H表示正面,T表示反面。显然,当硬币均匀时,这8个结果的出现等可能。将试验所有可能结果组成的集合Ω称为样本空间。如果仅将注意力集中在正面出现的次数上,如以X表示这一试验中正面出现的次数,则X可能的取值为0,1,2,3。且易知,X取这4个数的概率分别为18,38,38和18。事实上,这些概率值对应着试验结果出现的概率。例如,X=1对应着试验结果HTT,THT或TTH的出现,则X=1的概率等于试验结果HTT,THT或TTH出现的概率之和。因此,X是定义在样本空间上的一个实值函数。
随机变量的严格定义如下:设E是一个随机试验,S={e}为其样本空间,如果对于S中的每一个样本点e,有一个实数Xe与之对应,则称这个定义在样本空间S上的实值函数Xe为随机变量。
随机变量X的分布函数定义如下:对于任意的实数称函数
为随机变量X的累积分布函数(简称分布函数)。实际上,Fx是随机变量X取值不超过某一特定值的概率,故有累积之意。
容易看到,分布函数具有如下性质:
(1)Fx是x的非减函数;
(2)limx→+∞Fx=1;
(3)limx→-∞Fx=0;
(4)P{ax≤b}=Fb-Fa,对一切ab。
1.1.1常用的随机变量及其分布
1.离散型随机变量及其分布
一个*多取可数个可能值的随机变量,称为离散型随机变量。对于一个离散型随机变量X,记,这里xi为X的可能取值,则pi0,且对于所有的xi,有∑+∞i=1pi=1;X的分布函数。
下面介绍一些常用的离散型随机变量。
1)0-1分布
假定一个随机试验,其结果可以分为成功或失败,称这样的试验为伯努利试验。例如,试验的结果是成功,令X=1,否则,令X=0,则X的分布律为
这里,p为试验结果是成功的概率,且0p1。
随机变量X也称为伯努利随机变量,如果其分布律由上述公式给出,称X服从0-1分布,记为X~b1,p。
在实践中,对产品进行质量检验,每抽出一件产品,只有两种结果,即要么是合格品,要么是不合格品,如记产品的合格率为p,则产品的质量检验问题可以用0-1分布来描述。
2)二项分布
若进行n次独立的伯努利试验,其中每次结果是成功的概率为p,结果是失败的概率为1-p。以X表示在n次独立的伯努利试验中成功出现的次数,则称X为具有参数n,p的二项随机变量,或称X服从参数n,p的二项分布,记为X~bn,p。其分布律为
例1.1已知某生产线生产的产品是废品的概率为0.1,且与任意的其他产品独立。现从生产线上随机抽取3件产品,则至多有一个废品的概率是多少?
解以X表示这3件被抽产品中的废品数,则X为服从参数(3,0.1)的二项随机变量。
例1.2某公司有7个顾问。假定每个顾问贡献正确意见的概率为0.6,且设顾问之间是否贡献正确意见相互独立。先对某项目可行与否个别征求各顾问意见,并按多数顾问的意见作出决策。试求作出正确决策的概率。
解以X表示7个顾问中贡献正确意见的人数,则X~b7,0.6。从而作出正确决策的概率为
例1.3某车间有80台机器,经过长时间的观察,得知每台机器发生故障的概率为0.01。设机器发生故障与否相互独立,又设每个维修工在同一时间只能维修一台机器,则配备3个维修工共同维修80台机器,与配备4个维修工每人承担20台机器维修任务,哪个方案不能及时维修的概率较小?
解(1)按照第1种方案,以X表示80台机器中需要维修的机器数,可易见,X~b80,0.01,则不能及时维修的概率为
(2)按照第2种方案,以Ai表示事件“第ii=1,2,3,4个维修工承担的20台机器不能及时维修”,则所求的概率为
由此可见,第1种方案较好。
注二项分布的概率计算可以调用excel中的函数BINOMDIST。
3)泊松分布
对于取值为0,1,2, 的随机变量X,如对某个λ0,有
则称X为具有参数λ的泊松随机变量,或称X服从参数为λ的泊松分布,记为
泊松分布的一个重要性质是可以用来近似二项分布。事实上,如果二项分布参数中的n较大,而p较小,对于二项分布的随机变量,取λ=np,则
对于较大的n和较小的p,有
从而,对于较大的n和较小的p,有
例1.4假定某书一页上的印刷错误个数是一个具有参数λ=1的泊松随机变量,则在此页上至少有一个错误的概率为多少?
解以X表示此页上的错误数,则X~π1,从而
例1.5假定每天在高速公路上发生事故的数目是一个具有参数λ=3的泊松随机变量,则今天没有发生事故的概率是多少?
解以X表示今天在此条高速公路上发生的事故数,则
例1.6(泊松分布在运营管理中的应用:排队)在生活和工作中排队是常见现象,如在银行、超市、餐饮店等场所都会遇到排队的情况;再如,货车等待装货、生产线上的零件排队等待装配等。通过排队模型,可以帮助公司管理人员掌握排队的特征。
每小时到达某加油站要求加油的汽车数服从均值为5的泊松分布,则
(1)接下来的1个小时内只有一辆车到达的概率是多少?
(2)接下来的3个小时内有多于20辆汽车到达的概率是多少?
某ATM机使用人数服从泊松分布,每间隔5分钟平均有1.5个使用者,则
(1)在接下来的5分钟内没有使用者的概率是多少?
(2)接下来的10分钟内有3个或3个以上使用者的概率是多少?
作者可自行练习。
注也可以调用excel中的函数POISSON进行计算。
4)几何分布
设进行独立试验直到首次出现成功为止,其中每次试验成功的概率都是p,以X表示直到首次成功所进行的试验次数,则称X为具有参数p的几何随机变量,或称X服从参数为p的几何分布,记为X~gn,p。其分布律为
例1.7对产品进行检验,直到检测到次品为止。设产品的合格率为0.9,求直到第11个产品才检测到次品的概率。
解以X表示首次检测到次品时所检测的产品数,则X~g11,0.9,由此
2.连续型随机变量及其分布
在某型号灯泡的寿命试验中,每一个被测试灯泡的寿命是一个非负实数,它可以取到某个区间中的任意一个数。同样该型号灯泡的寿命在某一范围内取值的概率也是客观存在的。将这样能取到一个区间中任意一个数的随机变量,称为连续型随机变量。
连续型随机变量的分布函数为
这里,fx是连续型随机变量X的分布密度函数。
1)均匀分布(记为X~Ua,b)
密度函数为
2)指数分布(记为X~Eλ)
密度函数为
1.8已知某种轮胎的使用寿命X~E0.1(单位:万公里)。现随机抽取这种轮胎5只,试求至少有两只轮胎的行驶距离不足30万公里的概率1公里=1千米。
解以X表示任意一只这样的轮胎的使用寿命,则其寿命不足30万公里的概率为
于是5只轮胎中至少有两只轮胎的行驶距离不足30万公里的概率为
3)正态分布
密度函数为
称为标准正态分布的密度函数,对应的随机变量以Z表示,且记与之间的关系为这里,为标准正态分布Z的分布函数。
由正态分布的密度函数图像图1.1可以看到,此曲线完全由均值μ和标准差σ决定,事实上,μ决定了密度函数曲线的位置,也称位置参数;决定了曲线的形状,也称尺度参数。
图1.1正态分布
正态随机变量的3个重要数据:若X~Nμ,σ2,则
我们可以看到,X的取值几乎落在以均值为中心,3倍的标准差为半径的对称区间中。此性质也称为3σ准则,其在产品的质量控制中有着重要应用。
例1.9招生录取线的确定某学校近年招生情况看好,申请者越来越多,因此,录取标准需要提高。经学校管理部门反复论证,制订出一个录取条件,即申请者的入学分数必须在前1%以内。如果入学分数服从均值为490,标准差为61的正态分布,则录取的**分为多少?
解以X表示申请者的入学分数,则X~N490,612。记**录取分数线为x0.01,则有
这里,查附表1得x0.01-49061=2.3263,即x0.01=632。
实际上,在上述常用分布的概率计算中,都可以运用excel统计计算中的相应函数,请读者思考。本例中,可以运用excel中的函数NORMINV,立得x0.01=632。
1.1.2随机变量的矩
若EXk存在,则称之为随机变量X的k阶原点矩,k=1,2, ;
若EX-EXk存在,则称之为随机变量的k阶中心矩,k=2,3, 。
特别地,称随机变量X的一阶原点矩EX为随机变量X的数学期望,也称为均值;称随机变量X的二阶中心矩EX-EX2为随机变量X的方差,称EX-EX2为随机变量X的标准差。
在实践中*常用的当属随机变量的数学期望与方差。
下面给出常用随机变量的数学期望与方差。
1.离散情形
|
|