登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』SPSS 21.0行业统计分析与应用

書城自編碼: 2715199
分類:簡體書→大陸圖書→計算機/網絡行业软件及应用
作者: 张慈、薛晓光、王大永
國際書號(ISBN): 9787302419860
出版社: 清华大学出版社
出版日期: 2015-12-01
版次: 1 印次: 1
頁數/字數: 448/673000
書度/開本: 16开 釘裝: 平装

售價:HK$ 90.7

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
工程机械手册——农林牧渔机械
《 工程机械手册——农林牧渔机械 》

售價:HK$ 457.7
夜幕之下(5、6套装)
《 夜幕之下(5、6套装) 》

售價:HK$ 126.5
国际艺术品市场A-Z:风俗、习惯和惯例的基本指南
《 国际艺术品市场A-Z:风俗、习惯和惯例的基本指南 》

售價:HK$ 78.2
忧伤的群岛:查戈斯人的流散与抗争
《 忧伤的群岛:查戈斯人的流散与抗争 》

售價:HK$ 90.9
现代自建小别墅VR效果图 实用的自建小别墅指南 帮你解决设计难题
《 现代自建小别墅VR效果图 实用的自建小别墅指南 帮你解决设计难题 》

售價:HK$ 156.4
语义学(下卷)(语言学及应用语言学名著译丛)
《 语义学(下卷)(语言学及应用语言学名著译丛) 》

售價:HK$ 156.4
迷人的珊瑚礁(迷人的科学丛书)
《 迷人的珊瑚礁(迷人的科学丛书) 》

售價:HK$ 124.2
夜幕之下.5:极恶都市
《 夜幕之下.5:极恶都市 》

售價:HK$ 63.3

 

編輯推薦:
SPSSStatistical Product and Service
Solutions,统计产品和服务解决方案是当今世界著名的统计软件之一,具有界面友好,统计功能强大,前后处理功能完善等优点。本书基于**版本SPSS 21.0,结合统计教学的特点,应用大量的案例,分七篇18章阐述了SPSS的常用统计分析方法以及在社会学、管理学、经济学、教育学、医学、工业生产等方面的应用。本书内容翔实、语言简练、思路清晰、图文并茂、深入浅出、理论与实际设计相结合,通过大量的案例对SPSS进行了比较全面的介绍。

本书适合高等院校相关专业的本科生、研究生,以及在各领域从事统计分析和决策的人员学习参考。
內容簡介:
SPSSStatistical Product and Service Solutions,统计产品和服务解决方案是当今世界著名的统计软件之一,具有界面友好,统计功能强大,前后处理功能完善等优点。本书基于最新版本SPSS 21.0,结合统计教学的特点,应用大量的案例,分七篇18章阐述了SPSS的常用统计分析方法以及在社会学、管理学、经济学、教育学、医学、工业生产等方面的应用。本书内容翔实、语言简练、思路清晰、图文并茂、深入浅出、理论与实际设计相结合,通过大量的案例对SPSS 进行了比较全面的介绍。
本书适合高等院校相关专业的本科生、研究生,以及在各领域从事统计分析和决策的人员学习参考。
目錄
目 录
第1篇 SPSS统计分析界面操作介绍
第1章 SPSS基本统计分析操作介绍2
1.1 统计报告2
1.1.1 在线分析处理报告2
1.1.2 个案摘要报告3
1.1.3 行形式摘要报告4
1.1.4 列形式摘要报告8
1.2 描述性统计分析10
1.2.1 频数分析10
1.2.2 描述性分析12
1.2.3 探索性分析14
1.2.4 列联表分析16
1.3 均值比较与检验21
1.3.1 均值比较Means过程21
1.3.2 单样本T检验
One-Sample T Test22
1.3.3 独立样本T检验23
1.3.4 配对样本T检验24
1.4 方差分析25
1.4.1 单因素方差分析25
1.4.2 多因素方差分析29
1.4.3 重复测量方差分析34
1.4.4 协方差分析36
1.5 相关分析36
1.5.1 双变量过程36
1.5.2 偏相关分析38
1.5.3 距离分析39
1.6 回归分析44
1.6.1 线性回归分析44
1.6.2 曲线回归分析50
1.6.3 二维Logistic回归分析51
1.7 非参数检验56
1.7.1 卡方检验56
1.7.2 二项分布检验58
1.7.3 游程检验60
1.7.4 单样本K-S检验61
1.7.5 两独立样本检验62
1.7.6 多独立样本检验63
1.8 聚类分析与判别分析64
1.8.1 快速聚类64
1.8.2 分层聚类67
1.8.3 判别分析73
1.9 因子分析和主成分分析78
1.9.1 因子分析78
1.9.2 主成分分析84
1.10 本章小结84
第2章 SPSS高级统计分析操作介绍85
2.1 生存分析85
2.1.1 生存分析简介85
2.1.2 寿命表分析86
2.1.3 Kaplan-Meier分析88
2.1.4 Cox回归分析92
2.2 信度分析96
2.2.1 信度分析简介97
2.2.2 信度分析操作98
2.3 时间序列分析101
2.3.1 时间序列分析简介101
2.3.2 时间序列分析操作102
2.4 统计图形103
2.4.1 图形生成器104
2.4.2 传统模式创建图形105
2.5 本章小结109
第2篇 SPSS在社会学中的应用
第3章 SPSS在居民收入和消费
分析中的应用112
3.1 我国居民收入和消费的
现状及研究价值112
3.2 人均收入与消费关系分析113
3.2.1 案例描述113
3.2.2 操作步骤和结果分析114
3.3 居民收入与储蓄关系分析118
3.3.1 案例描述118
3.3.2 操作步骤和结果分析118
3.4 居民消费支出与教育支出分析122
3.4.1 案例描述122
3.4.2 操作步骤和结果分析123
3.5 各地区生活消费支出分类126
3.5.1 案例描述126
3.5.2 操作步骤和结果分析128
3.6 本章小结133
第4章 SPSS在电视广告收视与
收益分析中的应用134
4.1 电视广告收视与收益现状及
研究价值134
4.2 电视广告平均收益分析135
4.2.1 案例描述135
4.2.2 操作步骤和结果分析136
4.3 某商品电视广告收视率分析138
4.3.1 案例描述138
4.3.2 操作步骤和结果分析138
4.4 电视广告效用评价分析141
4.4.1 案例描述141
4.4.2 操作步骤和结果分析143
4.5 广告投入与销售额关系分析146
4.5.1 案例描述146
4.5.2 操作步骤和结果分析147
4.6 本章小结154
第5章 SPSS在智商测试和开发
分析中的应用155
5.1 智商测试和开发方法的现状及
研究价值155
5.2 不同智商测试方法差异分析156
5.2.1 案例描述156
5.2.2 操作步骤和结果分析156
5.3 智商开发方法探索分析160
5.3.1 案例描述160
5.3.2 操作步骤和结果分析161
5.4 本章小结166
第3篇 SPSS在管理学中的应用
第6章 SPSS在企业人力资源
管理中的应用168
6.1 企业人力资源管理现状及研究价值168
6.2 公司员工薪酬水平分析169
6.2.1 案例描述169
6.2.2 操作步骤和结果分析169
6.3 企业意外事故管理分析172
6.3.1 案例描述172
6.3.2 操作步骤和结果分析173
6.4 公司员工招聘资料分析175
6.4.1 案例描述175
6.4.2 操作步骤和结果分析177
6.5 本章小结189
第7章 SPSS在商品营销管理
分析中的应用190
7.1 商品营销管理的现状和研究价值190
7.2 商场营业时间分析191
7.2.1 案例描述191
7.2.2 操作步骤和结果分析191
7.3 营销方式与销售量关系分析193
7.3.1 案例描述193
7.3.2 操作步骤和结果分析194
7.4 销售额影响因素分析197
7.4.1 案例描述197
7.4.2 操作步骤和结果分析198
7.5 电话线缆年销售量分析203
7.5.1 案例描述203
7.5.2 操作步骤和结果分析204
7.6 新产品营销资料分析208
7.6.1 案例描述208
7.6.2 操作步骤和结果分析208
7.7 本章小结216
第4篇 SPSS在经济学中的应用
第8章 SPSS在地区经济发展水平
分析中的应用218
8.1 我国各地区经济发展的现状及
研究价值218
8.2 地方财政收入影响因素分析219
8.2.1 案例描述219
8.2.2 操作步骤和结果分析220
8.3 各地区经济水平分类分析225
8.3.1 案例描述225
8.3.2 操作步骤和结果分析226
8.4 本章小结231
第9章 SPSS在房地产交易
分析中的应用232
9.1 房地产交易分析的现状和研究价值232
9.2 家庭购房需求分析232
9.2.1 案例描述232
9.2.2 操作步骤和结果分析233
9.3 住房抵押申贷分析243
9.3.1 案例描述243
9.3.2 操作步骤和结果分析244
9.4 本章小结250
第10章 SPSS在企业经济效益
评价中的应用251
10.1 企业经济效益研究的现状和价值251
10.2 企业经济效益分类分析251
10.2.1 案例描述251
10.2.2 操作步骤及结果说明252
10.3 企业经济效益差异分析267
10.3.1 案例描述267
10.3.2 操作步骤及结果说明268
10.4 本章小结276
第5篇 SPSS在教育学中的应用
第11章 SPSS在研究生招生
分析中的应用278
11.1 研究生招生录取的现状和研究价值278
11.2 待录取研究生分类分析279
11.2.1 案例描述279
11.2.2 操作步骤和结果分析280
11.3 研究生分类判别分析291
11.3.1 案例描述291
11.3.2 操作步骤和结果分析292
11.4 本章小结301
第12章 SPSS在教学方法与学生成绩
分析中的应用302
12.1 教学方法与学生成绩关系研究的
现状和价值302
12.2 学生对教学改革态度分析302
12.2.1 案例描述302
12.2.2 操作步骤和结果分析303
12.3 学生成绩分布情况分析306
12.3.1 案例描述306
12.3.2 操作步骤和结果分析306
12.4 教学方法效果评价分析309
12.4.1 案例描述309
12.4.2 操作步骤和结果分析309
12.5 学生成绩分类分析316
12.5.1 案例描述316
12.5.2 操作步骤和结果分析317
12.6 学生成绩评定研究323
12.6.1 案例描述323
12.6.2 操作步骤和结果分析324
12.7 本章小结330
第6篇 SPSS在医学中的应用
第13章 SPSS在儿童生长发育
研究中的应用332
13.1 儿童生长发育研究的现状和
研究价值332
13.2 儿童生长发育阶段划分333
13.2.1 案例描述333
13.2.2 操作步骤和结果分析334
13.3 儿童发育营养状态分析339
13.3.1 案例描述339
13.3.2 操作步骤和结果分析340
13.4 儿童生长指标间关系研究345
13.4.1 案例描述345
13.4.2 操作步骤和结果分析345
13.5 不同地区儿童身高差异分析350
13.5.1 案例描述350
13.5.2 操作步骤和结果分析350
13.6 本章小结353
第14章 SPSS在癌症生存诊疗
分析中的应用354
14.1 癌症生存诊疗的现状和研究价值354
14.2 肿瘤患者生存率分析355
14.2.1 案例描述355
14.2.2 操作步骤和结果分析355
14.3 癌症患者缓解天数研究359
14.3.1 案例描述359
14.3.2 操作步骤和结果分析359
14.4 肺癌患者生存时间分析366
14.4.1 案例描述366
14.4.2 操作步骤和结果分析366
14.5 本章小结373
第15章 SPSS在病毒培养和病症
分析中的应用374
15.1 病毒培养和病症分析的现状及
研究价值374
15.2 钩端螺旋体培养计数分析374
15.2.1 案例描述374
15.2.2 操作步骤和结果分析375
15.3 胃病病例判别分析379
15.3.1 案例描述379
15.3.2 操作步骤和结果分析379
15.4 本章小结387
第7篇 SPSS在工业生产中的应用
第16章 SPSS在饮料成分鉴别
分析中的应用390
16.1 饮料成分鉴别分析的现状和研究价值390
16.2 品牌啤酒分类分析390
16.2.1 案例描述390
16.2.2 操作步骤和结果分析391
16.3 饮料相似程度分析396
16.3.1 案例描述396
16.3.2 操作步骤和结果分析397
16.4 本章小结406
第17章 SPSS在产品生产控制
分析中的应用407
17.1 产品质量控制分析的现状和
研究价值407
17.2 包装机运转稳定性分析408
17.2.1 案例描述408
17.2.2 操作步骤和结果分析408
17.3 生产方法与日产量分析410
17.3.1 案例描述410
17.3.2 操作步骤和结果分析411
17.4 产品一级品率分析414
17.4.1 案例描述414
17.4.2 操作步骤和结果分析415
17.5 产品质量影响分析418
17.5.1 案例描述418
17.5.2 操作步骤和结果分析419
17.6 本章小结424
第18章 SPSS在矿产资源勘探
分析中的应用425
18.1 矿产资源勘探分析的现状和
研究价值425
18.2 煤矿含灰率分析426
18.2.1 案例描述426
18.2.2 操作步骤和结果分析426
18.3 油田勘测判别分析429
18.3.1 案例描述429
18.3.2 操作步骤和结果分析430
18.4 本章小结440
內容試閱
第2章 SPSS高级统计分析操作介绍
在上一章中详细介绍了SPSS基本统计分析方法的界面操作和英文标签说明,包括数据描述性分析、均值检验、方差分析、相关回归分析、非参数检验、聚类和判别分析、主成分分析和因子分析等。在本章中,将详细介绍SPSS软件中所用到的高级统计分析方法,主要包括生存分析、信度分析以及常用统计图形的界面操作和英文标签说明。
2.1 生 存 分 析
生存分析方法是一种非常重要的统计分析方法,主要用于分析涉及一定时间的发生和持续长度的时间数据,用以揭示事件发生和发展的规律。生存分析是近一二十年来发展起来的数理统计新分支,它是根据现代医学、工程等科学研究的大量实际问题提出来的,着重对截断数据进行统计分析研究。生存分析的理论与应用受到了世界各国,特别是发达国家很大的重视。1986 年美国国家科学院委员会提出的数学发展概况中,曾把生存分析列为?6?大发展方向之一。
生存分析目前已广泛应用在医学、生物学、公共健康、金融学、保险、人口统计等诸多领域,它涉及数理统计中原有的参数统计与非参数统计的结合,而且涉及一些较深较新的概率和其他数学工具。因此,生存分析方法日益受到人们的重视。
本章介绍了如何使用SPSS来进行生存分析。SPSS所提供的功能主要有以下4项。
* Life Tables:寿命表分析。
* Kaplan-Meier:Kaplan-Meier分析。
* Cox Regression:Cox回归分析。
* Cox wTime-Dep Cov:时间相依性的回归分析。
2.1.1 生存分析简介
生存分析Survival Analysis主要用于对涉及一定时间的发生和持续长度的时间数据的分析。生存分析所分析的数据通常称为生存数据,生存数据按照观察数据所提供的信息的不同,可以分为完全数据、删失数据和截尾数据3种。
生存分析Survival Analysis是目前统计学的热门,自20世纪70年代中期以来,得到了迅速的发展,无论在理论或应用方面都受到了人们的重视。生存分析不仅能妥善处理现实生活中常见的截尾数据Censored Data问题,而且在解决实际问题的同时,揭示了一些更为复杂的理论问题,促进了数理统计理论的发展。1986 年美国国家科学院委员会提出的数学发展概况的报告中,6个有代表性的分支学科中就有一个是论述生存分析的,而且被作为数学与其他学科,甚至社会科学互相渗透的一个重要例子。
生存分析所要分析的数据称为生存数据,用于度量某事件发生前所经历的时间长度。事件可以是产品的失效、保单的索赔、疾病的发生、生命的死亡等。若跟产品失效有关,生存数据也称为失效数据。
按照观察数据所提供的信息的不同,生存数据又可以分为以下三大类。
1.完全数据
完全数据指的就是提供了完整信息的数据,比如研究某种产品的失效时间,如果有一个样品从进入研究直到失效都在我们的观察之中,就可以得到其失效的具体时间,那么这个失效数据就是一个完全数据。
2.删失数据
生存分析经常研究在不同的时间点或时期被研究的事件发生的概率,而研究的周期可能很长,比如在医学领域,研究某种慢性疾病的治疗效果一般都要对患者进行长期随访,统计一定时期后的生存或死亡的情况以判断治疗效果,这种随访数据就是生存数据。但是,由于获得数据的时间很长,中间可能患者由于迁移、不愿意继续合作等各种原因退出了随访,或者研究单位由于人力、物力、财力等方面的原因在某个时刻决定中止随访,那么这些退出研究或者被终止研究的患者提供的信息就是不完整的信息,若他们在退出研究之时仍然存活,那么日后的确切死亡时间在数据中就无法反映。
完全数据和删失数据都是在生存分析中经常会碰到的数据,SPSS要求在进行生存分析时每个变量都必须再设置一个相应的示性函数,用以说明这个数据到底是完全数据还是删失数据。通常采用的示性函数的取值规则是:完全函数,示性函数取值为0;删失数据,示性函数取值为1。
3.截尾数据
截尾数据和删失数据一样,所提供的是不完整的数据,它和删失数据的不同在于,它提供的是跟时间有关的条件信息。比如保险公司想研究60岁以上的老年人投保了意外伤害险的人发生意外的概率,那么被研究的投保人在研究期内所提供的生存数据为截尾数据,因为它们都附带一个时间条件:进入研究的人的年龄都应该大于等于60岁。
不过SPSS软件只考虑对完整数据和删失数据的分析,对截尾数据不提供专门的分析方法。
2.1.2 寿命表分析
在生存分析中,对生存函数的估计是一个重要问题。寿命表方法是一种重要的非参数估计方法,它不仅有悠久的历史,而且在各领域都有广泛的应用。
在实际研究中,通常需要了解两个事件之间间隔的时间长短的分布。例如,如果正在研究治疗某种致命疾病的效果,可能要观察治疗实施到患者死亡这段时间的情况。得到评估结果的时候,若并非所有患者都死亡,则必须将死亡患者和仍然活着的患者的生存时间合并到分析中。又如,检验一部分人婚姻持续的时间,必须包括婚姻正在延续和婚姻已经终止两种时间长度。从各保险表中,可以分析在一个特定时间点上生存患者的比例和婚姻持续的比例。总的来说,这样的一些事件被称为截断观测。此时,使用传统的方法来分析这种观测不再适合。
寿命表分析正好适合于分析这种数据。寿命表的基本思想是将观测区间划分为很多小的时间区间。对于每一个区间,所有的在该区间依然“存活”的观测个案都会被用来计算在此区间“死亡”的概率。对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率。
建立或打开数据文件后,即可进行寿命表分析。
选择菜单栏中的“分析”→“生存函数”→“寿命表”命令,即可弹出如图2.1.1所示的“寿命表”对话框。
在该对话框的左侧为源变量框,右侧的“时间”列表框用于在左侧的源变量框中选择生存时间变量。
在“显示时间间隔”选项组中设置时间区间的长度及终点。寿命表分析以时间0为第一个时间区间的起点。用户在前面的数值框中输入最后一个区间的终点值,在“步长”数值框中输入区间长度。
“状态”列表框用于选入状态变量进入。选入状态变量后,“定义事件”按钮被激活,单击该按钮,即可弹出如图2.1.2所示的“寿命表:为状态变量定义事件”对话框。
图2.1.1 “寿命表”对话框
图2.1.2 “寿命表:为状态变量定义事件”对话框
在“寿命表:为状态变量定义事件”对话框中有两个选项:“单值”选项,在该选项的数值框中设置一个指示事件发生的数值。在输入这个值之后,带有其他值的观测都被作为截断观测;“值的范围”选项,在该选项的数值框中设置一个指示事件发生的数值区间。在数值框中输入区间的上下界,观测值不在这个区间的观测都被作为截断观测。
设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
“因子”列表框用于从左侧的源变量框中选入一阶因素变量。选入变量后,“定义范围”按钮被激活,单击该按钮,即可打开“有效表格:定义因子范围”对话框,如图2.1.3所示。
在“有效表格:定义因子范围”对话框中有两个选项:“最小值”数值框中的数值用于设置因素变量的下界;“最大”数值框中输入的数值用于设置因素变量的上界。设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
“按因子”列表框用于选入二阶因素变量。选入变量后,“定义范围”按钮被激活,单击该按钮,即可打开如图2.1.3所示的“有效表格:定义因子范围”对话框,用于设置第二因素变量取值的上下限,设置方法同上。设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
在“寿命表”对话框中单击“选项”按钮,即可弹出“寿命表:选项”对话框,如图2.1.4所示。
图2.1.3 “有效表格:定义因子范围”对话框
图2.1.4 “寿命表:选项”对话框
“寿命表”选项:用于选择是否输出生命表。
“图”选项组用于选择所输出的函数图形。
* “生存函数”选项:如果选中此选项,则会输出以线性刻度生成的累积生存函数。
* “危险函数”选项:如果选中此选项,则会输出以线性刻度生成的累积危险函数。
* “1减去生存函数”选项:如果选中此选项,则会输出1-累积生存函数。
* “取生存函数的对数”选项:如果选中此选项,则会输出以对数刻度生成的累积生存函数。
* “密度”选项:如果选中此选项,则会输出密度函数。
“比较第一个因子的水平”选项组用于选择比较不同水平的一阶因素变量的方法。
* “无”选项:表示不进行子群之间的比较。
* “整体比较”选项:表示同时比较所有水平的一阶因素变量。
* “两两比较”选项:表示配对比较一阶因素变量水平。
设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
所有设置结束后,单击“确定”按钮,执行生命表分析。
2.1.3 Kaplan-Meier分析
Kaplan-Meier方法是Kaplan和Meier在1958年提出的一种求生存函数的非参数方法,也称为乘法极限估计Product Limit Estimate、PL估计或最大似然估计法Maximum Likelihood Estimate。Kaplan-Meier法能对完全数据和截尾数据及不必分组的生存资料进行分析,并且能对分组变量各水平所对应的生存曲线与危险函数差异进行显著性检验等。
在现实生活中,很多时候用户需要检查两个事件之间的间隔时间的分布,例如被某个公司所雇用的时间的长度从进入公司到被公司解雇为止,但这些数据中可能存在截断观测。Kaplan-Meier 方法可以在有截断数据的情况下建立时间-事件模型。Kaplan-Meier 模型是建立在下面两个基础之上的,其一为对每一个事件发生的时间点的条件概率所做的估计;其二为这些概率的范围,然后使用这两个方面的信息来估计每一个时间点的生存率。
Kaplan-Meier估计是Kaplan与Meier于1958年提出的,由于它具有乘积极限的形式,又称为乘积极限PL估计或最大似然估计Maximum Likelihood Estimate。Kaplan-Meier 估计有重要的理论意义,它在生存分析中的地位与经验分布函数在经典统计中的地位相仿,而且两者有渐近行为。
在数据编辑窗口中,选择菜单栏中的“分析”→“生存函数”→Kaplan-Meier命令,即可弹出Kaplan-Meier对话框,如图2.1.5所示。
图2.1.5 Kaplan-Meier对话框
与生命表分析的对话框类似,Kaplan-Meier对话框上的“时间”列表框也是用于在左侧的源变量框中选入一个时间变量。时间变量可以以任何长度为单位,在时间变量中如果存在负数,则分析过程中不考虑此负值。
“状态”列表框用于选入一个状态变量。选入变量后,“定义事件”按钮被激活。单击“定义事件”按钮,即可弹出如图2.1.6所示的“Kaplan-Meier:定义状态变量事件”对话框。
* “单值”选项:用于设置一个指示事件发生的数值。在后面的数值框中输入数值之后,含有设定值的个案看作完全数据,带有其他值的观测都作为截尾数据处理。
* “值的范围”选项:用于设置一个指示事件发生的数值区间。在后面的数值框中输入区间的上下界,观测值不在这个区间的观测都被作为截断观测。
* “值的列表”选项:如果选中此选项,则还要在后面的设置框内设置指示事件发生的值的列表。输入数值后,单击“添加”按钮进行添加,单击“更改”按钮进行修改,而“删除”按钮用于删除已经添加的内容。
“因子”列表框用于选入一个分类变量,该变量可以将观测分为几个不相交的观测群。“层”列表框用于选入一个分层变量。“标注个案”列表框用于选入一个变量来标定观测量,SPSS将以变量标签值列出所有的变量。
在Kaplan-Meier对话框中还有“比较因子”、“保存”和“选项”3个扩展按钮。下面就进行详细讲解。
1.“比较因子”选项
单击“比较因子”按钮,即可弹出“Kaplan-Meier:比较因子水平”对话框,如图2.1.7所示。
在该对话框中用户可以设置比较分类变量的统计方法。
“检验统计量”选项组用于选择检验的统计方法。
* “对数秩”选项:如果选中此选项,则会对所有的时间点给予相同的权重,来检验生存分布是否相等。
* Breslow选项:如果选中此选项,则会依据每一个时间点上的危险观测数来给予每一个时间点不同的权重,然后检验生存分布是否相等。
* Tarone-Ware选项:如果选中此选项,则会依据每一个时间点上的危险观测数的平方根来给予每一个时间点不同的权重,然后检验生存分布是否相等。
图2.1.6 “Kaplan-Meier:定义状态变量事件”对话框
图2.1.7 “Kaplan-Meier:比较因子水平”对话框
选择检验统计方法后,下方的用于选择比较方法的选项被激活。
* “因子水平的线性趋势”选项:如果选中此选项,则会使用倾向信息来检验生存分布是否相等。
* “在层上比较所有因子水平”选项:如果选中此选项,则会检验生存曲线是否相等时,同时检验所有因素水平。
* “对于每层”选项:如果选中此选项,则会对每一个分层之下比较不同分类水平下的生存时间。用户需要注意,该选项只有在设置分层变量之后才有效。
* “在层上成对比较因子水平”选项:如果选中此选项,则会配对比较不同分类水平下的生存时间。
* “为每层成对比较因子水平”选项:如果选中此选项,则会对每一分层之下比较配对的分类水平下的生存时间。
2.“保存”选项
单击“保存”按钮,即可弹出“Kaplan-Meier:保存新变量”对话框,如图2.1.8所示。
在该对话框中有4个选项,用于选择新变量的保存。
* “生存函数”Survival选项:如果选中此选项,则计算St并以“sur_”为变量名的变量来保存累积生存概率的估计值。
* “生存函数的标准误”Standard error of survival选项:如果选中此选项,则以“se_”为变量名保存累积生存概率的估计值的标准误差。
* “危险函数”Hazard选项:如果选中此选项,则会计算ht并以“haz_”为变量名保存累积危险概率的估计值。
* “累积事件”Cumulative event选项:如果选中此选项,则当事件是由它们的生存时间和状态排序时,使用变量“cul_”来保存事件的累积频率值。
3.“选项”选项
单击“选项”按钮,即可弹出如图2.1.9所示的“Kaplan-Meier:选项”对话框。
图2.1.8 “Kaplan-Meier:保存新变量”对话框
图2.1.9 “Kaplan-Meier:选项”对话框
“统计量”选项组用于选择在分析过程中所需要计算的统计量。
* “生存分析表”选项:如果选中此选项,则会输出简化的生存表,该生存表中包含生存区间估计,估计的标准差、事件的累积频率和危险的观测数。
* “均值和中位数生存时间”选项:如果选中此选项,则会输出该生存时间的均值和中位数,以及生存时间的标准差和置信区间。
* “四分位数”选项:如果选中此选项,则会输出生存时间的四分之一、二分之一和四分之三分位数,以及它们的标准差。其中,“生存分析表”和“均值和中位数生存时间”选项为系统默认选项。
“图”选项组用于设置分析过程中需要输出的图形。
* “生存函数”选项:如果选中此选项,则会输出以线性刻度生成的累积生存函数。
* “1减去生存函数”选项:如果选中此选项,则会输出1-累积生存函数。
* “危险函数”选项:如果选中此选项,则会输出以线性刻度生成的累积危险函数。
* “对数生存”选项:如果选中此选项,则会输出以对数刻度生成的累积生存函数。
所有设置结束后,单击“确定”按钮,执行Kaplan-Meier分析。
2.1.4 Cox回归分析
Cox回归又称为比例危险度模型Proportional Hazard Model,是生存分析中的一个重要模型,可以出生存时间无一定规律,且具有完全Complete或截尾Censored状态和诸多危险因素之间的定量关系。如同寿命表分析和Kaplan-Meier生存分析一样,Cox回归分析也是在存在截断数据情况下的拟合时间-事件模型的一种方法,其适应性比较强,是生存分析中的半参数方法Semi-Parametric。
在多变量场合通常使用多元回归分析的方法。但是,多元回归分析都有一个基本假定,即变量应服从正态分布,但是生存数据很少会服从正态分布,而是多服从指数分布、Weibull分布等。而且,生存数据中有许多是删失数据,但多元回归分析只能针对完整数据。
如同寿命表分析和Kaplan-Meier生存分析一样,Cox回归是一种存在截断数据情况下的拟合时间-事件模型的一种方法。但是,Cox 回归中可以在模型中包含预测变量协变量。例如,你想在受教育的层次和工作类别上建立一个雇用时间长度的模型。Cox 回归能正确处理这种情况,而且还给出了每个协变量的相关系数。
在数据编辑窗口中,选择菜单栏中的“分析”→“生存函数”→“Cox回归”命令,即可弹出如图2.1.10所示的“Cox 回归”对话框。
在该对话框的左侧为源变量框,右侧上方有“时间”列表框,与前面的生存分析对话框一样,该列表框用于选入时间变量,时间变量可以以任何长度为单位。在时间变量中如果存在负数,则分析过程中不考虑此负值。
“状态”列表框用于从源变量框中选入一个状态变量。选入状态变量后,下方的“定义事件”按钮被激活,单击该按钮,即可弹出如图2.1.11所示的“Cox 回归:为状态变量定义事件”对话框。
图2.1.10 “Cox回归”对话框
图2.1.11 “Cox 回归:为状态变量定义事件”对话框
* “单值”选项:在该选项的数值框中设置一个指示事件发生的数值。在输入这个值之后,带有其他值的观测都被作为截断观测。
* “值的范围”选项:在该选项的数值框中设置一个指示事件发生的数值区间。在数值框中输入区间的上下界,观测值不在这个区间的观测都被作为截断观测。
* “值的列表”选项:如果选中此选项,则在后面的设置框内设置指示事件发生的值的列表。输入数值后,单击“添加”按钮进行添加,单击“更改”按钮进行修改,而“删除”按钮用于删除已经添加的内容。
“协变量”列表框用于从左侧的源变量框内选入协变量。在选入协变量时,用户可选择多变量的交互作用项a*b,则根据所选变量生成两两交互选项。
在“方法”下拉列表框中选择协变量进入回归方程的形式,有以下7个选项。
* “输入”选项:如果选中此选项,则对变量只检查容忍度,而不检查其他进入标准,然后让所有的变量进入回归方程。
* “转发:条件”选项:如果选中此选项,则采用向前选择的方法来选择协变量,协变量进入回归方程的标准是分值统计量的显著性,删除的标准是条件参数估计的似然率统计量的概率值。
* “转发:LR”选项:如果选中此选项,则采用向前选择的方法来选择协变量进入回归方程,协变量进入回归方程的标准是分值统计量的显著性,删除的标准是极大似然偏估计的似然率统计量的概率值。
* “转发:Wald”选项:如果选中此选项,则会采用向前选择的方法来选择协变量进入回归方程,协变量进入回归方程的标准是分值统计量的显著性,删除的标准是Wald统计量的概率值。
* “向后:条件”选项:如果选中此选项,则采用向后选择的方法来选择协变量,删除协变量的标准是条件参数估计的似然率统计量的概率值。
* “向后:LR”选项:如果选中此选项,则采用向后选择的方法来选择协变量,删除协变量的标准是极大似然偏估计的似然率统计量的概率值。
* “向后:Wald”选项:如果选中此选项,则采用向后选择的方法来选择协变量,删除协变量的标准是Wald统计量的概率值。
“Cox回归”对话框中的“层”列表框用于选择分层变量。
在“Cox 回归”对话框中有4个扩展按钮。下面将进行详细讲解。
1.“分类”选项
单击“分类”按钮,即可弹出“Cox回归:定义分类协变量”对话框,如图2.1.12所示。
图2.1.12 “Cox回归:定义分类协变量”对话框
从左侧的“协变量”列表框中选择分类协变量进入“分类协变量”列表框中,选入协变量后,下方的“更改对比”选项组被激活,用于设置对比方法。其中包括以下7个选项。
* “指示符”选项:如果选中此选项,则比较是否具有同类效应。
* “简单”选项:如果选中此选项,则将预测变量的每一类都与参照类进行比较。
* “差异”选项:如果选中此选项,则将预测变量的每一类都与其前面各类的平均效应进行比较。
* Helmert选项:如果选中此选项,则将预测变量的每一类都与其后面各类的平均效应进行比较。
* “重复”选项:如果选中此选项,则将预测变量的每一类都与其前面的一类进行比较。
* “多项式”选项:如果选中此选项,则将各类变量的正交多项式进行比较。
* “偏差”选项:如果选中此选项,则将预测变量的每一类都与整个观测相比较。
在设置完比较方式之后,对于“指示符”、“简单”和“偏差”3个选项,可以在“参考类别”中选择是由第一类还是由最后一类作为参照来进行分类。单击“更改”按钮,即确定这些改变。
设置结束后,单击“继续”按钮确认选择并返回到“Cox回归”对话框。
2.“绘图”选项
单击“绘图”按钮,即可弹出“Cox回归:图”对话框,如图2.1.13所示。
图2.1.13 “Cox 回归:图”对话框
“图类型”选项组用于选择要生成的图形。
* “生存函数”选项:如果选中此选项,则会输出以线性刻度生成的累积生存函数。
* “1减去生存函数”选项:如果选中此选项,则会输出1-累积生存函数。
* “危险函数”选项:如果选中此选项,则会输出以线性刻度生成的累积危险函数。
* “负对数累积生存函数的对数”选项:如果选中此选项,则会输出1-对数刻度生成的累积生存函数。
在“图类型”选项组中选择任意一种生成图形类型后,下方的“协变量值的位置”列表框被激活,从中选择分类协变量进入右侧的“单线”文本框中,SPSS按其变量值将数据分为两个或多个小的分组,然后再分别对各个小的分组生成图形。
选择协变量后,“更改值”选项组被激活,在此选项组中选择以什么样的对比变量和协变量的均值来输出函数图形。“均值”表示均值,选中该选项后单击“更改”按钮即可确定;“值”文本框用于输入设定相应数值。
设置结束后,单击“继续”按钮确认选择并返回到“Cox回归”对话框。
3.“保存”选项
单击“保存”按钮,即可弹出“Cox回归:保存新变量”对话框,如图2.1.14所示。
“生存函数”选项组用于选择所要保存的生存函数。
* “函数”选项:如果选中此选项,则会以“sur_”为变量名的变量来保存累积生存概率的估计值。
* “标准误”选项:如果选中此选项,则会以“se_”为变量名的变量来保存累积生存概率的估计值的标准差。
* “负对数累积生存函数的对数”选项:如果选中此选项,则会以“lml_”为变量名的变量来保存经对数转换的生存函数估计值。
图2.1.14 “Cox 回归:保存新变量”对话框
* “危险函数”选项:如果选中此选项,则会以“haz_”为变量名的变量来保存累积危险概率的估计值。
* “偏残差”选项:如果选中此选项,则会以“pr_”为变量名的变量来保存生存时间的偏残差。
* DfBetaD选项:如果选中此选项,则会以“dfb_”为变量名的变量来保存Beta系数。它是因消除一个观测值而引起的相关系数的变化值,包括常数项的每一项的相关系数都要计算。
* “X*Beta”选框:如果选中此选项,则会以“xbe_”为变量名的变量来保存线性预测因素分值,即每个变量中心协变量值与其相应的参数估计值得积之和。
设置结束后,单击“继续”按钮确认选择并返回到“Cox回归”对话框。
4.“选项”选项
单击“选项”按钮,即可弹出“Cox回归:选项”对话框,如图2.1.15所示。
图2.1.15 “Cox回归:选项”对话框
“模型统计量”选项组用于选择模型统计量。
* “CI用于expB”选项:如果选中此选项,则在后面的设置框内设定相对危险估计值的置信区间,在进行统计时,会输出置信区间,系统默认置信水平为95%。
* “估计值的相关性”选项:如果选中此选项,则输出回归系数的相关矩阵。
“显示模型信息”用于设置需要显示的模型信息,对于现有的模型,Cox回归输出似然比统计量和卡方统计量。对于模型中的变量,输出估计的参数、它们的标准差和 Wald 统计量。对于不在模型中的变量,输出分值统计量和残差的卡方统计量。
* “在每个步骤中”选项:如果选中此选项,则会对每一步进入过程都输出上述的所有统计量。
* “在最后一个步骤中”选项:如果选中此选项,则会输出最后的回归模型的上述的所有统计量。
“步进概率”选项组用于选择逐步分析方法。
* “进入”数值框用于设置协变量进入模型的阀门值,即引入的概率。
* “删除”数值框用于设置从模型中删除协变量的阀门值,即剔除概率。
* “最大迭代次数”数值框用于设置迭代进行的最大次数,系统默认为20次。
* “显示基线函数”选项:如果选中此选项,则会输出基准危险函数,以及以协变量均值衡量的生存函数和危险函数。如果还设置了一个分层变量,则会对每一分层会输出一个统计量表。
设置结束后,单击“继续”按钮确认选择并返回到“Cox回归”对话框。
所有设置结束后,单击“确定”按钮,执行Cox回归分析。
2.2 信 度 分 析
信度分析Reliability Analysis又称可靠性分析,是一种度量综合评价体系是否具有一定的稳定性和可靠性的有效分析方法。综合评价问题在统计学方面可利用信度分析方法进行分析。基本方式是做出被评估对象的总体目标,然后将其分解为若干个子目标,它们是总体目标不同方面的体现,是总体特征的部分反映。进一步,再将每个子目标进行量化处理。评估者通过计算被评估对象的总体得分得到最终的评估结果。
上述过程实际上是编制量表的过程。编制量表是否合理决定评价结果的信度和效度。SPSS的信度分析的主要作用在于对测验工具量表或问卷内在信度的分析。
本节主要讨论信度分析的基本方法和SPSS操作。
2.2.1 信度分析简介
信度反映了测验工具所得到的结果的一致性或稳定性,是被测特征真实程度的指标。
一般而言,两次或两个测验的结果越接近,则误差越小,所得的信度越高。信度本身与测量所得结果正确与否无关,它的功用在于检验测量本身是否稳定,学者 Kerlinger认为信度可以衡量出工具问卷的可靠度、一致性与稳定性;信度值强调的是某一特定类型下的一致性,信度系数会因不同时间、不同受试者或不同评分者而出现不同的结果。一般信度的测量时容易产生误差的原因,是来自研究者的因素,包括测量内容遣词用句、问题形式等不当、情境时间长短、气氛、前言说明等以及研究者本身的疏忽听错、记错等;而来自受访者的因素则可能是由于其个性、年龄、教育程度、社会阶层及其他心理因素等,而影响其答题的正确性。在统计学分析方面,信度检验完全依赖于统计方法。
另外,效度与信度的关系:信度为效度的必要而非充分条件。既有效度一定又信度,但有信度不一定有效度。
研究者通过信度与效度的检验,可以了解测验工具本身是否优良适当,以作为改善修正的根据,并可避免做出错误的判断。问卷受访时间间隔的影响及内容的同构型是影响信度的两个主要因素。
根据被测试者的测试时间和测试内容,信度又可分为内在信度和外在信度。内在信度是对一组问题也可称之为题项是否测量同一个概念,即这些问题题项的内在一致性如何,能否稳定地衡量这一概念变量或维度,最常用的检测方法是Cronbach’s克朗巴哈?系数;而外在信度是指对相同的测试者在不同时间测得的结果是否一致,重测信度是外在信度最常用的检验法。
信度指标是对信度的一种定量化的描述方式,信度指标的量化值称为信度系数。信度系数越大,表明测量的可信程度越大,但也无法期望两次测验结果完全一致,信度除受测验质量影响外,亦受很多其他受测者因素的影响,故没有一份测验是完全可靠的。不同研究者对信度系数的界限值有不同的看法,一般认为,0.60~0.65认为不可信;0.65~0.70认为是最小可接受值;0.70~0.80认为相当好;0.80~0.90就是非常好。
因此,一份信度系数好的量表或问卷最好在0.80以上,0.70~0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60~0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应该考虑重新修订量表或增删题目。
信度指标多以相关系数来表示,大致可分为稳定系数跨时间的一致性、等值系数跨形式的一致性和内在一致性系数跨项目的一致性3类。
2.2.2 信度分析操作
选择菜单栏中的“分析”→“度量”→“可靠性分析”命令,即可弹出如图2.2.1所示的“可靠性分析”对话框。
图2.2.1 “可靠性分析”对话框
在左侧的源变量框中选择两个或两个以上的变量作为评估项目,选中要分析的变量后,单击右向箭头按钮,将其移动到“项目”列表框中。
在“模型”下拉列表框中选择信度分析模型,SPSS给出了5种模型。
* α选项:对应Cronbach’s α模型,为系统默认选项。该选项计算用于度量表内部的一致性的克朗巴哈Cronbachα系数。
* “半分”选项:对应拆半信度系数模型。该选项用于计算度量外在信度的表间相关程度的拆半信度系数,输出结果将给出Guttman和Spearman-Brown拆半信度系数以及拆半后两部分的克朗巴哈α系数,考察两部分间的相关性。
* Guttman选项:对应Guttman模型法。该选项用于计算最低下限的真实信度法,输出结果中产生6个信度系数,lambda1~lambda6。
* “平行”选项:对应平行模型法。该选项用于计算各评估项目变异数同质时的最大概率Maximum-Likelihood信度,该模型假设所有项目具有相等的方差和相等的方差误差。
* “严格平行”选项:对应严格平行模型法。该模型是假设评估项目具有相等均值的平行模型法,输出结果种包含有模型的拟合优度检验、各评估项目的方差计值、项内相关系数、信度的无偏估计等统计量。
在“可靠性分析”对话框中单击“统计量”按钮,即可弹出“可靠性分析:统计量”对话框,如图2.2.2所示。该对话框用于选择描述信度和评估项目的统计量。
“描述性”选项组中给出了根据个案产生的尺度或评估项目的描述性统计。
* “项”选项:选中该选项,表示输出各评估项目的基本描述统计量,包括项内均值合标准差等。
* “度量”选项:选中该选项,表示输出各评估项目之和的基本描述统计量,包括均值、方差等。
* “如果项已删除则进行度量”选项:选中该选项,表示输出剔除某评估项目后的基本统计量,以便对各评估项目逐个评价。
图2.2.2 “可靠性分析:统计量”对话框
“项之间”选项组中给出了输出项内统计量的选项。
* “相关性”选项:表示项内相关系数矩阵。如果选中此选项,则会输出相关系数矩阵的基本描述统计量。
* “协方差”选项:表示项内协方差矩阵。如果选中此选项,则会输出协方差矩阵的基本描述统计量。
“摘要”选项组中给出了根据所有评估项目的分布计算的基本描述统计量。
* “均值”选项:表示评估项目均值。如果选中此选项,则输出若干个评估项目平均分的基本描述统计量,包括最大、最小和评估项目均值的平均分,以及评估项目平均分的极差和方差,最大评估项目平均分和最小评估项目平均分比率。
* “方差”选项:表示评估项目方差。输出若干个评估项目方差的基本描述统计量,包括最大、最小和评估项目均值的方差,以及评估项目方差的极差和方差,最大评估项目方差和最小评估项目方差的比率。
* “协方差”选项:表示评估项目内在协方差。输出若干个评估项目协方差矩阵的基本描述统计量,包括最大、最小和评估项目的内在协方差,以及评估项目内在协方差的极差和方差,最大评估项目内在协方差和最小评估项目内在协方差的比率。
* “相关性”选项:表示评估项目内在相关系数。输出若干个评估项目相关系数矩阵的基本描述统计量,包括最大、最小和评估项目的内在相关系数,以及评估项目内在相关系数的极差和方差,最大评估项目内在相关系数和最小评估项目内在相关系数的比率。
“ANOVA 表”选项组中给出了用于检验同一被评估项目在各评估项目上的得分是否有一致性的方法。
* “无”选项:表示不做检验。
* “F检验”选项:即F检验,表示重复测量的方差分析,适合于数据为定距型且服从正态分布的情况。
* “Friedman 卡方”选项:即Friedman卡方分析,表示进行非参数检验中的多配对样本Friedman检验,适合数据为非正态分布或定序型数据,计算Friedman和Kendall一致性系数。在ANOVA表中,利用卡方检验代替F检验。
* “Cochran 卡方”选项:即计算Cochran’s Q检验值,表示进行非参数检验中的多配对样本Cochran检验,适合数据为二值型。在ANOVA表中,利用Q统计量代替F统计量。
在“可靠性分析:统计量”对话框中,还给出了对评估项目检验和计算的选项。
* “Hotelling的T平方”选项:表示Hotelling T方检验,检验所有评估项目的均值是否相等的多变量检验。
* “Tukey的可加性检验”选项:表示可加型的Tukey检验,用于检验评估项目中是否存在倍增交互作用。
* “同类相关系数”选项:表示组内相关系数,用于进行一致性测度或个案数值的一致性检验。
当选中“同类相关系数”选项后,因为计算组内相关系数需选择计算方法和相关类型下列选项变为可用。
* “模型”下拉列表框中给出了用于选择计算组内相关系数的方法,其中“双向混合”为系统默认选项,当个案效应和评估项目效应均为固定时选择此选项;“双向随机”,当个案效应和评估项目效应均为随机时选择此选项;“单项随机”,当个案效应为随机时选择此选项。
* “类型”下拉列表框用于选择指示类型,可选择的类型有“一致性”为系统默认选项和“绝对一致”两个。
* “置信区间”列表框用于指定置信区间的水平,默认值为95%。
* “检验值”列表框用于指定假设检验过程的检验值,默认值为0,可输入0~1之间的数值,用于类间相关系数的比较。
在实际应用中,一般将信度分析与因子分析相结合,来确定测验工具项目的增减,基本步骤如下:
1先做因子分析。选择菜单栏中的“分析”→“降维”→“因子分析”命令,弹出“因子分析”对话框,然后单击“旋转”按钮,在“方法”选项组中选择“最大方差法”选项;单击“继续”按钮,返回到“因子分析”对话框,单击“选项”按钮,在“系数显示格式”选项组中,设定“绝对值不小于0.5”。执行相关分析后,在输出窗口中得到结果,如果显示信息为“KMO=0.5Yesthen communaity0.5?Yes”,那么删去所有communaity0.5的项目,再重做因子分析,直到全部communaity=0.5;或“KMO=0.5Yesthen communaity=0.5?Yes”;“旋转成分矩阵”中如果有项目落到两个或两个以上的因子上,或有题项没有落到任何一个因子上,都要删掉再重做因子分析,按照上述方法循环,直到所有指标全部达标相关内容请参照本书第10章。
2再做信度分析。选择菜单栏中的“分析”→“度量”→“可靠性分析”命令,打开“可靠性分析”对话框,然后单击“统计量”按钮,在“描述性”选项组下选中“如果项已删除则进行度量”选项,执行相关分析后,在输出窗口中得到结果,在表“可靠性分析”中,如果Cronbach’s Alpha大于等于0.8,那么表示不用删掉任何项目,结果足够好;如果Cronbach’s Alpha小于0.8,则要在表“项-Total Statistics”中,看指标Alpha if Item Deleted输出剔除某评估项目后的基本统计量,即α系数可提高或降低为此值,把题项剔除,使α系数大于等于0.8。一般而言,α系数值的最低要求要大于等于0.7。若α系数小于0,说明该反转的题项未反转,检查题项,将其反转。
2.3 时间序列分析
系统中某一变量的观测值按时间顺序时间间隔相同排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其他各种因素影响的总结果。通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。它不研究事物之间相互依存的因果关系。许多经济、金融、商业等方面的数据都是时间序列数据,时间序列的预测和评估技术相对完善,其预测情景相对明确,尤其关注预测目标可用数据的数量和质量,即时间序列的长度和预测的频率。
2.3.1 时间序列分析简介
时间序列具有以下特征。
* 趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。
* 周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
* 随机性:个别为随机变动,整体呈统计规律。
* 综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。
* 随机性:均匀分布、无规则分布,可能符合某统计分布用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。
* 平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。
认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。样本序列的自相关函数只是时间间隔的函数,与时间起点无关。其具有对称性,能反映平稳序列的周期性变化。特征识别利用自相关函数ACF:?k=?k?0,其中?k是yt的k阶自协方差,且?0=1、-1?k1。平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其他先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。
实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。
时间序列具有以下可预测的类型。
* 点预测:确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。
* 区间预测:未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。区间的长度传递了预测不确定性的程度,区间的中点为点预测值。
* 密度预测:序列未来预测值的一个完整的概率分布。根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。
无论是哪种模型形式,时间序列总是受自身历史数据序列变化的影响,因此需将历史数据序列作为一个新的时间序列变量。
2.3.2 时间序列分析操作
选择菜单栏中的“转换”→“创建时间序列”命令,即可弹出如图2.3.1所示的“创建时间序列”对话框。
图2.3.1 “创建时间序列”对话框
在功能“函数”下拉列表框中选择变量转换的函数。
* 非季节差分Differences:计算时间序列连续值之间的非季节性差异。
* 季节性差分Seasonal Differences:计算时间序列跨距间隔恒定值之间的季节性差异,跨距根据定义的周期确定。
* 先前移动平均Prior Moving Average:计算先前的时间序列数值的平均值。
* 差值Difference:计算围绕和包括当前值的时间序列数值的差。
* 中心移动平均Centered Moving Average:计算围绕和包括当前值的时间序列数值的平均值。
* 运行中位数Running Medians:计算围绕和包括当前值的时间序列的中位数。
* 累计求和Cumulative Sum:计算直到包括当前值的时间序列数值的累计总数。
* 滞后Lag:根据指定的滞后顺序,计算在前观测量的值。
* 提前Lead:根据指定的领先顺序,计算连续观测量的值。
* 平滑Smoothing:以混合数据平滑为基础,计算连续观测量的值。
以上各选项主要用在生成差分变量、滞后变量、平移变量,并且还要关注差分、滞后、平移的次数,以便在建立模型、进行参数估计时,使方程达到一致。
在“顺序”数值框中填入在前或在后的时间序列数值间隔的数目。在“变量”列表框中接受左侧列表框移来的源变量。在“名称”列表框中定义新变量的名称,但必须单击“更改”按钮方能成立。单击“确定”按钮运行系统,在原数据库中出现新变量列。
另外,若需产生周期性时间序列的日期型变量,则单击菜单栏中的“数据”→“定义日期”命令,即可弹出如图2.3.2所示的“定义日期”对话框。
图2.3.2 “定义日期”对话框
在样本“个案为”列表框中选择定义日期变量的时间间隔,在起始日期“第一个个案为”列表框中设定日期变量第一个观测量的值,单击“确定”按钮完成定义。采用最大似然估计或最小二乘估计等方法估计?、?参数值,并进行显著性检验。
2.4 统 计 图 形
SPSS除了提供很多的统计分析功能以外,还提供了强大的绘图功能。SPSS可以生成20多种图形,并且可以对输出图形进行多种形式的编辑和修改。SPSS中专门用于统计绘图的是“图形”菜单。在常用的统计图中,除生存曲线被完全整合到“生存函数”模块中、P-P概率图和Q-Q概率图被整合到“描述统计”模块中外,其他统计绘图均可由“图形”菜单的各子菜单完成。
SPSS输出图形的方式有很多种,可以由统计软件分析过程生成,也可以直接从“图形”菜单中包含的一系列图形选项中直接产生。在SPSS中具有友好的交互式功能和图形处理功能,用户可以在短时间内绘制出高质量的统计图形,并且可以对生成的图形进行编辑和修改,以保证图形的质量和适用性。本节主要介绍“图形”菜单下各子菜单的基本功能和主要选项。
在新版本中,“图形”菜单中取消了控制图Control、帕累托图Pareto、时间序列图Time Series等图形功能,保留了常用的几种图形。但是,这些图形依然可以通过“分析”菜单下相应的分析过程得出。
2.4.1 图形生成器
SPSS的图形生成器Chart Builder是由早期版本中Graphs菜单下的Gallery过程发展形成的,是SPSS 14.0 for Windows及其以后的版本中新添的绘制图表界面。
Chart Builder是一种简易的绘制图形工具。利用Chart Builder对话框可以直接将图形元素用拖动的方式放入图表对话框中的画布区域,例如可以预先设置横轴的变量以及条形图的样式等。其特点是可以产生所见即所得的样式。此外,还可以利用已创建的图形通过设定快捷方式来创建新的图形。
利用“图表构建程序”方式创建图形是初级用户的一个较好的选择,可以提高创建图形的效率,减少一些不可预见的错误。
通过选择菜单栏中的“图形”→“图表构建程序”命令来打开图形生成器。如图2.4.1所示为“图表构建程序”对话框。
图2.4.1 “图表构建程序”对话框
2.4.2 传统模式创建图形
利用传统模式创建图形Legacy Chart是直接生成SPSS图形的主要方式。和交互模式不同的是,传统图形的生成模式是以对话框设置的方式创建的,这一点和前面的统计分析功能的对话框操作类似。操作时需要在各级对话框中选择图形的变量,设置变量产生的图形类型和参数以及其他的选项,例如对缺失值的处理等。
传统图形模式可以生成更多类型的图形,同时还可以利用SPSS的语句命令进行创建;但和交互模式相比,传统图形模式缺少灵活性和直观性,这一点可以通过对生成图形的进一步编辑得到改进。
在“旧对话框”子菜单中可以创建以下类型的传统模式图形。
* Bar:该选项生成条形图。
* 3-D Bar:该选项生成三维条形图。
* Line:该选项生成线图。
* Area:该选项生成面积图。
* Pie:该选项生成饼图。
* High-Low:该选项生成高低图。
* Boxplot:该选项生成箱图。
* Error Bar:该选项生成误差条图。
* Population Pyramid:该选项生成金字塔图。
* ScatterDot:该选项生成散点图。
* Histogram:该选项生成直方图。
在“旧对话框”子菜单中提供了条形图、线图、饼图等图形的传统模式绘制方式。下面以用绘制条形图为例来简单讲解传统模式图形的绘制方法。
建立或打开数据文件后,在数据编辑窗口中,选择菜单栏中的“图形”→“旧对话框”→“条形图”命令,即可打开如图2.4.2所示的“条形图”对话框。
在该对话框中给出了3种条形图图式,即简单箱图Simple、复式条形图Clustered Bar Chart和堆积面积图Stacked Bar Chart。在左侧给出了例图图例,单击该图例,即可选择相应的条形图类型。
* “简单箱图”例图:为系统默认选项。如果选择该图例,则会做出简单条形图。该条形图使用单个的条形来对每一个类别、观测或变量做出对比。这种图形用间隔的等宽条带表示各类统计数据的大小,可以很明显地显示基于某一种分类的各类数据间的对比情况。该图形的形成有两个统计量决定。
* “复式条形图”例图:如果选择此图例,则会做出分组条形图或复合条形图,适用于对两个变量交叉分类的描述。该条形图使用一组条形来做出对比,每一类的条形图都能表现出一群观测、分类的变量或单个的观测。每个组的位置是其中一个变量的取值,在该位置上紧密排列的若干条带是以不同颜色标记的另一个变量的取值,条的长度是要描述的统计量的值。这种图形相当于根据其他变量对简单条形图中的每一个条带对应的数据作进一步的分类,图形的形成由3个变量决定。
* “堆积面积图”例图:如果选择此图例,则会做出分段条形图,该图形实际上也是对简单条形图的一种复合。该图形适用于两个变量交叉分类的描述,每个条的位置是其中一个变量的一个取值,条的长度是要描述的统计量的值,但是按另一个变量各类别所占的比例将原条带划分为多个段,并用不同的颜色或阴影填充方式来表示这种分段。这样形成的图形在形式上就像堆垒条形积木一样,因此称为堆栈条形图。又由于该图具有明显的分段特征,因此又称为分段条形图。
在“条形图”对话框下方的“图表中的数据为”选项组可以选择条形图中统计量的描述方式,系统提供3种模式。
* “个案组摘要”选项:为系统默认选项,表示个案分组模式。如果选中此选项,将根据分组变量对所有个案进行分组,然后根据分组后的个案数据创建条形图。
* “各个变量的摘要”选项:表示变量分组模式。如果选中此选项,则能描述多个变量。简单类型的条形图能描述文件中的每一个变量涵括所有观测。复杂类型的条形图能使用另一个分类变量来描述一个变量。
* “个案值”选项:表示个案模式。如果选中此选项,将为分组变量中每一个观测值生成一个条形图,条带的长度表示观测值的大小。当数据文件中包含大量个案时,显然不适合用个案模式简单条形图来描述;但适用于对原始数据进行一定的整理后形成的概括性的数据文件,例如利用数据的分类汇总功能等整理后的数据文件。
设置结束后,单击“定义”按钮,可以进入具体条形图对话框对相关图形做进一步的设置。现在以个案分组模式为例说明绘制简单条形图的方法。在“条形图”对话框的条形图图式栏中选择“简单箱图”图例,并且在“图表中的数据为”选项组中选中“个案组摘要”选项,单击“定义”按钮即可打开“定义简单条形图:个案组摘要”对话框,如图2.4.3所示。
在该对话框中可以定义生成条形图的统计量、应用图形模板等。
“类别轴”列表框用于从左侧的源变量框中选择变量,被选入的变量作为分类变量。分类变量的不同值对应条形图中条的数目,分类变量可以是字符型变量或数值型变量。
“条的表征”选项组中的选项用于定义确定条形图中条带的长度的统计量。
* “个案数”选项:为系统默认选项。如果选中此选项,则条形图的长度为分类变量值的观测数。条形图中条的长度表示频数,可以视为频数分布表的图形表示。
* “个案数的%”选项:如果选中此选项,则条形图的长度为分类变量的观测在总观测中所占的百分比,即以频率作为统计量,条形图中的长度表示的是频率。
* “累积个数”选项:如果选中此选项,则条形图的长度为分类变量中到某一个值的累积频数,即分类变量的当前值对应的个案数与以前各值对应的总个案数。
* “累计%”选项:如果选中此选项,则条形图的长度为分类变量中到某一个值的累积百分比,即条的长度表示的是累计频率。
* “其他统计量例如均值”选项:如果选中此选项,则“变量”文本框被激活,选择变量后,单击向右箭头按钮将其移入该文本框,系统按照默认设置对该变量的数据取均值,并作为条形图条的长度。
如果不希望对变量取均值,需要改变变量的统计量函数,单击“更改统计量”按钮,即可弹出如图2.4.4所示的“统计量”对话框。
图2.4.3 “定义简单条形图:个案组摘要”对话框
2.4.4 “统计量”对话框
在该对话框中可以选择总体特征的描述统计量、单侧区间数据特征描述统计量和双侧区间数据的特征描述统计量。
在“选定变量的统计量”选项组中可以选择描述数据总体特征的统计量。
* “值的均值”选项:如果选中此选项,则以变量a的均值为条形的长度。该选项为系统默认选项。
* “值的中位数”选项:如果选中此选项,则以变量a的中位数为条形的长度。
* “值的众数”选项:如果选中此选项,则以变量a的众数为条形的长度。
* “个案数”选项:如果选中此选项,则以变量a的观测数为条形的长度。
* “值的和”选项:如果选中此选项,则以变量a的值和为条形的长度。
* “标准差”选项:如果选中此选项,则以变量a的标准差为条形的长度。
* “方差”选项:如果选中此选项,则以变量a的方差为条形的长度。
* “最小值”选项:如果选中此选项,则以变量a的最小值为条形的长度。
* “最大值”选项:如果选中此选项,则以变量a的最大值为条形的长度。
* “累计求和”选项:如果选中此选项,则以变量a值的累积和为条形的长度。
在对话框的中间给出了单侧区间数据特征的描述统计量。当选择该区域中的选项时,上方的“值”数值框被激活。在“值”数值框中输入数值,表示单侧区间的固定界限称为内界。按照原有数据与内界的大小关系,可见所有数据划分为两个区间,即大于该值的区间和小于该值的区间。
* “上百分比”选项:如果选中此选项,则以变量a的值大于阀值在“值”文本框中设定的比例作为条形的长度。
* “下百分比”选项:如果选中此选项,则以变量a的值小于阀值在“值”文本框中设定的比例作为条形的长度。
* “百分位”选项:如果选中此选项,则以变量a的值的百分位数作为条形的长度。
* “上个数”选项:如果选中此选项,则以变量a的值大于阀值在“值”文本框中设定的数目作为纵轴。
* “下个数”选项:如果选中此选项,则以变量a的值小于阀值在“值”文本框中设定的数目作为纵轴。
在对话框的下方为描述双侧区间数据特征的统计量。当选择该区域中的选项后,上方的“低”和“高”文本框被激活,在“低”文本框中输入区间下限,在“高”文本框中输入区间上限。
* “内百分比”选项:如果选中此选项,则以变量a的值在指定区间在“低”和“高”文本框中设定的比例为纵轴。
* “内数”选项:如果选中此选项,则以变量a的值在指定区间在“低”和“高”文本框中设定的数目为纵轴。
* “值是组中点”选项:如果选中此选项,则值由中点分类。
设置结束后,单击“继续”按钮确认并返回到“定义简单条形图:个案组摘要”对话框。
在该对话框中有“面板依据”选项组,用于建立子图网,这是SPSS for Windows中新增的功能。
1.“标题”选项
在该对话框中单击“标题”按钮,即可弹出如图2.4.5所示的“标题”对话框。
在“标题”对话框中可以设定图形的标题。
* “标题”选项组的两个文本框用于输入标题,用户可以选择其中的任何一个文本框输入图形的标题;如果用户需要输入的标题太长,可以分成两行分别在两个“行”文本框中输入。
* “子标题”文本框用于输入副标题。
* “脚注”选项组用于输入脚注。该选项组也有两个“行”文本框,用户可以选择其中的任何一个文本框输入图形的注释;如果用户需要输入的注释太长,可以分成两行分别在两个“行”文本框中输入。
设置结束后,单击“继续”按钮确认并返回到“定义简单条形图:个案组摘要”对话框。
2.“选项”选项
在该对话框中单击“选项”按钮,即可弹出如图2.4.6所示的“选项”对话框。
图2.4.5 “标题”对话框
图2.4.6 “选项”对话框
在“选项”对话框中可以选择缺失值的处理方式和误差条图的显示方式。
“缺失值”选项组只有在“条的表征”选项组中有多个变量时才会被激活。缺失值的处理方式选项和前面章节中所讲的一样,此处不再赘述。
如果需要将缺失值作为单独的一个条带显示在条形图中,可以选中“显示由缺失值定义的组”复选框;如果需要在图中显示个案的标签值,可以选中“使用个案标签显示图表”复选框。
在SPSS for Windows中,该对话框中增加了“误差条图的表征”选项组,用于选择定义确定误差条形图中条带的长度的统计量。可以定义“置信区间”,系统默认为95.0%;也可以定义“标准误”的水平,系统默认为2.0;还可以定义“标准差”的水平,系统默认水平为2.0。
选择完毕后,单击“继续”按钮确认选择并返回到“定义简单条形图:个案组摘要”对话框。所有设置结束后,单击“确定”按钮,执行操作,在结果输出窗口中输出所需要显示的图形。
2.5 本 章 小 结
本章主要讲解了SPSS中的一些高级操作,包括生存分析、信度分析、时间序列分析以及统计图形的相关知识。读者可以根据对这一章的学习,从而巩固基本的操作知识。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.