12and13假设检验与t检验

阅读: 评论:0

12章分布类型的检验
本章将涉及统计学分析中最为主要的理论之一:假设检验,它是分析统计数据、构建统计模型进行决策支持的基石。
12.1假设检验的基本思想
12.1.1问题的提出
12.1.2假设检验的基本步骤
1.小概率事件
在讨论假设检验的基本思想之前,首先需要明确小概率事件这一概念。衡量一个事件发生与否可能性的标准是概率大小,通常概率大的事件容易发生,概率小的事件不容易发生。习惯上将发生概率很小,如P<=0.05的事件称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,因此,如果只进行一次试验,可以视为不会发生。
这里需要澄清一个事实:注意上面的表述是“一次试验中小概率事件不应当发生”,这并不表
示小概率事件不可能发生,也就是说,这里有一个前提:只进行一次试验,结果应当不会是小概率事件。如果进行多次(可能无穷多)试验,那么小概率事件就肯定会发生,或者说,小概率事件在一次试验中不大可能发生,然而在大量试验中几乎是必然发生的。
2.小概率反证法
假设检验的基本思想是统计学的“小概率反证法”原理:对于一个小概率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为,小概率事件在一次试验中不应当发生。因此可以首先假定需要考察的假设是成立的,然后基于此进行推导,来计算一下在该假设所代表的总体中进行抽样研究得到当前样本(及更极端样本)的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然就发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为它们实际上是不成立的,这就是小概率反证法原理。
假设检验的基本逻辑:先成立一个与H1相对立的H0。各种假设检验方法都是根据H0来成立抽样分布,然后求出H0是正确的可能性。如果我们能证明H0是对的可能性很小,那么就可以据此排除抽样误差的说法,认为H1可能是对的。简言之,假设检验的基本原则是直接
检验H0因而间接地检验H1,目的是排除抽样误差的可能性。
否定域,就是抽样分布内一端或两端的小区域,如果样本的统计值落在此区域范围内,则否定虚无假设。
显著度(levelofsignificance)表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否定域内的机会。
显著度愈小,便愈难否定虚无假设H0,也即愈难证明研究假设H1是对的。
3.假设检验的标准步骤
12.1.3假设检验的两类错误(参见李沛良《社会研究的统计应用》p157
第一类错误:弃真错误,Ⅰ型错误(α)
第二类错误:存伪错误,II型错误(β)
12.1.4假设检验中的其他问题
--原假设-备择假设
--单侧检验-双侧检验
--参数检验-非参数检验通常参数检验是在已经知道了相关数据的分布形式,只是不了解相应参数取值时采用的检验形式。而如果对相关数据的分布形式也并不了解,就必须先确定数据的分布形式,这样才可以进一步对分布做出更为具体的说明以及解释。
13章连续变量的统计推断(一)——t检验
13.1t检验概述
13.1.1t检验的基本原理
在针对连续变量的统计推断方法中,最常用的有t 检验方差分析AnalysisofVariance,ANOVA两种,其中t检验是最基本的检验方法,也是统计学中跨里程碑的一个杰作。它最初是由W.S.Gosset在1908年以笔名“Student”发表的一篇关于t分布的论文中提出的,并从此开始了利用小样本计量资料进行统计推断的先河,迎来了统计学的新纪元。
1.均数比较的一个实例
这里用一个典型的均数比较实例来引入t检验。
例13.1在CCSS项目中,以项目启动时的2007年4月的数据作为指数基线,基线期指数值为100,随后各期所计算出的指数则代表当期数值相对于“基线”调查数值的变动比例。CCSS中提供了北京、上海、广州三个一线城市的调查数据,现希望考察2007年4月北京、上海、广州三个一线城市的消费者信心指数值是否和基准值100存在差异。
如果从统计学的角度来看,这是一个典型的对总体均数进行假设检验的问题,在这种问题中,研究者所关心的变量为定距变量,因此可以使用均数来代表该定距变量的集中趋势。研究者对该样本所在总体的均数有一个事先的假设(本例中为指数100),而研究目的就是推断:实际上该样本所在总体的均数是否等于这一已知总体均数。根据假设检验知识可以给出两种可能的假设如下:
H0:u=u0,样本均数与假定总体均数的差异完全是由抽样误差造成的。
H1:u≠u0,样本均数与假定总体均数的差异除了由抽样误差造成外,确实也反映了实际的总体均数与假定的总体均数间的差异。
那么,究竟哪一种假设才是正确的呢?根据假设检验的步骤,可以首先假定H0是成立的。那么,该样本就真的是从均数为100的总体中随机抽样而来的。但是,如果考察该样本的实际数据,则会发现,2007年4月北京、上海、广州三地的总样本均数不等于100,而是98.34。
描述统计量(月份=200704箭扣长城一日游攻略
N
极小值
极大值
均值
标准差
上海迪士尼特项目总指数
300
31.24
140.59
98.3363
18.92074
有效的N(列表状态)
300
(注:利用以前学过的操作实现输出上面的表格)
两者之间存在着差异, -u=-1.66,仅看这一个数字很难推断出这种差异究竟是大还是小,因为这还和数据的离散程度有关,如果消费者信心值差异较大,本身信心指数的离散程度就比较大,那么这一差值可能并不起眼。反之,则这一差值可能相对比较明显。为此,需要到某种方式对这一差值进行标准化。T值的公式(见李沛良p165)
上图即为t分布。相应的标准化后的统计量为t统计量。显然,t统计量的分布规律是和样本量有关的,更准确地说是和自由度有关。自由度(DegreeofFreedom,一般用v或者英文缩写df来表示)这个概念还出现在其他分布中,它基本上是信息量大小的一个度量,描述
样本数据能自由取值的个数,在t分布中因为有给定的样本均数这一限定,所以自由度为df=n-1。从上图可以看出,当自由度增加时,它的分布就逐渐接近标准正态分布了。因此,在样本量较大时,可以用标准正态分布来近似t分布。
t检验就是应用t分布的特征,将t作为检验的统计量来进行的检验。
13.1.2SPSS中的相应功能
t检验在SPSS中基本上被击中在“比较均值”子菜单中,具体如下。
(1)单样本t检验过程:进行样本均数与已知总体均数的比较。
(2)独立样本t检验过程:进行两样本均数差别的比较,即通常所说的两组资料的t检验。
(3)配对样本t检验过程:进行配对资料的均数比较,即配对t检验。
13.2样本均数与总体均数的比较
13.2.1单样本案例:基期一线城市信心指数与基准值的比较
单个样本均数检验问题是一种关于总体均数的假设检验问题这种问题中只有一个随机抽样的样本,研究目的是推断这个样本的总体均数是否等于(或大于,或小于)某个已知总体均数。以例13.1为例,首先应当建立相应的假设。
H0:u=u0,2007年4月一线城市的总信心指数均值为100。
H1:u≠u0,2007年4月一线城市的总信心指数均值不是100。
α=0.05。
数据文件CCSS,其中变量index1为2007年4月的总指数,这是一个典型的单样本总体均数检验问题。天津佛罗伦萨小镇营业时间
SPSS中的操作分析比较均值单样本t检验
首先给出的是对当前样本进行的统计描述。
单个样本统计量
N
均值
标准差
均值的标准误
总指数
300
98.3363
18.92074
1.09239
然后是t检验的分析结果:
单个样本检验
检验值=100
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
总指数
-1.523
299
.129
-1.66367
-3.8134
.4861
t值自由度p
根据上面的检验结果t=-1.523,p=0.129,因为p值大于检验水准0.05,因此不能拒绝H0,不能认为样本所在的总体均数与假设的总体均数不同。
总体均数置信区间与t检验的一致性图13.5中同时给出了总体均数的置信区间和t检验的结果,两者的结论实际上是完全一致的,置信区间可用于回答假设检验的问题,同时这两者又是互为补充的关系:置信区间回答“量”的问题,即总体均数的范围在哪里,而假设检验
回答“质”的问题,即总体均数之间是否存在差异,以及在统计上确认这种差异的把握有多大。
置信区间在回答有无统计学意义的同时,还可进一步回答这种差异有无实际意义,如在13.2.1节中的案例中,2007年4月份的总指数与100相差在一定范围内都是正常的,则即使差异具有统计学意义,如果差值的可信区间并未超过范围,这个差值也可以认为正常。
13.3成组设计两样本均数的比较
在实际问题中,除了一个总体的检验问题外,还常碰到两个总体均数的比较问题,此时可以考虑使用成组设计的t检验来进行分析。
13.3.1方法原理
两样本t检验和单样本t检验的基本原理实际上非常相似,设两组样本量分别为n1和n2,且均来自两个正态分布的总体,则两样本t检验所建立的假设为:
H0:u1=u2,两样本均数的差异完全是抽样误差造成的,两总体均数相同。
H1:u河北自驾游必去的十个景点1≠u2,两样本均数的差异除由抽样误差造成外,也确实反映了两总体均数存在的差异。
13.3.2案例:不同收入水平家庭的信心指数比较
例13.2研究者认为家庭收入的高低可能会影响消费者信心的平均水平,收入较高的家庭其消费者信心应当比低收入家庭更高。根据前期研究的结果,CCSS项目中将受访家庭按照年收入是否大于4.8万元人民币分为两组,这里以2007年4月的数据为例,比较这两组家庭的消费者信心均值有无差异。
本案例的数据文件CCSS,其中变量index1为总指数,Ts9为家庭收入2级。这是一个典型的两样本t检验的问题,建立的假设如下。
H0:u1=u2,两组家庭收入级别在总指数上没有差别。
H1:u1≠u2,两组家庭收入级别在总指数上有差别。
α=0.05。
SPSS操作
首先给出的是两组需检验变量的基本情况描述。
组统计量
家庭收入2
海外国旅N
均值
标准差
均值的标准误
总指数
Below48,000
110
90.7458
21.23893
2.02505
Over48,000
145
104.4475
14.92637
1.23957
随后结果中会给出最重要的方差齐性检验和t检验分析结果。
方差方程的Levene检验
均值方程的t检验
差分的95%置信区间
F
Sig.
t云南师大旅行社排名
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
总指数
假设方差相等
11.930
.001
-6.047
253
.000
-13.70173
2.26593
-18.16421
-9.23924
假设方差不相等
-5.771
186.197
.000
-13.70173
2.37431
-18.38574
-9.01771

本文发布于:2023-08-25 06:11:37,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/2/596233.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:均数   样本   检验
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图