方差分析适用于什么数据类型(方差分析法)
一、什么是方差分析
什么是方差分析?
方差分析是在20世纪年代发展起来的一种统计方法,它是由英国统计学家费希尔在进行试验设计时为解释试验数据而首先引入的,根据所分析的自变量多少,方差分析一般包括单因素方差分析、双因素方差分析以及多因素方差分析。方差分析用于研究X对于Y的差异性,根据X的不同,方差分析又可以进行细分。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。单因素方差分析(即X为一个时时)使用频率最高,默认称单因素方差分析就是方差分析。
以单因素方差分析举例进行说明:
首先将数据整理成正确的格式,一般X一列,Y为一例,并且分析的数据带有数据标签的,需要另添加一个表格进行说明,数据格式如下:
将整理好的数据上传至SPSSAU系统内,如下:
分析三种不同剂量的郁金灌胃,小鼠存活时间是否有差异,以“组别”为自变量,以“存活时间”作为因变量进行单因素方差分析,结果如下:
从上表中可以看出,A组的均值为40.08,标准差为5.79;B组的均值为52.96,标准差为5.01;C组的均值为74.19,标准差为6.42。从中可以看出三者之间有差异,并且C组的小鼠存活时间相对更长,以及单因素方差模型的F值为106.968,P值远小于0.05,具有显著性差异,也说明了三者之间存在显著性差异。也可以用图示化方法进行描述三者的均值对比:
从折线图中可以看出,例子中“C组”的均值最大,其次是“B组”最后是“A组”也即说明“C组”的小鼠存活时间较长,然后是“B组”最后是“A组”。
二、方差分析是什么
方差分析:根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用F检验进行显著性检验的方法。又称“变异数分析”或“F检验”,是用于两个及两个以上样本均数差别的显著性检验。
F值是两个均方的比值[效应项/误差项],不可能出现负值。F值越大[与给定显著水平的标准F值相比较]说明处理之间效果[差异]越明显,误差项越小说明试验精度越高。
扩展资料:
方差分析,又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
(2)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。
总偏差平方和 SSt= SSb+ SSw。
组内SSw、组间SSb除以各自的自由度(组内dfw=n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb>>MSw(远远大于)。
MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
方差是衡量源数据和期望值相差的度量值。
1、设C是常数,则D(C)=0
2、设X是随机变量,C是常数,则有
3、设 X与 Y是两个随机变量,则
其中协方差特别的,当X,Y是两个不相关的随机变量则
此性质可以推广到有限多个两两不相关的随机变量之和的情况。
4、D(X)=0的充分必要条件是X以概率1取常数E(X),即
(当且仅当X取常数值E(X)时的概率为1时,D(X)=0。)
注:不能得出X恒等于常数,当x是连续的时候X可以在任意有限个点取不等于常数c的值。
参考资料:百度百科-方差分析
三、方差分析,请问该怎么做
答:方差分析的做法:
(一)求平方和
平方和的计算方法有三种:一种是用“平方和”定义公式,即公式9-3.9-4。一种是用原始数据公式,或利用样本统计量进行计算。
1.总平方和
总平方和是所有观测值与总平均数的离差的平方总和。用原始数据计算总平方和要使用公式9-10。表9-1中数据的总平方和等于: SS,=∑∑X nk(∑∑X)°
2.组间平方和
组间平方和是几个组的平均数与总平均数的离差的平方总和。用原话数据计算组间平方和使用公式911。表9-1中数据的组间平方和等于 SS,-∑(∑X)_(∑∑X)
组内平方和是各被试的数值与组平均数之间的离差的平方总和。计算组内平方和的公式为9-12。表9-1中数据的组内平方和等于: ss„=∑∑x-∑(∑X)°
(二)计算自由度
计算自由度的公式见公式9-8。在表9-1中,共有3组,每组有4个被试,因此
总自由度分别dfr=N-1=12-1=11组间自由度df=k-1=3-1=2
组内自由度dfw=k(n-1)=3x(4-1)=9
(三)计算均方
组间均方的MS。计算是用组间平方和除以组间自由度,组内均方 MSw是用组内平方和除以组内自由度。
(四)计算F值
(五)查F值表进行F检验并做出决断
假如拒绝虚无假设的力值(p-value)定为p=0.05,如果计算的值远大于所确定的显著性水平的临界值,表明F值出现的几率小于0.05,就可拒绝虚无假设,可以说不同组的平均数之间在统计上至少有一对有显著差异最如实验控制适当,也可以提出自变量对因变量作用显著的结论。
(六)陈列方差分析表
上面几个步骤的计算结果,可以归纳成一个方差分析表。
四、方差分析方法
方差分析(Analysis of Variance,简称ANOVA)为数据分析中常见的统计模型,主要为探讨连续型资料型态之因变量与类别型资料型态之自变量的关系。当自变项的因子中包含等于或超过三个类别情况下,检定其各类别间平均数是否相等的统计模式,广义上可将T检定中方差相等(Equality of variance)的合并T检定(Pooled T-test)视为是方差分析的一种,基于T检定为分析两组平均数是否相等,并且采
用相同的计算概念,而实际上当方差分析套用在合并T检定的分析上时,产生的F值则会等于T检定的平方项