方差分析工具提供了以下3种不同类型的方差分析:单因素方差分析、包含重复的双因素方差分析和无重复的双因素方差分析。具体应该使用何种工具,需要根据因素的个数以及待检验样本总体中所含样本的个数而定。

单因素方差分析

也叫作一维方差分析,此工具可对两个或更多样本的数据执行简单的方差分析。此分析可提供一种假设测试,该假设的内容是:每个样本都取自相同的基础概率分布,而不是对所有样本来说基础概率分布都不相同。如果只有两个样本,则可使用工作表函数TTEST。如果有两个以上的样本,则没有使用方便的TTEST归纳,可改为调用“单因素方差分析”模型。

下面通过实例说明如何进行单因素方差分析。

STEP01:打开“单因素方差分析.xlsx”工作簿,将要处理的数据输入工作表中。本例将5个地区一天当中发生交通事故的次数输入工作表,原始数据如图22-25所示。下面将以α=0.01检验各地区平均每天交通事故的次数是否相等。

STEP02:选中工作表中的任意一个单元格,如B2单元格,切换至“数据”选项卡,然后在“分析”组中单击“数据分析”按钮打开“数据分析”对话框,如图22-26所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-25 原始数据

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-26 单击“数据分析”按钮

STEP03:打开“数据分析”对话框后,在“分析工具”列表框中选择“方差分析:单因素方差分析”选项,然后单击“确定”按钮,如图22-27所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-27 选择分析工具

STEP04:随后会打开“方差分析:单因素方差分析”对话框,在“输入”列表区域设置输入区域为“$A$3:$E$6”,在“分组”方式列表中单击选中“列”单选按钮,设置α的值为“0.01”。然后在“输出选项”列表区域中单击选中“输出区域”单选按钮,并设置输出区域为“$A$8”单元格,最后单击“确定”按钮返回工作表,如图22-28所示。

对话框中各选项简要介绍如下。

1)输入区域:输入待分析数据区域的单元格引用,该引用必须由两个或两个以上按列或行排列的数据区域组成。

2)分组方式:如果要指定输入区域中的数据是按行还是按列排列,则选择“行”或“列”单选按钮。

3)标志位于第一行/标志位于第一列:如果输入区域的第1行中包含标志项,则选中“标志位于第一行”复选框。如果输入区域的第1列中包含标志项,则选中“标志位于第一列”复选框。如果输入区域没有标志项,则不选择该复选框,Excel将在输出表中生成合适的标志项。

4)α:输入要用来计算F统计的临界值的置信度。α置信度为与I型错误发生概率相关的显著性水平(拒绝真假设)。

5)输出区域:输入对输出表左上角单元格的引用,Excel只在输出表的半边填写结果,这是因为两个区域中数据的协方差与区域被处理的次序无关。在输出表的对角线上为每个区域的方差。

6)新工作表组:选择此项可以在当前工作簿中插入新工作表,并由新工作表的A1单元格开始粘贴计算结果。如果要为新工作表命名,则在右侧的文本框中输入名称。

7)新工作簿:选择此项可以创建一个新的工作簿,并在新工作簿的新工作表中粘贴计算结果。

STEP05:此时,工作表中会显示“方差分析:单因素方差分析”的分析结果,如图22-29所示。由于F=1.50265<Fα=5.952544683,说明各地区每天的交通事故次数差异不显著。Fα为统计学固定值。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-28 “方差分析:单因素方差分析”对话框

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-29 方差分析:单因素方差分析结果

包含重复的双因素方差分析

双因素方差分析用于观察两个因素的不同水平对所研究对象的影响是否存在明显的不同。根据是否考虑两个因素的交互作用,它又可以分为“包含重复的双因素方差分析”和“无重复的双因素方差分析”。本节首先介绍“包含重复的双因素方差分析”。

例如,在测量植物生长高度的实验中,共施用了5种不同品牌的化肥(A、B、C、D、E),同时植物处于不同温度(20℃、25℃、30℃)的环境中。对于每种化肥与每种温度的组合各统计两次,测定结果如图22-30所示,本例中的原始数据记录保存在“可重复双因素分析.xlsx”工作簿中。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-30 统计数据

使用“包含重复的双因素方差分析”可以检验:

1)施用不同化肥的植物高度是否取自相同的基础样本总体,此分析忽略温度。

2)处于不同温度环境中的植物高度是否取自相同的基础样本总体,此分析忽略所使用的化肥品牌。

无论是否考虑上述不同品牌化肥之间的差异的影响以及不同温度之间差异的影响,代表所有{化肥,温度}值对的样本都取自相同的样本总体。另一种假设是除了基于化肥或温度单个因素的差异带来的影响之外,特定的{化肥,温度}值对也会有影响。

下面通过实例介绍进行包含重复的双因素方差分析的具体操作步骤。

STEP01:选中工作表中的任意一个单元格,如B2单元格,切换至“数据”选项卡,然后在“分析”组中单击“数据分析”按钮打开如图22-31所示的“数据分析”对话框,在“分析工具”列表框中选择“方差分析:可重复双因素分析”选项,然后单击“确定”按钮。

STEP02:随后会打开“方差分析:可重复双因素分析”对话框,在“输入”列表区域设置输入区域为“$A$3:$F$9”,在“每一样本的行数”文本框中输入“2”,设置α的值为“0.05”。然后在“输出选项”列表区域中单击选中“输出区域”单选按钮,并设置输出区域为“$A$11”单元格,最后单击“确定”按钮返回工作表,如图22-32所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-31 选择分析工具

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-32 设置参数

在“每一样本的行数”框中输入包含在每个样本中的行数。每个样本必须包含同样的行数,因为每一行代表数据的一个副本。

STEP03:此时,工作表中会显示“方差分析:可重复双因素分析”的分析结果,如图22-33所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-33 可重复双因素方差分析结果

无重复的双因素方差分析

此分析工具可用于当数据像可重复双因素那样按照两个不同维度进行分类时的情况,只是此工具假设每一对值只有一个观察值,例如,在上面的示例中的每个{化肥,温度}值对。下面通过实例说明如何进行无重复的双因素方差分析。

STEP01:打开“无重复双因素分析.xlsx”工作簿,将要处理的数据输入工作表中,本例中的原始数据如图22-34所示。

STEP02:选中工作表中的任意一个单元格,如B2单元格,切换至“数据”选项卡,然后在“分析”组中单击“数据分析”按钮打开如图22-35所示的“数据分析”对话框。在“分析工具”列表框中选择“方差分析:无重复双因素分析”选项,然后单击“确定”按钮。

STEP03:随后会打开“方差分析:无重复双因素分析”对话框,在“输入”列表区域设置输入区域为“$B$4:$F$6”,设置α的值为“0.05”。然后在“输出选项”列表区域中单击选中“输出区域”单选按钮,并设置输出区域为“$A$8”单元格,最后单击“确定”按钮返回工作表,如图22-36所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-34 原始数据

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-35 选择分析工具

STEP04:此时,工作表中会显示“方差分析:无重复双因素分析”的分析结果,如图22-37所示。

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-36 设置分析参数

Excel 方差分析:单因素、包含重复的双因素、无重复的双因素方差分析-Excel22

图22-37 无重复双因素方差分析结果