方差分析

时间：2020-07-07 12:39:33 阅读：86 评论：0 收藏：0 [点我收藏+]

1.单因素方差分析：

单因素方差分析：只有一个因素A对实验指标有影响，假设因素A有r个水平，分别在第i个水平下进行多次独立的观察，所得到的实验指标数据如下：

A_1：N(μ₁,σ²) X₁₁ X₁₂ ... X_1n₁

A₂_：N(μ₂,σ²) X₂₁ X₂₂ ... X₂_n2

Ar：N(μ_r,σ²) X_r₁ X_r₂ ... X_r_n_r

注意：每个水平的观测次数不一定一样

各总体间相互独立，因此有下面的模型：

技术分享图片

X_ij就是第i个水平的第j个观测值，μ_{i就是第i个水平的理论均值，ε}_i显示随机误差（误差服从正态分布）

分析因素A对于实验指标是否有显著影响，可以看因素A不同水平的均值是否有显著差异，因此有如下假设：

原假设：H₀:μ₁=μ₂=...μ_r

备选假设 H1：既是均值不全相等

X_ij有偏差，要不就是由于不同水平的均值不同，又或者是随机误差的存在，因此全部X_ij之间的差异的公式如下：

技术分享图片

上面这个叫总偏差平方和

技术分享图片

有A因素引起的差异叫效应平方和S_A，随机误差引起的差异，叫做误差平方和S_E

首先计算误差平方和，这样个体之间的差异的每个水平的均值没有关系，因此有如下：

技术分享图片

综合上述表达，得到：

技术分享图片

总偏差平方和减去误差平方和，得到

技术分享图片

S_E如果除以σ²则会符合自由度为n_i-1的卡方分布

当H0为真的时候技术分享图片，但是我们不知道σ^2，因此为了抵消这个未知量，我们构造的检验统计量为：

技术分享图片

我们最终只会关系p值，如果p>0.05则接受原假设，否则拒绝原假设

例子：

import pandas as pd
import numpy as np

from scipy import stats
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

# 这是那四个水平的索赔额的观测值
A1 = [1.6, 1.61, 1.65, 1.68, 1.7, 1.7, 1.78]
A2 = [1.5, 1.64, 1.4, 1.7, 1.75]
A3 = [1.6, 1.55, 1.6, 1.62, 1.64, 1.60, 1.74, 1.8]
A4 = [1.51, 1.52, 1.53, 1.57, 1.64, 1.6]

data = [A1, A2, A3, A4]
# 方差的齐性检验
w, p = stats.levene(*data)
if p < 0.05:
    print(‘方差齐性假设不成立‘)

# 成立之后， 就可以进行单因素方差分析
f, p = stats.f_oneway(*data)
print(f, p)      #  stats.f_oneway函数就可以直接算出检验假设的f值和p值

方差的齐性检验,如果p<0.05则拒绝原假设，即是方差不齐性

如果手动去计算：

#首先将数据改成DataFrame形式
values = A1.copy()
groups = []
for i in range(1, len(data)):
    values.extend(data[i])  #extend() 函数用于在列表末尾一次性追加另一个序列中的多个值

for i, j in zip(range(4), data):
    groups.extend(np.repeat(‘A‘+str(i+1), len(j)).tolist())

df = pd.DataFrame({‘values‘: values, ‘groups‘: groups})


#单因素分析
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
anova_res = anova_lm(ols(‘values~C(groups)‘, df).fit())
anova_res.columns = [‘自由度‘, ‘平方和‘, ‘均方‘, ‘F值‘, ‘P值‘]
anova_res.index = [‘因素A‘, ‘误差‘]
anova_res        # 这种情况下看p值  >0.05 所以接受H0

方差分析

原文：https://www.cnblogs.com/cgmcoding/p/13259823.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)