假设检验
- 原假设/null hypothesis $H_0$
- 备择假设/alternate hypothesis $H_1$
- 单边假设/双边假设
- 简单假设/复合假设
- 参数检验假设/非参数假设检验
- 假设检验的错误
- 第一类错误(弃真错误)
- P(拒绝 $H_0$|$H_0$)=$\alpha$
- 显著性水平 $\alpha$
- 第二类错误(存伪错误)
- P(接受 $H_0$|$H_1$)=$\beta$
- Neyman-Pearson 原则
- 在控制第一类错误 $\alpha$ 的前提下,使第二类错误的概率 $\beta$ 尽量小
- 拒绝有充分证据
- 接受:目前找不到拒绝 $H_0$ 的理由,先接受 $H_0
- 参数假设检验
- 参数处理的假设检验问题
- $H_0$ and $H_1$
- $\alpha$ and $n$
- 确定检验统计量 $U$ 和临界值、接受域、拒绝域
- 计算统计量的观察值,判断是接受还是拒绝 $H_0$
- 正态总体均值的假设检验
- $\sigma^2$ 已知 ($u$ 检验)
- $U=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$
- 双边拒绝域:$W={|U|\geq u_{\alpha/2}}$
- $\sigma^2$ 未知但相等 ($t$ 检验)
- $T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}$
- 双边拒绝域:$W={|T|\geq t_{\alpha/2}(n-1)}$
- 成对数据:成对$t$检验
- 两个正态总体的均值差
- $\sigma_1^2,\sigma_2^2$ 已知:$U=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$
- 双边拒绝域 $W={|U|\geq u_{\alpha/2}}$
- $\sigma_1^2,\sigma_2^2$ 未知:$T=\sqrt{\frac{n_1n_2(n_1+n_2-2)}{n_1+n_2}}\frac{(\overline{X}-\overline{Y})}{(n_1-1)S_1^2+(n_2-1)S_2^2}$
- 方差的假设检验 ($\chi^2$ 检验法)
- $\chi^2=\frac{(n-1)S^2}{\sigma_0^2}$
- 双边拒绝域 $W={\chi^2\leq \chi^2_{1-\alpha/2}(n-1)}\cup{\chi^2\geq\chi_{\alpha/2}^2(n-1)}$
- 方差比 $\sigma_1^2/\sigma_2^2$
- $F=\frac{S_1^2}{S_2^2}$
- 双边拒绝域 $W={F\leq F_{1-\alpha/2}(n_1-1,n_2-1)}\cup{F\geq F_{\alpha/2}(n_1-1,n_2-1)}$
- 分布拟合优度检验
- 假设 $H_0:F(x)=F_0(x;\theta)$
- 皮尔逊$\chi^2$拟合优度检验
- 将样本空间分为 $k$ 个互不相交的事件 $A_1,A_2,\cdots,A_k$
- 计算 $A_i$ 上的理论频数:若 $\theta$ 未知,可利用极大似然估计,$\hat p_i=P(X\in A_i|\theta=\hat\theta)$
- 计算实际频率 $n_i$
- 计算两者偏差方之和 $\chi^2=\sum_{i=1}^k\frac{(n_i-n\hat p_i)^2}{n\hat p_i}$
- 由 Pearson-Fisher 定理,拒绝域:$W={\chi^2\geq \chi^2_{\alpha}(k-r-1)}$
- 大样本,$n\geq 50, n\hat p_i>5$
- 独立性检验
- 假设 $H_0:X\perp Y$
- 列联表:$r\times s$ 列联表
- 独立性检验:$H_0:p_{ij}=p_i*p_j$
- 极大似然估计:$\hat p_{i*}=\frac{n_{i*}}{n},\hat p_{*j}=\frac{n_{*j}}{n}$
- $\chi^2=\sum_{i=1}^r\sum_{j=1}^s\frac{n_{ij}-n_{i*}n_{j}/n}{n_{i}n_{*j}/n}$