点估计

  • 总体分布 F(x;θ), θ=(θ1,θ2,,θk), 根据 X1,X2,,Xn 构造一个统计量 θ^(X1,X2,,Xn) 作为 θ 的点估计

矩估计

  • 求总体的各阶原点矩 μi=gi(θ1,θ2,,θk)
  • 解得 θi=hi(μ1,μ2,,μk)
  • 用样本矩代替总体矩的矩估计 θ^i=hi(A1,A2,,Ak)
  • 相合性:h 为已知的连续函数,h(A1,A2,,Ak)Ph(μ1,μ2,,μk)

极大似然估计

  • X 为连续性随机不变量,密度函数为 p(x;θ),θΘ, 样本 (X1,X2,,Xn) 落在点 (x1,x2,,xn) 的领域的概率近似为 i=1np(xi;θ)dxi
  • 似然函数 L(θ)=L(x1,,xn;θ)=i=1np(xi;θ)
  • 极大似然估计值θ^(x1,x2,,xn)L(x1,x2,,xn;θ^)=maxθΘL(x1,x2,,xn;θ)
  • 极大似然估计量θ^(X1,X2,,Xn)
  • 对数似然函数 lnL(θ)
  • 不变性原则:θ^θ 的极大似然估计,ϕ(θ) 有单值反函数,则ϕ(θ)^=ϕ(θ^)
  • X(1)=min(Xi),X(n)=max(Xi)
    • F(n)(X)=Fn(X)

EM

  • 对数边际似然:L(D;θ)=1Nn=1Nlogp(x(n);θ)=1Nn=1Nlogzp(x(n),z;θ)
  • 变分函数:q(z)Z 上的分布
  • 证据下界 ELBO(q,x;θ)=zq(z)logp(x,z;θ)q(z)logzq(z)p(x,z;θ)q(z)=logp(x;θ)
    • q(z)=p(z|x;θ) 时,对数边际似然与下界相等
  • EM 算法
    • Expectation: 固定 θt,寻找 qt+1(z) 使 ELBO(q,x;θt)=logp(x;θt)
      • 理想分布:q(z)=p(z|x;θt) 推断问题
    • Maximization: 固定 qt+1(z),寻找参数最大化证据下界 θt+1=argmaxθELBO(qt+1,x;θ)
  • 信息论视角: logp(x;θ)=ELBO(q,x;θ)+KL(q(z)|p(z|x;θ))

估计量的评价标准

  • 无偏性
    • θ^(X1,X2,,Xn)θ 的估计量,Θθ 的取值范围,若E(θ^)=θ,θΘ, 则 θ^θ 的无偏估计
    • E(Ak)=μk
    • E(S2)=σ2
    • 渐进无偏估计:n 时无偏
    • 正态分布的矩估计和极大似然估计:
      • μ^=X
      • σ^2=S
  • 均方误差准则
    • M(θ^,θ)=E(θ^θ)2 值越小越好
    • M(θ^,θ)=D(θ^)+(Eθ^θ)2
      • 偏差:Eθ^θ
  • 一致性(相合性)
    • θ^nPθ

区间估计

  • (θ^1,θ^2)θ 的置信度为 1α 的置信区间:P(θ^1<θ<θ^2)=1α
    • 置信下限 θ^1
    • 置信上限 θ^2
    • 置信度 1α
  • (θ^1,+)θ 的置信度为 1α 的单侧置信区间:P(θ^1<θ)=1α
  • 枢轴变量法
    1. 枢轴变量:U(X1,X2,,Xn;θ) 分布已知
    2. 根据分布找到两个常数 a,b 使得 P(a<U<b)=1α
    3. 利用 a<U<b 求解 θ^1<θ<θ^2
  • 正态分布 (置信度1α
    • μ
      • σ2 已知:枢轴变量 U=Xμσ/nN(0,1)
        • [Xuα/2σ0n,X+uα/2σ0n]
      • σ2 未知:枢轴变量 T=n(Xμ)St(n1)
        • [Xtα/2(n1)Sn,X+tα/2(n1)Sn]
    • σ2
      • μ 未知:(n1)S2/σ2χ2(n1)
        • [(n1)S2χα/22(n1),(n1)S2χ1α/22(n1)]
      • μ 已知
        • [i=1n(Xiμ)2χ1α/22(n),i=1n(Xiμ)2χα/22(n)]
    • μ1μ2
      • σ12,σ2 已知:U=XY(μ1μ2)σ12n1+σ22n2N(0,1)
        • [(XY)uα/2σ12n1+σ22n2,(XY)+uα/2σ12n1+σ22n2]
      • σ12=σ22=σ2 未知:T=n1n2(n1+n22)n1+n2(XY)(μ1μ2)(n11)S12+(n21)S22t(n1+n22)
    • σ12/σ22
      • μ1,μ2 未知:F=S12σ22S22σ12F(n11,n21)
        • [S12S221Fα/2(n11,n21),S12S221F1α/2(n11,n21)]
  • 非正态总体均值 大样本法
    • Xμσ/nN(0,1)
    • σ 未知:用 S 代替