落日余晖

夕阳无限好，只是近黄昏。

附录

在统计推断中，我们常常需要评估一个估计量的好坏。通常使用以下几个标准：

无偏性 (Unbiasedness)

定义：若估计量 $\hat{\theta}$ 满足
$\mathbb{E}[\hat{\theta}] = \theta,$
则称它是 $\theta$ 的无偏估计。
解释：在平均意义上，它不会系统性偏离真值。
备注：如果 $\mathbb{E}[\hat{\theta}] \neq \theta$ ，则称为有偏估计，但有时适度的偏差能换取更小的方差，这类估计仍可能在应用中更优（如岭回归）。

一致性 (Consistency)

定义：若当样本量 $n \to \infty$ 时，估计量收敛到真值：
$\hat{\theta}_n \xrightarrow{P} \theta \quad \text{或} \quad \hat{\theta}_n \xrightarrow{a.s.} \theta,$
则称 $\hat{\theta}_n$ 是一致估计量。
解释：样本越大，估计越可靠。
备注：一致性通常需要借助大数定律来证明。

这里简单补充一下上述两种收敛方式的概念：

note

定义：
$\forall \epsilon > 0, \quad \lim_{n\to\infty} P(|\hat{\theta}_n - \theta| > \epsilon) = 0.$
意义：当样本越来越大时，估计量与真值相差超过 $\epsilon$ 的概率趋近于零。
直观比喻：大样本下，估计“通常”离真值很近，但偶尔会偏离。

📌 区别：

有效性 / 相合性 (Efficiency)

定义（参数情形）：在所有无偏估计量中，若某个估计量达到了 Cramér–Rao 下界，则称它是有效的。
非参数情形：我们一般用“方差随 $n$ 的变化”来衡量效率：
$\mathrm{Var}(\hat{\theta}_n) \to 0 \quad \text{当 } n \to \infty.$
解释：在有限样本下，方差越小，估计越稳定。

这里我们简单补充一下上述CR下界的概念：

note

一般定义

\mathrm{Var}(\hat{\theta}) \geq \frac{1}{I(\theta)},

其中 $I(\theta)$ 是 Fisher 信息量。

Fisher 信息量

I(\theta) = \mathbb{E}\!\left[\left(\frac{\partial}{\partial \theta} \log f(X;\theta)\right)^2\right].

Cramér–Rao 下界 (CRLB)

在非参数统计中的对应

\mathrm{Var}(\hat{F}_n(x)) = \frac{F(x)(1-F(x))}{n}.