上式中\(n=a+b+c+d\)

卡方检验的统计量是:

卡方检验的全称是Pearson’s Chi-square test,这是统计中最重要的检验。

从用途来讲, 卡方检验可以做两件事:

这篇不讲怎么用卡方检验,而是讲讲卡方检验的公式,推导,以及和似然检验的联系,目的是温故知新。

从公式来讲卡方检验:

同卡方检验的公式相比较,这里面有两个问题:

以上四个步骤可以从理论上证明卡方检验。另外一种思路是把似然检验(G-test)和卡方检验联系起来:

可见两种检验基本上是等价的(上面推导来自[3],但更简洁)。

然而,似然检验和卡方检验相比,似然检验需要计算对数,在皮尔森的年代,这是很不方便的。

卡方检验则便于手算,这或许是得到广泛应用的原因之一吧。