图中展示了在女士‘全部猜对’的情况下,P值随总杯数增加而下降的趋势。
8 杯是第一个能提供‘强有力证据’且‘操作简便’的最小样本量。
Fisher 假设列联表的行列边际(Margins)是固定的。在这种情况下,猜对杯数 \(k\) 的概率计算如下:
$$P(K = k) = \frac{\binom{n}{k} \binom{n}{n - k}}{\binom{2n}{n}}$$
这里的分母表示从 \(2n\) 杯茶中随机选出 \(n\) 杯的所有组合方式。
P 值不是‘原假设为真的概率’,而是‘在原假设下观测到当前及更极端结果的概率’:
$$P = \sum_{i=k}^{n} P(K = i)$$
当 P 足够小时,我们认为‘纯属巧合’的解释不再合理。