列联表计算器
通过卡方独立性检验分析分类数据之间的关系。支持任意 R×C 列联表,并提供期望频数、标准残差、Cramér's V 效应量、动态马赛克图、残差热图以及分步解决方案。
检测到广告拦截,导致我们无法展示广告
MiniWebtool 依靠广告收入免费提供服务。如果这个工具帮到了你,欢迎开通 Premium(无广告 + 更快),或将 MiniWebtool.com 加入白名单后刷新页面。
- 或升级 Premium(无广告)
- 允许 MiniWebtool.com 显示广告,然后刷新
列联表计算器
列联表计算器可对任何 R×C 列联表(交叉表)执行卡方独立性检验。输入您的观测频数,以测试两个分类变量在统计学上是否相关。获取详细结果,包括期望频数、调整后的标准化残差、Cramér's V 效应量、单元格贡献分析、交互式马赛克图、残差热图、卡方分布曲线以及完整的逐步解法。
如何使用列联表计算器
- 设置表格维度 — 选择列联表的行数和列数。默认是 2×2 表格,但您可以使用下拉选择器分析高达 10×10 的表格。
- 输入观测频数 — 直接在交互式网格中输入每个单元格的观测计数。或者,切换到“文本输入”模式以粘贴制表符分隔或逗号分隔的数据。所有值必须为非负整数。
- 添加标签(可选) — 输入以逗号分隔的行和列类别标签。标签使输出的表格和图表更易于解读。例如,行标签为“男性, 女性”,列标签为“是, 否”。
- 设置显著性水平 — 选择您期望的 α 水平。最常见的选择是 0.05(95% 置信度)。较小的 α 值(0.01、0.001)需要更强的证据才能宣布显著性。
- 分析结果 — 点击“分析列联表”以查看卡方统计量、p 值、效应量指标、可视化图表和逐步解法。
什么是列联表?
列联表(也称为交叉表或双向频数表)显示两个分类变量的联合频数分布。每一行代表第一个变量的一个类别,每一列代表第二个变量的一个类别,每个单元格包含属于该特定组合的观测计数。列联表是许多分类数据分析方法的基础,包括卡方检验、Fisher 精确检验和对数线性模型。
卡方独立性检验
卡方 (χ²) 独立性检验用于确定两个分类变量之间是否存在统计学上的显著关联。它的工作原理是将观测到的单元格频数与变量独立时预期的频数进行比较。
其中 Oᵢⱼ 是单元格 (i,j) 中的观测频数,Eᵢⱼ 是计算得出的期望频数:
该检验的自由度为 (r − 1) × (c − 1),其中 r 是行数,c 是列数。较大的 χ² 值表示观测频数与期望频数之间存在较大差异,表明变量之间存在关联。
Cramér's V — 衡量效应量
虽然 p 值告诉您是否存在关联,但 Cramér's V 告诉您关联有多强。Cramér's V 的范围从 0(无关联)到 1(完全关联),计算公式为:
其中 N 是总样本量,k 是行数或列数中的较小者。Cramér's V 的解读取决于自由度:
| 效应量 | df* = 1 | df* = 2 | df* ≥ 3 |
|---|---|---|---|
| 可忽略 | < 0.10 | < 0.07 | < 0.06 |
| 小 | 0.10 – 0.30 | 0.07 – 0.21 | 0.06 – 0.17 |
| 中 | 0.30 – 0.50 | 0.21 – 0.35 | 0.17 – 0.29 |
| 大 | ≥ 0.50 | ≥ 0.35 | ≥ 0.29 |
*df* 指的是 min(行数, 列数) − 1
理解标准化残差
调整后的标准化残差揭示了哪些特定单元格对显著的卡方结果贡献最大。单元格中 +2.5 的残差意味着该单元格的观测值比独立性假设下的期望值多出 2.5 个标准差。关键阈值为:
- |r| > 1.96 — 与期望值有显著差异 (p < 0.05)
- |r| > 2.58 — 与期望值有极显著差异 (p < 0.01)
- 正残差 — 该单元格的观测值多于预期
- 负残差 — 该单元格的观测值少于预期
何时使用卡方检验
- 分类数据 — 两个变量都必须是分类变量(定类或定序)
- 独立观测 — 每个观测值只能计数一次
- 足够的样本量 — 至少 80% 的期望计数应 ≥ 5,且任何期望计数都不应低于 1
- 随机抽样 — 观测值应来自总体的随机样本
如果期望计数太低,请考虑合并类别、使用 Fisher 精确检验(针对 2×2 表格),或对更大的表格使用精确检验或蒙特卡罗模拟。
卡方检验与 Fisher 精确检验
- 卡方检验使用大样本近似;Fisher 检验计算精确概率
- 对于期望计数较小 (< 5) 的 2×2 表格,首选 Fisher 检验
- 卡方检验可以自然地推广到任何大小的 R×C 表格
- 对于大样本,两种检验产生的结果非常相似
常见问题解答
什么是列联表?
列联表(也称为交叉表)是一种显示两个或多个分类变量的频数分布的表格。每个单元格显示落在特定类别组合中的观测值计数。它是使用卡方检验测试变量是否独立或相关的基础。
什么是卡方独立性检验?
卡方独立性检验用于确定列联表中两个分类变量之间是否存在统计学上的显著关联。它将观测到的单元格频数与在变量独立的假设下计算出的期望频数进行比较。相对于自由度而言,较大的卡方统计量表明变量之间存在关联。
什么是 Cramér's V,如何解读它?
Cramér's V 是卡方检验的效应量衡量标准,范围从 0(无关联)到 1(完全关联)。对于 2×2 表格,低于 0.10 的值可忽略不计,0.10–0.30 为小效应,0.30–0.50 为中等效应,0.50 以上为大效应。对于更大的表格,阈值会按比例降低。与 p 值不同,Cramér's V 衡量关联的强度,而不仅仅是它在统计学上是否存在。
列联表中的标准化残差是什么?
调整后的标准化残差显示每个单元格与独立性假设下的期望值偏离了多少。大于 +1.96 或小于 −1.96 的值表示在 0.05 水平上存在显著偏离。正残差意味着该单元格的观测值多于预期;负残差意味着少于预期。它们有助于精确指出哪些特定的单元格组合驱动了整体关联。
什么时候不应该使用卡方检验?
当期望频数非常低时,卡方检验可能不可靠——具体而言,当超过 20% 的期望计数低于 5,或任何期望计数低于 1 时。对于样本较小的 2×2 表格,首选 Fisher 精确检验。该检验还要求观测值相互独立,因此不应将其用于配对、匹配或重复测量数据。
引用此内容、页面或工具为:
"列联表计算器" 于 https://MiniWebtool.com/zh-cn//,来自 MiniWebtool,https://MiniWebtool.com/
由 miniwebtool 团队开发。更新日期:2026-04-15
您还可以尝试我们的 AI数学解题器 GPT,通过自然语言问答解决您的数学问题。