简化您的工作流程:搜索 miniwebtool。
添加插件
> A/B测试显著性计算器
 

A/B测试显著性计算器

确定A/B测试版本之间的差异在统计学上是否显著。输入对照组和变体组的访客数与转化数,即可获得P值、置信水平、提升率以及明确的胜负结论。

A/B测试显著性计算器

快速示例点击加载典型场景,然后在计算前调整任一字段。

实时预览 — 请添加数据
对照组转化率
实验组转化率
相对提升度

z = — · p 值待定

对照组 (A)

原始版
必须小于或等于上方的访客数。

实验组 (B)

挑战版
与对照组测量相同的时间窗口。

Embed A/B测试显著性计算器 Widget

A/B测试显著性计算器

A/B 测试显著性计算器对您的实验数据进行双比例 z 检验,并报告对照组原始版本(A)和实验组挑战版本(B)之间的观测差异是否具有统计学显著性。输入两组的访客数和转化数,该工具将返回 p 值、转化率差异的置信区间、绝对和相对提升度、观测效应的统计功效、在 80% 统计功效下确认提升所需的每组样本量,以及一个通俗易懂的胜出 / 落败 / 结论不明确的结论——并辅以您的 z 得分落在标准正态分布上何处位置的动态可视化图形。

如何使用

  1. 输入对照组原始版本(A)的访客数量和转化数量。
  2. 输入正在测试的实验组挑战版本(B)的相同两组数字,这些数据应在相同的时间窗口内测得。
  3. 选择一个置信水平——95% 是标准值,99% 更严格,90% 用于早期探索。
  4. 选择双尾检验(B 在任一方向上与 A 不同)或单尾检验(仅在 B 击败 A 时计入)。
  5. 点击计算显著性来读取结论、p 值、置信区间、统计功效以及逐步拆解的数学计算。

所用公式(双比例 Z 检验)

p₁ = c₁ / n₁ · p₂ = c₂ / n₂

p̂ = (c₁ + c₂) / (n₁ + n₂) (零假设 H₀ 下的合并转化率)

SE = √[ p̂ × (1 − p̂) × (1/n₁ + 1/n₂) ]

z = (p₂ − p₁) / SE

p-value (双尾) = 2 × (1 − Φ(|z|))

在置信水平 (1 − α) 下 (p₂ − p₁) 的置信区间 = (p₂ − p₁) ± zα/2 × √[ p₁(1−p₁)/n₁ + p₂(1−p₂)/n₂ ]

是什么让这款 A/B 测试计算器与众不同

  • 提交前的实时预览——输入四个计数中的任意一个,即可实时查看转化率、提升度、z 得分、p 值和结论的更新。
  • 视觉显著性检查——动态标准正态曲线精准展示了您的 z 统计量相对于拒绝域落在何处。
  • 置信区间森林图——并排查看两组转化率的 95% 置信区间。互不重叠的条形图是判定胜出者的直观视觉信号。
  • 通俗易懂的结论——采用绿/黄/红横幅代替枯燥的 p 值数字。对大多数利益相关者来说,说“实验组 B 胜出”比说“p = 0.028”更易于理解。
  • 统计功效读数——自动识别测试何时统计功效不足,并推荐在 80% 功效下所需的每组样本量。
  • 贝叶斯风格的“P(B > A)”——作为频率学派 p 值的补充视角,许多产品团队发现这种方式更为直观。
  • 快速示例预设——一键加载明显胜出、结果险胜、暂无信号或落败场景,探索数字是如何变化的。

如何解读结论

  • 绿色 — 显著胜出。p 值 ≤ α 且实验组转化率 > 对照组转化率。这种提升不太可能是偶然造成的;您可以推行版本 B。
  • 红色 — 显著落败。p 值 ≤ α 但实验组转化率 < 对照组转化率。B 的效果确实更差;请保留 A 并调查原因。
  • 黄色 — 接近临界值。p 值接近 α。在做出决定前,建议收集更多流量数据。
  • 灰色 — 暂无信号。数据表明目前没有实质性差异。您可以选择继续运行测试,或者停止测试并尝试更大胆的改动。

为什么不应该在 p 值一达到显著时就提前停止测试

频繁地检查测试并在 p 值 < 0.05 的那一刻停止(通常被称为“中途窥视”)会显著抬高假阳性率——有时对于名义上为 5% 的检验,假阳性率会上升到 30% 或更高。应当在测试前使用功效计算来决定样本量,将实验运行到该目标,然后再评估显著性。该计算器显示的所需每组样本量是规划未来测试的一个很好目标。

样本量规划

如果您的测试统计功效不足,计算器会使用标准的双比例功效公式推荐每组的样本量:

每组 n ≈ (zα/2 · √[2p̄(1−p̄)] + zβ · √[p₁(1−p₁) + p₂(1−p₂)])² / (p₂ − p₁)²

其中 p̄ 是 p₁ 和 p₂ 的平均值,zβ 是目标功效的标准正态分位数(80% 功效时为 0.84)。

将您的历史基线转化率以及您关心的最小提升度代入该公式——这就是在启动新测试前需要瞄准的目标样本量。

A/B 测试中的常见陷阱

  • 中途窥视 (Peeking)——每天查看结果并在第一个显著的 p 值出现时停止测试,这会使假阳性结果激增。请使用序贯检验或等待达到计划的样本量。
  • 样本量过小——当每组的转化数少于几百个时,正态近似可能会失效。此时可以考虑使用 Fisher 精确检验作为替代。
  • 多重比较——运行十个测试却只报告获胜的那一个,这会夸大假阳性率。应当应用 Bonferroni 校正或运行预先登记的验证性测试。
  • 新奇效应 (Novelty effects)——实验组 B 在第一周表现极佳可能纯粹是因为用户注意到了新变化。应当让测试运行足够长的时间以使效应稳定下来。
  • 幸存者偏差——在随机分组后过滤访客会破坏测试的严谨性。务必始终基于完整的随机抽样人群计算测试结果。
  • 错位的测量窗口——确保对照组和实验组在完全相同的时间窗口内收集数据。周末和工作日的流量组合差异会改变基线转化率。

单尾检验与双尾检验

双尾检验询问的是 B 是否在任何方向上与 A 存在差异。当您确实可能推行任一版本时,它是正确的默认选择。单尾检验仅在预先指定的方向(通常是:B 击败 A)上对结果进行确认,并且当数据指向该方向时,它会将 p 值折半——但您必须在查看数据之前就确定好方向。在看到结果后切换到单尾检验是一种常见形式的 p 修正(p-hacking)。

如何读取置信区间

转化率差异的 95% 置信区间告诉您真实提升度可能落在的合理范围。如果该区间完全大于零,则 B 胜出;完全小于零,则 B 落败;如果跨越零点,则数据表明目前没有真实的差异。区间的宽度是衡量估计精准度的一个指标——区间越窄意味着数据越充足。

常见问题解答

A/B 测试显著性计算器有什么作用?

它对您的对照组和实验组转化数据进行双比例 z 检验,并告诉您所观测到的转化率差异是否不太可能由随机偶然解释。它会报告 p 值、差异的置信区间、观测效应的统计功效、提升度以及通俗易懂的结论。

A/B 测试应该使用什么置信水平?

95% 的置信度(α = 0.05)是产品和营销测试的行业标准。对于错误阳性代价高昂的高影响投放,请使用 99%;而 90% 仅用于您可以接受较高假阳性风险的早期探索。

我应该运行单尾检验还是双尾检验?

当您只关心 B 是否在任一方向上与 A 不同时,请使用双尾检验。当您预先确定了方向性假设(例如预期 B 会击败 A),并且愿意忽略任何相反方向的信号时,请使用单尾检验。大多数产品团队应默认使用双尾检验。

p 值是如何计算的?

综合转化数和访客数计算出合并转化率 p̂。标准误差是 √[p̂(1−p̂)(1/n₁ + 1/n₂)]。z 统计量是转化率差异除以该标准误差。双尾 p 值是 2 × (1 − Φ(|z|)),其中 Φ 是标准正态累积分布函数。

什么是统计功效,为什么它很重要?

功效是在当前样本量下,检验能够检测出观测到的真实效应大小的概率。功效低于 80% 意味着测试规模可能太小,即使提升是真实的,也无法确认。计算器会报告统计功效以及达到 80% 功效所需的每组样本量。

一旦 p 值降到 0.05 以下,我可以立即停止测试吗?

不能。中途窥视并提前停止会使假阳性率远高于名义上的 α。应在测试前通过功效计算决定样本量,将测试运行至结束,然后才评估显著性。此计算器显示的所需样本量是一个很好的目标。

如果我的转化率非常低(例如低于 1%)该怎么办?

当 np 或 n(1−p) 很小时,正态近似可能不够准确。作为经验法则,您希望每组至少有 30 个转化,理想情况下是 100 个以上。对于极低转化率的测试,可以考虑使用 Fisher 精确检验作为更保守的替代方案。

P(B > A) 是什么意思?

在对每个转化率采用无信息(均匀分布型)先验的前提下,数据推导出了一个后验概率,即实验组 B 的真实转化率高于对照组 A 的真实转化率。它是频率学派 p 值的贝叶斯补充,通常更容易向非统计人员传达(“有 85% 的把握 B 更好”比“p = 0.03”更容易沟通)。

引用此内容、页面或工具为:

"A/B测试显著性计算器" 于 https://MiniWebtool.com/zh-cn//,来自 MiniWebtool,https://MiniWebtool.com/

由 miniwebtool 团队提供。更新时间:2026-05-17

您还可以尝试我们的 AI数学解题器 GPT,通过自然语言问答解决您的数学问题。

常用工具:

职位查找器随机信用卡生成器MAC地址查找彩票号码生成器网址提取器相对标准偏差计算器厘米到英尺和英寸转换器CAGR计算器英尺英寸转换为厘米太阳、月亮与上升星座计算器 🌞🌙✨磅转千克转换器VAT计算器随机选择器样本量计算器cpm计算器定期存款计算器百分比折扣计算器随机名字选择器随机ip地址生成器毛利率计算器📅 日期计算器图片打码工具kg到lbs转换器英寸到厘米转换器t检验计算器血糖转换器斜边计算器音频提取器FPS 转换器音频分割器合并视频厘米到英寸转换器罗马数字转换器随机字符串生成器HEX计算器比例计算器圆计算器对数计算器英尺到米转换器股票平均成本计算器MAC 地址分析工具数字提取器🎮 游戏灵敏度转换器百分比增长率计算器MAC地址生成器质数检查器随机扑克牌生成器SRT转为TXT工具SHA256 哈希生成器卡方检验计算器闰年清单两个日期之间Facebook用户ID查询随机化数字二进制计算器条形码生成器DOY日历srt时间偏移图片分割器真心话大冒险生成器随机IMEI生成器数织生成器-picross视频转图片提取器移除标点符号在线工具图片压缩器平方根计算器百分比计算器圆形面积计算器名人名言搜索 (英文)年度天数计算器 - 今天是今年的第几天年龄计算器线性回归计算器复利计算机月亮星座计算器半衰期计算器跑步配速计算器利润计算器最简分数计算器PSI 转 Bar 转换器分数计算器调整视频速度凯利公式计算器百分比变化计算器日历分数百分比转换器标准偏差计算器 - 高精度鞋码转换器复合增长率计算器盎司到克转换器分贝 (dB) 计算器每个月的天数百分比增加计算器随机颜色生成器直方图生成器为图片添加文字椭圆周长计算器随机分组生成器AI Token 计数器AI内容检测器相关系数计算器A/B测试样本量计算器A/B测试显著性计算器透镜方程计算器导线磁场计算器电场计算器库仑定律计算器斯涅尔定律计算器惯性矩计算器角速度计算器向心力计算器单摆周期计算器弹簧劲度系数计算器多普勒效应计算器索提诺比率计算器特雷诺比率计算器股票贝塔系数计算器通胀保值美国国债 (TIPS) 计算器房贷重新摊还计算器远期利率计算器债券久期计算器 (麦考利和修正)债券凸性计算器固定指数年金计算器变额年金计算器反向抵押贷款计算器年金支付计算器日本算盘模拟器俄罗斯农民乘法吠陀数学技巧计算器古埃及乘法计算器罗马数字数学求解器心算训练器乘法口诀表测验进位与借位可视化工具数的分合生成器硬币应用题求解器距离速度时间三角形计算器工作效率问题求解器混合问题求解器年龄问题求解器火车相遇问题求解器补水计算器配速卡路里计算器药物剂量计算器酒精卡路里计算器身体重塑计算器随机辩论话题生成器随机猫狗名字生成器随机圣经经文生成器随机数学题生成器随机段落生成器随机英文句子生成器砾石、砂和表土计算器钢材重量计算器螺栓扭矩计算器管道流量计算器梁荷载计算器美元换黄金转换器期权概率计算器股票拆分计算器员工持股计划计算器发票滞纳金计算器自由职业者时薪计算器租赁与购买对比计算器高级小费分摊计算器装箱清单生成器时差反应计算器旅行预算计算器飞行距离计算器热损失计算器发电成本计算器用水量计算器家电用电成本计算器家庭能源审计计算器太阳能投资回报率计算器太阳能板计算器堆肥CN比计算器草坪肥料计算器霜冻日期计算器高床种植箱土壤计算器NPK肥料计算器种子发芽率计算器视频比特率计算器音乐调性转换器音乐BPM节拍点击器照片文件大小估算计算器百万像素到打印尺寸计算器裁切系数计算器曝光三角计算器车辆牵引能力计算器汽车租赁计算器0–60与四分之一英里计算器电动车充电时间计算器电动汽车续航计算器汽车油耗计算器服装尺码转换器纸张尺寸参考表戒指尺寸转换器天文单位转换器燃油效率转换器数据传输速率转换器扭矩转换器 (Nm, ft-lb, kgf-cm)删除线文字生成器空白字符可视化工具阅读时间计算器演讲时间计算器段落计数器句子计数器音节计数器文本转二进制/十六进制/ASCII转换器Lorem Picsum / 占位符图片生成器.env 文件生成器Git 命令生成器颜色代码转换器全格式Bcrypt 哈希生成器和校验器JWT生成器CSS Grid 生成器数值积分计算器z变换计算器快速傅里叶变换FFT计算器张量积计算器矩阵指数计算器约当标准形计算器环与域计算器群论阶数计算器常微分方程组求解器伯努利微分方程求解器欧拉方法计算器方向场斜率场绘图器二阶常微分方程求解器一阶常微分方程求解器稳定婚姻问题求解器网络最大流计算器平面图检查器哈密顿路径检查器旅行商问题求解器 TSP线性规划求解器容斥原理计算器递推关系求解器邻接矩阵计算器拓扑排序计算器图着色计算器逻辑门模拟器卡诺图 (K-Map) 求解器布尔代数化简器分拆函数计算器数字根计算器斐波那契数检查器埃及分数计算器莫比乌斯函数计算器哥德巴赫猜想验证器梅森素数检查器孪生素数查找器亲和数检查器完全数检查器模幂运算计算器重复排列计算器效果量计算器相对风险计算器优势比计算器列联表计算器费舍尔精确检验计算器斯皮尔曼等级相关系数计算器贝塔分布计算器威布尔分布计算器指数分布计算器几何分布计算器负二项分布计算器超几何分布计算器F检验/F分布计算器贝叶斯定理计算器特征多项式计算器矩阵幂计算器乔列斯基分解计算器QR分解计算器矩阵对角化计算器克莱姆法则计算器列空间计算器零空间计算器向量夹角计算器单位向量计算器向量模计算器向量叉积计算器向量点积计算器矩阵乘法计算器逆矩阵计算器RREF计算器行最简阶梯形牛顿迭代法计算器雅可比矩阵计算器曲面积分计算器线积分计算器旋度计算器散度计算器梯度计算器多变量优化计算器微积分相关变化率求解器瞬时变化率计算器平均变化率计算器无限级数求和计算器级数收敛判定计算器幂级数计算器麦克劳林级数计算器洛必达法则计算器广义积分计算器辛普森法则计算器梯形法则计算器黎曼和计算器参数曲线绘图器旋转体表面积计算器旋转体体积计算器坐标几何距离计算器海伦公式计算器圆的切线计算器角平分线计算器内切圆计算器三角形外接圆计算器大圆距离计算器3D距离计算器环面计算器圆台计算器不规则多边形面积计算器正多边形计算器圆锥曲线识别器双曲线计算器抛物线计算器二项式定理展开计算器帕斯卡三角形生成器乘积符号计算器 (Pi记号)西格玛求和计算器有理根定理计算器笛卡尔符号法则计算器平行线和垂直线计算器直线方程计算器标准形式转斜截式转换器点斜式计算器非线性方程组求解器有理方程求解器字母方程求解器三角方程求解器指数方程求解器对数方程求解器四次方程求解器三次方程求解器估算计算器数字转分数转换器跳数生成器单位费率计算器上取整和下取整计算器绝对值计算器数列模式查找器位值图生成器运算顺序计算器PEMDAS竖式加减法计算器长乘法计算器乘法表生成器🎮 游戏货币换算器🎲 掉落概率计算器🎰 抽卡保底计算器⚔️ DPS计算器❄️ 雪天计算器🚚 搬家费用估算器🔍 抄袭检测器📷 OCR / 图片文字识别📈 折线图制作工具🥧 饼图制作工具📊 柱状图制作工具🔊 音调发生器🖱️ 点击计数器在线记事本⬛ 宽高比计算器🌍 碳足迹计算器向 文胸尺码计算器轮胎尺寸计算器燃油费用计算器💧 露点计算器🌡️ 体感温度计算器🌬️ 风寒指数计算器⏰ 在线闹钟⏰ 考勤卡计算器📅 日期差计算器🕐 军事时间转换器⏱️ 小时计算器⏱️ 在线秒表⏱️ 倒计时器🌐 时区转换器地毯计算器挡土墙计算器HVAC容量计算器隔热材料计算器铺路石计算器钢筋计算器木材计算器平方英尺计算器交叉相乘计算器五数概括计算器百分位数计算器正态分布计算器p值计算器比率计算器配方法计算器四舍五入计算器长除法计算器Twitter/X 字符计数器YouTube评论抽选器YouTube标签提取器YouTube缩略图下载器youtube收益估算器随机RPG角色生成器