简化您的工作流程:搜索 miniwebtool。
添加插件
主页 > 数学 > 统计与数据分析 > A/B测试样本量计算器
 

A/B测试样本量计算器

在启动 A/B 测试前进行规划。输入您的基准转化率、最小可探测效应 (MDE)、显著性水平 (alpha) 和统计功效 (1 减 beta),即可获取每个版本所需的样本量、总样本量以及根据您的每日流量计算出的试验所需时长。

A/B测试样本量计算器

快速场景点击可加载行业典型的基准 + MDE,计算前可调整任意字段。

实时预览 — 请输入数据
每组访客
总访客量
测试持续时间

目标转化率 — · 请配置基准 + MDE

基准组(对照组 A)

当前现状
%
版本 A 当前的转化率 —— 建议使用最近测得的数据。

最小可检测效应(MDE)

相对值
% rel
更小的 MDE → 需要大得多的样本量(n 与 1/MDE² 成正比)。
/天
接受测试页面的每日总流量。
%
分流到本次实验中的每日流量百分比。

Embed A/B测试样本量计算器 Widget

A/B测试样本量计算器

A/B测试样本量计算器旨在帮助您在测试启动之前对其进行科学的规划。只需输入基准转化率、您期望检测到的最小可检测效应(MDE)、显著性水平(alpha)以及所需的统计功效,计算器即可为您输出每组以及总计所需的样本量 —— 此外,它还会基于您的每日流量和分流份额自动生成测试持续时间估算、展示功效如何随样本量增长的功效曲线、横向对比不同 MDE 选择成本的敏感性分析表、流量分配可视化图表,以及一个通俗易懂的可行性结论判决。该工具专为转化率 A/B 测试(双比例 z 检验,Cohen 阐述公式)打造,并为多变量测试提供了可选的 Bonferroni 修正支持。

如何使用

  1. 输入当前版本(A)在最近一段代表性周期内测得的基准转化率
  2. 设置最小可检测效应(MDE) —— 即能够实质性改变您业务决策的最小提升幅度。您可以在相对百分比和绝对百分点之间快捷切换。
  3. 选择显著性水平(alpha) —— 行业默认值通常为 5%(即 95% 置信度)。
  4. 选择统计功效 —— 行业默认值通常为 80%;对于高影响力的重大改版发布,建议将其提升至 90%。
  5. 选择是采用双尾测试(默认,代表版本 B 在任一方向上与 A 存在差异)还是单尾测试(仅在版本 B 优于 A 时予以认定)。
  6. 如果您正在进行包含多个测试版本的多元测试,请设置变体版本数量 —— 计算器将自动为您应用 Bonferroni 修正。
  7. 输入页面的每日访客量以及分流进入本实验的流量比例
  8. 点击计算样本量按钮,即可读取每组及总计所需的样本量、预期测试周期、功效曲线、敏感性分析表以及分步数学推导过程。

所用计算公式(双比例功效公式)

p₂ = p₁ × (1 + MDE_relative)   或   p₂ = p₁ + MDE_absolute

p̄ = (p₁ + p₂) / 2(零假设 H₀ 下的合并率)

SD₀ = √[ 2 × p̄ × (1 − p̄) ](零假设下的标准差)

SD₁ = √[ p₁(1 − p₁) + p₂(1 − p₂) ](备择假设下的标准差)

n / arm = (zα/2 × SD₀ + zβ × SD₁)² / (p₂ − p₁)²

对于单尾测试,将 zα/2 替换为 zα。对于 K 个变体版本对比 1 个对照组的场景,将 α 替换为 α / (K − 1)(即 Bonferroni 修正)。

本样本量计算器的独特优势

  • 提交前的实时动态预览 —— 您的每一次键盘输入都会实时更新每组样本量、总访客量、目标转化率和预计持续时间。
  • 具象化的测试周期转化 —— 将抽象的“您需要 31,000 名访客”转化为更接地气的“在 50% 分流下,您的测试需要以每天 4,000 名访客的速度运行 8 天”。
  • 带动画的统计功效曲线 —— 直观查看您的目标样本量在功效曲线上的落点,以及如果延长一周的测试时间能够为您换取多少统计功效。
  • MDE 敏感性分析对照表 —— 横向对比检测 2%、5%、10%、15%、20% 和 25% 提升幅度所需的样本量成本,帮您在业务敏感度与时间可行性之间找到最完美的平衡点。
  • 自由切换相对或绝对 MDE —— 一键切换产品和运营团队在制定提升目标时最常用的两种表述习惯。
  • 原生支持带有 Bonferroni 修正的多元测试 —— 完美支持 A/B/C 或 A/B/C/D 等多组测试并提供自动校正;而市面上许多计算器在遇到多版本输入时只会盲目套用简单的 A/B 测试公式。
  • 流量分配可视化柱状图 —— 堆叠图清晰展示了测试整体流量是如何在对照组和各个实验变体版本之间进行切分的。
  • 通俗易懂的可行性评级 —— 顶部的红/黄/绿横幅会在您正式发布测试前,及时对那些极其耗时的“龟速测试”发出警告。
  • 一键加载快捷场景 —— 针对电商、SaaS、邮件营销和移动端安装等行业典型基准提供了便捷的预设参数选项。

如何解读可行性判决横幅

  • 绿色 —— 完全可行。 测试可在两周内完成。您拥有充足的流量,可以在所选的置信度下轻松检测到预期的提升幅度。
  • 黄色 —— 可以执行。 测试需要耗费两到六周的时间。请务必规划好至少覆盖一个完整的业务周期,并坚决抵制中途窥探数据的冲动。
  • 红色 —— 周期漫长。 测试需要超过六周(甚至由于流量不足而无法完成)。时间过长的测试极易受到季节性因素和用户长周期行为漂移的干扰 —— 建议调高您关心的 MDE 目标,或者提高路由到实验中的流量比例。

为什么所需样本量会增长得如此迅猛?

这主要受两个核心数学关系的影响。首先,所需的样本量与 MDE 平方的倒数成正比 —— 这意味着将您期望检测的提升幅度减小一半,所需的访客样本量就会乘以四倍。其次,基准转化率越低,测试成本越高 —— 在 1% 的基准转换率下,要检测相同的相对提升,所需的访客量大约是 5% 基准转化率下的 25 倍。这两个效应重叠在一起,完美解释了为什么即便是高流量的网站,在面对低频转化流程时,也很难在合理时间内测出微小的提升。

A/B 测试规划中的常见大坑

  • 把 MDE 设得太小。 这会导致样本量膨胀到您在预期时间内根本无法收集完成的天文数字。请根据能实质改变发布决策的最小改进来选择 MDE —— 而不是凭空盲目遐想。
  • 统计功效低于 80%。 一个功效仅为 60% 的测试,有高达 40% 的概率会彻底漏掉一个真实存在的业务改进。行业推断的黄金标准是 80%;千万不要为了让样本量勉强“凑效”而强行调低功效。
  • 看到低 p 值就提早收工。 在测试运行中途频繁查看临时结果,并在 p < 0.05 的那一刻立即叫停(数据窥探行为)会使假阳性率急剧飙升。请务必在测试启动前就咬定既定的样本量目标。
  • 忽视了多变量测试的额外代价。 一个包含四个版本的 A/B/C/D 测试必须采用经过 Bonferroni 修正的 alpha 值 —— 这通常会让每组所需的样本量达到简单 A/B 测试的 2 到 3 倍。
  • 忽略了周末效应。 保证测试至少运行 7 天可以有效平摊和抹平一周内不同日期的流量组合差异;周期过短的测试极易因为工作日与周末的用户心理差异而产生严重偏差。
  • 低估了流量切分的损耗。 如果您只允许 50% 的全站流量进入测试,那么平均到每组的每日流量就会减半 —— 这意味着您需要付出两倍的自然日历时间。

显著性水平(Alpha)与统计功效的选择

Alpha 代表假阳性率 —— 即在版本 B 实际上没有任何改进时,测试却误判其胜出的概率。而功效(Power)等于 1 减去假阴性率 —— 即当存在 MDE 规模的真实改进时,测试能够成功将其捕捉并捕获的概率。行业默认设置一般为 alpha = 0.05 且功效 = 0.80。对于试错成本极高的核心高壁垒业务发布,建议使用 alpha = 0.01 和功效 = 0.90。这些严苛的选择会显著收紧测试判据并使所需样本量激增:将 alpha 从 0.05 降低到 0.01 会使样本量接近翻倍;而将功效从 0.80 提升到 0.90 会让样本量再增加约 30%。

相对 MDE 与绝对 MDE 的区别

相对 MDE(基于基准的百分比)是最普遍的定级视角:“我想在当前 5% 的转化率基础上,成功检测出 10% 的相对提升”,这意味着期望的目标值 p₂ = 5.5%。而绝对 MDE(百分点)在业务效益直接以点数衡量时更为适用:“我想在 5% 的基准转化率之上,检测出 +0.5 个百分点的绝对提升”,此时计算出的目标值同样是 p₂ = 5.5%。两者在数学上完全等价 —— 选择哪种表述纯粹取决于您的团队和利益相关者习惯如何定义指标。

多变量测试与 Bonferroni 修正

当您将 K 个变体版本同时与一个对照组进行纵向对比时,您实际上是在并行运行 K − 1 组独立的统计检验。随着对比版本的增加,天真的整体假阳性率会不断累积放大 —— 例如,在 alpha = 0.05 下进行三次独立的比对,实验整体录得至少一次假阳性的概率将高达约 14%,而非 5%。统计学上的经典解决方案是应用 Bonferroni 修正:在计算临界 z 值之前,将您的名义 alpha 除以总的比较组数。当您在本计算器中将版本数量设置为大于 2 时,系统将自动激活并应用此校正。这也解释了为什么多元测试在各变体版本上对流量的消耗要远高于常规的 A/B 测试。

常见问题解答(FAQ)

A/B 测试需要多少样本量?

这取决于四个关键数字:基准转化率、最小可检测效应(MDE)、显著性水平(alpha)和统计功效。例如一个典型的电商测试,基准转化率为 5%,相对提升目标为 10%,显著性水准为 0.05 且功效为 80%,您每个版本大约需要 31,000 名访客。更低的初始基准和更小的 MDE 都会导致所需样本量呈指数级大幅膨胀。

什么是最小可检测效应(MDE)以及如何选择?

MDE 是您希望本次实验能够稳健可靠地捕捉到的最小指标提升幅度。请结合实际的商业回报和财务账目来选定 —— 即至少需要多大的业务改进,才能抵消开发和上线该功能的成本并促使您做出全量发布的决策。通常的建议:高流量的结账和注册主流程可设在相对 5% 到 10% 之间,而流量较低的边缘功能则可设在相对 15% 到 25% 之间。MDE 设得越小,对流量的胃口就越大,因此切忌无章法地调得太低。

我应该使用什么显著性水平和功效?

在日常的产品迭代和互联网营销测试中,Alpha = 0.05(即 95% 置信度)和 80% 功效是约定俗成的行业标准。如果涉及可能重创核心营收的大型策略改版,建议采用 alpha = 0.01 和 90% 功效。收紧任何一个容错指标都会使所需样本量变大 —— 这是一场关于假阳性(α)、假阴性(β)以及测试时间成本之间的严谨权衡。

为什么我的测试每个版本需要这么多元气访客?

主要受制于两大统计学定律。首先,较低的基准转化率天生需要更大的样本量来沉淀出统计显著的转化事件 —— 在 1% 的基准上辨别出微小波动所需的总访客量大约是在 5% 基准下的 25 倍。其次,样本量规模与 MDE 的平方成反比 —— 期望检测的跨度缩小一半,样本量就要翻四倍。您可以尝试放大您真正聚焦的业务 MDE 目标,或者接受更长的长跑测试周期。

该公式是如何推导出来的?

它基于统计学上利用正态近似推导的标准双比例功效计算公式。每组所需的绝对样本量等于:(zα 乘以零假设下的合并标准差 + zβ 乘以备择假设下的独立标准差) 的平方,再除以两组率差的平方。本计算器在零假设项中采用合并方差(pooled variance),在备择假设项中采用未合并方差 —— 这是统计学教科书中最经典、最稳健的表述方式(源自 Cohen 1988, Fleiss 等人 1980)。

如何处理包含多个版本的多元测试?

当测试包含 K 个实验变体和 1 个对照组时,计算器在推导关键 z 值之前,会严格执行 Bonferroni 修正,将原始 alpha 值除以 (K − 1)。这能有效锁死由于多路比对而导致的假阳性泛滥。其代价是每组分得的所需样本量目标会有所抬升 —— 多元测试在每条支流上占用的流量总数要远超简单 A/B 测试。

我应该运行推荐的天数,还是在达到显著性时就停止?

请严格按照推荐的规划周期完整运行,并且只在达到既定周期后才开箱评估显著性。在测试未完结时,一旦看到 p 值跌破 0.05 就擅自偷跑收工(即“窥探数据”行为),会使您的实际假阳性率远远超标。此处计算出来的样本量是您对抗统计噪声的科学计划 —— 请在发布前坚持这一底线。实验圆满结束后,您可以将累积的真实转化数据灌入配套的“A/B测试显著性计算器”中,来精准读取最终的 p 值和置信区间。

如果我的初始转换率非常低(例如低于 1%)会怎样?

当 np 或 n(1 − p) 的数值较小时,经典的正态近似公式可能会产生轻微的微弱偏差。对于指标极低(如 0.1% 基准)的极限测试,本计算器算出的结果依然具有高度的宏观规划参考价值,但在实际落地时,建议在推荐样本量的基础上额外增加 10% - 15% 的安全缓冲池。另外,在测试结束后的分析阶段,采用费舍尔精确检验(Fisher's exact test)会是更为保守和严谨的裁决选择。

引用此内容、页面或工具为:

"A/B测试样本量计算器" 于 https://MiniWebtool.com/zh-cn/a-b测试样本量计算器/,来自 MiniWebtool,https://MiniWebtool.com/

由 miniwebtool 团队提供。更新时间:2026-05-17

您还可以尝试我们的 AI数学解题器 GPT,通过自然语言问答解决您的数学问题。

其他相关工具:

统计与数据分析:

常用工具:

随机信用卡生成器MAC地址查找彩票号码生成器英尺英寸转换为厘米相对标准偏差计算器网址提取器太阳、月亮与上升星座计算器 🌞🌙✨📅 日期计算器凯利公式计算器CAGR计算器音频提取器比例计算器🌡️ 体感温度计算器调整视频速度SRT转为TXT工具厘米到英尺和英寸转换器定期存款计算器cpm计算器VAT计算器斜边计算器样本量计算器百分比折扣计算器毛利率计算器图片打码工具MAC地址生成器kg到lbs转换器音频分割器HEX计算器英尺到米转换器花样字体生成器血糖转换器随机字符串生成器对数计算器真心话大冒险生成器质数检查器🎮 游戏灵敏度转换器百分比增长率计算器随机IMEI生成器FPS 转换器MAC 地址分析工具srt时间偏移卡方检验计算器移除标点符号在线工具视频转图片提取器随机选择器SHA256 哈希生成器合并视频随机英文句子生成器One Rep Max (1RM) 计算器圆计算器生物年龄计算器枢轴点计算器箱线图生成器椭圆周长计算器随机虚假地址生成器因子计算器罗马数字转换器随机化数字wpa密钥生成器两个日期之间图着色计算器英寸到厘米转换器为视频添加水印年龄计算器月亮星座计算器百分比增加计算器随机扑克牌生成器t检验计算器为图片添加文字kpa到psi转换器位数计算器分贝 (dB) 计算器变异系数计算器百分比到ppm转换器图片压缩器农历转换器根式化简器不可见字符移除器指数计算器-高精度伊斯兰历转换器积分计算器体脂百分比计算器泰勒级数计算器Facebook用户ID查询MD5哈希生成器分数计算器百分比计算器💧 露点计算器磅转千克转换器Log Base 10 计算器PSI 转 Bar 转换器卧推计算器行数统计工具随机电影选择器DOY日历利润计算器🖱️ 点击计数器相关系数计算器螺栓扭矩计算器幻方生成器直方图生成器视频分割器数据传输速率转换器随机RPG角色生成器随机分组生成器复数计算器SRT合并工具熵计算器厘米到英寸转换器图片Base64转换器平方根计算器最小公倍数计算器AI标点符号添加器Zalgo文本生成器半衰期计算器平均偏差计算器极坐标方程绘图器随机超能力生成器椭圆面积计算器考拉兹猜想计算器逻辑门模拟器随机数字选择器AI Token 计数器先付年金现值计算器图片分割器圆柱体体积计算器 高精度景深 (DoF) 计算器条形码生成器随机生日生成器多项式展开计算器最简分数计算器AI健身计划生成器年度天数计算器 - 今天是今年的第几天排序数字自酿啤酒酒精度计算器随机名称生成器随机装备生成器VTT转txt转换器二进制计算器IPv4/IPv6到十六进制转换器十进制到十六进制转换器名人名言搜索 (英文)模计算器死链检查器每个月的天数科学记数法计算器随机数学题生成器Bar to PSI 转换器csv转srt圆形面积计算器年金现值计算器角速度计算器黄金时刻和蓝调时刻计算器AI内容检测器AI道歉信生成器分数简化空白字符可视化工具配速卡路里计算器长除法计算器随机锦标赛对阵生成器JWT生成器youtube收益估算器发音音标转换器数字提取器斐波纳契回撤计算器随机小数生成器随机颜色生成器atan2计算器分数百分比转换器卷积计算器工资转换计算器隐形文本生成器AI礼貌借口生成器傅里叶级数系数计算器大额存单计算器新月和满月日历旋转视频水星逆行日历磅到克转换器组合计算器翻转视频自然对数计算器随机 NanoID 生成器555定时器计算器AI正则表达式生成器AI膳食计划生成器CRC64 校验和计算器📷 OCR / 图片文字识别YouTube频道统计两点间距离计算器克到磅转换器反向文字图像增强器康奈尔笔记生成器惯性矩计算器排列计算器查找并替换文本标准误差计算器电话号码提取器视频压缩器HSA计算器遣散费计算器加薪计算器发票生成器出差津贴计算器里程报销计算器房租涨幅计算器按比例租金计算器房租承受能力计算器汽车落地价计算器购车预算计算器摩托车贷款计算器房车贷款计算器船舶贷款计算器土地贷款计算器建筑贷款计算器只付利息抵押贷款计算器气球贷计算器房贷点数计算器PMI计算器双周房贷还款计算器ARM浮动利率房贷计算器VA贷款计算器实发工资计算器AI SQL 查询生成器AI 数据可视化工具 (粘贴 CSV)AI文本语气分析器AI简历分析器AI单位转换器自然语言AI旅行行程生成器AI阅读清单生成器AI礼物点子生成器ai食谱生成器根据现有食材奖学金投资回报率计算器大学费用计算器语言学习流利度小时数计算器词汇测验生成器学习曲线计算器抽认卡间隔重复调度器颜料调色计算器瓷砖填缝剂计算器洗碗机装载优化器洗涤剂用量计算器染发剂调配计算器打印成本计算器燃气与电力成本对比礼品卡小费计算器搬家纸箱数量计算器储物单元尺寸计算器胶囊衣橱搭配计算器皮带长度计算器液压缸推力计算器滑轮组计算器齿轮比计算器机械比热容计算器热膨胀计算器热传递计算器伯努利方程计算器雷诺数计算器太阳位置计算器潮汐时间计算器星空可见度计算器绳结打法参考工具睡袋温度评级指南帐篷地布尺寸计算器背包旅行食物重量计算器奈史密斯徒步配速计算器刺绣线长度计算器树脂浇注用量计算器串珠图案计算器陶土收缩率计算器折纸纸张尺寸计算器被子滚边计算器十字绣绣线计算器针织图案计算器编织针尺寸转换器钩针尺寸转换器马匹干草计算器宠物航空旅行航空箱尺寸查询器爬虫栖息地UVB计算器鸟笼尺寸计算器鱼缸加热棒瓦数计算器猫砂盆数量计算器前照灯光束距离计算器发动机压缩比计算器轮胎花纹磨损计算器挂车舌重计算器车辆重量分布计算器旅行费用分摊计算器刹车距离计算器工伤赔偿计算器遗嘱资产分配计算器商标分类查询工具专利申请费计算器销售税关联检查器刑期减免计算器诉讼时效计算器Airbnb 定价优化器室友房租分摊计算器Section 8 租金计算器BRRRR 方法计算器现金对现金回报率计算器租金收益率计算器1031 交换计算器财富增长可视化工具午餐花费计算器健身房 vs 家庭健身花费计算器咖啡花费计算器远程办公省钱计算器副业ROI计算器订阅费用追踪器SaaS定价计算器自由职业项目报价计算器烟熏木材搭配指南发酵时间计算器腌制时间计算器饮食限制食谱筛选器香料替代查找器咖啡因半衰期追踪器标准杯计算器葡萄酒搭配建议器攀岩难度等级转换器自行车齿轮比计算器钓鱼结强度计算器瑜伽体式保持计时器游泳SWOLF计算器跑步成绩预测计算器拳击出拳力量计算器橄榄球得分计算器板球得分率计算器足球 xG预期进球计算器网球计分器Wells评分计算器 (DVT/PE)格拉斯哥昏迷评分计算器阿普加评分计算器FFMI计算器库珀12分钟跑步计算器一英里步行测试Rockport计算器瘦体重力量计算器碳水化合物胰岛素比例计算器胰岛素敏感系数计算器希伯来历转换器跨文化年龄计算器多久以前计算器还有多久倒计时计算器日期模式生成器中间日期计算器日期添加工作日工作日计算器词频分析器句子长度方差分析器海明威风格可读性编辑器维吉尼亚密码工具埃特巴什密码工具ROT13编码解码器EXIF数据查看与移除工具猪拉丁文翻译器倒推首字母缩写生成器首字母缩写生成器全字母句检查器漏字文检测器图像转SVG描摹器图片转 ASCII 艺术转换器JSON Schema 生成器TypeScript 在线演练场Less 到 CSS 编译器SCSS转CSS编译器SVG 转 React/JSX 转换器查询字符串生成器URL解析器UUID验证和解码器HTTP状态码参考cURL命令构建器谢尔宾斯基三角形生成器3D曲面绘图器朱利亚集合生成器曼德博集合探索器L-System分形生成器Delaunay 三角剖分生成器Voronoi 图生成器万花尺图案生成器镶嵌图案生成器六西格玛过程能力计算器帕累托图生成器NPS净推荐值计算器留存率同期群计算器客户流失率计算器客户获取成本CAC计算器客户终身价值 CLV 计算器转化率计算器A/B测试样本量计算器A/B测试显著性计算器透镜方程计算器导线磁场计算器电场计算器库仑定律计算器斯涅尔定律计算器向心力计算器单摆周期计算器弹簧劲度系数计算器多普勒效应计算器索提诺比率计算器特雷诺比率计算器股票贝塔系数计算器通胀保值美国国债 (TIPS) 计算器房贷重新摊还计算器远期利率计算器债券久期计算器 (麦考利和修正)债券凸性计算器固定指数年金计算器变额年金计算器反向抵押贷款计算器年金支付计算器日本算盘模拟器俄罗斯农民乘法吠陀数学技巧计算器古埃及乘法计算器罗马数字数学求解器心算训练器乘法口诀表测验进位与借位可视化工具数的分合生成器硬币应用题求解器距离速度时间三角形计算器工作效率问题求解器混合问题求解器年龄问题求解器火车相遇问题求解器补水计算器药物剂量计算器酒精卡路里计算器身体重塑计算器随机辩论话题生成器随机猫狗名字生成器YouTube缩略图下载器