作業フローを簡素化:miniwebtoolを検索。
追加
> A/Bテスト サンプルサイズ電卓
 

A/Bテスト サンプルサイズ電卓

ローンチ前にA/Bテストの計画を立てましょう。ベースラインのコンバージョン率、最小検出可能効果(MDE)、有意水準(alpha)、検出力(1マイナスbeta)を入力すると、バリアントごとの必要サンプルサイズ、合計サンプルサイズ、および日次トラフィックに基づいたテストに必要な期間を算出します。

A/Bテスト サンプルサイズ電卓

簡単シナリオ設定クリックすると業界標準のベースラインとMDEが読み込まれます。必要に応じて各項目を調整して計算してください。

ライブプレビュー — データを入力してください
グループごと
合計訪問者数
テスト期間

目標レート — · ベースラインとMDEを設定してください

ベースライン(コントロール A)

現在
%
直近の代表的な期間に測定された、現在のバリアントAのコンバージョン率。

最小検出可能効果(MDE)

相対
% 相対
MDEが小さいほど → 必要なサンプルサイズは激増します(nは1/MDE²に比例)。
/日
テスト対象ページの1日あたりの総トラフィック。
%
1日のトラフィックのうち、この実験に誘導する割合(%)。

Embed A/Bテスト サンプルサイズ電卓 Widget

A/Bテスト サンプルサイズ電卓

A/Bテスト サンプルサイズ電卓は、A/Bテストをローンチする前に計画を立てるためのツールです。ベースラインコンバージョン率、検出したい最小検出可能効果(MDE)、有意水準(アルファ)、および希望する統計的検出力を入力すると、グループごとおよび合計に必要なサンプルサイズが算出されます。さらに、1日のトラフィックと割り当て割合からテスト期間を自動推定し、サンプルサイズに応じた検出力の伸びを示す検出力曲線、異なるMDEの選択コストを並べて比較できる感度分析テーブル、トラフィック割り当ての視覚化チャート、そしてわかりやすい言葉による実現可能性の判定を表示します。コンバージョン率のA/Bテスト(2つの比率の z テスト、Cohenの定式化)に特化して構築されており、多変量テスト向けのオプションとしてボンフェローニ補正もサポートしています。

使い方

  1. 最近の代表的な期間で測定された、現在のバリアント(A)のベースラインコンバージョン率を入力します。
  2. 最小検出可能効果(MDE)を設定します。これは、実際の意思決定を左右する最小のリフト(改善幅)です。相対パーセント(%)と絶対パーセンテージポイント(pp)をワンクリックで切り替えられます。
  3. 有意水準(アルファ)を選択します。業界標準のデフォルトは5%(信頼度95%)です。
  4. 統計的検出力を選択します。業界標準のデフォルトは80%ですが、ビジネスへの影響が大きいリリースでは90%に引き上げることをお勧めします。
  5. 両側テスト(バリアントBがAとどちらの方向にも異なる可能性を考慮する、デフォルト)または片側テスト(バリアントBがAに勝つ場合のみを評価する)を選択します。
  6. 多変量テストを実施する場合は、バリアント数を設定します。電卓が自動的にボンフェローニ補正を適用します。
  7. ページの1日あたり訪問者数と、実験に誘導するトラフィックの割り当て割合を入力します。
  8. 「サンプルサイズを計算する」をクリックして、グループごとおよび合計のサンプルサイズ、予想されるテスト期間、検出力曲線、感度分析テーブル、ステップごとの計算詳細を確認します。

使用されている計算式(2つの比率の検出力計算式)

p₂ = p₁ × (1 + MDE_relative)   または   p₂ = p₁ + MDE_absolute

p̄ = (p₁ + p₂) / 2 (帰無仮説 H₀ の下でのプールされた割合)

SD₀ = √[ 2 × p̄ × (1 − p̄) ] (帰無仮説下での標準偏差)

SD₁ = √[ p₁(1 − p₁) + p₂(1 − p₂) ] (対立仮説下での標準偏差)

n / グループ = (zα/2 × SD₀ + zβ × SD₁)² / (p₂ − p₁)²

片側テストの場合は、zα/2zα に置き換えます。1つのコントロール群に対して K 個のバリアントを比較する場合は、αα / (K − 1) に置き換えます(ボンフェローニ補正)。

このサンプルサイズ電卓の特長

  • 送信前のライブプレビュー — キー入力ごとに入力内容が反映され、グループごとのサンプルサイズ、合計訪問者数、目標コンバージョン率、推定期間がリアルタイムに更新されます。
  • 具体的なテスト期間の提示 — 「31,000人の訪問者が必要です」という抽象的な数字を、「1日4,000人がテストに参加する場合、テスト期間は8日間になります」という具体的なスケジュールに変換します。
  • 動的な検出力曲線 — 目標とするサンプルサイズが検出力曲線上のどこにあるか、またトラフィックをもう1週間増やした場合にどれだけ検出力を高められるかを視覚的に確認できます。
  • MDE感度分析テーブル — 2%、5%、10%、15%、20%、25%の改善幅を検出するために必要なサンプルサイズを横並びで比較できるため、実現可能な範囲で最小のMDEを選択できます。
  • 相対または絶対MDEの切り替え — プロダクトチームが改善目標を設定する際の2つの主要なアプローチを、1クリックで切り替えることができます。

実現可能性(Feasibility)判定の読み方

  • グリーン(緑) — 実施可能(Feasible)。 テストは2週間以内に完了します。選択した信頼度で選択したリフトを検出するのに十分なトラフィックがあります。
  • アンバー(黄) — 実行可能(Doable)。 テスト完了に2〜6週間かかります。少なくとも1つの完全なビジネスサイクルをまたぐように計画し、途中で結果を覗き見たい衝動を抑えてください。
  • レッド(赤) — 低速(Slow)。 テスト完了に6週間以上かかるか、完了が困難です。長期にわたるテストは季節変動やユーザー行動の変化の影響を受けやすくなります。検出したいMDEを上げるか、実験に割り当てるトラフィックの割合を増やしてください。

サンプルサイズが急激に大きくなる理由

最も重要な関係性は2つあります。第一に、必要なサンプルサイズはMDEの2乗に反比例して大きくなります。つまり、検出したい改善幅を半分にすると、必要なサンプルサイズは4倍になります。第二に、ベースラインが低いテストほどコストがかかります。1%のベースラインで同じ相対リフトを検出するには、5%のベースラインと比較して約25倍の訪問者が必要です。これら2つの相乗効果により、トラフィックの多いサイトであっても、CV率の低いフローで小さなリフトを検出することに苦戦する理由が説明できます。

A/Bテスト計画におけるよくある罠

  • MDEを小さく設定しすぎる。 合理的な期間内では集めきれないレベルまでサンプルサイズが膨れ上がります。希望的観測ではなく、実際のリリース判断を変える最小のリフト幅を設定してください。
  • 検出力を80%未満に下げる。 検出力が60%のテストでは、実際の改善効果を見落とす確率が40%もあります。プロダクトの意思決定における標準は80%です。テストを期間内に「収める」ためだけに数値を下げないでください。
  • 低いp値を見て早期にテストを終了する。 途中の経過データを覗き見して、p < 0.05 になった瞬間にテストを止める行為は、偽陽性率を劇的に上昇させます。開始前に計画したサンプルサイズまで必ずやり遂げてください。
  • 多変量テストのコストを無視する。 4つのバリアントがある A/B/C/D テストでは、ボンフェローニ補正されたアルファが必要になり、通常、単純なA/Bテストの2〜3倍のグループあたりサンプルサイズが必要になります。
  • 週末効果の失念。 最低でも7日間のテストを実施することで、曜日によるトラフィック特性の偏りを平均化できます。短すぎるテストは平日と週末のユーザー層の違いによって歪む可能性があります。
  • 割り当てオーバーヘッドの過小評価。 トラフィック全体の50%しかテストに割り当てない場合、グループごとの蓄積ペースは半分になり、カレンダー上の必要期間は2倍になります。

有意水準(アルファ)と検出力の選び方

アルファ(α)は偽陽性率、つまりバリアントBに本当は効果がないのに勝者であると誤って判断してしまう確率です。検出力(1 − β)は偽陰性率の裏返しであり、設定したMDE規模の真の改善を正しく検出できる確率です。業界のデフォルト設定は アルファ = 0.05、検出力 = 0.80 です。判断を誤った場合のコストが大きい重要なリリースでは、アルファ = 0.01、検出力 = 0.90 のような厳しい設定を使用します。どちらの設定もテストの精度を高めますが、必要なサンプルサイズを押し上げます。アルファを 0.05 から 0.01 に下げるとサンプルサイズは約2倍になり、検出力を 0.80 から 0.90 に上げるとさらに約30%増加します。

相対MDE vs 絶対MDE

相対MDE(ベースラインに対する割合)は最も一般的な表現です。「現在の5%のコンバージョン率に対して10%のリフトを検出したい」という場合、目標レートは p₂ = 5.5% になります。絶対MDE(パーセンテージポイント)は、ビジネスインパクトがポイント数で表現される場合に適しています。「5%のベースラインに対して +0.5 pp のリフトを検出したい」という場合も、目標レートは p₂ = 5.5% になります。この2つは数学的に等価であるため、ステークホルダーが指標を検討する際の思考様式に合致する方を選択してください。

多変量テストとボンフェローニ補正

1つのコントロール群に対して K 個のバリアントを比較する場合、K − 1 個のテストを同時に実行していることになります。単純に比較を増やすと全体の偽陽性率が膨れ上がります。アルファ = 0.05 で3つの独立した比較を行うと、全体の偽陽性確率は5%ではなく約14%に達します。この問題に対する標準的な解決策がボンフェローニ補正です。限界 z 値を計算する前に、公称アルファを比較の数で除算します。この電卓では、バリアント数を2より大きく設定すると自動的にこの補正が適用されます。結果として必要なグループごとのサンプルサイズは大きくなります。多変量テストは、シンプルなA/Bテストよりもグループあたりにより多くのトラフィックコストがかかります。

FAQ

A/Bテストにはどのくらいのサンプルサイズが必要ですか?

それはベースラインコンバージョン率、最小検出可能効果(MDE)、有意水準(アルファ)、および統計的検出力の4つの数値によって決まります。一般的なECサイトのテストで、ベースラインが5%、相対リフト目標が10%、アルファが0.05、検出力が80%の場合、バリアントごとに約31,000人の訪問者が必要です。ベースラインが低い場合やMDEが小さい場合は、必要なサンプルサイズが劇的に増加します。

最小検出可能効果(MDE)とは何ですか?また、どのように選べばよいですか?

MDEは、テストで確実に検出したい最小のリフト(改善幅)です。ビジネスへの影響、つまり正式リリースに踏み切る判断を変える最小の改善幅に基づいて決定します。一般的な目安として、トラフィックの多い購入手続きや会員登録フローでは相対的な5〜10%、トラフィックの少ない機能では相対的な15〜25%から始めます。MDEを小さく設定するとサンプルサイズが大幅に大きくなるため、低く設定しすぎないようにしてください。

有意水準と検出力はどの値を使用すべきですか?

プロダクトやマーケティングのテストでは、アルファ0.05(信頼度95%)と検出力80%が業界のデフォルトです。影響の大きいリリースでは、アルファ0.01と検出力90%を使用します。アルファまたはベータのいずれかを厳しくすると、より大きなサンプルサイズが必要になります。これは、偽陽性(アルファ)、偽陰性(ベータ)、およびテストにかかる時間の間のトレードオフです。

なぜ私のテストにはバリアントごとにこれほど多くの訪問者が必要なのですか?

2つの要因が大きく影響しています。第一に、ベースラインコンバージョン率が低いほど、必要なサンプルサイズは膨れ上がります。1%のベースラインで小さなリフトを検出するには、5%のベースラインの約25倍の訪問者が必要です。第二に、必要なサンプルサイズはMDEの2乗に反比例します。MDEを半分にすると、必要なサンプルサイズは4倍になります。検出したいMDEを上げるか、より長いテスト期間を受け入れる必要があります。

計算式はどのように導出されていますか?

正規近似に基づく、標準的な2つの比率の検出力計算式です。グループごとのサンプルサイズは、(帰無仮説下でのプールされた標準偏差にzαを掛けたもの + 対立仮説下での標準偏差にzβを掛けたもの)の2乗を、率の差の2乗で割ったものに等しくなります。この電卓では、帰無仮説の項にはプールされた分散を、対立仮説の項にはプールされていない分散を使用しており、これは最も一般的な教科書通りの定式化です(Cohen 1988, Fleiss et al. 1980)。

複数のバリアントがある多変量テストはどのように処理すればよいですか?

1つのコントロール群に対して K 個のバリアントを比較する場合、この電卓は限界 z 値を計算する前にアルファを (K − 1) で割るボンフェローニ補正を適用します。これにより、複数の比較を行うことで発生する偽陽性率の上昇を防ぎます。その結果、必要なグループごとのサンプルサイズは大きくなります。多変量テストは、シンプルなA/Bテストよりもグループあたりにより多くのトラフィックを必要とします。

テストは推奨された日数だけ実施すべきですか?それとも有意差が出た時点で止めてもよいですか?

推奨された期間中ずっとテストを実施し、最後にのみ有意性を評価してください。p値が0.05を下回った瞬間にテストを終了する行為(覗き見)は、偽陽性率を公称アルファより大幅に上昇させます。この電卓が示すサンプルサイズは計画された目標値です。開始前にこの数まで実施することを決定し、早期に勝者を判定したい衝動を抑えてください。テスト終了後は、結果を姉妹ツールの「A/Bテスト有意差判定電卓」に入力して、p値や信頼区間を確認してください。

コンバージョン率が非常に低い(1%未満)場合はどうなりますか?

np または n(1 − p) が小さい場合、正規近似の正確性がわずかに低下する可能性があります。非常に低いコンバージョンレート(例:ベースライン 0.1%)のテストにおいて、この電卓は依然として妥当な計画の目安を提供しますが、推奨されるサンプルサイズの上に少しの余分なバッファ(10-15%)を上乗せすることを検討してください。また、グループあたりのサンプルサイズが非常に小さい場合の分析ステージでは、より保守的な選択肢としてフィッシャーの正確確率テストが挙げられます。

このコンテンツ、ページ、またはツールを引用する場合は、次のようにしてください:

"A/Bテスト サンプルサイズ電卓"(https://MiniWebtool.com/ja//) MiniWebtool からの引用、https://MiniWebtool.com/

by miniwebtool チーム。更新日: 2026-05-17

また、AI 数学ソルバー GPT を使って、自然言語による質問と回答で数学の問題を解決することもできます。

おすすめ:

標準偏差電卓 - 高精度パーセント増加電卓パーセンテージ減少電卓war電卓ランダムカラージェネレーターランダム誕生日ジェネレーター弧長電卓HEX電卓パーセント誤差電卓シグマ記法電卓 総和番号を並べ替える合計電卓フィートとインチからセンチメートルへのコンバーター英単語ランダム生成ツール売上総利益率電卓画像分割ツール対数電卓円錐展開図テンプレートジェネレーターai句読点追加MACアドレス検索手数料電卓相対標準偏差電卓中央値電卓筆算割り算電卓YouTubeチャンネル統計楕円円周電卓CAGR電卓動画を結合ランダム名ピッカー分散電卓 高精度ASCIIコード表逆テキストMP3ルーパー配当利回り電卓変化率電卓クロスワードパズルメーカーランダム名前ジェネレーターコラッツ予想電卓マン・ホイットニーのU検定計算機相関係数計算機動画を逆再生平方完成電卓血糖値コンバーターデシベル (dB) 電卓指数電卓-高精度log-base-2電卓小数時間から普通の時間へのコンバーターモジュロ電卓関数電卓ランダムトーナメント表作成ツールt検定電卓圧力電卓センチメートルからフィートとインチへのコンバーターバイナリ電卓中国剰余定理電卓マスターナンバー電卓ランダム日付ジェネレーター労働時間計算ツールXMLバリデーターボウリングスコア計算機平方根電卓BUN対クレアチニン比電卓ランダム絵文字ジェネレーターランダムトランプカードジェネレーター動画を回転音節カウンター空の行を削除する変動係数電卓斜辺電卓InstagramユーザーID検索年の日電卓 - 今日は今年の何日目fena電卓階段電卓FPSコンバーター上下反転テキストジェネレーター💧 露点電卓トルク電卓関数グラフ作成ツール土星回帰電卓歩数距離変換電卓血液型計算機ピタゴラスの定理電卓迷路ジェネレーター平均電卓-高精度表面積電卓ビデオ速度を調整梁の電卓配管流量電卓SRT 時間シフト 電卓CRC32チェックサム電卓ランダム超能力ジェネレーターオーディオ スプリッターポアソン分布電卓正多角形電卓並列抵抗電卓画像回転ツールHEXコンバーター桁数電卓比率電卓論理ゲートシミュレーターA/Bテスト サンプルサイズ電卓A/Bテスト有意性電卓レンズの式計算機導線の磁場電卓電場計算機クーロンの法則電卓スネルの法則計算機慣性モーメント計算機角速度計算機求心力計算機振り子周期電卓ばね定数電卓ドップラー効果電卓ソルティノレシオ電卓トレイナー・レシオ電卓株式ベータ計算機インフレ連動米国債TIPS電卓住宅ローン リキャスト 電卓フォワードレート電卓債券デュレーション電卓 マコーレーと修正債券コンベクシティ電卓インデックス連動年金電卓変額年金電卓リバースモーゲージ電卓年金支払い計算機そろばんシミュレーターロシア農民式乗算ヴェーダ数学トリック電卓古代エジプト式乗算電卓ローマ数字計算ソルバー暗算トレーナー九九クイズ繰り上がりと繰り下がりビジュアライザー数の合成と分解生成ツール硬貨文章題ソルバー距離・速さ・時間の三角形電卓仕事算ソルバー混合問題ソルバー年齢文章題ソルバー列車出会い問題ソルバー水分補給計算機ペース カロリー電卓薬剤投与量計算機アルコールカロリー電卓ボディリコンポジション電卓ランダム討論トピックジェネレーターランダムな猫犬の名前ジェネレーターランダム聖句ジェネレーターランダム算数問題ジェネレーターランダム段落ジェネレーターランダム英文ジェネレーター砂利・砂・表土計算機鋼材重量電卓ボルト締付トルク計算機ドルから金への変換ツールオプション電卓株式分割電卓ESPP電卓請求書遅延手数料電卓フリーランス時給電卓リース対購入電卓高度なチップ割り勘電卓持ち物リストジェネレーター時差ぼけ電卓旅行予算電卓飛行距離電卓熱損失電卓発電コスト電卓水使用量電卓家電電気代計算機家庭エネルギー監査電卓太陽光ROI電卓太陽光パネル電卓堆肥cn比計算機芝生肥料電卓霜の日付電卓レイズドベッド用土電卓NPK肥料電卓種子発芽率電卓動画ビットレート電卓音楽キー移調ツール音楽BPMタッパー写真ファイルサイズ推定電卓メガピクセルから印刷サイズ計算機クロップファクター電卓露出トライアングル電卓車両牽引能力電卓カーリース計算機0–60とクォーターマイル電卓EV充電時間電卓EV航続距離計算機燃費計算機服のサイズ変換用紙サイズ一覧指輪サイズ変換器天文単位変換器燃費変換ツール MPG L/100km km/L 電卓データ転送速度変換ツールトルク変換器 (Nm, ft-lb, kgf-cm)取り消し線テキスト生成ツール空白文字可視化ツール読書時間電卓スピーチ時間電卓段落カウンター文カウンターテキストからバイナリ/16進数/ASCII変換器Lorem Picsum / プレースホルダー画像ジェネレーター.env ファイルジェネレーターGitコマンド生成ツールカラーコード変換器全形式bcryptハッシュ生成・検証ツールJWTジェネレーターCSS Grid生成ツール数値積分電卓z変換電卓高速フーリエ変換FFT電卓テンソル積電卓行列指数関数電卓ジョルダン標準形電卓環と体の電卓群論の位数電卓常微分方程式系ソルバーベルヌーイ方程式ソルバーオイラー法電卓方向場・傾き場プロッター二階常微分方程式ソルバー一階常微分方程式ソルバー安定結婚問題ソルバーネットワークフロー電卓最大フロー平面グラフ判定ハミルトン路チェッカー巡回セールスマン問題ソルバー TSP線形計画法ソルバー包除原理電卓漸化式ソルバー隣接行列電卓トポロジカルソート電卓グラフ彩色電卓カルノー図 (K-Map) ソルバーブール代数簡略化ツール分割数電卓デジタルルート電卓フィボナッチ数チェッカーエジプト分数電卓メビウス関数電卓ゴールドバッハ予想検証ツールメルセンヌ素数チェッカー双子素数ファインダー友愛数チェッカー完全数チェッカーモジュラー冪乗計算機重複順列電卓効果量電卓相対リスク電卓オッズ比電卓分割表電卓フィッシャーの正確確率検定電卓スピアマン順位相関係数計算機ベータ分布電卓ワイブル分布電卓指数分布電卓幾何分布電卓負の二項分布電卓超幾何分布電卓F検定・F分布電卓ベイズの定理電卓固有多項式計算機行列べき乗電卓コレスキー分解電卓QR分解電卓行列対角化電卓クラメルの公式電卓列空間電卓零空間電卓ベクトル間の角度電卓単位ベクトル電卓ベクトルの大きさ電卓外積電卓内積電卓行列の掛け算電卓逆行列電卓RREF計算機行簡約階段形ニュートン法電卓ヤコビ行列電卓面積分電卓線積分計算機回転カール電卓発散計算機勾配計算機多変数最適化電卓微積分関連変化率ソルバー瞬間変化率電卓平均変化率計算機無限級数和電卓級数収束判定電卓べき級数電卓マクローリン級数電卓ロピタルの定理計算機広義積分電卓シンプソン則電卓台形公式電卓リーマン和電卓パラメトリック曲線グラフ作成ツール回転体の表面積計算機回転体の体積電卓座標幾何距離計算機ヘロンの公式計算機円の接線電卓角の二等分線電卓内接円インサークル電卓外接円電卓大圏距離計算機3d距離電卓トーラス電卓円錐台電卓不規則多角形面積電卓円錐曲線識別ツール双曲線電卓放物線電卓二項定理展開電卓パスカルの三角形ジェネレーター積の記号電卓 (Π パイ記法)有理根定理 電卓デカルトの符号法則電卓平行線と垂直線の電卓直線の方程式電卓標準形から傾き切片形への変換点傾き形式電卓非線形連立方程式ソルバー有理方程式ソルバー文字式方程式ソルバー三角方程式ソルバー指数方程式ソルバー対数方程式ソルバー四次方程式計算機三次方程式ソルバー概算電卓数値から分数への変換器スキップカウントジェネレーター単価電卓天井関数と床関数 電卓絶対値電卓数列パターン検出ツール位取り表ジェネレーター演算の順序電卓PEMDAS筆算足し算・引き算計算機筆算かけ算計算機九九表ジェネレーター🎮 ゲーム内通貨変換器🎲 ドロップ確率電卓🎰 ガチャ天井計算機⚔️ DPS電卓🎮 ゲーム感度変換器❄️ 雪の日計算機🚚 引っ越し費用見積もり🔍 盗作チェッカー📷 OCR / 画像からテキスト抽出📈 折れ線グラフ作成ツール🥧 円グラフ作成ツール📊 棒グラフ作成ツール🔊 トーンジェネレーター🖱️ クリックカウンターオンラインメモ帳⬛ アスペクト比電卓🌍 カーボンフットプリント電卓👙 ブラサイズ電卓タイヤサイズ電卓燃料費電卓🌡️ 暑さ指数電卓🌬️ 体感温度電卓⏰ オンラインアラーム時計⏰ タイムカード電卓📅 日付差分電卓🕐 ミリタリータイム変換器⏱️ 時間計算機⏱️ オンラインストップウォッチ⏱️ カウントダウンタイマー🌐 タイムゾーン変換器カーペット計算機擁壁電卓HVAC容量計算電卓断熱材電卓ペーバー電卓鉄筋電卓木材計算機平方フィート計算機交差掛け算電卓五数要約電卓パーセンタイル電卓正規分布電卓p値電卓四捨五入電卓Twitter/X 文字数カウンターYouTubeコメントピッカーYouTubeタグ抽出ツールyoutubeサムネイルダウンローダーyoutube収益見積もりツールランダムRPGキャラクタージェネレーター