作業フローを簡素化:miniwebtoolを検索。
追加
ホームページ > 数学 > 統計とデータ分析 > A/Bテスト有意性電卓
 

A/Bテスト有意性電卓

A/Bテストのバリアント間の差が統計的に有意であるかどうかを判定します。統制群(コントロール)と実験群(バリアント)の訪問者数とコンバージョン数を入力するだけで、P値、信頼度、アップリフト、および明確な勝敗の判定結果を取得できます。

A/Bテスト有意性電卓

クイックサンプルタップして典型的なシナリオを読み込み、各フィールドを調整してから計算できます。

ライブプレビュー — データを入力してください
コントロールの比率
バリアントの比率
相対リフト

z = — · p値は保留中

コントロール (A)

オリジナル
上記の訪問者数以下である必要があります。

バリアント (B)

チャレンジャー
コントロールの測定と同じ期間。

Embed A/Bテスト有意性電卓 Widget

A/Bテスト有意性電卓

A/Bテスト有意性電卓は、実験データに2つの母比率のz検定を適用し、コントロールバリアント(A)とチャレンジャーバリアント(B)の間で観察された差が統計的に有意であるかどうかを報告します。両方のグループの訪問者数とコンバージョン数を入力すると、このツールはp値、比率の差の信頼区間、絶対リフトおよび相対リフト、観察された効果に対する統計的検定力、80%の検定力でリフトを確認するために必要な1グループあたりのサンプルサイズ、および判りやすいと言葉による勝利 / 敗北 / 判定不能の結論を返します。また、標準正規分布上でzスコアがどこに位置するかをアニメーション視覚化して示します。

使い方

  1. コントロールバリアント(A)の訪問者数とコンバージョン数を入力します。
  2. 同じ期間内に測定された、テスト対象のバリアント(B)について、同じ2つの数値を入力します。
  3. 信頼度を選択します。95%が標準的、99%はより厳格、90%は初期段階の探索用です。
  4. 両側検定(Bがどちらの方向であってもAと異なる)または片側検定(BがAに勝つ場合のみを評価)を選択します。
  5. 「有意性を計算」をクリックして、結論、p値、信頼区間、検定力、およびステップバイステップの数式を確認します。

使用される数式(2つの母比率のZ検定)

p₁ = c₁ / n₁ · p₂ = c₂ / n₂

p̂ = (c₁ + c₂) / (n₁ + n₂) (帰無仮説 H₀ の下での統合比率)

SE = √[ p̂ × (1 − p̂) × (1/n₁ + 1/n₂) ]

z = (p₂ − p₁) / SE

p値 (両側検定) = 2 × (1 − Φ(|z|))

水準 (1 − α) における (p₂ − p₁) の信頼区間 = (p₂ − p₁) ± zα/2 × √[ p₁(1−p₁)/n₁ + p₂(1−p₂)/n₂ ]

このA/Bテスト電卓の特徴

  • 送信前のライブプレビュー — 4つの数値のいずれかを入力すると、比率、リフト、zスコア、p値、および結論がリアルタイムで更新されます。
  • 視覚的な有意性チェック — アニメーション付きの標準正規分布曲線により、z統計量が棄却域に対して正確にどこの位置に落ちるかが示されます。
  • 信頼区間のフォレストプロット — 両方の比率の 95% 信頼区間を並べて確認できます。バーが重なっていないことが、勝者を視覚的に示すシグナルとなります。
  • 判りやすい言葉による結論 — 単なるp値の表示ではなく、緑/黄/赤のバナーで表示されます。多くのステークホルダーにとって、「p = 0.028」と言うよりも「バリアントBの勝利」と伝える方が明確です。
  • 統計的検定力の表示 — テストが検定力不足であるかどうかを識別し、80%の検定力に達するために必要な1グループあたりのサンプルサイズを推奨します。
  • ベイズ流の「P(B > A)」 — 頻度主義的なp値を補完する見方であり、多くのプロダクトチームにとってより直感的に理解できます。
  • クイックサンプルのプリセット — 明確な勝利、きわどい判定、シグナルなし、または敗北のシナリオをワンクリックで読み込み、数値がどのように変化するかを探索できます。

結論の読み方

  • 緑 — 有意な勝利。 p値 ≤ α かつ バリアントの比率 > コントロールの比率。リフトが偶然によるものである可能性は低く、Bをロールアウトすることができます。
  • 赤 — 有意な敗北。 p値 ≤ α ですが バリアントの比率 < コントロールの比率。Bは明らかに悪化しています。Aを維持して原因を調査してください。
  • 黄 — 閾値付近。 p値が α に近いです。判断を下す前により多くのトラフィックを集めてください。
  • 灰色 — シグナルなし。 データは真の差がない状態と一致しています。テストをそのまま継続するか、あるいは停止してより大きな変更を試みてください。

有意なP値が出ても早期に停止すべきではない理由

テストを繰り返し確認し、p値 < 0.05 になった瞬間に停止すること(いわゆる「覗き見」)は、偽陽性率を劇的に上昇させます。名目上5%のテストであっても、実際には30%以上に跳ね上がることがあります。事前に検定力計算を用いてサンプルサイズを決定し、その目標まで実験を実行し、その後初めて有意性を評価してください。この電卓に表示される必要な1グループあたりのサンプルサイズは、将来のテストを計画する際の良い目標になります。

サンプルサイズの計画

テストが検定力不足の場合、電卓は標準的な2つの母比率の検定力公式を使用して、1グループあたりのサンプルサイズを推奨します。

n / グループ ≈ (zα/2 · √[2p̄(1−p̄)] + zβ · √[p₁(1−p₁) + p₂(1−p₂)])² / (p₂ − p₁)²

ここで p̄ は p₁ と p₂ の平均であり、zβ は目標とする検定力に対する標準正規分布の分位数です(80%の場合は 0.84)。

過去のベースライン比率と、関心のある最小限のリフト(改善率)をこの数式に当てはめてください。それが新しいテストを開始する前に目標とすべきサンプルサイズになります。

A/Bテストにおける一般的な落とし穴

  • 覗き見(ピーキング) — 毎日結果を確認し、最初に有意になったp値で停止することは、偽陽性を増加させます。逐次検定を使用するか、計画されたサンプルサイズに達するまで待ってください。
  • 極小のサンプル — 1グループあたりのコンバージョン数が数百未満の場合、正規近似が崩れる可能性があります。代わりにフィッシャーの正確確率検定を検討してください。
  • 多重比較 — 10個のテストを実行して勝ったものだけを報告することは、偽陽性率を跳ね上げます。ボンフェローニ補正を適用するか、事前に登録された実証テストを実行してください。
  • 目新しさ効果(ノベルティ効果) — ユーザーが単に変更に気づいたという理由だけで、最初の1週間はバリアントBが素晴らしく見えることがあります。効果が安定するまで、十分な期間テストを実行してください。
  • 生存者バイアス — ランダム化の後に訪問者をフィルタリングするとテストが壊れます。常にランダム化された全人口に基づいてテストを計算してください。
  • 不一致な測定期間 — 両方のグループのデータを全く同じ期間にわたって収集してください。週末と平日のトラフィック比率の変化は、ベースラインの比率を変動させます。

片側検定 vs 両側検定

両側検定は、Bがどちらの方向であってもAと異なるかどうかを問いめます。どちらのバリアントもロールアウトする可能性が本当にある場合、これが正しいデフォルトの設定です。片側検定は、あらかじめ指定された方向(通常は:BがAに勝つ)の結果のみを評価し、データがその方向を指している場合にp値をほぼ半分にします。ただし、データを検討する前にその方向にコミットする必要があります。結果を見た後に片側検定に切り替えることは、一般的なpハッキング(データの改ざん)の一種です。

信頼区間の読み方

比率の差に対する 95% 信頼区間は、真のリフトとして考えられる妥当な範囲を示しています。区間が完全にゼロを上回っている場合、Bの勝利です。完全にゼロを下回っている場合、Bの敗北です。ゼロをまたいでいる場合、データは真の差がない状態と一致しています。区間の幅は、推定がどれだけ正確であるかの尺度であり、幅が狭いほどデータが多いことを意味します。

FAQ

A/Bテスト有意性電卓は何をするものですか?

コントロールとバリアントのコンバージョンデータに2つの母比率のz検定を適用し、観察されたコンバージョン率の差が偶然の確率で説明できないものであるかどうかを判定します。p値、差の信頼区間、観察された効果に対する統計的検定力、リフト、および判りやすい言葉による結論を報告します。

A/Bテストにはどの信頼度を使用すべきですか?

95%の信頼度(α = 0.05)が、プロダクトやマーケティングのテストにおける業界標準です。偽陽性のコストが高い影響の大きなロールアウトには99%を使用し、高い偽陽性リスクを許容する初期段階の探索のみに90%を使用します。

片側検定と両側検定のどちらを実行すべきですか?

Bがどちらの方向であってもAと異なることだけに関心がある場合は、両側検定を使用します。BがAに勝つことが予想されるなど、事前に方向性のある仮説が決まっており、逆方向のシグナルを無視しても構わない場合は、片側検定を使用します。ほとんどのプロダクトチームは、デフォルトで両側検定を使用すべきです。

p値はどのように計算されますか?

統合比率 p̂ は、合計コンバージョン数と合計訪問者数から算出されます。標準誤差は √[p̂(1−p̂)(1/n₁ + 1/n₂)] です。z統計量は、比率の差をその標準誤差で割ったものです。両側検定のp値は 2 × (1 − Φ(|z|)) であり、ここで Φ は標準正規分布の累積分布関数です。

統計的検定力とは何ですか?なぜ重要なのですか?

検定力とは、現在のサンプルサイズにおいて、観察された大きさの真の効果をテストが検出できる確率です。検定力が80%未満の場合、たとえ効果が本物であっても、テストが小さすぎてリフトを確認できない可能性が高くなります。この電卓は、検定力と80%に達するために必要な1グループあたりのサンプルサイズを報告します。

p値が0.05を下回ったらすぐにテストを停止してもいいですか?

いいえ。途中で結果を覗き見て早期に停止すると、偽陽性率が名目上の α を大幅に上回ってしまいます。事前に検定力計算を用いてサンプルサイズを決定し、テストを最後まで実行し、その後初めて有意性を評価してください。この電卓に表示される必要なサンプルサイズは、良い目標になります。

コンバージョン率が非常に低い場合(例: 1%未満)はどうすればよいですか?

np または n(1−p) が小さい場合、正規近似は不正確になる可能性があります。目安として、各グループで少なくとも30個、理想的には100個以上のコンバージョンが必要です。比率が非常に低いテストの場合は、より保守的な代替手段としてフィッシャーの正確確率検定を検討してください。

P(B > A) は何を意味しますか?

各比率に対する無情報(一様スタイル)事前分布の下で、データから導き出されるバリアントBがコントロールAよりも高い真のコンバージョン率を持つ事後確率を意味します。これは頻度主義的なp値を補完するベイズ的なアプローチであり、統計の専門家ではない人にも伝えやすい表現です(「p = 0.03」と言うよりも「Bが良いという信頼度が85%」と言う方が伝わります)。

このコンテンツ、ページ、またはツールを引用する場合は、次のようにしてください:

"A/Bテスト有意性電卓"(https://MiniWebtool.com/ja/a-bテスト有意性電卓/) MiniWebtool からの引用、https://MiniWebtool.com/

by miniwebtool チーム. 更新日: 2026-05-17

また、AI 数学ソルバー GPT を使って、自然言語による質問と回答で数学の問題を解決することもできます。

その他の関連ツール:

統計とデータ分析:

おすすめ:

標準偏差電卓 - 高精度InstagramユーザーID検索パーセンテージ減少電卓パーセント増加電卓ランダムカラージェネレーターシグマ記法電卓 総和画像分割ツールMACアドレス検索円錐展開図テンプレートジェネレーター筆算割り算電卓弧長電卓パーセント誤差電卓平方完成電卓war電卓フィートとインチからセンチメートルへのコンバーターHEX電卓合計電卓動画を結合ランダム誕生日ジェネレーター対数電卓中央値電卓売上総利益率電卓英単語ランダム生成ツールランダム名前ジェネレーターバイナリ電卓番号を並べ替えるt検定電卓YouTubeチャンネル統計ボウリングスコア計算機手数料電卓動画を逆再生FPSコンバーターai句読点追加楕円円周電卓逆テキストCAGR電卓ランダムトーナメント表作成ツール太陽・月・上昇星座電卓 🌞🌙✨センチメートルからフィートとインチへのコンバーター分散電卓 高精度関数電卓エンジェルナンバー電卓モジュロ電卓不可視文字除去ツール相対標準偏差電卓MP3ルーパーマン・ホイットニーのU検定計算機血糖値コンバーターHEXコンバーターランダム絵文字ジェネレーター動画を回転変動係数電卓ランダム超能力ジェネレーター圧力電卓私のIPアドレスは何ですかクロスワードパズルメーカーASCIIコード表土星回帰電卓ランダム日付ジェネレーター3d距離電卓小数時間から普通の時間へのコンバーター変化率電卓階段電卓迷路ジェネレーターヘロンの公式計算機平方根電卓XMLバリデータービンゴカードジェネレーター相関係数計算機ビデオ速度を調整ランダム時刻ジェネレーターSRT 時間シフト 電卓上下反転テキストジェネレーターレンズの式計算機log-base-2電卓デシベル (dB) 電卓正多角形電卓分数電卓画像回転ツール加速度電卓指数電卓-高精度文字数による改行ワードサーチパズルジェネレーター労働時間計算ツール平均寿命電卓標準誤差電卓桁数電卓並列抵抗電卓比率電卓ボルト締付トルク計算機fena電卓TikTok収益計算ツールオーディオ スプリッターBUN対クレアチニン比電卓SRTからTXTへの変換ツールスペースを削除する動画から画像抽出ツール10進数からBCDへのコンバーター比率電卓水星逆行カレンダー💧 露点電卓平均電卓-高精度複数分数電卓VTTからtxtへのコンバーターじゃんけんジェネレーター周波数波長変換ツール配当利回り電卓🖱️ クリックカウンタータンジェント電卓多項式展開電卓積分電卓オンライン句読点削除ツール👙 ブラサイズ電卓ピタゴラスの定理電卓斜辺電卓CRC32チェックサム電卓筆算足し算・引き算計算機外れ値電卓🔊 トーンジェネレーター平方和の計算太陽位置計算機年の日電卓 - 今日は今年の何日目空の行を削除する三角関数グラフ作成ツールパスワード強度テスタービデオをループ再生ランダムトランプカードジェネレーター梁の電卓点つなぎジェネレーター行番号を追加アナグラム生成器角速度計算機夏至の日wpaキージェネレーターパーソナリティ・ナンバー電卓ヒストグラムメーカー水泳ペース計算機絶対値電卓SHA256 ハッシュジェネレーターTwitch収益計算ツール円錐台電卓熱伝達計算機音節カウンターオンラインメモ帳テキストリピートマスターナンバー電卓化学反応式バランサー身長パーセンタイル電卓ANC電卓ヘッドライト照射距離電卓eの最初のn桁割り切れるテスト電卓FacebookユーザーID検索幾何平均電卓散布図作成ツール論理ゲートシミュレーター配管流量電卓ランダム算数問題ジェネレーターグレイコード・バイナリ変換電卓中間日計算機筆算かけ算計算機通常の時間から小数の時間へのコンバーターatan2電卓ベーカーズパーセント電卓ランダムクレジットカードジェネレーターランダム名ピッカー小文字生成器 ⁽ᶜᵒᵖʸ ⁿ ᵖᵃˢᵗᵉ⁾授乳カロリー計算器hba1c電卓HTMLからテキストコンバータジニ係数電卓概算電卓番号をランダム化する馬力電卓CPM 電卓ランダム国ジェネレーターニュートン法電卓数字抽出ツール熱膨張計算機血液型計算機YouTubeショート収益化計算ツールパーセント成長率電卓ランニングペース電卓多項式の筆算計算機文化別年齢電卓素数のリスト表面積電卓赤ちゃん成長パーセンタイル計算機Cohen's d 電卓RSA暗号化ステップバイステップシミュレーターランダム座標ジェネレーター中国剰余定理電卓沸点計算ツールAIトークンカウンターGIFメーカーOPS電卓シューレース公式電卓フィートからメートルへのコンバーター二重積分電卓四分位範囲電卓出張日当計算機走行距離手当計算機家賃値上げ計算機日割り家賃計算家賃適正額計算機乗り出し価格計算ツール車購入可能額計算機バイクローン計算機キャンピングカーローン計算ボートローン電卓土地ローン計算機建設ローン計算機金利のみ住宅ローン計算機バルーンローン計算機住宅ローンポイント計算機PMI電卓隔週住宅ローン返済額計算機ARM住宅ローン電卓VAローン計算機給与手取り計算機AI SQLクエリジェネレーターAI正規表現ジェネレーターAIデータ可視化ツールCSV貼り付けAIテキストトーン分析ツールAI履歴書アナライザーAI単位変換ツール自然言語AI謝罪文ジェネレーターAI 丁寧なお断り文ジェネレーターAI旅行日程ジェネレーターAI読書リストジェネレーターAIワークアウトプランジェネレーターAI献立ジェネレーターAIギフトアイデアジェネレーターAIレシピジェネレーター食材から奨学金ROI電卓大学費用計算機言語学習 流暢になるまでの学習時間電卓単語クイズ作成ツールコーネルノート作成ツール学習曲線電卓フラッシュカード間隔反復スケジューラーペイント色混合計算機タイル目地計算機食洗機の積み込み最適化ツール洗剤の使用量計算ヘアカラー混合計算機印刷コスト計算機ガス vs 電気 コスト比較電卓ギフトカードチップ電卓引っ越し用ダンボール数計算機ストレージユニットサイズ計算機カプセルワードローブ計算機ベルト長さ計算機油圧シリンダー推力計算機滑車システム計算機ギア比計算機機械比熱計算機ベルヌーイの式計算機レイノルズ数計算機潮汐時刻計算機星空観測条件計算機結び方リファレンスツール寝袋温度評価ガイドテントフットプリントサイズ電卓バックパッキング食料重量電卓ネイスミス式ハイキングペース電卓刺繍糸長さ電卓レジンキャスト量計算電卓ビーズパターン電卓陶芸粘土収縮率電卓折り紙用紙サイズ電卓キルトバインディング電卓クロスステッチ刺繍糸計算編み物パターン計算機編み針サイズ変換器かぎ針サイズ変換器馬の干し草計算ツールペット航空輸送クレートサイズ検索爬虫類飼育UVBライト距離計算機鳥かごサイズ計算機水槽ヒーターワット数電卓猫のトイレ数計算機エンジン圧縮比計算機タイヤ溝摩耗計算機トレーラー牽引荷重計算機車両重量配分計算機旅行費用割り勘計算停止距離計算機労災補償計算機遺産配分電卓商標区分検索ツール特許出願料電卓売上税ネクサスチェッカー刑期短縮計算機時効計算機Airbnb料金最適化ツールルームメイト家賃分割計算機セクション8 家賃電卓BRRRR法計算機キャッシュオンキャッシュリターン計算機賃貸利回り計算機1031エクスチェンジ計算機資産成長ビジュアライザーランチ代計算機ジム vs 自宅トレーニング費用電卓コーヒー代計算機リモートワーク節約計算機副業ROI電卓サブスクリプション費用トラッカーSaaS料金計算ツールフリーランスプロジェクト料金計算機スモークウッド・ペアリングガイド発酵時間計算機マリネ時間計算機食事制限レシピフィルタースパイス代用品ファインダーカフェイン半減期トラッカー標準ドリンク計算ツールワインペアリング提案ツールクライミンググレード変換器自転車ギア比計算機釣り結び強度計算機ヨガポーズホールドタイマー水泳SWOLF電卓レースタイム予測計算機ボクシングパンチ力計算機ラグビー得点電卓クリケット・ランレート電卓サッカーxg期待ゴール電卓テニススコアトラッカーWellsスコア電卓 (DVT/PE)グラスゴー・コーマ・スケール計算機アプガースコア計算機FFMI 電卓クーパー12分間走計算ツール1マイルウォークテストロックポート電卓除脂肪体重から筋力計算炭水化物インスリン比計算機インスリン感受性係数計算機ヘブライ暦変換器ヒジュラ暦変換器旧暦変換ツールどれくらい前計算機あと何日カウントダウン電卓日付パターンジェネレーター日付に営業日を追加営業日計算機単語頻度アナライザー文の長さばらつき分析ツールヘミングウェイ風リーダビリティエディタ発音IPA変換ツールヴィジュネル暗号ツールアトバッシュ暗号ツールROT13エンコーダー・デコーダーEXIFデータビューア・削除ツールピッグラテン翻訳機バックロニム ジェネレーター頭字語ジェネレーターパングラムチェッカーリポグラム チェッカー画像からSVGトレーサー画像からASCIIアートへの変換器JSONスキーマジェネレーターTypeScriptプレイグラウンドLessからCSSへのコンパイラーSCSSからCSSへのコンパイラーSVGからReact/JSXへの変換器クエリ文字列ビルダーURLパーサーUUID検証・デコーダーHTTPステータスコードリファレンスcURLコマンドビルダーシェルピンスキーの三角形ジェネレーター3D曲面プロッター極方程式プロッタージュリア集合生成器マンデルブロ集合エクスプローラーL-Systemフラクタルジェネレータードロネー三角形分割ジェネレーターボロノイ図ジェネレータースピログラフジェネレーターテッセレーションジェネレーターシックスシグマ工程能力計算機パレート図ジェネレーターNPSネットプロモータースコア計算機コホート維持率電卓解約率計算機顧客獲得コストCAC計算機顧客生涯価値CLV電卓コンバージョン率電卓A/Bテスト サンプルサイズ電卓A/Bテスト有意性電卓導線の磁場電卓電場計算機クーロンの法則電卓スネルの法則計算機慣性モーメント計算機求心力計算機振り子周期電卓ばね定数電卓ドップラー効果電卓ソルティノレシオ電卓トレイナー・レシオ電卓株式ベータ計算機インフレ連動米国債TIPS電卓住宅ローン リキャスト 電卓フォワードレート電卓債券デュレーション電卓 マコーレーと修正債券コンベクシティ電卓インデックス連動年金電卓変額年金電卓リバースモーゲージ電卓年金支払い計算機そろばんシミュレーターロシア農民式乗算ヴェーダ数学トリック電卓古代エジプト式乗算電卓ローマ数字計算ソルバー暗算トレーナー九九クイズ繰り上がりと繰り下がりビジュアライザー数の合成と分解生成ツール硬貨文章題ソルバー距離・速さ・時間の三角形電卓仕事算ソルバー混合問題ソルバー年齢文章題ソルバー列車出会い問題ソルバー水分補給計算機ペース カロリー電卓薬剤投与量計算機アルコールカロリー電卓ボディリコンポジション電卓ランダム討論トピックジェネレーターランダムな猫犬の名前ジェネレーターyoutubeサムネイルダウンローダーyoutube収益見積もりツールランダムRPGキャラクタージェネレーター