2026/02/09

マーケティング

すぐ使える!分析がちょっと深まる統計の豆知識5選

この記事の目次

    お疲れ様です!
    CXマーケ・コンテンツプランニング2部 ・コンテンツ推進1課のY・Kです。
    現在は主にマイナビ転職・マイナビスカウティングのコンテンツを担当しております。

    前回、統計検定3級の勉強方法に関して、記事を投稿させていただきました。

    【試験振り返り】数式アレルギーからの「統計検定3級」合格レポ

    今回は、私が統計検定3級の勉強をし始めてから、実際に業務の中で意識するようになったことについて、ご共有できればと思います。

    統計検定の勉強では数式が必須でしたが、実務では数式は全く使用せず、考え方を少し知っておくだけで分析の時に役立つなと思うことが多かったので、すぐ使えるような豆知識をいくつか挙げてみます。

    統計の知識って業務にどう役立つの?と思われている方がいれば、少しでも参考になれば幸いです!

    平均値だけでなく、中央値も出す

    平均値・中央値・最頻値の違いについては、統計検定3級の頻出問題でした。

    分析では平均値を見ることが多いですが、平均は一部の極端な値に引っ張られやすい、という特徴があります。

    例:1, 2, 2, 3, 100 の場合
    
    平均値:全部足して5で割る → (1+2+2+3+100)÷5=21.6
    中央値:並べて真ん中 → 2
    最頻値:一番多い値 → 2
    

    たとえば、

    • 一部のページだけCTRが極端に高い
    • 特定の日だけ数値が跳ねている

    といったケースでは、平均値だけを見ると実態を誤解してしまうことがあります

    そのため平均値と中央値をできるだけセットで見て、平均値と中央値が大きく違う場合は、外れ値があるのではないか?と考えて分析を深めていきます。

    ちなみに、平均値・中央値・最頻値は下記の関数で簡単に出せます。

    平均値
    =AVERAGE()
    
    中央値
    =MEDIAN()
    
    最頻値
    =MODE()
    

    ※参考情報:統計検定3級公式テキストP.56

    数値とグラフはセットで見る

    分析をしていると、つい数値だけ、あるいはグラフだけを見て判断してしまいがちです。ただ、統計検定のテキストを読んでいて印象に残ったのが、グラフも平均値などの数値も、「データを要約したもの」という表現でした。

    たとえば、

    • 平均値は、ばらつきのあるデータを1つの数字に要約したもの
    • グラフは、たくさんの数値を視覚的に要約したもの

    どちらも便利ですが、要約している時点で、どうしてもこぼれ落ちる情報があるという前提を忘れてはいけないと感じました。

    数値だけを見ると、一部の極端な値に引っ張られていないか、実態より良く(または悪く)見えていないか、などが見えにくくなります。一方で、グラフだけを見ると、スケールの取り方で印象が変わっていないか、見た目の変化に引っ張られていないか、といった点に注意が必要です。

    そのため、数値もグラフもセットで確認して、総合的に情報をつかむことが大事だなと思うようになりました。

    また、自分がデータを見るときもそうですが、レポートや資料を作ったりする側のときも、同様の手法で無意識的に騙すようなことをしないように心がけています。

    ※参考情報:統計検定3級公式テキストP.10

    ABテストでは、「偶然かもしれない」を一度考える

    ABテストの結果を見るときに、CTRが高い・低いという実数や差分だけでなく、その差が「たまたま」なのか、「意味のある差」なのかを一度立ち止まって考えるようになりました。

    そのときに便利なのが p値 。

    p値:観測されたデータが偶然で起こる確率
    
    ∟p値が小さい → 偶然起きた可能性が低い
    ∟p値が大きい → たまたまの可能性もある
    
    ※一般的な値としては、5%(0.05)または1%(0.01)未満であれば「偶然ではない」と判断する。
    

    ABテストの結果を見るときは、この差は偶然とは言いにくそうか、それともまだ様子を見るべきか、を一度確認するようにしています。

    p値の計算は、K・Nさん&H・Yさんが社内向けに作成した検定シートをコピーして使ったり、簡易的な計算であれば、Web上にあるABテスト判定ツールなどを使っています。

    【余談】
    ABテストに関連して、国勢調査のように全員に対して調査するのでなく、一部だけで全体の傾向を推定する「サンプリング」がいかに偉大な発見か!というような内容が書籍『統計学が最強の学問である』に書いてありとても興味深かったです。おすすめ!

    ※参考情報:統計検定3級公式テキストP.183

    スプレッドシートの関数で相関分析をする

    分析をしていると、「この指標とこの指標、感覚的には連動しそうだけど、実際どうなんだろう?」と思うことがあります。

    この時に確認するようになったのが、相関係数。

    相関係数:2つのデータ(変数)の間にどれくらい強い「直線的な関係」があるかを示す指標
    
    値の範囲: -1(完全な負の相関)〜 +1(完全な正の相関)
    
    正の相関: +1に近づくほど強い(一方が増えれば他方も増える)
    負の相関: -1に近づくほど強い(一方が増えれば他方は減る)
    無相関: 0に近い(相関がなくバラバラ)
    

    統計検定では相関係数の公式を覚えて手計算させられましたが、スプレッドシートなどの関数を使って、簡単に相関係数を出すことができます。

    相関係数
    =CORREL(範囲A, 範囲B)
    

    相関係数は、1に近いほど強い相関があり、0に近いほど相関が弱いと言われますが、実務では厳密な基準よりも、「なんとなく関係がありそうか」「ほぼ関係なさそうか」を判断するための目安として見るのがいいのかなと思っています。

    なお、「②数値とグラフはセットで見る」の章で記載したとおり、相関係数の数値だけで判断すると、場合によっては誤った解釈をしてしまう場合もあるので、散布図も併せて作って見るのが良いかと思います。

    また、相関がある=因果関係があるというわけではないので、相関分析だけで原因を決めつけずに、仮説を立てるためのきっかけとして使うと良さそうです!

    ※参考情報:統計検定3級公式テキストP.86

    混乱したらベン図で表現してみる

    統計検定の確率の項目で出てきたベン図。子供でも書けそうな簡単な図ですが、思ったより便利なのではと思い、実務でも使うようになりました。

    たとえば、「この属性のユーザーと、この属性のユーザーって、どれくらい重複しているのだろう?」などのマーケティングの分析でも使えますし、単純に思考の整理やアイデア出しのような場合にも使えるなと思っています。整理収納アドバイザー的には、良い整理グッズを見つけた気分です。

    ユーザーの分析でベン図を使いたいときは、GA4の探索レポートで、セグメントを作ることで簡単にベン図で可視化できます。


    GA4>探索レポート>セグメントの重複

    ※参考情報:統計検定3級公式テキストP.116

    まとめ

    今回は、統計の勉強を通して自分自身がどう変わったのか?といった視点で、振り返りを兼ねて、実務に活かせそうな内容をまとめてみました。

    まだまだ初学者ではありますが、少し知識が増えるだけで物事の見方や考え方が変わり、それが成長の実感にも繋がるのが面白いなと感じます。

    何か少しでも、業務に活かせそうな点や、気づきがあれば嬉しく思います。

    お読みいただき、ありがとうございました。

    ※本記事は2026年02月時点の情報です。

    著者:マイナビマーケブログ編集部