Excelでデータ分析をするとき、多くの人が「平均値」だけを見がちです。しかし、実際の業務では平均値だけでは不十分なケースが多く存在します。なぜなら、外れ値があると平均が大きく歪んでしまうからです。
そこで重要になるのが 中央値(Median) と 分散(Variance) です。
- 中央値は「データの真ん中の値」を示し、外れ値の影響を受けにくい。
- 分散は「データのばらつき具合」を示し、安定しているかどうかを判断できる。
この記事では「Excel 中央値 分散」というテーマで、基礎からExcelでの求め方、実務での活用法までを詳しく解説します。
目次
✅ 中央値とは?
中央値(Median) は、データを小さい順に並べたときの真ん中にある値です。
- データ数が奇数 → 真ん中の1つが中央値
- データ数が偶数 → 真ん中の2つの平均が中央値
📌 例1:データ「10, 20, 30, 40, 50」
- 中央値 = 30
📌 例2:データ「10, 20, 30, 40」
- 中央値 = (20+30) ÷ 2 = 25
➡️ 平均値と異なり、極端な外れ値の影響を受けにくいのが特徴です。
参考:【Excel】中央値とは?Excelでの求め方と実務での活用方法を徹底解説
✅ 分散とは?
分散(Variance) は「データが平均からどれだけ散らばっているか」を示す指標です。
- 値が大きい → データが広く散らばっている(ばらつきが大きい)
- 値が小さい → データが平均の近くに集まっている(安定している)
📌 例:
- データ「10, 11, 12」 → 分散は小さい(安定)
- データ「5, 15, 25」 → 分散は大きい(バラバラ)
✅ Excelで中央値を求める方法
Excelでは MEDIAN関数 を使います。
構文
=MEDIAN(数値1, [数値2], …)
・例:A1:A10の中央値を求める
=MEDIAN(A1:A10)
➡️ 範囲全体から中央値を自動的に算出できます。
参考:【Excel】初心者でもわかる写真で解説した平均の出し方とは
✅ Excelで分散を求める方法
Excelには分散を求めるための複数の関数があります。
・母集団全体を対象とする場合
=VAR.P(A1:A10)
・標本データを対象とする場合
=VAR.S(A1:A10)
- VAR.P(Population variance) → 母集団全体の分散
- VAR.S(Sample variance) → 標本データの分散
➡️ 実務では「標本データ」を扱うことが多いため、VAR.S を使うケースが一般的です。
✅ 中央値と分散を組み合わせた分析
中央値と分散を組み合わせると、データの「中心」と「散らばり」の両方を把握できます。
📌 例:テストの点数(100人分)
- 平均値 = 65点
- 中央値 = 68点
- 分散 = 144(標準偏差12)
➡️ 解釈:
- 中央値が平均より高い → 下位の点数に引っ張られて平均が下がっている
- 分散が大きい → 学力にばらつきがある
このように複数の指標を組み合わせることで、単純な平均値よりも実態を正確に把握できます。
✅ 実務での活用シナリオ
・営業データ分析
- 「売上金額の中央値」 → 標準的な取引規模を把握
- 「売上金額の分散」 → 担当者ごとの成績の安定性を評価
参考:【Excel】【営業向け】売上金額に応じてランクを自動表示するIF関数の使い方|簡単に業績ランク付け!
・給与分析
- 平均年収だけでなく中央値を出す → 実態に近い給与水準を把握
- 分散を計算すれば「給与格差」が大きいかどうかを確認可能
参考:【Excel】【勤怠管理】遅刻・欠勤・早退を自動で判定するIF関数の使い方|勤怠チェックを効率化!
・品質管理
- 製品検査データの中央値 → 標準的な品質を確認
- 分散 → 品質のばらつきを数値化し、安定度を判断
参考:【Excel】【在庫管理】在庫数に応じて発注判断を自動化するIF関数の設定方法|ムダなく効率的な仕入れを実現
・教育分野
- テスト結果の中央値 → 典型的な学生の成績を示す
- 分散 → 学力のバラつき(クラスの学習状況)を測定
✅ グラフと組み合わせてわかりやすく
数値だけでなく、グラフにすることで直感的に理解しやすくなります。
- 箱ひげ図:中央値とデータの散らばり(四分位範囲)を一目で確認
- 棒グラフ+中央値ライン:中央値と分散を基準にした比較
- 散布図+平均・中央値ライン:データの傾向とばらつきを同時に表示
➡️ Excel 2016以降なら「統計グラフ(箱ひげ図)」を活用すると効果的です。
参考:【Excel】グラフのデータ選択方法
参考:【Excel】2軸のグラフを作成する方法
✅ 中央値・分散を使うときの注意点
- 中央値は「中心」だけを表すため、分布全体は見えない
- 分散は数値が大きいと解釈しづらいため、標準偏差(=SQRT(分散)) も合わせて確認するとよい
- 0や欠測値をどう扱うかを事前に決めることが重要
■ まとめ:Excelで中央値と分散を活用して分析力を高めよう
- 中央値 → データの真ん中を表す(外れ値の影響を受けにくい)
- 分散 → データの散らばりを数値化(安定性を確認できる)
- Excel関数
- 中央値:
=MEDIAN(範囲) - 分散:
=VAR.P(範囲)(母集団)、=VAR.S(範囲)(標本)
- 中央値:
- 実務では「中央値+分散」を組み合わせて分析すると、データの実態がより明確になる
- グラフと併用すれば、視覚的に説得力ある資料を作成できる
✅ まとめ:Excelで中央値と分散を同時に活用すれば、「標準的な値」と「データの安定度」の両面から分析でき、ビジネス・教育・品質管理など幅広いシーンで役立ちます!