データ分析において「平均値」を使う人は多いですが、実は平均値だけでは正しい判断ができないことがあります。特に「外れ値」が含まれている場合、平均値は大きく引きずられてしまうのです。
そこで重要になるのが 中央値(Median)。
中央値はデータの中心を表す代表値であり、外れ値の影響を受けにくいため、ビジネスや統計の現場で広く活用されています。
この記事では「中央値とは」というテーマで、基礎知識からExcelでの計算方法、実務的な応用まで詳しく解説します。
目次
✅ 中央値とは?
中央値(Median) とは、データを小さい順に並べたときの「真ん中の値」を指します。
- データ数が奇数の場合 → 真ん中の1つを中央値とする
- データ数が偶数の場合 → 真ん中の2つの平均を中央値とする
📌 例1:データが「10, 20, 30, 40, 50」
- 中央値 = 30(ちょうど真ん中)
📌 例2:データが「10, 20, 30, 40」
- 中央値 = (20 + 30) ÷ 2 = 25
➡️ 平均値と違い、極端に大きな数値があっても影響を受けにくいのが特徴です。
✅ 平均値との違い
よく比較されるのが「平均値」と「中央値」です。
- 平均値(Mean):データを合計して個数で割った値
- 中央値(Median):データを並べ替えて真ん中を取った値
・外れ値がある場合の違い
📌 例:データ「50, 60, 70, 80, 500」
- 平均値 = (50+60+70+80+500) ÷ 5 = 152
- 中央値 = 70
➡️ 平均値は「500」に大きく引っ張られますが、中央値は実態を反映しています。
このように中央値は「典型的な値」を知るのに適しており、特にアンケート調査や給与データなどでよく使われます。
参考:【Excel】IFERRORで「0」を表示させない!Excelでゼロを消すベストな方法とは?
✅ Excelで中央値を求める方法
Excelでは MEDIAN関数 を使って中央値を求められます。
構文
=MEDIAN(数値1, [数値2], …)
・例:A1~A10の中央値を求める
=MEDIAN(A1:A10)
➡️ これで範囲の中央値を自動的に算出できます。
参考:【Excel】条件付き中央値を求める方法|IF関数と組み合わせて柔軟に分析する
✅ 条件付きで中央値を求めたい場合
Excelには「MEDIANIF」関数はありません。
そのため、IF関数やFILTER関数と組み合わせる 必要があります。
・IF関数を使う場合(配列数式)
=MEDIAN(IF(A2:A100="東日本", B2:B100))
➡️ 「A列が東日本の行だけ」のB列の中央値を求める。
※ Excel 2019以前は Ctrl + Shift + Enter が必要。
・FILTER関数を使う場合(Excel 365)
=MEDIAN(FILTER(B2:B100, A2:A100="東日本"))
➡️ 条件付き中央値をシンプルに書ける。
参考:【Excel】表から抽出して新しい表を作る方法まとめ|関数・フィルター・ピボットで効率化
✅ 中央値の実務での活用例
・アンケート集計
「顧客満足度(1~5)」の中央値を出せば、典型的な回答傾向がわかる。
➡️ 外れた回答(極端に高い/低い)に左右されない。
・給与分析
平均年収ではなく中央値を使えば、実態に近い給与水準を把握できる。
➡️ 一部の高収入者に平均値が引っ張られる問題を回避。
参考:【Excel】【勤怠管理】遅刻・欠勤・早退を自動で判定するIF関数の使い方|勤怠チェックを効率化!
・営業データ
「売上金額の中央値」を出すことで、標準的な契約規模を確認できる。
参考:【Excel】【営業向け】売上金額に応じてランクを自動表示するIF関数の使い方|簡単に業績ランク付け!
・品質管理
測定値の中央値を求めれば「典型的な製品の状態」を把握可能。
参考:【Excel】【在庫管理】在庫数に応じて発注判断を自動化するIF関数の設定方法|ムダなく効率的な仕入れを実現
✅ 中央値と一緒に使いたい指標
中央値だけでなく、他の代表値と組み合わせるとさらに分析が深まります。
- 平均値:全体の傾向を把握
- 最頻値:最もよく出現する値
- 標準偏差:データのばらつき具合
📌 例:テストの点数
- 平均値 = 65点
- 中央値 = 68点
- 最頻値 = 70点
- 標準偏差 = 12
➡️ 「多くの学生は70点前後だが、全体の傾向は65点付近」といった解釈が可能になります。
✅ 中央値をグラフで可視化する方法
数値だけでなく、グラフに中央値を加えると理解が深まります。
- 棒グラフ+中央値ライン:データの中心を直感的に把握できる
- 箱ひげ図(Excel 2016以降)で中央値・外れ値・範囲を一目で表示
- 条件付き書式+棒グラフで中央値を強調
➡️ プレゼンや報告資料で説得力が増すテクニックです。
✅ 注意点とよくある誤解
- 0や欠測値をどう扱うかを明確にする
- データ数が少ないと中央値は安定しない
- 「中央値=平均的な人の値」とは限らない(あくまで中心位置を示す指標)
■ まとめ:中央値を理解してデータ分析の精度を高めよう
- 中央値とは? → データを並べたときの真ん中の値
- 平均値との違い → 外れ値の影響を受けにくい
- Excelでの計算 →
=MEDIAN(範囲)
で簡単に算出 - 条件付き中央値 →
IF
やFILTER
関数と組み合わせて応用可能 - 実務での活用 → アンケート、給与、営業、品質管理など幅広く活躍
✅ まとめ:中央値は「実態を正しく表す代表値」。Excelで活用すれば、外れ値に惑わされない精度の高いデータ分析が可能になります!