中央値の説明
中央値(メディアン)は、統計学においてデータセットを数値の大きさ順に並べたときに、ちょうど中央に位置する値を指します。中央値は、データセットの「中央」を表す尺度であり、外れ値の影響を受けにくいという特徴があります。これは、平均値(アベレージ)とは異なり、データの分布が偏っている場合でも、データセットの中心的な傾向をより適切に反映することができます。
中央値の計算式
中央値の計算方法は、データセットの数が奇数か偶数かによって異なります。
- データセットの数が奇数の場合:
データセットを昇順に並べた後、ちょうど中央に位置する値が中央値です。 - データセットの数が偶数の場合:
データセットを昇順に並べた後、中央に位置する2つの数値の平均値を取ります。これが中央値です。
計算の例
例えば、以下のデータセットがあるとします。
- 奇数の場合: $ {3, 1, 4, 2, 5} $
- 昇順に並べると $ {1, 2, 3, 4, 5} $ となります。
- 中央に位置する値は $ 3 $ です。よって、中央値は $ 3 $ です。
- 偶数の場合: $ {7, 5, 3, 1} $
- 昇順に並べると $ {1, 3, 5, 7} $ となります。
- 中央に位置する値は $ 3 $ と $ 5 $ です。
- これらの平均値 $ \frac{3 + 5}{2} = 4 $ を計算します。よって、中央値は $ 4 $ です。
このように、中央値はデータセットの中心的な値を示し、特に外れ値がある場合には平均値よりも信頼性の高い尺度となります。