共分散:
共分散とは?
共分散は、2つのデータセットがどのように一緒に変動するかを示す統計的な指標です。具体的には、2つの変数の関係性やその変動の度合いを測るために使用されます。
共分散の計算式
2つのデータセット (X) と (Y) に対する共分散は以下の式で計算されます:
$$
\text{Cov}(X, Y) = \frac{\sum_{i=1}^{n} (X_i – \bar{X})(Y_i – \bar{Y})}{n}
$$
ここで、
- $ X_i $ と $ Y_i $ はそれぞれのデータセットの個々のデータポイントを表します。
- $ \bar{X} $ と $ \bar{Y} $ はデータセット $X$ と $Y$ の平均値を表します。
- $ n $ はデータポイントの数を表します。
共分散の解釈
- 共分散が正: 一方の変数が増加すると、もう一方の変数も増加する傾向がある。
- 共分散が負: 一方の変数が増加すると、もう一方の変数は減少する傾向がある。
- 共分散が0に近い: 2つの変数の間にはあまり関連性がない。
ただし、共分散の値自体は2つの変数の単位に依存するため、その大きさだけで2つの変数の関係の強さを解釈するのは難しいことがあります。そのため、変数間の関係の強さを評価する際には、共分散を正規化した「相関係数」を用いることが一般的です。