共分散の計算

covariance ツール
スポンサーリンク

共分散:

共分散とは?

共分散は、2つのデータセットがどのように一緒に変動するかを示す統計的な指標です。具体的には、2つの変数の関係性やその変動の度合いを測るために使用されます。

共分散の計算式

2つのデータセット (X) と (Y) に対する共分散は以下の式で計算されます:

$$
\text{Cov}(X, Y) = \frac{\sum_{i=1}^{n} (X_i – \bar{X})(Y_i – \bar{Y})}{n}
$$

ここで、

  • $ X_i $ と $ Y_i $ はそれぞれのデータセットの個々のデータポイントを表します。
  • $ \bar{X} $ と $ \bar{Y} $ はデータセット $X$ と $Y$ の平均値を表します。
  • $ n $ はデータポイントの数を表します。

共分散の解釈

  • 共分散が正: 一方の変数が増加すると、もう一方の変数も増加する傾向がある。
  • 共分散が負: 一方の変数が増加すると、もう一方の変数は減少する傾向がある。
  • 共分散が0に近い: 2つの変数の間にはあまり関連性がない。

ただし、共分散の値自体は2つの変数の単位に依存するため、その大きさだけで2つの変数の関係の強さを解釈するのは難しいことがあります。そのため、変数間の関係の強さを評価する際には、共分散を正規化した「相関係数」を用いることが一般的です。

タイトルとURLをコピーしました