平均・分散・共分散

数学



本ページでは\(n\)個の離散データ点\(\left\{ \left( x_i , y_i \right) \right\}\)について、その平均値・分散・共分散の関係式を示します。関係式の導出については以下のpdfファイルを確認してください。

変数の定義

\( \left\{ \left( x_i, y_i \right) \right\} \):データ点
\( n\):データ点の数
\(\mu_{\mathrm{x}}\): \(\left\{ x_i \right\} \) の 平均値
\(s_{\mathrm{xx}}^2\): \(\left\{ x_i \right\} \) の 分散
\(\sigma_{\mathrm{x}}\): \(\left\{ x_i \right\} \) の 標準偏差
\(s_{\mathrm{xy}}^2\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 共分散
\(\rho_{\mathrm{xy}}\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 相関係数
$$
X_i=a x_i+b, Y_i=c y_i+d \tag{1}
$$
\(a, b, c, d\):定数

関係式

各量についての関係式をまとめます。それぞれの導出については、本ページ上部のpdfファイルを確認してください。

また、以下の関係式において、\(\sum_i\)は\(i\)についての総和をとる事を意味します。

平均

$$
\mu_{\mathrm{x}}=\frac{1}{n} \sum_i x_i \tag{1-1}
$$

$$
\mu_{\mathrm{X}}=a \left( \mu_{\mathrm{x}} -b \right) \tag{1-2}
$$

分散・標準偏差

$$
s_{\mathrm{xx}}^2=\frac{1}{n} \sum_i \left( x_i-\mu_{\mathrm{x}} \right) ^2 \tag{2-1}
$$

$$
s_{\mathrm{xx}}^2=\mu_{\mathrm{x}^2}- \mu_{\mathrm{x}}^2 \tag{2-2}
$$

$$
s_{\mathrm{XX}}^2= a^2 s_{\mathrm{xx}}^2 \tag{2-3}
$$

$$
\sigma_{\mathrm{x}}=\sqrt{ s_{\mathrm{xx}}^2} \tag{2-4}
$$

Eq. (2-3)より、分散は\(b\)に依存しないことが分かります。

共分散

$$
s_{\mathrm{xy}}^2=\frac{1}{n} \sum_i \left( x_i-\mu_{\mathrm{x}} \right) \left( y_i-\mu_{\mathrm{y}} \right) \tag{3-1}
$$

$$
s_{\mathrm{xy}}^2=\mu_{\mathrm{xy}}- \mu_{\mathrm{x}} \mu_{\mathrm{y}} \tag{3-2}
$$

$$
s_{\mathrm{XX}}^2= ac s_{\mathrm{xy}}^2 \tag{3-3}
$$

Eq. (3-3)より、共分散は\(b, d\)に依存しないことが分かります。

相関係数

$$
\rho_{\mathrm{xy}}=\frac{s_{\mathrm{xy}^2}}{\sigma_{\mathrm{x}} \sigma_{\mathrm{y}} } \tag{4-1}
$$

$$
\rho_{\mathrm{XY}}= \rho_{\mathrm{xy}}, \left( ac>0 \right) \tag{4-2}
$$

$$
\rho_{\mathrm{XY}}= -\rho_{\mathrm{xy}}, \left( ac<0 \right) \tag{4-3}
$$

$$
|\rho_{\mathrm{xy}}| \leq 1 \tag{4-4}
$$

Eqs. (4-2, 4-3)より、相関係数は\(b, d\)に依存せず、 \(a, c\)の大きさに依存し ないことが分かります。

また、 Eq. (4-4)より、相関係数は -1から1の値をとることが分かります。


関連ページ

期待値を用いた表現

期待値を用いた、平均・分散・共分散の関係式については以下の記事をご確認ください。

平均・分散・共分散(期待値を用いた表現)
個の離散データ点 について、その平均値・分散・共分散の関係式を以下のページにて紹介しています。当該記事では、各関係式を総和記号を用いて表現していますが、平均値・分散・共分散 は、確率の分野でも登場する概念であり、期待値と密接に関...
タイトルとURLをコピーしました