本ページでは\(n\)個の離散データ点\(\left\{ \left( x_i , y_i \right) \right\}\)について、その平均値・分散・共分散の関係式を示します。関係式の導出については以下のpdfファイルを確認してください。
変数の定義
\( \left\{ \left( x_i, y_i \right) \right\} \):データ点
\( n\):データ点の数
\(\mu_{\mathrm{x}}\): \(\left\{ x_i \right\} \) の 平均値
\(s_{\mathrm{xx}}^2\): \(\left\{ x_i \right\} \) の 分散
\(\sigma_{\mathrm{x}}\): \(\left\{ x_i \right\} \) の 標準偏差
\(s_{\mathrm{xy}}^2\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 共分散
\(\rho_{\mathrm{xy}}\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 相関係数
$$
X_i=a x_i+b, Y_i=c y_i+d \tag{1}
$$
\(a, b, c, d\):定数
関係式
各量についての関係式をまとめます。それぞれの導出については、本ページ上部のpdfファイルを確認してください。
また、以下の関係式において、\(\sum_i\)は\(i\)についての総和をとる事を意味します。
平均
$$
\mu_{\mathrm{x}}=\frac{1}{n} \sum_i x_i \tag{1-1}
$$
$$
\mu_{\mathrm{X}}=a \left( \mu_{\mathrm{x}} -b \right) \tag{1-2}
$$
分散・標準偏差
$$
s_{\mathrm{xx}}^2=\frac{1}{n} \sum_i \left( x_i-\mu_{\mathrm{x}} \right) ^2 \tag{2-1}
$$
$$
s_{\mathrm{xx}}^2=\mu_{\mathrm{x}^2}- \mu_{\mathrm{x}}^2 \tag{2-2}
$$
$$
s_{\mathrm{XX}}^2= a^2 s_{\mathrm{xx}}^2 \tag{2-3}
$$
$$
\sigma_{\mathrm{x}}=\sqrt{ s_{\mathrm{xx}}^2} \tag{2-4}
$$
Eq. (2-3)より、分散は\(b\)に依存しないことが分かります。
共分散
$$
s_{\mathrm{xy}}^2=\frac{1}{n} \sum_i \left( x_i-\mu_{\mathrm{x}} \right) \left( y_i-\mu_{\mathrm{y}} \right) \tag{3-1}
$$
$$
s_{\mathrm{xy}}^2=\mu_{\mathrm{xy}}- \mu_{\mathrm{x}} \mu_{\mathrm{y}} \tag{3-2}
$$
$$
s_{\mathrm{XX}}^2= ac s_{\mathrm{xy}}^2 \tag{3-3}
$$
Eq. (3-3)より、共分散は\(b, d\)に依存しないことが分かります。
相関係数
$$
\rho_{\mathrm{xy}}=\frac{s_{\mathrm{xy}^2}}{\sigma_{\mathrm{x}} \sigma_{\mathrm{y}} } \tag{4-1}
$$
$$
\rho_{\mathrm{XY}}= \rho_{\mathrm{xy}}, \left( ac>0 \right) \tag{4-2}
$$
$$
\rho_{\mathrm{XY}}= -\rho_{\mathrm{xy}}, \left( ac<0 \right) \tag{4-3}
$$
$$
|\rho_{\mathrm{xy}}| \leq 1 \tag{4-4}
$$
Eqs. (4-2, 4-3)より、相関係数は\(b, d\)に依存せず、 \(a, c\)の大きさに依存し ないことが分かります。
また、 Eq. (4-4)より、相関係数は -1から1の値をとることが分かります。
関連ページ
期待値を用いた表現
期待値を用いた、平均・分散・共分散の関係式については以下の記事をご確認ください。