平均・分散・共分散(期待値を用いた表現)

数学



\(n\)個の離散データ点\(\left\{ \left( x_i , y_i \right) \right\}\) について、その平均値・分散・共分散の関係式を以下のページにて紹介しています。当該記事では、各関係式を総和記号を用いて表現していますが、平均値・分散・共分散 は、確率の分野でも登場する概念であり、期待値と密接に関係しています。

本ページでは\(n\)個の離散データ点\(\left\{ \left( x_i , y_i \right) \right\}\)について、その平均値・分散・共分散の関係式を期待値で表現します(紹介する関係式は、ほとんど上記のページと同じです)。関係式の導出については以下のpdfファイルを確認してください。

変数の定義と基本的な関係式

データ点に関連

\( \left\{ \left( x_i, y_i \right) \right\} \):データ点
\( n\):データ点の数
\( \mu_{\mathrm{x}}\): \(\left\{ x_i \right\} \) の 平均値
\( s_{\mathrm{xx}}^2\): \(\left\{ x_i \right\} \) の 分散
\( s_{\mathrm{xy}}^2\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 共分散
\( \rho_{\mathrm{xy}}\): \(\left\{ \left( x_i, y_i \right) \right\} \) の 相関係数
$$
X_i=a x_i+b, Y_i=c y_i+d \tag{1}
$$
\(a, b, c, d\):定数

期待値を用いた表現関連

\( p_i \): \( i \) 番目のデータが得られる確率

本ページでは、以下のように\( p_i \)を与えることで、平均値等を期待値を用いて表現します。

$$
p_i =\frac{1}{n} \tag{2}
$$

さらに、確率変数\(x, y\)に対して、以下の二つの関係式を定義します。

$$
E \left[ x \right]=\sum_i x_i p_i \tag{3}
$$

$$
\mathrm{Cov} \left[ x, y \right]= E \left[ \left( x – E \left[ x \right] \right) \left( y – E \left[ y \right] \right) \right] \tag{4}
$$

Eq. (3)は確率変数\(x\)の期待値です。

関係式

各量についての関係式をまとめます。それぞれの導出については、本ページ上部のpdfファイルを確認してください。

平均

$$
\mu_{\mathrm{x}}=E \left[ x \right] \tag{1-1}
$$

$$
E \left[ X \right] =a \left( E \left[ x \right] -b \right) \tag{1-2}
$$

分散

$$
s_{\mathrm{xx}}^2= \mathrm{Cov} \left[ x, x \right] \tag{2-1}
$$

$$
\mathrm{Cov} \left[ x, x \right] = E \left[ x^2 \right]- \left( E \left[ x \right] \right)^2 \tag{2-2} $$

$$
\mathrm{Cov} \left[ X, X \right] = a^2 \mathrm{Cov} \left[ x, x \right] \tag{2-3}
$$

Eq. (2-3)より、分散は\(b\)に依存しないことが分かります。

共分散

$$
s_{\mathrm{xy}}^2= \mathrm{Cov} \left[ x, y \right] \tag{3-1}
$$

$$
\mathrm{Cov} \left[ x, y \right]= E \left[ xy \right]- E \left[ x \right] E \left[ y \right] \tag{3-2}
$$

$$
\mathrm{Cov} \left[ X, Y \right] = ac \mathrm{Cov} \left[ x, y \right] \tag{3-3}
$$

Eq. (3-3)より、共分散は\(b, d\)に依存しないことが分かります。

相関係数

$$
\rho_{\mathrm{xy}}=\frac{ \mathrm{Cov} \left[ x, y \right] }{\sqrt{ \mathrm{Cov} \left[ x, x \right] } \sqrt{ \mathrm{Cov} \left[ y, y \right] }} \tag{4-1}
$$

$$
\rho_{\mathrm{XY}}= \rho_{\mathrm{xy}}, \left( ac>0 \right) \tag{4-2}
$$

$$
\rho_{\mathrm{XY}}= -\rho_{\mathrm{xy}}, \left( ac<0 \right) \tag{4-3}
$$

Eqs. (4-2, 4-3)より、相関係数は\(b, d\)に依存せず、 \(a, c\)の大きさに依存し ないことが分かります。


関連ページ

総和記号を用いた表現

総和記号を用いた平均・分散・共分散の関係式については以下の記事をご確認ください。

タイトルとURLをコピーしました