最近のコメント

    データの要約と確率変数の特徴付け

    以前の記事】で標本データを要約するために使われる主な統計量を勉強しました。具体的にはデータの平均データの分散・標準偏差の定義と意味を勉強しました。覚えているでしょうか?

    実は、標本データだけでなく確率変数に対しても同様に、データの平均と分散・標準偏差に対応する概念を定義することができます。これらは、確率変数の実現値を特徴付けるものになります。

    ゴールドスミス
    確率変数の場合には、その中心を要約する値のことを「期待値」と呼ぶよ。あと、ここで扱う確率変数は厳密にいうと「離散型の確率変数」であって、「連続型の確率変数」の場合には少し定義が変わるので注意が必要だ。
    ヤスチカ
    確率変数ってなんだっけ?

    確率変数とは、簡単にいうと確率関数が与える確率に従って実現値が決定する変数のことでしたね。詳しくは【こちらの記事】の前半部分で扱っています。

    離散型確率変数の期待値と分散・標準偏差

    離散型確率変数の期待値:実現値の中心を要約する

    データの平均と同じように、確率変数の実現値の中心を表現するにはどうすれば良いのでしょうか?

    このように、定義の対象をかえた上で同種の概念を定義したい場合には、既存の定義を元にしたアナロジカルな(類比的な)思考が基本になります。

    そこで、まずは既存の定義を確認してみましょう。データの平均は次のように定義されました。

    Def. データの平均

    $$ \bar x = \frac{1}{N}\sum_{i=1}^{N}x_i $$

    この定義を少し変形して分析してみます。すると、

    $$ \bar x = \frac{1}{N}\sum_{i=1}^{N}x_i$$

    $$ = \sum_{i=1}^{N}\frac{1}{N}x_i $$

    $$ = \frac{1}{N}x_1 + \frac{1}{N}x_2 + … + \frac{1}{N}x_N $$

    のように変形することができます。

    最後の行をみてもらうと、各観測値に \(\frac{1}{N}\)がかけられているのがわかります。つまり、データの平均では各観測値を \(\frac{1}{N}\)という値で評価したものを足し合わせているわけです。

    このことから、データの場合には、各観測値はすべて等しい値で評価されていることがわかります。

    しかし、確率変数の実現値は対応する確率関数が与える確率の値によって出現頻度が異なるという特徴があります。したがって、実現値の数の逆数ですべての実現値を評価して足し合わせたとしても、データの平均のようにうまく中心を要約することはできません。

    それでは、どうすれば、確率変数の各実現値を適切に評価して、その中心を表現できるのでしょうか。

    その答えは、 \(\frac{1}{N}\)のかわりに、各実現値に与えらられた確率で評価を行うということです。

    ゴールドスミス
    評価という言葉を「重み付け」という言葉で表現することも多いよ。この表現をもちいれば、確率変数の期待値は「各実現値の確率で重み付けをしたものを足し合わせたもの」だと表現できる。つまり、この定義は「加重和」とよばれるものと同じものなんだ。

    これを数式の形でまとめておくと、次のようになります。

    Def. 離散型確率変数の期待値

    $$ E(X) = \sum_{i=1}^{N}x_i P(x_i) $$

    ヤスチカ
    EはExperience(期待値)のことだ!

    ここで、\(x_i\)は確率変数の各実現値(realization)を表しています。大文字のシグマを使った記号表現は\(x_iP(x_i)\)を\(i=1\)から\(i=N\)まですべて足し合わせるという演算を表しているわけです。

    繰り返しになりますが、データの平均との相違点は、各実現値を等しく評価するのではなく、それぞれに対応する確率で評価して足し合わせているということです。

    離散型確率変数の分散:実現値の散らばり具合を要約する

    散らばり具合の指標である分散についても、上の議論と同様に考えることができます。

    期待値の時と同じく、まずは既存の定義を確認してみましょう。データの分散は次のように定義されました。

    Def. データの分散

    $$ \bar x = \frac{1}{N}\sum_{i=1}^{N}(x_i – \bar x)^2 $$

    この定義を変形して分析していきます。すると、

    $$ \bar x = \frac{1}{N}\sum_{i=1}^{N}(x_i – \bar x)^2$$

    $$ = \sum_{i=1}^{N}\frac{1}{N}(x_i – \bar x)^2 $$

    $$ = \frac{1}{N}(x_1 – \bar x)^2 + \frac{1}{N}(x_2 – \bar x)^2 + … + \frac{1}{N}(x_N – \bar x)^2 $$

    のように変形することができます。データの平均の時と同じ構造が見えてきたでしょうか?

    つまり、データの分散は、各観測値の平均からの偏差の2乗を\(\frac{1}{N}\)という値で等しく評価して足し合わせています。

    さて、このことを念頭において、確率変数の分散を構築していきましょう。

    やることは期待値の場合とまったく同じです。確率変数の各実現値の平均からの偏差の2乗を各確率で評価して足し合わせるだけです。

    この定義も数式でまとめておきましょう。

    Def. 離散型確率変数の分散

    $$ Var(X) = \sum_{i=1}^{N}(x_i -\bar x)^2P(x_i) $$

    ヤスチカ
    VarはVariance(分散)のことだったな!
    離散型確率変数の標準偏差:確率変数の分散の修正

    データの分散に続き、離散型確率変数の分散を定義することができました。しかし、データの分散の時と同じ問題がここでも発生してしまいます。それは散らばりの単位が元の実現値とずれてしまっているということです。分散は2乗の計算をしているため、その単位も2乗されたものになってしまいます。

    確率変数の実現値の散らばりの指標にも、元のデータと同じ単位をもつものが欲しいですよね。この問題はデータの分散の時と同じく、分散の正の平方根をとってあげるだけで解決します。これで元のデータと同じ単位をもつ散らばりの指標が完成します。これも数式でまとめておきましょう。

    Def. 離散型確率変数の標準偏差

    $$ \sqrt {Var(X)} = \sqrt {\sum_{i=1}^{N}(x_i -\bar x)^2P(x_i)} $$

    今回はここまでです。データの平均、分散・標準偏差に続いて、離散型確率変数についても同様の指標を手に入れることができました。どの指標も重要な概念なので、必ず定義を覚えておきましょう!

    Twitterでフォローしよう

    おすすめの記事