標準偏差とは、抽出したデータのバラツキを表します。標準偏差が大きいほど、データのバラツキが大きいということになります。標準偏差の2乗のことを分散といいます。
例えば、違う母集団から10個ずつデータを取ったとします。
多項式を簡素化するために使用できる基本的な原理
母集団A | 5 | 6 | 4 | 3 | 2 | 5 | 4 | 3 | 5 | 4 | 平均4.日本スペースは認識されている1 |
母集団B | 9 | 2 | 10 | 3 | 1 | 4 | 2 | 7 | 2 | 1 | 平均4.1 |
どちらの母集団も、平均値は4.1で同じですが、一見すると母集団Bの方がバラツキが大きいように思います。これを標準偏差で表すと、母集団Aが1.2、母集団Bが3.3になり、数値的にも母集団Bの方がバラツキが大きいことがわかります。
個々のデータXと、平均Yとの差(X-Y)の2乗の総和を分散といいます。標準偏差は、分散の平方根で表すことができます。手計算では非常に困難な作業ですが、エクセルのSTDEVという関数を使うと、瞬時に求めることができます。
男性がバーからです。
●標準偏差の統計的意味 |
あるデータのサンプルが、平均値を頂点とした理想的な分布(正規分布)をしていると仮定した場合、標準偏差σは次のような意味を持ちます。
・平均値±1σの間に全データの68.27%が分布している。
・平均値±2σの間に全データの95.45%が分布している。
・平均値±3σの間に全データの99.73%が分布している。
・平均値±6σの間に全データの99.999997%が分布している。
上の例で±3σを考えると、母集団Aは統計上、0.5〜7.7(4.1±3×1.2)の間に99.73%のデータが集約されていることになります。一方、母集団Bの場合は、統計上、-5.8〜14.0(4.1±3×3.3)の間に99.73%のデータが集約されていることになります。
標準偏差は工程における製品のバラツキ具合を示す、工程� ��力指数などに用いられます。また、最近では経営指標にもなるシックスシグマ(6σ)などが注目されています。
●標準偏差とリスク |
ビジネスの定量分析の世界では、標準偏差のことをリスクといいます。つまり、「リスクが大きい=バラツキが大きい」ということになります。
例えば、次のように将来3パターンに分かれる投資案があるとします。
パターン | 収益 | 確率 |
A | 100万 | 20% |
B | 50万 | 60% |
C | 5万 | 20% |
このとき、収益の期待値は次のようになります。
期待値 = 100万×0.2 + 50万×0.6 + 5万×0.2 = 51万円
ここから標準偏差を求めるには、まず分散(標準偏差の2乗)を求めます。
分散 = (100万-51万)2×0.2 + (50万-51万)2×0.6 + (5万-51万)2×0.2
= 904万円2
ここから標準偏差は次のようになります。
標準偏差 = 約30万円
これを期待値が同じ51万円になるような次の投資と比べてみます。期待値が同じなので、どちらに投資してもよさそうですが、リスクの観点から比較してみます。
パターン | 収益 | 確率 |
A | 71万 | 50% |
B | 31万 | 50% |
この場合、
標準偏差 = 20万円
となります。したがって、上と比べて期待値は同じですが、リスクの少ない投資だということがわかります。
0 件のコメント:
コメントを投稿