標準偏差

出典: 低身長治療病院情報

2009年10月27日 (火) 10:10時点における Teishin (会話 | 投稿記録) による版
(差分) ←前の版 | 最新版を表示 (差分) | 次の版→ (差分)

標準偏差(ひょうじゅんへんさ、Standard Deviation)は、統計値や確率変数の散らばり具合(ばらつき)を表す数値のひとつで σ や s で表す。例えばある試験で、クラス全員が同じ点数であった場合(全員が平均値であった場合)のデータは、ばらつきがないので、標準偏差や分散は0となる。

二乗平均平方根 (RMS) と混同されることもある。両者の違いについては、二乗平均平方根を参照。

目次

統計値の標準偏差

例として、n 人のクラスで試験が行われたとする。それぞれの点数を x1, x2, ..., xn とすると相加平均(あるいは算術平均、ふつう単に平均とよばれるもの)は、

Template:Indent

この時、

Template:Indent

分散(正確には標本分散)という。<math>\sum_{i=1}^{n}</math>の右側は、各自の値と平均値との距離の二乗を意味する。この標本分散は、母集団の分散よりも常に小さくなるという性質がある(つまり偏りのない推定量ではない)。

そこで、母集団が十分に大きく標本数が有限の場合、分散 σ2 の推定値として

Template:Indent

不偏分散という。不偏分散の期待値は母集団の分散に等しい。不偏分散の場合、標本数(例えばデータの人数)nでなく<math>{n-1}</math>を用いる。この理由は、標本における散らばり具合(ばらつき)は、母集団のばらつきよりも常に小さくなるという性質があるからである。例えば、標本数が1の場合、ばらつきはないので標本分散が必ず0となるが、母集団のばらつきは普通0ではない。

この分散または不偏分散の正の平方根標準偏差 σである。

※統計の教科書によっては <math>n-1</math> で割ったものが標本分散という名称になっており(例:東京大学教養学部統計学教室編『統計学入門』ISBN 4-13-042065-8)、用語が混乱して使用されている場合がある。母集団平均が不明で標本平均を代わりに使用する場合には、期待値が母集団分散となる不偏分散を使用する事が多い(分散または標準偏差の図による解説と具体例は村瀬洋一他『SPSSによる多変量解析』pp.52-53 ISBN 4-27-406626-6 等を参照)。

確率変数の標準偏差

離散型確率変数

X を離散型確率変数とする。X のとりうる値が x1, x2, ..., xnXxi をとる確率を pi で表す。ここで、 Template:Indent とする。この時、

Template:Indent

を確率変数 X の平均値という。分散は

Template:Indent

となり、分散の平方根が標準偏差となる。

連続型確率変数

X を連続型確率変数とする。連続関数 f(x) が

Template:Indent

を満たし、かつ X の値が区間 [x1, x2] に属する確率が

Template:Indent

の時、平均値は

Template:Indent

分散は

Template:Indent

となり、分散の平方根が標準偏差となる。

関連項目

外部リンク

  • 低身長クリニック渋谷[1] 日本初の身長を伸ばす専門クリニック。プロのドクターが集い、お子様が『希望身長』になるまで共に成長を見守る。