足跡

@vbear00のメモ

相関係数の性質とベクトル

 ピアソンの相関係数は共分散を標準偏差の積で割ったものであるのは良いとして、それがもつ良い性格がなぜ生じるのかは理解できていなかった。そのうち、測定単位に影響されないというのは、単位つきで計算してみれば当たり前のことだとわかるので良い。一方、相関係数が-1<=r<=1の範囲にあるという性格については、なぜそうなるのか理解できなかった。手元の統計学の入門書を引いても、rの計算式は載っているが、なぜその計算式にならなくてはいけないのかは書いてない。

 と、いうことで調べた結果は、rはふたつの単位ベクトルの内積であるから、そうなるのは自明、ということだった。

http://oku.edu.mie-u.ac.jp/~okumura/stat/correlation.html

Wikipedia にはrは、平均からのデータのずれを表すベクトルのなす角の余弦であると書いてある。

http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0

つまり自分の疑問に答えるためには、ベクトルについての理解が必要ということだった。「ここさえわかれば理解できる」ということが明らかになったので確実な進展だが、結局理解できていないことには変わりないのである。

 ただ、以下のスライドから、相関係数はconθだと覚えてしまうと、-1<=r<1は「そうなんだ」という感じにはなる。

ベクトルで理解する相関係数