目次
はじめに
この記事はYouTubeにアップした動画との連動記事です。
というよりむしろ動画がメインで、こちらの内容は概要レベルのものとなっております。
内容をしっかり理解するためにも、ぜひ動画と合わせて本文を読んでみてください。
というよりむしろ動画がメインで、こちらの内容は概要レベルのものとなっております。
内容をしっかり理解するためにも、ぜひ動画と合わせて本文を読んでみてください。
相関係数とは?概要から計算方法までわかりやすく説明します!
via www.youtube.com
相関係数とは?
2つの変数間に
一方が増えるともう一方も増える(正の相関)
一方が増えるともう一方は減る(負の相関)
といった直線的な関係を相関といいます。
一方が増えるともう一方も増える(正の相関)
一方が増えるともう一方は減る(負の相関)
といった直線的な関係を相関といいます。
正の相関
たとえば、上記の図のように、気温が20℃のときに売れたビールは50杯、気温が30℃のときに売れたビールが100杯というデータがあったとします。
この場合、気温が上がるとビールが売れる、という正の相関があると言えます。
この場合、気温が上がるとビールが売れる、という正の相関があると言えます。
負の相関
また、上記の図のように、会議が週に3回だと顧客への提案数が10回、会議が週に10回あると顧客への提案数が5回に減るというデータがあったとします。
この場合、会議が増えると提案数が減るという関係性があり、負の相関があると言えます。
この場合、会議が増えると提案数が減るという関係性があり、負の相関があると言えます。
相関係数とは
2つの例では相関があるか、ないかと説明しましたが、相関の程度を-1から1の値で表す指標を相関係数といいます。
相関係数は散布図にすることが多いのですが、図にすると下記にようになります。
相関係数は散布図にすることが多いのですが、図にすると下記にようになります。
相関係数は-1から1の値で表す、と説明しましたが、その程度によって解釈の仕方が変わります。
一般的には以下のように解釈します。
一般的には以下のように解釈します。
相関分析
相関係数を使って分析することを相関分析と言います。
相関分析も例をご紹介します。
例えば顧客への提案数が減ったとき、在宅勤務の日数と会議の数、という2つの変数で見たとします。
相関分析も例をご紹介します。
例えば顧客への提案数が減ったとき、在宅勤務の日数と会議の数、という2つの変数で見たとします。
上記の図のように在宅勤務の日数との相関係数が-0.2、会議の数との相関係数が-0.8という結果になった場合、顧客への提案数を増やすためには会議の数を減らしたほうがいい、ということがわかります。
注意点(擬似相関など)
相関関係があるからといって、 必ずしも因果関係が認められるわけではありません
よくある例を紹介します。
アイスの売り上げとビールの売り上げという変数の間に相関係数0.85の正の相関があるとします。
しかし、だからといってビールの売り上げを上げるためにアイスの売り上げを頑張って上げよう、とはならないと思います。
アイスの売り上げとビールの売り上げには相関関係はあっても因果関係はなく、気温という共通の要因からみられた関係と考えられます。
アイスの売り上げとビールの売り上げという変数の間に相関係数0.85の正の相関があるとします。
しかし、だからといってビールの売り上げを上げるためにアイスの売り上げを頑張って上げよう、とはならないと思います。
アイスの売り上げとビールの売り上げには相関関係はあっても因果関係はなく、気温という共通の要因からみられた関係と考えられます。
このように因果関係ないけど相関関係がみられることを疑似相関といいます。
単に相関係数と言うときは、 これまで見てきた相関係数と思って大丈夫
相関係数は種類がありますが、単に相関係数と言う時はこれまで見てきた相関係数と思って大丈夫です。
ちなみに「ピアソンの積率相関係数」と言い、他には「スピアマンの順位相関係数」などがあります。
ちなみに「ピアソンの積率相関係数」と言い、他には「スピアマンの順位相関係数」などがあります。
相関係数の計算の仕方
相関係数の計算の仕方を、Aさん~Eさん5人の身長と体重のデータを例にとって説明します。
まずはそれぞれの値から平均を引きます。
Aさんの場合、身長166cmから平均の170を引いて-4となります。
このように個々の値から平均を引くことを偏差を求めると言います。
次に計算された偏差を二乗します。
二乗した偏差の合計を偏差の平方和、個々の身長の偏差×体重の偏差の合計を積和と言います。
それぞれの数値を相関係数の計算式に当てはめると以下のようになります。
Aさんの場合、身長166cmから平均の170を引いて-4となります。
このように個々の値から平均を引くことを偏差を求めると言います。
次に計算された偏差を二乗します。
二乗した偏差の合計を偏差の平方和、個々の身長の偏差×体重の偏差の合計を積和と言います。
それぞれの数値を相関係数の計算式に当てはめると以下のようになります。
Excelの関数紹介
相関係数の式でも求められますが、Excelではもっと簡単に「=CORREL(配列1,配列2)」という関数で求められます。
先程の身長と体重の例を当てはめるとこのようになります。
先程の身長と体重の例を当てはめるとこのようになります。
36 件