【Mac用】エクセルでデータ分析をした結果

散布図

Excelで相関関係を作成するためのアドイン があるのをご存知でしょうか。

相関関係とは、一方が増加するとき、他方が増加する傾向があるもの、または減少する傾向があるものを言います。増加する傾向を正の相関関係、減少する傾向を負の相関関係があると言います。右斜め
要は、両者の関係が強いか弱いかを数値で表現したものです。

 

目次
 ・Excelのアドイン で相関関係をみる方法
 ・Excelの関数で相関関係をみる方法

Excelのアドイン で相関関係をみる方法

Excelのアドイン 「データ分析」から相関を選択し、相関関係を作成してみたいと思います。

事前準備:アドイン に相関を追加

Excelを開き、ツールのExcelアドイン を選択します。

Excelアドイン

次に分析ツールを選択しOKをクリックします。

分析ツールを選択

ツールの中にデータ分析が追加されていますので選択します。

データ分析

こちらで準備は完了です。

次に相関を見るための、対象データの準備をしていきます。

サンプル的なデータでみていきたいと思います。

競技参加匹数競技時間(分)怪我した猫(匹)
玉入れ100204
綱引き150308
リレー50151
毛糸玉ころがし75255
にぼし食い競走60305
ムカデ競争125359
騎馬戦2004015

各競技の参加匹数と競技時間が散布図で表すと次のように表現されます。
相関を作成するときは基本、散布図が使われます。
x軸(横軸)に1つ目のデータ、y軸(縦軸)にもう片方のデータを表します。

散布図

それでは実際のデータを利用して、相関を出してみましょう。先ほど追加したデータ分析から相関を選んでOKボタンをクリックします。

相関

次に相関を求めたい数値の範囲を入力範囲で指定します。
空白の右側にあるアイコンをクリックすると選択することができます。

範囲指定

次に、出力先を決めます。今回は、同じシートのセルを選択してみました。

出力先指定

OKボタンをクリックします。そうすると数値の表が作成されていると思います。

相関係数

列1と列2の相関は、0.76822
列2と列3の相関は、0.930222066
列1と列3の相関は、0.928501

相関係数の値は必ず−1以上1以下で表されます。
相関係数が1に近ければ、正の相関が強く、−1に近づけば負の相関が強くなります。0に近ければ無相関です。

相関係数の値相関係数の強弱
0.7~1強い正の相関あり
0.4~0.7正の相関あり
0.2~0.4弱い正の相関あり
-0.2~0.2ほぼ関係ない
-0.4~-0.2弱い負の相関あり
-0.7~-0.4負の相関あり
-1~-0.7強い負の相関あり

今回の結果は下記の内容でした。
列1と列2の相関は、0.76822
列2と列3の相関は、0.930222066
列1と列3の相関は、0.928501

列2と列3、列1と列3の相関は強い正の相関ありといえそうです。
列1と列2も同様に強い正の相関があるといえます。

上記の結果を言い換えると、「参加匹数」が増えると「怪我する猫」が増え、
「競技時間」が長くなると「怪我する猫」が増えると解釈できます。

ただし、ここで注意が必要です!!!

相関が強く出たからといって、必ずしも因果関係かというとそうとは限らない場合があるのです。(こういった説明文はどのサイトでも記載されていると思いますが・・・)先程の例では、確かに相関的には強い正の相関が出ているという解釈は間違っていませんが、実はその間(参加匹数と怪我する猫)には共通な事柄が隠れている可能性があるからです。

例えば、「猫が顔を洗うと雨が降る」という事柄を相関関係で説明することができます。

「雨が降る前は湿気が多くなりやすくなります」
「猫のひげが敏感に湿気に反応して、ひげの感度が落ちないように拭う可能性が高くなる」のが原因です。

そのため、「猫が顔を洗う」と「雨が降る」の間には共通事項の湿気があり、湿気が高くなると猫が顔を洗うというのが因果関係だったりします。


相関と因果の簡易説明
相関:AとBの事柄になんらかの関連性があるもの
因果:Aを原因としてBが変動すること

 

分析依頼や相談、質問などありましたら、お気軽にお問い合わせください。

  

 

補足:簡単な相関関係の求め方

Excelの関数で相関係数を出すことも可能です。
関数は、CORREL(コリレーション)関数を使います。

数式はこちらになります。
=CORREL(配列1,配列2)

今回のサンプルを利用すると

Excel関数

結果、先ほどの関数の列1と列2の相関係数と同じになりました。

結果

このことから、相関係数を出すときは関数の方が簡単でよさそうというイメージになるかと思いますが、実はそうではなくデータ分析からの相関係数しかできない機能があります。それは、3つ以上のデータ群を比較する時です。

実際に相関関数やデータ分析を利用して、相関関係があるかのデータ分析をして、業務に役立ててみてください。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です