“Excelでデータ分析ができるらしい”ということは知っていても、統計にまで使いこなしている人は、どれくらいいるでしょうか?
また、仕事の場面で、実際に統計解析が必要になったことはありませんか?
総務省統計局サイトでは、統計のことを「『集団』の『傾向・性質』を『数量的』に明らかにすること」と定義しています。ビジネス・パーソン実務上では、この定義ではやや「ざっくり」しすぎてますので、言いかえれば「なにか判断するための数字を、明らかにすること」ということです。
数字あつかいは、Excelが得意とするところ。あまりむずかしく考えず、まずは「仕事の判断材料」を、Excelでどんどん加工・編集してみましょう。 この記事では、Excel統計解析の入口「単回帰分析」の方法について、ご説明します。
Excelでは、回帰分析はアドインで簡単に利用できます
回帰分析とは、ざっくり言うと「何かを行うこと(説明変数)が、結果(被説明変数/目的変数)にどんな影響を与えたか」因果関係を数量的に見る分析手法です。1つの説明変数で予測するのが単回帰分析、1つの予測に対して複数の説明変数を用いるのが重回帰分析です。
ただし、Excel分析ツール上には、「単」も「重」もありません。あるのは、「回帰分析」のみです。
Excelの[データ]タブ→[データ分析]ボタンをクリックして、分析ツール一覧の中から[回帰分析]を選択することで利用します。
※もし、あなたのパソコンに[データ分析]ボタン(アドイン)がなければ、こちら(過去記事へジャンプ)を参照して、[有効なアドイン]一覧から[分析ツール]を選択してください。
実収入が実支出にあたえる影響を単回帰分析
収入と支出の関係では、「収入が高い方が、支出も高い(だろう)」ということが、なんとなく想像できます。収入をこえて(借金してまで)、支出しつづけることには、限界があるからです。
以下では、総務省統計局オープンデータを使用しますが、これを自社アンケートの「世帯収入」+「自社商品購買履歴」におきかえれば、自社独自の分析結果がえられるようになります。
家計調査(家計収支編)時系列データ(2人以上の世帯)では、「2人以上の世帯のうち勤労者世帯」について、西暦2000年以降20年以上の1ヶ月ごと費目別収入、支出統計がExcel形式で公開されています。
長期間にわたる統計資料なので、非表示セルや結合セルもある約250行280列の大きな1枚のワークシートです。 そこで、まずは約270ヶ月分の「実収入」と「実支出」2項目のみを、この大きなシートから抽出し、分析ツールにかけられるシンプルな表へ整形します。
次に、この約270ヶ月分の実収入と実支出データをドラッグし、[データ分析]→[回帰分析]→[OK]で、分析するデータ範囲を選択します。
最後に、分析結果を出力する先を指定し、[OK]を押すと…
分析結果が出ました!
うぉぉぉぉっ!!! 何だかさっぱりわからん!!! やっぱりオレ、アホなんかな?
いえいえ。各用語は、きちんと統計学を学べばわかるのですが、この表の中から、ビジネスのためにチェックしておくポイントはごくわずかです。
「回帰統計」の「重決定R2」という指標。「決定係数」とよばれる指標で、分析結果の信頼性をあらわしています。
0〜1の範囲で、この係数が1に近いほど信頼性が高く、0では「全く当てにならない」ことになります。この係数が、一般的に0.4以上であれば「当てはまりの良い分析結果」となりますので、実収入と実支出との関係性(重決定R2)0.69は、信頼できる分析結果だといえるでしょう。
散布図で、関係性のつよさをビジュアル的に確認
最後に、回帰分析にかけたデータで、グラフ(散布図)を作成します。
さらに、作成した散布図を右クリックして[近似曲線の追加]を選択し、書式設定で[グラフに数式を表示する]を選択してみてください。
高校数学の微分を使わなければ計算できなかった、近似曲線の数式がえられました。
この数式が、回帰分析を活用した予測では、重要になります。
y=0.1928x+310779
xが実収入、yが実支出になりますので、
「xが150万円の時には、yは599,970(約60万円)」
「yを50万円にするためには、xを981436(約98万円)にする必要がある」、
のように、仮定の数値を方程式に代入すると、簡単に信頼性の高い予測ができるようになります。
まとめ
2つの要素を分析するだけなら、統計の専門知識は不要
Excel回帰分析ツールだけで目的に近づけます!
「投下した販売促進費用と、該当商品の売上動向」
「最寄り駅からの距離と家賃の関係」
など、ビジネス成果を左右する要素について、自分なりの分析をかけたい場合には、Excel回帰分析が便利です。
もちろん、実ビジネスで「結果(目的)に影響する要素が1つだけ」という場面はほとんどありません。それでも、まず分析する要素を1つか2つにしぼって、シンプルな単回帰分析で影響を調べてみることは、とても重要なことです。
そして、それだけのことをするためには、統計の専門知識が必要ないことをご理解いただけたでしょうか?
最初は「やってみたらアテが外れた」ということがあるかもしれませんが、何度もツールに生データを入れてみれば、使い方の勘所をつかめるようになりますよ。
マイデータ分析の第一歩として、ぜひ試してみてください。