Tableauを使った小売の数値可視化入門

気温と売上の相関関係を可視化してみよう!

第6回オープンデータを使って販売実績を分析する

前回は複数の数値項目データを使って散布図を表示する方法を説明しました。データの分布から特徴や共通項を探り出し、更に傾向線を引くことで相関関係の有無や強さを見ることもできました。これまでは自社内で蓄積されていく販売実績データをベースとした分析でしたが、この第6回では一般に公開されているデータを組み合わせて活用する方法を説明します。

  • Facebook
  • Twitter
  • Line
  • Hatena

1.オープンデータ

売上や仕入、在庫といった業務上のデータ以外にも、世の中には様々なデータであふれています。身近なもので言えば気温や降水量、ガソリン価格などが挙げられますし、もっと大きな視点なら為替や株価、人口動態などもあります。これらの中には、国や自治体が収集・集計して公開しているものもあり、そのようなデータを「オープンデータ」と呼びます。国と自治体はオープンデータ戦略を推進しており、近年は「政府統計の総合窓口 e-Stat」の整備が進み、人口や経済など様々なデータが公開されています。また業界団体などの非政府系組織もデータを公開して民間企業に活用してもらうことに積極的に取り組む流れが出来つつあります。

オープンデータは社会全般のデータであり、自社の影響を受けていない部分を少なからず含んでいます。このオープンデータと自社データの2つを組み合わせることで、「販売実績に影響を与える外部要因は何か」「自社は世の中や業界のトレンドに追従しているだろうか」といったことを分析することができます。

2.二つのデータを同時に使う

Tableauではひとつの分析ファイル内に複数のデータファイルを読み込むことができます。今回はオープンデータと自社データという、異なる2つのデータを読み込む方法を説明します。気象のオープンデータと自社データの販売実績を用いて、「暑いとき/寒いときに売れるものは何か」をテーマに進めます。

2.1.Excelファイルの読み込み

今回は販売実績データ気象データを利用します(それぞれのリンクからデータをダウンロードすることができます)。Tableauを起動し、左上にある「接続→ファイルへ→Microsoft Excel」をクリックして、ダウンロードした「sales.xlsx(月次販売データサンプル)」のファイルを選択します。データが読み込まれたらシート1に移動しましょう。

2.2.月ごとの売上を表示する

まずは月ごとの売上を棒グラフで表示します。メジャーにある年と月を右クリックメニューからディメンションに変換します。

<図2-1 メジャーからディメンションへの変換>

ディメンションに変換された年と月を列に、メジャーから売上を行にドラッグ&ドロップすると棒グラフが表示されます。

<図2-2 年、月、売上の配置>

<図2-3 月ごとの売上>

ここに気温の情報を追加していきます。気温のデータはダウンロードした「weather.xlsx(気象データサンプル)」のExcelファイルに入っていますので、このデータに接続します。

2.3.二つめのExcelファイルに接続する

Tableauに複数のデータファイルを接続するときは、画面上部の「新しいデータソースを追加」アイコンからファイルを選択します。「「weather.xlsx(気象データサンプル)」のExcelファイルを使用します。なお、過去の気象データは気象庁などからダウンロードすることが可能です。

<図2-4>

「「weather.xlsx(気象データサンプル)」のファイルを選択してシートに戻ると、月次販売データの下に気象データが追加されています。気象データの年と月も最初はメジャーにありますので、先ほどと同様にディメンションに変換しておきます。

<図2-5>

2.4.気温のグラフを追加する

このように2つ以上のデータファイルを読み込んだとき、データを連携させて表示することができます。Tableauではこの機能を「データブレンディング」と呼びます。データを連携させるには、共通する項目(ディメンション)をリンクさせることが必要です。

気象データのディメンションを見ると、年と月の横に鎖のアイコンがあります。

<図2-6 鎖のアイコン>

このアイコンが青色になっているときはリンクしていません。アイコンをクリックしてオレンジ色にするとリンクしたことになり、異なる2つのデータファイルを連携させることができます。ここでは年と月の両方をオレンジ色の状態にしておきます。

<図2-7 リンクさせた状態>

年と月をリンクさせた状態で気象データのメジャーにある平均気温を行に追加すると、売上と同時に気温のグラフが表示されます。

<図2-8>

マークから売上のグラフタイプを棒に、平均気温のグラフタイプを線にして、行の平均気温の右クリックメニューから「二重軸」を選択すると、売上と気温のグラフを重ねて見ることができます。

<図2-9 グラフタイプの変更>

<図2-10 二重軸>

<図2-11>

以上のようにして、自社データと社外のデータを組み合わせることができます。ここから、第5回のときのように売上と気温の散布図を作ってそれぞれの関係をもう少し詳しく見てみます。

2.5.散布図を作成する

散布図は分布や相関を見るのに適した表現方法です。ここでは売上と気温の散布図を作って「暑さの影響を受ける品種は何か」を探ってみます。

新しいシートを作り、月次販売データの売上を行に入れてから、気象データの年と月をリンクさせます。それから気象データの平均気温を列に、月次販売データの年と月をマークの詳細に配置します。月次販売データのディメンションにある品種をフィルターにドラッグ&ドロップして、試しに「アイスクリーム・シャーベット」のみを選択します。

「アイスは暑いときに売れる」という認識は、なんとなく皆さん持っていることと思いますが、このデータからも明らかになりました。

<図2-12 散布図>

散布図が表示されたら傾向線を表示しておくと、データの傾向と相関を簡単に見ることができます。フィルターもドロップダウンリストなどで表示しておくと、切替をスムーズに行うことできます。

<図2-13 傾向線の表示>

<図2-14 フィルターの表示>

フィルターを切り替えて見ていくと、色々な発見をすることができると思います。

例えばこのサンプルデータなら、「しめじよりもえのきたけのほうが傾向線の傾きが小さいので、寒いときの伸びが良い」「コーヒー豆は通年で気温の影響をあまり受けないが、缶やペットボトルのコーヒー飲料は暑いときに売れて、年々売上が増加している」「うどんは夏場は乾麺、冬場は生麺」といったことが見てとれます。

また、気温の変化による変動幅を表す「傾向線の傾き」や、気温と売上の関連性の強さを表す「相関係数」は、計算によって求めることもできます。品種ごとの傾きと相関係数を棒グラフで表示して並び替えたり散布図にプロットしたりすれば、「暑いとき/寒いときに売れるものは何か」を一目で見ることも可能です。 ※1

<図2-15 傾きの棒グラフ 左は寒いときに売れ、右は暑いときに売れる>

3.まとめ

今回はデータブレンディング機能を使用して、自社データにオープンデータを組み合わせる方法を説明しました。自社内のデータでExcelとCSVのようにファイル形式が異なるデータがあっても、同じように連携させて分析することができます。

オープンデータのような「自社の外側」のデータは活用の機会が数多くあります。世帯と人口を用いた商圏分析やアンケート調査などから分かる需要動向は、営業戦略に大きな影響を与えます。限定的な自社のデータだけでなくオープンデータなども活用して、分析をより精緻に深めてみてはいかがでしょうか。

[注釈]

※1 気温は月の影響を強く受けますので、気温の変化によるものか月に特有の事情なのかは注意が必要です。たとえば、このサンプルデータでは「えび」や「もち」は寒いときに売れているように表示されますが、実態はお正月準備のために売れていますので、気温ではなく月に特有の事情による変動です。

著者プロフィール

柳瀬隆志
柳瀬隆志ヤナセタカシ

株式会社カホエンタープライズ代表取締役社長。1976年福岡生まれ。2000年東京大学経済学部卒業後、三井物産株式会社に入社。2008年嘉穂無線株式会社へ入社、2013年、嘉穂無線株式会社代表取締役副社長を経て、2016年に株式会社グッデイ(嘉穂無線株式会社より社名変更)の代表取締役社長に就任。現在に至る。