マーケティングデータとGephi
久しぶりにGephiを触ってみました。今回は朝倉書店「Pythonによるビジネスデータサイエンス3 マーケティングデータサイエンス」にある相関分析の項目でほんの少し掲載されていたGephiによる可視化について挑戦してみました。
簡単に本の紹介
今回の本ですが、「Pythonによるビジネスデータ分析」ということで、タイトルどおりPythonをつかってビジネスデータを分析しようとするものです。
この本はシリーズ化されいて、その3巻にあたります。他のシリーズも以下に紹介しておきます。
- 1巻 データサイエンス入門
- 2巻 データの前処理
- 3巻 マーケティングデータ分析(今回)
- 4巻 ファイナンスデータ分析
今回の3巻「マーケティングデータ分析」ということで豊富なサンプルデータが用意されています。3種類あり、サンプル用に加工されていますがかなり実態に近いものになっています。詳細はサポートサイトでご確認ください。以下にデータの種類のみ列挙しておきます。
- 株式会社マクロミルが保有するスキャンパネルデータ
- 株式会社光洋が保有するPOSデータ
- 株式会社肉のオカヤマが保有するPOSデータ
データの分析内容
Chapter5の「5.2 相関ルール分析による売り場づくり」で購入履歴を用いた相関ルールの分析があり、その可視化でGephiがわずかですが紹介されています。
相関ルールの分析ではnysol_pythonというソフトが必要になります。(Windowsでは不可)ですが、ここの可視化の部分は途中まで加工(nysol_pythonでの処理)したデータがあるので、それを使えば本のとおりのことができます。
それでできたのがこちらです。まずは図5.14「スナック菓子の相関ルール」を再現。コーラはスナック菓子との相関があるとのこと。
次に図5.15「コーヒーの相関ルール」を再現。少し重なりすぎました。レイアウトをもう少し検討するべきでした。
次は個人的に気になった部分です。たばこと酒類の相関がすごい。
まとめ
今回は朝倉書店「Pythonによるビジネスデータサイエンス3 マーケティングデータサイエンス」より相関ルールの可視化を行いました。こちらの本では他にもPythonを利用した分析が多数紹介されています。いずれ他の項目も紹介できたらと思います。