C-Connect Tech Blog

株式会社シー・コネクトの制作部が運営するテックブログ

社内で機械学習勉強会をやりました

こんにちは、システムチーム淺倉です。

10月にプロモ―ションチーム+システムチームで機械学習勉強会を行いました!
時間は木曜日の15時~16時半で、お題は
システムチーム=画像認識
プロモチーム(佐々木君)=アソシエーション分析
で行いました。

心強いことに、18新卒の吉村君が大学時代に機械学習やAIを専攻していたため、講師役としてサポートしてもらいました!

f:id:c-connect-tech:20171102193020j:plain
勉強会の様子


今回は佐々木君のアソシエーション分析の成果をご報告します!

非エンジニアマーケター佐々木くんがアソシエーション分析をやってみた

アソシエーション分析とは?

マーケットバスケット分析とも呼ばれ「商品Aを購入する人は商品Bも買う傾向がある」といったように、2つ以上のアイテムの関連性ルールを探るための手法。分析結果から、どの商品が一緒に買われるかなどの併売傾向や、どの商品を販売促進すべきかといった洞察を得ることができる。 たとえば、POSデータなどの大量データから「顧客がポテトフライを購入するとき、その約42%は同時にクラッカーも購入する」といったルールを漏れなく効率的に発見できる。アイテム間の関連性の強さは、信頼度(Confidence)、支持度(Support)およびリフト(Lift)という数値によって測ることができる。

マーケティング・アナリティクス・ゼミナール様の用語集より引用

「おむつを買う人は、ビールを買う傾向がある」という例がよく使用されます。
一見すると関係ないように見える商品も、購入データを分析することで相関性が見えるのでそこに対してアプローチをかけよう、ということですね。

佐々木君の軌跡

やるぞ!と決めたからと言ってすぐにうまくいくわけではありません。
佐々木君がアソシエーション分析に成功するまでの軌跡を聞いてみました。

  • Orangeをダウンロード

  • データ生成のためにエクセルで作成

  • エクセルを読み込んだらクラッシュしたのでRを使用することに

  • Rで頑張る

とにかくデータが重くて大変だったそうです。

f:id:c-connect-tech:20171102192956j:plain 成果報告会の様子です

苦労の末・・・


今回佐々木君は実際の購入データを基に試していたようです。
商品id,商品idのcsvを作成して、RGuiでこのcsvを読み込み…
支持度、確信度を指定し、処理をさせると・・・・

相関図のグラフを作成できました! f:id:c-connect-tech:20171107105619p:plain

結果

佐々木君「商品Aと商品Bを一緒に買っている人が多いという分析結果が得られました。」
(具体的な商品名は避けます…!)

吉村先生のコメント
今回はセット商品の注文情報でやったので単品買いが多いという結果になりましたが、サイズ別や色とかで出したら面白いと思います。
データとしては十分な量でしたが、セット商品も多かったので商品ごとの相関は見づらかったですね。

佐々木くんの感想Excelが重くてつらかった。
次は別の相関がでそうなデータでやりたい。

最初の成果はデータの質の問題もありちょっと物足りなかったようですが、その後別のデータをもらってやってみたところいい感じの相関が出たと喜んで送られてきたのがこちらです。

f:id:c-connect-tech:20171107094156p:plain

おお!図の左下のほう、相関が増えています。
これは今後の戦略にも生かせそうです。


部署またがったメンバーで勉強会をすることで、お互いの知識や技術で新しいことができるのは素晴らしいですね!
次の成果物が楽しみです。