Kaggle リクルート主催レストランの来店人数予測
※このブログの内容は個人の意見・見解となります。また、記事の内容の正確性については保証いたしません。本ブログの目的は分析結果をアウトプットしていくことによる自身のデータ分析力向上を主としています。誤りや違うアプローチの方が良いという事も多分にあると思います。後学のため、「もっとこうしたらいい」や誤りを見つけた場合はコメント欄などでお知らせいただけると有難いです。
今回は、シフト・食材を最適化し費用を削減するために来店回数予測を行う。

※駅近の店とその他店舗での来店回数の違いはオープンデータ入手できず未検証となります。
今回使用したデータ:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/data kaggleで過去に開催されていたコンペのデータを使います。
pythonのソースコード:https://github.com/ryosuke-yakura/Recruit-Restaurant-Visitor-Forecasting
では、早速データを見ていきます。
※visit_data:来店日 visit_count:予約者来店人数 reserve_count:予約人数 visitors:来店人数

来店人数と予約人数①2016-07までは差分が2000だが、②2016-07から2016-10までは6000、③2016-11以降からは6000と期間ごとに差分でグループに分けられます。
予約する人より圧倒的に予約しない人の方が多いことが伺えます。このことから今後の来店人数を予測する場合は2016-11以降からのデータを使用した方が精度が高くなると考えられます。 (①を入れると来店回数が低く出そうだし、②は逆に高く出てきそう)


曜日ごとの平均人数を見るとfriday、Saturdayの平均平均人数が多い。 翌日が休みとなる週末に集中していると考えられます。来店人数には日月火<水木<金土といった傾向があります。



仮説検証の結果は下記になります。
・予約人数と来店人数の相関係数は低く強く相関があるとは言えず当日に予約なしで来店する顧客が多くを占めている
・曜日、時間帯ごとの来店人数を見ると金曜日、土曜日の夜が多く、月から水曜、朝方の時間帯なでは少ない。
最後に来店回数を予測します。



このような形で分析した結果を今後は週に1回(目標)ペースで掲載していきたいと考えている。データ分析のキャリアを歩み始めたのですが、データの解釈、分析力が低いと感じ今回、このような形でアウトプットをしていくことにしたため、ぜひ、アドバイスやご指摘をいただけると幸いです。
コメントを残す