差分の差分法(DID)
今回は施策効果を正しく評価しするための分析方法の一つ、差分の差分法(DID)について説明させていただきます。
※このブログの内容は個人の意見・見解となります。また、記事の内容の正確性については保証いたしません。本ブログの目的は分析結果をアウトプットしていくことによる自身のデータ分析力向上を主としています。誤りや違うアプローチの方が良いという事も多分にあると思います。後学のため、「もっとこうしたらいい」や誤りを見つけた場合はコメント欄などでお知らせいただけると有難いです。
○正しく効果を測定するための障害
まずは、なぜ差分の差分法などの考え方が重要なのかをお話しさせていただきます。ある店舗で売上向上の施策を行なった場合に前年比や前月との比較結果を持って効果があった、なかったと判断した場合に考えられる懸念点はなんでしょうか?例えば、施策実施月が12月と毎年売上が高い月だった場合、前月との比較で売上実績が向上していても施策による効果によって売上が上がったとは考えにくいですよね。前年比の場合、コロナが流行する前と後の場合では施策のみではなくコロナの流行という外部要因が介入しており、コロナの影響により売上自体は下がっていても、もしかしたら施策を行なったことにより下げ幅が縮まっている可能性もあります。記載した例は一例ですが、上記例も配慮した上で効果を測定しないと誤った意思決定を行なってしまいそうな気がしませんか?そこで、施策の効果を正しく評価するための分析手法の一つとして登場するのが差分の差分法(DID)になります。
○差分の差分法
○平行トレンド仮定
差分の差分法では前提条件として平行トレンドの仮定があります。これは、介入あり群となし群の2群を比較した場合にどちらも介入がない場合は同じ変化をするという意味です。
○回帰分析の式に当てはめる
Yi:広告を出向した場合の売上、Di:広告を出向した店舗かどうかを表すダミー変数 /Di=1であれば出向した店舗、Di=0であれば出向していない店舗、At:時点を表すダミー変数Ai=1を処置後/Ai=0を処置前とすることで差分の差分法は回帰分析の式で表すことが出来ます。
○まとめ
今回は差分の差分法についてお話しさせていただきました。施策を実行した際にはRCTが最も理想的な方法とされていますが、現実の業務上ではRCTを実施するのが難しい場面も多々あるかと思います。そういった場合にケースに応じて正しい評価手法で施策の効果を図ることが重要となります。今回の差分の差分法も前提条件など、正しく評価するにはクリアしないといけない問題があるためしっかり各種手法の前提条件・測れる効果を理解していきたいと思いました。
○最後に
このような形で分析した結果や試してみたことを週に1回(目標)ペースで掲載しています。
(前回から大分更新が途絶えていましたが…)
データ分析のキャリアを歩み始めたのですが、データの解釈、分析力が低いと感じ今回、このような形でアウトプットをしていくことにしたため、ぜひ、アドバイスやご指摘をいただけると幸いです。
コメントを残す