今回はマーケターが分析リテラシーを上げるためには最高なのではないかという書籍をご紹介します。

その書籍というのが

「Excelでできるデータドリブン・マーケティング」

「統計学が最強の学問である」の著者・西内啓さんも推薦している書籍である。

みんな大好きなエクセルで実践形式で学んでいくので、分析に関して全く知識がないという方にとってもかなりとっつきやすく、容易に分析リテラシーを上げることができる一つであると言えます。

 

マーケターがよくぶち当たる悩みとしては感覚的な施策に陥るということがあるかと思いますが、この書籍を一通り読めば感覚的・定性的な施策でなく定量的な根拠に沿った施策を打てるのではないかと思います。

ちなみに自分は広告代理店でインターンをしているだけのでゴリゴリのマーケターというわけではないのでそこら辺の知識についてなにか不備があるかもしれないが、そこに関しては目をつぶっていただきたい。

ですがインターンの僕でもこんなことができるのではないかと色々と思うところがあったので、ゴリゴリのマーケターの方々にとってはより多くのことに応用できるのではないかと思います。

【1章】演習をはじめる前に

最初の章としてこの「データドリブン・マーケティング」の位置づけをはっきりさせている。

この本は今流行の「Webマーケティング」だけでなく、オフラインとオンラインのすべてのチャネルにまたがるマーケティング施策の全体最適化に対応する分析手法としてのマーケティング・ミックス・モデリング(MMM)を中心にした演習で全体最適をテーマにしたノウハウを詰め込んでいる。

マーケティング施策においてどの媒体にどのくらいの予算を投下すればいいのか悩んでいるマーケターの方にとっては何か解決の糸口が見つかる1つとなるかもしれないです。

このようにMMMを紹介するのだが、その上で著者はまず初めにマーケターの分析リテラシーに関して問題提起している。

左の図はSSRI社が2017年8月に実施した「社会人の方へ統計に関するアンケート」で「次の用語をご存知ですか?」という問いに対しての結果であるが、僕はこれを見た時に衝撃を受けた。さすがにこれは嘘ではないかと思った。僕がお世話になっている部署のマーケターの方は理系ということもありこれらの単語は普通に知っていたのだが、確かに社会人全体とするとこの表の通りそこら辺のリテラシーの水準はかなり低くなるのかなとも思う。

加えて著者の経験からマーケターに絞っても重回帰分析を使いこなしている人はおよそ5%前後ということでここに関してはかなり問題視している。

そういった経緯から「データサイエンティスト」を育てるのは大事であるが、「データサイエンティスト」が有益な分析結果を出しても、意思決定者である「マーケター」そのものがそれを理解していなければ意味がないとしてこのマーケターの分析リテラシーの底上げを最重要課題としている。

(参考:https://bellcurve.jp/statistics/blog/18272.html

 

このように問題提起をした上で簡単に統計用語の説明を加えて、次の章からの演習に簡単に入れるようにされている。

ここで説明されているものとしては「質的変数」と「量的変数」の違いなどの基礎的なものから、「準実験」・「回帰分析」など実践的な知識など多岐にわたってかなり丁寧に説明されており統計リテラシーがほとんどない人にとっても読みやすいものとなっている。

【2章】顧客データ(質的データ)をクロスセクションデータとして分析

2章から実際に演習に入っていく。

この章では主にクロス集計独立性の検定数量化2類クラスター分析について企業のホームページに来る問い合わせをイメージした架空のデータを用いて演習を行った。

ここでの演習を体験することによって、実際の現場でどのような属性の人たちが商品購入に至りやすいかなどを詳細に定量的に分析することができるようになるので、その結果からどういった施策を打てばいいのかを明確に理解することができるようになる。

この章で行った演習を少し紹介すると、書籍によって企業を知った人とそうでない人で商談(目的)への至りやすさに違いがあるのか理解できたり、もう一つより具体的な例を言うと、クラスター分析によって分けられた顧客のある1部の層においては契約の至りやすさに「講演」が大きな影響を及ぼしていたとわかったので、この結果からの施策としてこの層に対して講演の案内をするということが考えられるといったことを実際にエクセルで数値的に分析を行った。

このような演習を行うので実際の現場で施策を考える時に定性的な部分からだけでなく、定量的な観点から施策を考えることができるようになるだろう。

【3章】アルコール飲料の売上の予測モデルを作る準備(データをチェック)

3章では次の章から入る予測モデルの作成の前段階としてエクセルでのデータの可視化方法や基本的な統計用語を学んでいった。

ここで詳しく統計用語(「中央値」「標準偏差」「尖度」「歪度」「相関係数」)やデータの見方など詳しく書かれているので、今までデータに触れたことがない人にとっても安心安全の設計となっている。

【4章】Excel分析ツールを使って回帰分析

4章で実際に回帰分析を体験していく。

決定係数」や「P値」などの基本的な用語はしっかりと解説されているので回帰分析についてこれまで理解していない人でも置いていかれずに、しかも実際に自分で手を動かしながらエクセルで回帰分析を体験するのでより理解を深めながら演習を進めることができる。

加えて決定係数を高める工夫であったり、ダミー変数というものにも触れているので実際の現場でも使えるようなものも紹介されている。

基本的に5章6章でも回帰分析を用いて演習をしておくので、ここで簡単に回帰分析の概要や用語の説明をしておく。

回帰分析とは?

回帰分析を簡単に説明すると説明変数X目的変数Yをどのくらい説明できるのかを分析する手法。もっと嚙み砕いて言うとある変数Yとある変数Xの関係式を求めるという感じ。

数式的に見ると、Y=aX+bで説明するためのaとbの値を求めることを回帰分析と言う。

そしてこの求まったaを回帰係数、bを切片という。

また回帰分析の解釈としてある変数Xを1単位上げるaだけYが増加するということになり、このaが結局XのYに対する影響と考えることができる。

具体例を交えて説明すると「Y(売上)=100*X(クリック数)+10000」というような式ができた時にクリック数が1回増えると売り上げが100円増加するということになる。

aとbを求める際には上図の赤い矢印で示された予測値と実測値の差(残差)のを最小化するようにしてaとbの値が決められる。

実際には残差はプラスとマイナスの値をとるので、残差の二乗を合計した残差平方和を最小化するようにaとbが最適化される。ちなみにこの手法は最小二乗法という。

これまで回帰分析の式としてY=aX+bを紹介したが、このように説明変数Xが1つの場合を単回帰分析と言い、Y=a1X1+a2X2+bのように説明変数Xが複数含み回帰するものを重回帰分析という。

そしてできたモデルの当てはまりの良さを表す値として「決定係数」というものがある。

 

この回帰分析を用いて4章では目的変数Yを売上として様々な説明変数X(TVCM, Web広告など)を入れてみて回帰分析を行い、決定係数が高い売上を説明できるようなモデル(Y=aX+b)の作成を行った。

これだけ理解していればこれから書く5,6章の話をある程度理解できるかと思います。

【5章】残存効果などを加味して予測精度を上げる

インターン先の方から5章6章は面白そうという風なことを聞いていてかなり期待してこの5章の演習に取り組んだのですが期待以上でした。

この5章と6章はかなり見所満載でした。

広告の効果というのはどのくらいの期間長く続くのか?」や「広告効果を定量的に表せないか?」と結構インターンをしていくうちに疑問に思っていたのだが、この章で演習を行っていく中でこの疑問点がかなりスッキリした。

この5章でも4章と同じく売上を説明できるようなモデルを作成していくのだが、違いとして回帰分析に使用する説明変数である各媒体の広告に対して残存効果非線形な影響などを加味した変数を用いている。

残存効果とは?

残像効果というのは広告の効果がその時だけでなく翌週や翌々週にも効果が表れることを指す。例えば今週の広告への投下が100(単位は気にせんといて)で、残存効果が30%であった時に翌週この広告の効果が30残るというものである。

非線形な影響とは?

これは広告の投下量の増加に伴い売上への効果は一定で増加するのかどうか?もしくは投下量が増えれば効果は小さくなっていくのかどうか?を加味するものである。

例えば広告の投下量が増加するにつれて売上への効果が小さくなっていくことを逓減、広告投下量が増加するにつれて効果が大きくなっていくことを逓増という。

横軸が投下量、縦軸を売上としたときに広告投下量の非線形な影響のイメージはこのような感じ。

この残存効果p・非線形の影響(累乗q)を加味した広告投下量の変数(X)は以下のように表される。残存効果は2週間後まで続くとした場合。期間tの広告投下量

このように広告投下量の変数が加工される。

$$
X_{t}= (x_{t}+x_{t-1}p+x_{t-2}p^2)^q
$$

そしてこの加工された変数を用いて売上を回帰しており、結果として残存効果など加味した変数を使ったモデルの方が決定係数が高いという結果に。

実際の残存効果pと累乗qの求め方は是非本を手に取って学んでみてください。

【6章】予算配分最適化シミュレーション

Web広告の運用をしていく中でも結構問題となっている予算配分の問題。

「どの媒体にどのくらいの予算を投下した売上などのKPIを達成できるのか?」

この6章の「予算配分最適化シミュレーション」の演習を行うと最適な予算配分をするための糸口が見つかるような気がします。

ここでやったことの流れとしてはざっくりとこの通り。

  1. 5章でできたモデルから各媒体の各週の現状予算における効果数を求める。
    効果数=(各媒体の回帰係数)×(その週の投下量)
  2. 最も効果数が大きくなるような現状予算対比を求める

これは横軸が投下量、縦軸が効果数を表したグラフになっています。

演習では予算配分を最適化して、このようなグラフで各媒体のコストに対する効果数が可視化できるようになっている。

おそらくこれだけ見たらなんのこっちゃわからないと思うので詳しく知りたい方は本でご確認ください。

 

この5,6章を理解することによって常日頃から疑問に思っていた広告効果の定量化や予算配分の最適化はどのようにしたらいいのか問題について解決の手助けとなったのでこの章はかなりおすすめです。

 

【7章】ECとコールセンター2つの売上への影響を加味した予算配分最適化

この章ではオフラインとオンライン双方の申込数または利益を最大化するためのマーケティング施策予算配分シミュレーション、つまりオフライン広告(CMなど)によるオンライン(EC)申し込みの影響と、オンライン広告によるオフライン(コールセンター)申込への影響の両方を考慮したクロスチャネルにおける予算配分最適化シミュレーションの演習を行った。

やることとしては、各媒体の広告からオンライン(WEB申込)に寄与するモデルと、オフライン(コールセンター申込)に寄与するモデルを作成し、そのモデルを使い予算最適配分シミュレーションを行った。

つまりは5,6章の応用ってわけですね。

今までは単純に売上という1つの目的変数に対してモデルを作成し、予算配分シミュレーションをしていたが、この7章ではECの申込とコールセンターの申し込みという2つの目的変数がある中で、それぞれのモデルを作成しこの2つに対する各媒体の効果数を加味した予算配分シミュレーションを行った。Web広告的に言うとCVアクションが2パターンある中でそれぞれについての広告の影響を求めるような感じ。

そして予算最適配分シミュレーションも6章でやった時の流れと同じで、作成したモデルを基に効果数を最大化するように各媒体の現状予算対比を求めていきます。

ここで6章と違う部分として、6章のアルコール飲料事例では売上単価と利益率は一律としていたが、通販事例では施策ごとに効果数1件当たりの期待売上額と利益率が集客媒体ごとで異なることを加味して最適化を行っている。

故に最適化の目的関数を総効果数にする場合、総売上にする場合、総利益額にする場合で試算結果が変化する形になっており、それぞれの場合について最適化を行った。

流れ、やり方としては6章と同じ。

【8章】補足解説

これまで目的変数を予測するモデルを作り予測精度を高めていくかを重視してやってきた分析ではなく、この章では本来のMMMのモデル選択視点に関して補足として統計的な知識も交えて詳しく解説している。

これまでの章では実践形式であったが、この章は分析における統計的な知識がメインであるので、少し難しい部分がある。

しかしかなり詳しく分析において重要な統計的な知識や考え方に関して解説してあるのでとてもためになる。

またここで述べている本来のモデル選択の手順は以下の通りだ。

  1. 分析の目的を(予測か説明か)定める
  2. 候補となる変数を洗い出しデータを取得
  3. モデリング・最終的に使用するモデルの選択

分析の目的を定める

実際に分析するとなった時には説明変数の選択基準が分析の目的(予測か説明)によって変わるので、まず初めに分析の方針を固めることが重要であると述べている。マーケティングではどの媒体がどのくらい効果があるのかということを知るために「説明」を重視することがあるが、そのモデル選択の時にはかなり慎重な考察が必要であると述べて、そこで必要な因果推論の基礎知識について説明している。

少しだけここでもお話すると、因果関係を確認するポイントとしての「まったくの偶然」「第3の変数」「逆の因果関係」や「見せかけの回帰」など幅広く説明している。加えて「交絡変数」や「中間変数」についても説明しており因果推論に関して知識を深めることも可能かなと思う。

そしてこれらの因果推論の知識を踏まえたうえで説明変数選択の例を「説明」重視の場合と「予測」重視の場合で分けてわかりやすく紹介している。

候補となる変数を洗い出す

ここではモデリングに必要な変数を洗い出す視点をいくつかの業種を例に紹介している。

この変数を洗い出す際には「販促」「広告&PR」などの内部要因と「競合」「季節」「流行」などの外部要因に分けて細かい視点での紹介となっている。

モデリング・最終的に使用するモデル選択

最終的なモデル選択として必要なこととしてマーケターとして知見と統計解析の知見が必要であると述べており、ここでは後者の統計解析の知識に対応するものとしてこれまでに挙がった用語を詳しく解説している。

まとめ

独学でデータ分析について学んでいて、広告代理店でインターンをしている僕としてはかなり面白い内容ばっかでありかなりためになったと感じている。特に残存効果や非線形な影響を加味した説明変数の加工の部分は。

また今回の予算配分シミュレーションとして「TVCM」「紙媒体」「OOH」「Web広告」を使っていたが、もう少しミクロに考えてWeb広告における予算配分シミュレーションにも応用できるのではないかとも思う。

つまり「G検索」「GDN」「Y検索」「YDN」「Facebook」のどこにどれくらい予算を投下したらCVを最大化できるかについてより正確なシミュレーションを行えるのではないかと。

今回はマーケターの分析リテラシーを上げるために最高であろう書籍の「データドリブン・マーケティング」についてざっくりと各章を紹介してみたが、マーケティング施策において定性的な部分だけでなく定量的な根拠をもって施策を行いたい方や広告の効果を定量的に見てみたいというような方にはおススメの1冊なので是非手に取ってみていただきたく思う。

ご購入はこちらから↓
Excelでできるデータドリブン・マーケティング(特典付き)

スポンサーリンク