決定木分析とは?マーケティングにおける活用シーンや結果の見方をわかりやすく解説

30 2023.11

データ分析手法

決定木分析とは?マーケティングにおける活用シーンや結果の見方をわかりやすく解説

決定木分析とは?

観測された変数の中から”目的変数”に影響する”説明変数”を明らかにし、樹木状のモデルを作成する分析手法のことです。

例えば、購入率40%のある商品が誰によく買われているのか知りたい時、下記の図のように樹木状で視覚的に把握できるので解釈が簡単です。

主にマーケティング施策で活用されますが、近年では機械学習にも応用されています。
決定木分析とは

決定木分析とは

マーケティングリサーチでの利用シーン

商品のターゲット層を知る

マーケティングリサーチでの利用シーン

マーケティングリサーチでの利用シーン

ターゲット層を知るときに、仮説に基づいてクロス集計をすることも可能ですが、様々なパターンを全部確認する必要があり、少々時間がかかります。
一方で決定木分析を用いることで樹木状に全てのパターンを確認し、ターゲットになり得る属性を把握することが出来ます。

データサイエンスでの利用シーン

決定木単体のモデルを構築し、予測や分類に活用

決定木を応用させた機械学習モデルの活用

データサイエンスでの利用シーン

データサイエンスでの利用シーン

分析結果の見方

①上から順に説明変数を確認する

確認点

確認点

まずは上から順に説明変数を確認します。
上記の例の場合は「世帯年収」の項目となり、これが分類に1番効いていることを意味しています。
世帯年収で分類し、次の説明変数である「性年代」で分類しています。

②人数と結果の値を確認する

確認点

確認点

次は人数と結果の値を確認します。
今回の場合、n=1,000のデータである商品の購入率が23%とすると、世帯年収が600万円以上の方が購入率が34%のため、600万円未満より高い結果になっています。
続いて性年代で分類すると、20〜30代男性と20代女性の購入率が53%になり、『世帯年収600万円以上かつ2,30代男女』において購入率が向上していることがわかり、ここがターゲット層と把握することが出来ます。

決定木分析の注意点

①現れていない変数はカットされていることもある(剪定)

剪定イメージ図

剪定イメージ図

現れていない変数は元々効いていない可能性や、調査会社に頼んでリサーチを行う場合、納品時点でカット(剪定)してデータを出している可能性もあるので覚えておいてください。

②木の構造が深すぎると問題が発生することもある

剪定をする理由として、木の構造が深すぎる(分類しすぎる)と解釈が難しくなることや、今のデータにフィットしすぎてしまう(過学習)と、未知のデータを予測する面においてはよろしくないためです。

用語の説明

※結果を見るだけなら、とりあえず理解しなくても大丈夫です。
・決定木には、「分類木」と「回帰木」があります。
・アルゴリズム :CART、CHAID、C4.5など
・分割の基準 :ジニ係数、平均情報量(エントロピー)など

まとめ

決定木分析は主に「商品のターゲット層を知る」際によく用いられる分析手法です。詳しくターゲット層を知るためにはクロス集計などを行って様々なパターンを確認する必要がありますが、手間がかかる作業になるため決定木分析を利用します。

セルフ型ネットリサーチツールのご案内

本記事を運営するマーケティングアプリケーションズは、セルフ型ネットリサーチツールの「Surveroid(サーベロイド)」を提供しています。
アンケートの作成、配信、集計までをセルフで完結させることができます。
上記のようなリサーチで必要な一通りの作業を、低価格、スピーディーかつプロの調査会社が使うモニタに対してアンケート調査ができます。(ご登録したその日からアンケート作成、配信が可能です。)
これからリサーチの予定がある方はぜひ一度サービス内容をご確認ください。
33 件

Related Contents