2022年6月30日 更新

クラスター分析とは?(手法解析から注意点まで)

はじめに

この記事はYouTubeにアップした動画との連動記事です。
というよりむしろ動画がメインで、こちらの内容は概要レベルのものとなっております。
内容をしっかり理解するためにも、ぜひ動画と合わせて本文を読んでみてください。

クラスター分析とは?

クラスター分析とは、異なる性質を含んだ集合体の中から互いに類似した性質のものを集め、クラスター(集団)を作り対象を分類する手法のことです。

具体的に加湿器を買うときの重視度を例にとって説明します。
 (2047)

上記の図のように、加湿器の重視度についての回答をわけると、
AさんとBさん:全ての項目において数字が高いので高関心層
CさんとDさん:デザイン性を重視しているのでデザイン重視層
EさんとFさん:機能性を重視しているので機能性重視層
というようにグループ分けすることができます。

このように数字で似ているところで分ける分析をクラスター分析といいます。

また、クラスター分析は階層と非階層の2つに大別されます

階層クラスター分析

階層クラスター分析では、似ている対象が順々にクラスター(集団)化されるので、過程が視覚的に把握できます
階層クラスター分析のアウトプットはデンドログラム(樹形図)です。
 (2052)

非階層クラスター分析

非階層クラスター分析は、階層的な構造はなく似ている対象をグルーピングする手法です。
対象数(個体数)が多い場合に適しています。
アウトプットを図にするとしたか下記のようなイメージです。
機械学習で説明されるときは、ほとんどが非階層です。
 (2053)

階層クラスター分析と非階層クラスター分析のメリット・デメリット

階層クラスター分析

メリット
デンドログラム(樹形図)を見ながらクラスター化する数を変更することができます。また、分割の過程を直感的に理解できる点が多きなメリットになります。
デメリット
階層クラスターは、全データに対して総当たりで計算するためデータが大きい場合は計算自体できなくなる可能性があります。ビッグデータのような膨大な情報量をクラスター分類する場合は、非階層クラスター分析を使用しましょう。

非階層クラスター分析

メリット
事前に決めておいた分類数を基に計算するため、階層クラスター分析よりも計算が簡略化されます。そのため、階層クラスター分析で計算できないビッグデータも分類することができます。
デメリット
クラスター数を事前に決定しておく必要がある点がデメリットとなります。設定したクラスター数によっては正しい結果を導き出せない可能性があるため、最適なクラスター数を算出する必要があります。何度か設定数を変えて最適なクラスター数を導くため、試行錯誤が必要になります。

マーケティングリサーチでの利用シーン

マーケティングリサーチでの利用シーンは主に2つあります。

①アンケート回答者をグループ分けする(非階層)

1つ目はアンケート回答者をグループ分けすることができます。
マーケティングリサーチでの利用シーン②

マーケティングリサーチでの利用シーン②

たとえば年代別に比較したものの同じ年代でも意識が違うな、という場合、クラスター分析を知っていれば重視している点からグループを分けることができます。
グループ分けには因子得点を使うこともよくあります。

②商品(ブランド)をグループ分けする(階層)

もう1つは商品(ブランド)をグループ分けすることができます。
マーケティングリサーチでの利用シーン②

マーケティングリサーチでの利用シーン②

ブランドの評価値をグループ分けし、デンドログラムを作成します。
ネットリサーチツールへのリンク

クラスター分析の結果の見方

非階層クラスター分析の結果の見方

非階層の結果の見方①

非階層の結果の見方①

調査会社さんから上記のような結果が納品されたら、まずはどのようなクラスターが作成されたのか、ということを確認してみてください。
上記の図の場合、クラスター名という部分になり、今回の場合は4つのクラスターに分けられています。
クラスター名に関してはそれぞれの数値の大小を見て分析者がつけています。

それぞれのクラスターが市場ではどのような構成比になっているのか、というのが構成比のパーセンテージになります。
非階層の結果の見方②

非階層の結果の見方②

クラスターの特徴を示したものも納品されると思います。
クラスターの特徴結果に関しては色々な形がありますが、上記の図のようなものが多いです。

こちらに関してはたとえば高関心層だと年代の割合はどうなっていて、どんなブランドの商品が好きなのか、など出てきたものをそのまま見ていただければ大丈夫です。

階層クラスター分析の結果の見方

階層クラスター分析の場合は結果はデンドログラム(樹形図)で出てくるので、こちらもそのまま見ていただければ大丈夫です。
その場合、過程も含めてどのように対象が分けられたのか、どの商品が近いのか、というところを見てみてください。
階層結果の見方

階層結果の見方

縦軸は距離になるので近ければ近いほど商品同士が近い、ということです。
今回の結果の場合だと商品Fと商品Bが1番近く、その次は商品Dと商品Eになります。

また、分割線のところで2つに分けることができるので、今回の場合だと商品AFBが1つのグループ、商品DEGCがもう1つのグループとなります。

クラスター分析の注意点

注意点は3点ありますが、結果を見るだけなら理解しなくても大丈夫です。

・クラスターの名前は分析者の主観でつけています。

・クラスターの数は分析者が決めています。
 特に非階層クラスターは最初に数を決めて計算しています。

・対象間の距離は、ユークリッド距離、
 クラスターの合併法には、ウォード法、
 非階層のアルゴリズムはk-means法(k平均法)がよく使われます。
53 件

関連する記事 こんな記事も人気です♪

主成分分析とは?(手法解析から注意点まで)

主成分分析とは?(手法解析から注意点まで)

主成分分析について、YouTube動画を基に解説します。
Sayuri | 4,002 view
決定木分析とは?(手法解析から注意点まで)

決定木分析とは?(手法解析から注意点まで)

決定木分析について、YouTube動画を基に解説します。
Sayuri | 5,479 view
顧客分析で売上を上げる!フレームワークや活用方法を紹介

顧客分析で売上を上げる!フレームワークや活用方法を紹介

商品開発やマーケティング活動において重要な役割を担うのが「顧客分析」です。自社の成長のためには分析から現状を把握し、改善箇所について対策をしなければなりません。しかし、このような意識はあるものの進め方や、どのような視点で分析手法を決めれば良いのかがわからず行き詰る方も多いのではないでしょうか。そこで今回は「顧客分析」をする目的や進めていく上でのフレームワーク、手法などについてご紹介します。
大石 | 198 view
お客様アンケートでサービス品質を改善!作成・分析方法・テンプレートまで紹介

お客様アンケートでサービス品質を改善!作成・分析方法・テンプレートまで紹介

今回は「お客様アンケート」を活用しサービスを改善していくにあたっての、アンケート作成のコツや集計・分析の方法について解説していきます。
大石 | 279 view
重回帰分析とは?(手法解析から注意点まで)

重回帰分析とは?(手法解析から注意点まで)

重回帰分析について、YouTube動画を基に解説します。
Sayuri | 11,689 view

この記事のキーワード

この記事のキュレーター

Sayuri Sayuri
Surveroid
Surveroid