クラスター分析とは?事例を用いてやり方や結果の見方を解説

21 2023.11

データ分析手法

クラスター分析とは?

クラスター分析とは?

クラスター分析とは、異なる性質を含んだ集合体の中から互いに類似した性質のものを集め、クラスター(集団)を作り対象を分類する手法のことです。

具体的に加湿器を買うときの重視度を例にとって説明します。
 (2047)

上記の図のように、加湿器の重視度についての回答をわけると、
AさんとBさん:全ての項目において数字が高いので高関心層
CさんとDさん:デザイン性を重視しているのでデザイン重視層
EさんとFさん:機能性を重視しているので機能性重視層
というようにグループ分けすることができます。

このように数字で似ているところで分ける分析をクラスター分析といいます。

また、クラスター分析は階層と非階層の2つに大別されます

階層クラスター分析

階層クラスター分析では、似ている対象が順々にクラスター(集団)化されるので、過程が視覚的に把握できます
階層クラスター分析のアウトプットはデンドログラム(樹形図)です。
 (2052)

非階層クラスター分析

非階層クラスター分析は、階層的な構造はなく似ている対象をグルーピングする手法です。
対象数(個体数)が多い場合に適しています。
アウトプットを図にするとしたか下記のようなイメージです。
機械学習で説明されるときは、ほとんどが非階層です。
 (2053)

階層クラスター分析と非階層クラスター分析のメリット・デメリット

階層クラスター分析

メリット
デンドログラム(樹形図)を見ながらクラスター化する数を変更することができます。また、分割の過程を直感的に理解できる点が多きなメリットになります。
デメリット
階層クラスターは、全データに対して総当たりで計算するためデータが大きい場合は計算自体できなくなる可能性があります。ビッグデータのような膨大な情報量をクラスター分類する場合は、非階層クラスター分析を使用しましょう。

非階層クラスター分析

メリット
事前に決めておいた分類数を基に計算するため、階層クラスター分析よりも計算が簡略化されます。そのため、階層クラスター分析で計算できないビッグデータも分類することができます。
デメリット
クラスター数を事前に決定しておく必要がある点がデメリットとなります。設定したクラスター数によっては正しい結果を導き出せない可能性があるため、最適なクラスター数を算出する必要があります。何度か設定数を変えて最適なクラスター数を導くため、試行錯誤が必要になります。
マーケティングリサーチでの利用シーン

マーケティングリサーチでの利用シーン

①アンケート回答者をグループ分けする(非階層)

1つ目はアンケート回答者をグループ分けすることができます。
たとえば年代別に比較したものの同じ年代でも意識が違うな、という場合、クラスター分析を知っていれば重視している点からグループを分けることができます。
グループ分けには因子得点を使うこともよくあります。
マーケティングリサーチでの利用シーン②

マーケティングリサーチでの利用シーン②

②商品(ブランド)をグループ分けする(階層)

もう1つは商品(ブランド)をグループ分けすることができます。
ブランドの評価値をグループ分けし、デンドログラムを作成します。
マーケティングリサーチでの利用シーン②

マーケティングリサーチでの利用シーン②

クラスター分析の結果の見方

クラスター分析の結果の見方

非階層クラスター分析の結果の見方

非階層の結果の見方①

非階層の結果の見方①

調査会社さんから上記のような結果が納品されたら、まずはどのようなクラスターが作成されたのか、ということを確認してみてください。
上記の図の場合、クラスター名という部分になり、今回の場合は4つのクラスターに分けられています。
クラスター名に関してはそれぞれの数値の大小を見て分析者がつけています。

それぞれのクラスターが市場ではどのような構成比になっているのか、というのが構成比のパーセンテージになります。
非階層の結果の見方②

非階層の結果の見方②

クラスターの特徴を示したものも納品されると思います。
クラスターの特徴結果に関しては色々な形がありますが、上記の図のようなものが多いです。

こちらに関してはたとえば高関心層だと年代の割合はどうなっていて、どんなブランドの商品が好きなのか、など出てきたものをそのまま見ていただければ大丈夫です。

階層クラスター分析の結果の見方

階層クラスター分析の場合は結果はデンドログラム(樹形図)で出てくるので、こちらもそのまま見ていただければ大丈夫です。
その場合、過程も含めてどのように対象が分けられたのか、どの商品が近いのか、というところを見てみてください。
階層結果の見方

階層結果の見方

縦軸は距離になるので近ければ近いほど商品同士が近い、ということです。
今回の結果の場合だと商品Fと商品Bが1番近く、その次は商品Dと商品Eになります。

また、分割線のところで2つに分けることができるので、今回の場合だと商品AFBが1つのグループ、商品DEGCがもう1つのグループとなります。

クラスター分析の注意点

注意点は3点ありますが、結果を見るだけなら理解しなくても大丈夫です。

・クラスターの名前は分析者の主観でつけています。

・クラスターの数は分析者が決めています。
 特に非階層クラスターは最初に数を決めて計算しています。

・対象間の距離は、ユークリッド距離、
 クラスターの合併法には、ウォード法、
 非階層のアルゴリズムはk-means法(k平均法)がよく使われます。

セルフ型ネットリサーチツールのご案内

本記事を運営するマーケティングアプリケーションズは、セルフ型ネットリサーチツールの「Surveroid(サーベロイド)」を提供しています。
アンケートの作成、配信、集計といったリサーチに必要な作業を全てご自身で完結させることができます。

▼費用感→詳細はこちら
最低料金1万円(税抜)~で、アンケート種別によって料金レンジが異なります。
【本調査】:1問×1サンプル×10円
【スクリーニング調査】:2000サンプルごとに1万円ずつアップ

▼登録パネル数→詳細はこちら
ベーシックモード:約25万人
アドバンストモード:約480万人
配信時は基本属性情報で対象者を絞り込むことが可能です。

▼サンプル回収期間
最短12時間、平均で48時間で目標回収数を回収することができます。
※あくまで目安ですのでご留意ください。
興味がある方はぜひ一度サービス内容をご確認ください。
41 件

Related Contents