主成分分析とは?事例を用いて結果の見方や注意点をわかりやすく解説

04 2023.12

データ分析手法

主成分分析とは

主成分分析とは

主成分分析とは、観測された多くの量的な説明変数をより少ない合成変数(主成分)にして要約する手法のことです。
たとえば教科の点数を例にとって話すと、国語の点数や数学の点数のような実際に出ている点数(観測変数といいます)を要約して新しく総合学力、という合成変数を作るやり方を主成分分析と言います。
主成分分析の例

主成分分析の例

ちなみに4教科の合計点でもいいのではないか、と思うかもしれませんが、それだと教科によって平均点に差が出てしまうため平均点が高い科目が得意な人が有利になってしまいます。
そういったパターンを避けるために主成分分析は利用されます。

主成分分析は幅広い分野(ビジネス、研究開発等)で使用され、近年では、機械学習でも使用されています

主成分分析の利用シーン

マーケティングリサーチでの利用シーン

マーケティングリサーチにおいて、たくさんの項目を少ない変数で要約(説明)したいときに主成分分析を利用します。
マーケティングリサーチでの利用シーン

マーケティングリサーチでの利用シーン

たとえば上記の図のように味の評価について飲みごたえなど6つの項目があったとします。
それぞれの評価をランキングにすることもできますがたくさんあるので主成分分析を使ってまとめてしまい、総合評価のランキングとしたり、ポジショニングマップを作ったりします。

このように主成分分析は味やブランドの評価、企業の評価をしたいとき、少ない変数で要約するのに利用して総合評価ランキングやポジショニングマップ作成に利用することができます

データサイエンスでの利用シーン

データサイエンスでの利用シーンも基本的にはリサーチの時と同じように、たくさんの項目を少ない変数で要約(説明)したいという場面で使います。
データサイエンスでの利用シーン

データサイエンスでの利用シーン

たくさんのデータがある時、そのまま使うと計算コストがかかるので主成分分析で特徴量を要約し、データを小さくするのに使います。
このような方法を次元削減と言います。

主成分分析の結果の見方

主成分分析の結果の見方

①どのような主成分が作成されたか

主成分分析の結果として、調査会社さんから下記のような数表が納品されると思います。
結果の見方①

結果の見方①

まず最初に、どのような主成分が作成されたか、ということを確認します。
図の枠で囲っている主成分名です。
今回の場合、2つの主成分があり、第1主成分は「総合的な味の良さ」、第2主成分は「爽快さ」ということになります。

②主成分と質問項目はどのような関係か

結果の見方②

結果の見方②

次は主成分と質問項目はどのような関係か、という点を確認します。
上記の図の枠で囲われた部分で「主成分負荷量」とも言います。

今回の場合、第1主成分を見るとすべての質問項目に対してプラスになっています。
このように全部プラスになっていると総合的な能力のある主成分かな、ということで総合的なものと判断します。
主成分分析をすると大体最初の項目は総合能力になることが多いです。

次に第2主成分を見るとプラスとマイナスが混在していますが、黄色く色を付けている後味の良さや爽やかさなどの爽快さが大きな割合を占めているので結果として第2主成分の得点が高くなっています。

③主成分ごとにどれくらい寄与しているか

もし余裕があれば主成分ごとにどれくらい寄与しているか、という部分も確認するといいでしょう。
結果の見方③

結果の見方③

上記の図の枠で囲われた部分をご覧ください。
第1主成分の寄与率は43%となっているので、今回この項目は第1主成分で43%のことが表せる、ということです。
そして第2主成分は27%で、足すと累積寄与率が70%となるので、第1主成分と第2主成分で70%のことが表せると言えます。
主成分分析の注意点

主成分分析の注意点

全てのデータに主成分分析が適切なわけではありません。

例えば下記のようなデータは不適切です。
相関のないデータ
 →計算できるけど意味がありません。

「総合力」を仮定しない場合
 →因子分析を検討した方がいいでしょう。
以下は、結果を見るだけなら、とりあえず理解しなくても大丈夫です。

・主成分の軸は名前は分析者の主観でつけています。
・累積寄与率が70〜80%に達するところまでの主成分数を採用することが多いです。
 (計算上は、観測変数と同じ個数出てきます。)
・観測変数の単位が揃っていないときは、データを基準値に変換して主成分分析を行います。

主成分分析と因子分析の違い

主成分分析は、要因を総合化して新しい軸(主成分)を作ります
因子分析は、要因に働きかける共通因子を抽出します

文字だとわかりにくいので、具体的に教科の点数を例を挙げるとこのようになります。
主成分分析と因子分析の違い

主成分分析と因子分析の違い

主成分分析だと国語の点数や英語の点数などがあった場合、これらから総合的なものを作るので「主成分」

因子分析だと点数があった場合、裏側に共通の因子があってそれの影響を受けてテストの結果が出ている、と考えます。

このように見ると矢印の向きが違うので、主成分分析と因子分析は似ているけど考え方が違う、と覚えておいてください。

簡単に複数のものを要約して総合的なものを仮定するのであれば主成分分析の方が簡単なのでオススメですが、わからなければ調査会社さんと相談してみてください。

セルフ型ネットリサーチツールのご案内

本記事を運営するマーケティングアプリケーションズは、セルフ型ネットリサーチツールの「Surveroid(サーベロイド)」を提供しています。
アンケートの作成、配信、集計といったリサーチに必要な作業を全てご自身で完結させることができます。
このような作業を調査会社に委託する場合、実施料金が最低20万円程必要であったり、最終的なデータをもらうまでに2週間~1ヶ月ほどかかったりします。
ライトにリサーチがしたい、明後日の資料作成のためのエビデンスが欲しい等、セルフ型に興味がある方はぜひ一度サービス内容をご確認ください。
40 件

Related Contents