まず第1回は度数分布表とヒストグラムについて解説していきます。
それでは宜しくお願い致します。
それでは宜しくお願い致します。
1、アンケート調査ではどの程度、統計学の知識が必要か
アンケート調査を行うに当たって統計学の知識はどの程度必要になってくるのでしょうか。結論から言うと、単純にアンケート調査を行うだけであれば統計知識はほとんど必要ではありません。
どのようなアンケートを行うか企画し、配信して結果を集計するという一連の作業の中で統計学の知識が必要とされることはほぼないでしょう。
実際に、例えばメーカーに勤務して日々調査を行うマーケターの方でも統計学についてはあまり詳しくないという方も多いのではないでしょうか。
では、一方で統計学の知識は全く不要と言えるでしょうか?
それはNoだと思います。
厳密な計算式や応用的な統計学の知識を知っている必要はないと思いますが、データを扱う以上はその捉え方や扱い方に関して基本的なお作法は知っていた方が良いかと思います。
例えば、何人にアンケートを取ればよいかというのは標本誤差(母集団と標本の差)をどれだけ許容できるか、という統計学の考え方に基づきます。
重要なのはその概念を理解していることであって、厳密な計算式までは知らなくても十分だと言えます。
なのでこのシリーズでは全5回に渡って基本的な統計学の知識をお伝えしていこうと思います。
どのようなアンケートを行うか企画し、配信して結果を集計するという一連の作業の中で統計学の知識が必要とされることはほぼないでしょう。
実際に、例えばメーカーに勤務して日々調査を行うマーケターの方でも統計学についてはあまり詳しくないという方も多いのではないでしょうか。
では、一方で統計学の知識は全く不要と言えるでしょうか?
それはNoだと思います。
厳密な計算式や応用的な統計学の知識を知っている必要はないと思いますが、データを扱う以上はその捉え方や扱い方に関して基本的なお作法は知っていた方が良いかと思います。
例えば、何人にアンケートを取ればよいかというのは標本誤差(母集団と標本の差)をどれだけ許容できるか、という統計学の考え方に基づきます。
重要なのはその概念を理解していることであって、厳密な計算式までは知らなくても十分だと言えます。
なのでこのシリーズでは全5回に渡って基本的な統計学の知識をお伝えしていこうと思います。
2、度数分布表とは
まず第1回では、度数分布表とヒストグラムについてお伝えしていきましょう。
例えば、中学のクラスで期末テストの点数を聞いたとします。
人によって点数はまちまちで、悪い人は40点くらい~一番良い人だと100点の人がいるかもしれません。
クラスが30人だとして、その人達の点数を順番に並べると
例えば、中学のクラスで期末テストの点数を聞いたとします。
人によって点数はまちまちで、悪い人は40点くらい~一番良い人だと100点の人がいるかもしれません。
クラスが30人だとして、その人達の点数を順番に並べると
このような分布になったとしましょう。
これは生データと呼ばれるものです。
実際にアンケートをした際も結果として得られるのは上記のように加工されていない生データです。
このような生データは点数をただ並べただけなので、ここからデータの特徴を把握するのは難しいでしょう。
そこで登場するのが度数分布表です。
度数分布表を作成するには以下の概念が必要となります。
階級:範囲のこと。例えば点数を見やすくするため41~45、46~50と言った範囲に区切っていく
階級値:各階級における代表の値。基本的には階級の真ん中の数値を選ぶ
度数:各階級にあるデータの数
これらを整理したものが度数分布表です。
度数分布表を作るに当たってはまず、階級の幅を決めた上で階級値と度数を埋めていきます。ここでは階級の幅を10としてみましょう。
上記の点数は下記のような度数分布表になります。
これは生データと呼ばれるものです。
実際にアンケートをした際も結果として得られるのは上記のように加工されていない生データです。
このような生データは点数をただ並べただけなので、ここからデータの特徴を把握するのは難しいでしょう。
そこで登場するのが度数分布表です。
度数分布表を作成するには以下の概念が必要となります。
階級:範囲のこと。例えば点数を見やすくするため41~45、46~50と言った範囲に区切っていく
階級値:各階級における代表の値。基本的には階級の真ん中の数値を選ぶ
度数:各階級にあるデータの数
これらを整理したものが度数分布表です。
度数分布表を作るに当たってはまず、階級の幅を決めた上で階級値と度数を埋めていきます。ここでは階級の幅を10としてみましょう。
上記の点数は下記のような度数分布表になります。
このようにまとめてみると、なんとなく61点~70点の人が多いなーとか60点以下の人はあまり多くないなーということが分かってきますね。
ざっくりまとめてみると
1、60点以下の人や91点以上の人はそれ程多くない
2、61点から90点に多くの人がいる
というような特徴が見えてきます。
このようにデータ全体の特徴を得られるのが度数分布表のメリットです。
度数分布表はあくまでデータを分かりやすくすることが目的なので、階級の幅をどの程度にすれば良いのかなどのルールはありません。
つまり上記の例にしても、階級の幅を5点として度数分布表を作ってみても大丈夫です。
まずはデータを羅列した時に最小値と最大値は何なのか、というとことから階級を考えてみるようにしてください。
ざっくりまとめてみると
1、60点以下の人や91点以上の人はそれ程多くない
2、61点から90点に多くの人がいる
というような特徴が見えてきます。
このようにデータ全体の特徴を得られるのが度数分布表のメリットです。
度数分布表はあくまでデータを分かりやすくすることが目的なので、階級の幅をどの程度にすれば良いのかなどのルールはありません。
つまり上記の例にしても、階級の幅を5点として度数分布表を作ってみても大丈夫です。
まずはデータを羅列した時に最小値と最大値は何なのか、というとことから階級を考えてみるようにしてください。
3、ヒストグラムとは
さて、ここからヒストグラムを作っていきましょう。
ヒストグラムは度数分布表を長方形の柱で表したものです。
その際、横軸に階級値、縦軸に度数をとるようにして下さい。
上の度数分布表をヒストグラムにするとこのようになります。
ヒストグラムは度数分布表を長方形の柱で表したものです。
その際、横軸に階級値、縦軸に度数をとるようにして下さい。
上の度数分布表をヒストグラムにするとこのようになります。
ヒストグラムを作ってみると、それぞれの階級の人たちがどのように分布しているのかということがより視覚的に理解できるようになりました。
この、より視覚的に理解できるという点がヒストグラムのメリットです。
なお、ヒストグラムは棒グラフと似ていますが、連続した数値を表しているという特徴があります。ヒストグラムを作成する際は、それぞれの長方形を隙間なくくっつけるよう注意してください。
この、より視覚的に理解できるという点がヒストグラムのメリットです。
なお、ヒストグラムは棒グラフと似ていますが、連続した数値を表しているという特徴があります。ヒストグラムを作成する際は、それぞれの長方形を隙間なくくっつけるよう注意してください。
4、まとめ
ここまで、度数分布表とヒストグラムについて学んできましたがいかがだったでしょうか。
今まで見てきた内容を振り返ってみましょう。
・アンケート調査にあたって統計知識は必須なものではないが、とはいえ基本的なことは知っておいた方が良い。
・生データだけだとデータの特徴が分からないので加工が必要になる。
・生データをグループ分けしたものが度数分布表、さらにそれをグラフにしてより視覚的に理解できるようにしたものがヒストグラムである。
データを扱う際には、ここで学んだ度数分布表とヒストグラムをぜひ活用して頂ければと思います。
今まで見てきた内容を振り返ってみましょう。
・アンケート調査にあたって統計知識は必須なものではないが、とはいえ基本的なことは知っておいた方が良い。
・生データだけだとデータの特徴が分からないので加工が必要になる。
・生データをグループ分けしたものが度数分布表、さらにそれをグラフにしてより視覚的に理解できるようにしたものがヒストグラムである。
データを扱う際には、ここで学んだ度数分布表とヒストグラムをぜひ活用して頂ければと思います。
16 件