2022年10月12日 更新

負の2項分布とは?ゼロ過剰モデルなどの分布モデルまで紹介

gettyimages (4012)

負の2項分布とは

「負の2項分布」Negative Binominalというと何やらおそろしい感じがしますが、「失敗回数の分布のかたち」とでも思っておけばよくて、カウント(回数)データを予測するときに考える分布形の1つです。何も神秘的な意味や力はありません。

日本行動計量学会の学会誌「行動計量学」第96号では、「デジタル時代のマーケティング・データ活用1」という特集で、デジタルの広告・プロモーション、マーケティングツールに関する分析の論文が掲載されています。

「パートナーシップ・ロイヤルティ・プログラムから得られるトライアル会員の行動特性」(寺本他)では、購買回数に対するクーポンやポイントプログラムの影響が分析されています。

また、「オンライン・カスタマーレビューにおける感情表現と商品の不確実性がレビューの有用性に与える影響」(Feng他)では、レビューの評価(「役に立った」の投票数)に対するレビュー内の感情表現の影響が分析されています。

それぞれ内容も興味深かったのですが、単純に目を引いたのは、どちらも分析に「負の2項回帰モデル」を使用していることでした。

最近よく読まれている「確立思考の戦略論」(森岡・今西)で紹介されて以降、マーケティングの分野で「負の2項分布」という言葉を目にすることが多くなったように思います。

確率分布の考え方

コイン投げの成功回数(例えば表が出た回数)の分布が二項分布で、確率がある程度大きい場合は正規分布として考えられる。

福引きのように確率が小さい場合は、ポアソン分布という平均と分散が等しい単純な分布で考えられる。

人によって福引券を持っている枚数が違う場合のように、もう少し複雑と思われる(分散が大きくなる)とき、負の二項分布で考えます。

また、成功回数ゼロがとても多いデータの場合には、さらにゼロ過剰モデルというより複雑な分布の考え方をすることがあり、前述の寺本他論文もゼロ過剰負の二項回帰モデルによって分析されています。

単純な分布モデルで分析できたほうが、わかりやすくて便利な結果といえるのですが、複雑な分布を考慮するかどうかは、データ自体の性質や手元のデータのグラフをみて検討します。

分析の際、解析ソフトからデータへの適合度の指標が出ますので、単純なモデルと比較してどのモデルにするか決めればいい、ということになります。

5 件

関連する記事 こんな記事も人気です♪

アンケートで不正回答を防ぐことは難しい?不正回答者の傾向を徹底分析

アンケートで不正回答を防ぐことは難しい?不正回答者の傾向を徹底分析

Satisficing回答者の予測に関する実験調査結果の続きです。前回記事で不正回答者の傾向を変数を立て予測しましたが、本記事ではその予測がどれだけ正しいか検証をしてみました。
KOJI.A | 420 view

この記事のキーワード

この記事のキュレーター

KOJI.A KOJI.A