2022年5月31日 更新

負の2項分布、ゼロ過剰モデル

gettyimages (4012)

日本行動計量学会https://bms.gr.jp/の学会誌「行動計量学」第96号では、「デジタル時代のマーケティング・データ活用1」という特集で、デジタルの広告・プロモーション、マーケティングツールに関する分析の論文が掲載されています。

「パートナーシップ・ロイヤルティ・プログラムから得られるトライアル会員の行動特性」(寺本他)では、購買回数に対するクーポンやポイントプログラムの影響が分析されています。

また、「オンライン・カスタマーレビューにおける感情表現と商品の不確実性がレビューの有用性に与える影響」(Feng他)では、レビューの評価(「役に立った」の投票数)に対するレビュー内の感情表現の影響が分析されています。

それぞれ内容も興味深かったのですが、単純に目を引いたのは、どちらも分析に「負の2項回帰モデル」を使用していることでした。

最近よく読まれている「確立思考の戦略論」(森岡・今西)で紹介されて以降、マーケティングの分野で「負の2項分布」という言葉を目にすることが多くなったように思います。

「負の2項分布」Negative Binominalというと何やらおそろしい感じがしますが、「失敗回数の分布のかたち」とでも思っておけばよくて、カウント(回数)データを予測するときに考える分布形の1つです。何も神秘的な意味や力はありません。

コイン投げの成功回数(例えば表が出た回数)の分布が二項分布で、確率がある程度大きい場合は正規分布として考えられる。

福引きのように確率が小さい場合は、ポアソン分布という平均と分散が等しい単純な分布で考えられる。

人によって福引券を持っている枚数が違う場合のように、もう少し複雑と思われる(分散が大きくなる)とき、負の二項分布で考えます。

また、成功回数ゼロがとても多いデータの場合には、さらにゼロ過剰モデルというより複雑な分布の考え方をすることがあり、前述の寺本他論文もゼロ過剰負の二項回帰モデルによって分析されています。

単純な分布モデルで分析できたほうが、わかりやすくて便利な結果といえるのですが、複雑な分布を考慮するかどうかは、データ自体の性質や手元のデータのグラフをみて検討します。

分析の際、解析ソフトからデータへの適合度の指標が出ますので、単純なモデルと比較してどのモデルにするか決めればいい、ということになります。

2 件

関連する記事 こんな記事も人気です♪

Satisficing(努力の最小限化)回答者の予測 (3)

Satisficing(努力の最小限化)回答者の予測 (3)

Satisficing回答者の予測に関する実験調査結果の続きです。最後に、少し蛇足になりますが、予測の検証をしてみました。
KOJI.A | 235 view

この記事のキーワード

この記事のキュレーター

KOJI.A KOJI.A