2021年8月17日 更新

点過程データ

ネットリサーチCron : リサーチ関連の話題・手法について、業界内外の人が息抜きに読めるような軽いコラムです。

gettyimages (2339)

時系列(time-series)データという言葉はしょっちゅう見聞きすると思いますが、似たものとして、点過程(point process)というデータのタイプがあります。

例えば、Tシャツ屋さんをやっていて、あるネットショップにTシャツを卸しているとします。ネットショップから毎週注文数が報告されるとした場合、このようなデータになります。
ネットショップからの週次報告

ネットショップからの週次報告

グラフにするとこんな感じ。これは典型的な時系列データ、つまり、一定時間ごとに測定されたデータです。
時系列データのグラフ

時系列データのグラフ

一方、自分のネットショップでTシャツを販売していて、注文があるたびにデータがデータベースに追加されるような場合、データはこのような形になります。
データベースに記録された注文データ

データベースに記録された注文データ

これをグラフにするには、注文日(日)のカラムが量的データであると考えればいいので、幅を1日ごとにしたヒストグラム(度数分布表)を作ってみると、下図のようになります。
点過程データのグラフ

点過程データのグラフ

ある時間ごとの測定ではなく、このようにデータ(イベント)の発生ごとにその発生時刻が記録されたデータを、点過程データといいます。
ちなみに、先のデータ表に「商品」というカラムがあり、注文があったTシャツの色・柄が記載されていましたが、このように点過程データに属性情報がついているばあい、その情報を「マーク」と呼んで、マーク付き点過程データといいます。

点過程データの特徴について考えてみます。時系列データは、先にみたような折れ線グラフで表されます。ということは、時系列データは測定時点の間は直線的に(あるいはなだらかに)推移している、という仮定が暗に置かれているということがいえます。これに対し、点過程データにはそのような仮定はありません。

点過程データは発生時刻の集まりですので、グラフにするときヒストグラムにしたように、量的データの分布として分析することができます。

同時に、時間的な性質を持っているので、時系列データを自己相関、トレンド、周期などとの観点で分析するように、点過程データも過去の発生時刻との関係を分析することが考えられます。

また、点過程データは、情報の一部を捨象すれば時系列データに変換できるのですが、時系列データとしてではなく点過程データのまま分析したいという場合もあると思います。

残念ながら、点過程データを分析するための一般的な使いやすいツールはまだ見当たらないのですが、この形式のデータは世の中にたくさんあると思うので、今後分析法含めた進展が期待されます。

※参考文献「点過程の時系列解析」近江崇宏・野村俊一(共立出版2019)

11 件

関連する記事 こんな記事も人気です♪

コロナ禍とグレンジャー因果

コロナ禍とグレンジャー因果

ネットリサーチCron : リサーチ関連の話題・手法について、業界内外の人が息抜きに読めるような軽いコラムです。
KOJI.A | 201 view

この記事のキーワード

この記事のキュレーター

KOJI.A KOJI.A