時系列(time-series)データという言葉はしょっちゅう見聞きすると思いますが、似たものとして、点過程(point process)というデータのタイプがあります。
例えば、Tシャツ屋さんをやっていて、あるネットショップにTシャツを卸しているとします。ネットショップから毎週注文数が報告されるとした場合、このようなデータになります。
例えば、Tシャツ屋さんをやっていて、あるネットショップにTシャツを卸しているとします。ネットショップから毎週注文数が報告されるとした場合、このようなデータになります。
グラフにするとこんな感じ。これは典型的な時系列データ、つまり、一定時間ごとに測定されたデータです。
一方、自分のネットショップでTシャツを販売していて、注文があるたびにデータがデータベースに追加されるような場合、データはこのような形になります。
これをグラフにするには、注文日(日)のカラムが量的データであると考えればいいので、幅を1日ごとにしたヒストグラム(度数分布表)を作ってみると、下図のようになります。
ある時間ごとの測定ではなく、このようにデータ(イベント)の発生ごとにその発生時刻が記録されたデータを、点過程データといいます。
ちなみに、先のデータ表に「商品」というカラムがあり、注文があったTシャツの色・柄が記載されていましたが、このように点過程データに属性情報がついているばあい、その情報を「マーク」と呼んで、マーク付き点過程データといいます。
点過程データの特徴について考えてみます。時系列データは、先にみたような折れ線グラフで表されます。ということは、時系列データは測定時点の間は直線的に(あるいはなだらかに)推移している、という仮定が暗に置かれているということがいえます。これに対し、点過程データにはそのような仮定はありません。
点過程データは発生時刻の集まりですので、グラフにするときヒストグラムにしたように、量的データの分布として分析することができます。
同時に、時間的な性質を持っているので、時系列データを自己相関、トレンド、周期などとの観点で分析するように、点過程データも過去の発生時刻との関係を分析することが考えられます。
また、点過程データは、情報の一部を捨象すれば時系列データに変換できるのですが、時系列データとしてではなく点過程データのまま分析したいという場合もあると思います。
残念ながら、点過程データを分析するための一般的な使いやすいツールはまだ見当たらないのですが、この形式のデータは世の中にたくさんあると思うので、今後分析法含めた進展が期待されます。
※参考文献「点過程の時系列解析」近江崇宏・野村俊一(共立出版2019)
▲
点過程データの特徴について考えてみます。時系列データは、先にみたような折れ線グラフで表されます。ということは、時系列データは測定時点の間は直線的に(あるいはなだらかに)推移している、という仮定が暗に置かれているということがいえます。これに対し、点過程データにはそのような仮定はありません。
点過程データは発生時刻の集まりですので、グラフにするときヒストグラムにしたように、量的データの分布として分析することができます。
同時に、時間的な性質を持っているので、時系列データを自己相関、トレンド、周期などとの観点で分析するように、点過程データも過去の発生時刻との関係を分析することが考えられます。
また、点過程データは、情報の一部を捨象すれば時系列データに変換できるのですが、時系列データとしてではなく点過程データのまま分析したいという場合もあると思います。
残念ながら、点過程データを分析するための一般的な使いやすいツールはまだ見当たらないのですが、この形式のデータは世の中にたくさんあると思うので、今後分析法含めた進展が期待されます。
※参考文献「点過程の時系列解析」近江崇宏・野村俊一(共立出版2019)
▲
11 件