グレンジャー因果とは
日本行動計量学会の学会誌「行動計量学」第94号に、大阪大学の濱田悦生さんが、コロナ陽性者数/死者数とグレンジャー因果性についての論文を書かれていたので、ご紹介します(『日本でのCOVID-19禍におけるPCR陽性者数と感染死亡者数のGranger因果性の検討』濱田悦生,2021)
因果というのは原因・結果の因果で、グレンジャー因果はwikipediaによると以下のように説明されています。
時間に応じて変化するYの値を予測する際に、Y自体の過去の値だけに基づいた予測よりも、Yの過去の値およびXの過去の値に基づいた方が良い予測ができる場合に、「時系列変数Xから時系列変数Yへのグレンジャー因果がある」と言う。
つまり、グレンジャー因果というのは厳密な意味での因果よりは定義が緩い、ということです。
「厳密な意味での因果とは何か」については、難しい哲学的な議論になるので、統計学ではいったん脇におくことが多いですし、さらに人間集団の意識や行動を扱うことが多いマーケティング・リサーチでは、そんなことを考えるのに時間をかけるのは少し余計なことのようにも思いますが、専門的なリサーチャーやデータサイエンティストなら、一度は考えてみた方が良いテーマだと思います。
因果というのは原因・結果の因果で、グレンジャー因果はwikipediaによると以下のように説明されています。
時間に応じて変化するYの値を予測する際に、Y自体の過去の値だけに基づいた予測よりも、Yの過去の値およびXの過去の値に基づいた方が良い予測ができる場合に、「時系列変数Xから時系列変数Yへのグレンジャー因果がある」と言う。
つまり、グレンジャー因果というのは厳密な意味での因果よりは定義が緩い、ということです。
「厳密な意味での因果とは何か」については、難しい哲学的な議論になるので、統計学ではいったん脇におくことが多いですし、さらに人間集団の意識や行動を扱うことが多いマーケティング・リサーチでは、そんなことを考えるのに時間をかけるのは少し余計なことのようにも思いますが、専門的なリサーチャーやデータサイエンティストなら、一度は考えてみた方が良いテーマだと思います。
厳密な因果とは
ちなみに、「厳密な因果」について、因果関係があると判定するには次のことを満たすのがよい、というガイドラインがあります。いろいろなことを満たさないと厳密に因果があるとはいえないということがわかります。
・ 相関関係の強さ
・ 相関関係の一致性(対象や手法が違う調査でも相関関係の大きさが一致している)
・ 相関関係の特異性(原因A,結果Bと他の想定される変数の相関が高くない)
・ 時間的な先行性
・ 量・反応関係(原因Aの値が大きくなると結果Bも単調に大きくなる)
・ 妥当性(因果関係が該当分野の知見にもとづいてもっともらしい)
・ 先行知見との整合性
・ 実験による知見(実験研究による証拠がある)
・ 他の知見との類似性
(”The Environmental and Disease: Association or Causation?” Hill,A.B., 1965~岩波データサイエンスvol.3『因果関係ことはじめ』立森久照,2016 より孫引き)
・ 相関関係の強さ
・ 相関関係の一致性(対象や手法が違う調査でも相関関係の大きさが一致している)
・ 相関関係の特異性(原因A,結果Bと他の想定される変数の相関が高くない)
・ 時間的な先行性
・ 量・反応関係(原因Aの値が大きくなると結果Bも単調に大きくなる)
・ 妥当性(因果関係が該当分野の知見にもとづいてもっともらしい)
・ 先行知見との整合性
・ 実験による知見(実験研究による証拠がある)
・ 他の知見との類似性
(”The Environmental and Disease: Association or Causation?” Hill,A.B., 1965~岩波データサイエンスvol.3『因果関係ことはじめ』立森久照,2016 より孫引き)
コロナ禍における陽性者数と死亡者数の因果関係
さて、濱田論文に戻りますとこの論文では、PCR陽性者数を原因、感染死亡者数を結果としたグレンジャー因果性について、2020年6月18日以降とそれ以前では原因から結果への寄与率が大きく変化した、ということを言っています。
6月18日以降は、PCR陽性者数から感染死亡者数は予測しづらくなった、ということです。
では6月18日に何があったかというと、この日に厚生労働省から新型コロナによる死亡者数をどう定義するかについて、自治体等に事務連絡がありました。その中で、死亡者数をどうカウントするかについて、「陽性者で入院・療養中に亡くなった方については、厳密な死因を問わず『死亡者数』として全数を公表するよう』云々とあります。
つまり、新型コロナによる死亡者の定義が非常に広くなったわけです。常識的に考えれば感染者数から死亡者数はかなりよく予測できそうですから、この定義変更は少し広げすぎなのかもしれません。これは、新型コロナによる症状・身体への影響や後遺症がより明確になった後に判断できることでしょう。
もしかすると、新型コロナ流行初期と中期以降ではコロナの変異や陽性者属性の変化などがあったかもしれないので、これらが影響しているかもしれません。
グレンジャー因果という「より緩い」因果判定でも、なかなか難しいものだということを思いました。
6月18日以降は、PCR陽性者数から感染死亡者数は予測しづらくなった、ということです。
では6月18日に何があったかというと、この日に厚生労働省から新型コロナによる死亡者数をどう定義するかについて、自治体等に事務連絡がありました。その中で、死亡者数をどうカウントするかについて、「陽性者で入院・療養中に亡くなった方については、厳密な死因を問わず『死亡者数』として全数を公表するよう』云々とあります。
つまり、新型コロナによる死亡者の定義が非常に広くなったわけです。常識的に考えれば感染者数から死亡者数はかなりよく予測できそうですから、この定義変更は少し広げすぎなのかもしれません。これは、新型コロナによる症状・身体への影響や後遺症がより明確になった後に判断できることでしょう。
もしかすると、新型コロナ流行初期と中期以降ではコロナの変異や陽性者属性の変化などがあったかもしれないので、これらが影響しているかもしれません。
グレンジャー因果という「より緩い」因果判定でも、なかなか難しいものだということを思いました。
8 件