ちょうどいま勉強会でアンブレラレビューを作ってみているので、忘備録として学んだことをまとめてみます。有料の勉強会ということもあり、その中で行われた講義や議論はブログの内容に含みません。
私が課題をこなした上での忘備録としてまとめます。
1,システマティックレビューは乱造されている
2020年の1年間で作成されたシステマティックレビューは31375件です。(PubMedにて”reviwe”検索結果に対してsystematic reviewフィルタリング)
比較対象として1995年の1年間で作成されたシステマティックレビューは38件。1995年から2021年現在までのシステマティックレビュー総数は177137件です。これはPubMedでの(とても雑な)検索による数値なので、実態としてはその1.2倍程度はあるだろうと考えられます。
ちょっとした興味から下記のグラフの縦軸を対数変換してみたところ(微生物学講座的発想)、2005年以降はほぼ直線的な増加に。つまり「システマティックレビューはここ10年間、指数関数的な増加をしている」と言い切ることができます。
少し歴史的経緯を整理すると、コクラン共同計画(英)が医学分野にメタ解析=メタアナリシスの概念を導入したが1980年頃。EBMという概念が登場したのは1990 年頃です。それまでレビューはリテラチャーレビューという形式で、メタアナリシスを含まない主観的な「定性的評価」がされてきました。
1996年にはCochraneからQUOROMチェックリストというガイドラインによって、システマティックレビューの形式が固まりました。従来のレビューとの相違は、再現可能性を担保するために一定の手順を踏み、実施可能であればメタアナリシスを含むことで客観的な「定量的評価」が可能となった点です。
しかしシステマティックレビューで用いるメタアナリシスには母集団が正規分布という前提があり、これだけで評価するのは問題があることが1999年には指摘されました。そのため「メタアナリシスのみの論文」ではなく「定量的・定性的評価を組み合わせた定量的システマティックレビュー」がエビデンスレベルの頂点に立つことになります。
医学論文電子化/検索エンジンの発展を鑑み、2009年にCochraneから発表されたPRISMAチェックリストでは検索式(論文検索ストラテジー)の設定を義務付けました。ここで定められたフォーマットが、現在爆発的に増加しているシステマティックレビューの書式と言えます。
[本稿における図はここから引用し、一部改変しています]
2,模索されるシステマティックレビュー評価方法
なぜシステマティックレビューは乱造されるのでしょう。それは自分でフィールドワークや実験を行わなくても、論文投稿できるからです。PRISMAチェックリストに基づいて検索エンジンで論文を調べ、数名で協議しながら進めていけば、労力はともかく誰でもシステマティックレビューは書けてしまいます。
もちろんPRISMAチェックリストすべてを埋めようとすると、それこそコクランレビューのような膨大な文章と論文リストが必要になりますが、論文投稿という観点ではそこまで求められることはありません。
これまでは専門家同士でのディスカッションでも、システマティックレビューの結論を引用すれば決着がつく、というような場面も多くありました。しかし今後はシステマティックレビューがPRISMAチェックリストや、AMSTARチェックリストで何項目埋められるかという観点も必要になってくるかもしれません。
これはシステマティックレビューを外部評価する形で、合議と投票で推奨度を決定していく仕組みとなっており、非常に人為的な作業であると感じます。ここまでくると「第三者機関による有識者会議」的なもので、科学的アプローチとはもはや言えないのではないかなぁ、というのが私の感想です。
3,アンブレラレビューとは
アンブレラレビューは2015年頃から増加してきたシステマティックレビューをシステマティックレビューしようという試みです。2015年では1年間に127本、2020年では427件のアンブレラレビューが行われ、年々増加しています。
アンブレラレビューではまず検索式(論文検索ストラテジー)を設定して特定のテーマに関するシステマティックレビューを集めます。それをPRISMAチェックリストやAMSTARチェックリストを行い、論文からPICO・サンプルサイズ・バイアスリスク評価・一貫性/異質性評価・主な結果などを引用して一覧表形式で列挙します。
一方でアンブレラレビューは書式もメタアナリシスも定まっていないため、この一覧表作成のあとは定性的システマティックレビューと同様、主観的な評価を下します。
アンブレラレビューを行うことでシステマティックレビューがそれぞれ同様の傾向を示すか、そうではないのかが明らかになり、テーマに対する理解は大きく進むだろうと感じました。
まとめ,アンブレラレビューは必要か
従来の臨床診断ガイドラインを作成していくには、既存のシステマティックレビューが全てのPRISMAチェックリストを満たしているか、最新の状態であるかを評価し、そうでなければやり直しをするということがされてきました。
従来はシステマティックレビューが貴重だったために、基本的に最新版にリニューアルしつつやり直すというのが最適解だったかもしれません。
しかしシステマティックレビューが乱立する昨今において、10本程度を並列して、それぞれの結論に一貫性があるのか、それとも大きなバラツキがあるのか見ていくのは有意義な手段のように思えます。
そういう意味ではGREDEアプローチが協議と合意のもと臨床診療ガイドラインを作成するのを目的にかかげているのに対し、より再現性がとれる方法として科学的な真相に迫る方法であるように感じます。
とはいえ、目的が違うなら文脈が変わってくるのはありうるとしても、その結論が大幅に変化するとなれば違和感があります。GERDEアプローチによる外部評価であれ、アンブレラレビューであれ、その結果はある程度収束していかなければ、どこかに人為的エラーが潜んでいるということかもしれません。