厚生労働省科学研究班開発
患者報告アウトカム(Patient-Reported Outcome:PRO)
使用についてのガイダンス集
臨床試験のためのPatient-Reported Outcome(PRO)使用ガイダンス
2.9. データ解析
2.9.1. 統計解析に関する一般的留意点
PROデータに関する統計解析については、SISAQOL-IMI(Setting International Standards in Analyzing Patient-Reported Outcomes and Quality of Life Endpoints Data - Innovative Medicines Initiative)と呼ばれる、がん臨床試験におけるPROデータの統計解析の標準化に関するコンソーシアムがEORTCの呼びかけにより、NCI、ISOQOLのメンバーの統計家らを中心に結成されている 1。PROデータの使用、解析、解釈を標準化するための推奨事項を作成しており、本ガイドラインでは同コンソーシアムの推奨事項 2 を適宜参照する。
適切な統計解析手法を考慮するためには、PROデータを収集し評価する目的を明確にすべきである。特に、検証的あるいは探索的いずれかの目的でPROデータを評価するのか、異なるグループ間での比較の目的は優越性あるいは同等性/非劣性のいずれの検討を目的としているのか、個人内あるいはグループ内いずれの変化に興味があるか、などが重要な観点である。
PRO尺度の多くの質問票は多次元であるため、複数のスコア(各ドメインスコア、総合スコアなど)などを生じうる。さらに、PROは複数の時点で通常評価される。スコアの経時変化などを確認するためのグラフ表示が重要であるとともに、評価項目、解析方法などを事前に規定しておく必要がある。
研究目的を考慮しPROの改善、悪化、安定状態、観察期間全体の効果いずれに興味があるのか、決定する必要がある。改善、悪化、安定状態については、例えばベースラインスコアの33%の低下、2点の低下など、その定義が重要である。評価項目として、改善に興味がある場合には改善するまでの時間、特定の時点における改善の程度やスコア、特定の時点における改善者の割合など、悪化の場合には悪化するまでの時間、特定の時点における悪化の程度やスコア、特定の時点における悪化者の割合など、安定状態の場合には安定状態に至るまでの時間、特定の時点における安定状態者の割合など、全体の効果の場合には要約指標(曲線下面積(Area Under the Curve: AUC)など)、経時的な推移(反応パターン、プロファイル)などが考えられる。臨床的に意味のある差(Minimum important difference: MID)について考察する必要がある。(2.10参照)特定のPRO研究目的を達成するのに適した評価項目および統計解析方法を適用する。
2.9.2. 複数のエンドポイントを用いる場合の統計解析留意点
複数のエンドポイントの(階層)構造を、試験の目的、各尺度の臨床的妥当性および重要性を考慮し、相互に関連させて事前に決定しておく必要がある。PRO評価は、臨床試験の主要エンドポイント、他のPRO評価と組み合わせた複数の主要エンドポイント、他の臨床エンドポイントや医師評価による測定値または階層的な順序に従って解析される副次エンドポイントとなりうるものである。プロトコルにおいて、複数のエンドポイントの定義と相互関係、統計解析の基準(必要があれば検定の多重性の対処方法を含む)、結果の解釈やアクションについて事前に規定しておくことが重要である。
2.9.3. 複合エンドポイントを用いる場合の統計解析留意点
複数のドメインを持つPRO尺度では、ドメインスコアを組み合わせて総合スコアを算出することで、複合エンドポイントを構成することができる。複合エンドポイントには、例えば多重性の問題を軽減できるなどいくつかの利点があるが、使用には十分な考慮が必要である。
複合エンドポイントをどう解釈するかは、臨床試験のセッティングにおいてその尺度の十分な使用経験があるかどうかによって決まる。臨床試験計画時に複合エンドポイントを設定するかどうかは、構成要素それぞれが患者にとって同程度の重要性を持っている、より重要な構成要素とそうでないものが同じ頻度で発生すると考えられる、構成要素がほぼ同様の効果を持つ可能性が高いなど、特別に考慮すべき点や十分な経験的エビデンスがあるかどうかに依存する。複合エンドポイントの構成要素間に大きなばらつきがあると予測される場合には、使用は推奨されない。
複合エンドポイントの構成要素それぞれに対して統計学的な評価を行う場合に多重性の問題が生じる。プロトコルで個別のエンドポイントとして事前に設定し、事前に指定されたすべての構成要素の結果を提示しなければならない。構成要素の構造を考慮した統計解析手法を適用すべきである。複合エンドポイントに関して統計学的に有意な結果が得られた場合にのみ、構成要素に関する解析が行われる。
2.9.4. 患者レベルの欠測データに関する統計解析留意点
QOL調査にはデータの欠測がつきものである。データの欠測が生じないような調査計画を第一に考えるべきである 3。また、結論がデータの欠測の影響を受けにくい解析方法、あるいは、データの欠測理由を十分考慮した解析方法の適用が望まれる。そのためには、データの欠測理由がわかるような調査計画を考慮すべきである。
特定の時点におけるPROデータの欠測には、2つのレベルがある。(1)尺度中の全項目ではなく一部の項目が欠測、(2) PRO評価全体が行われていない、である。(1)については、いくつかの尺度のスコアリングマニュアルなどには、欠測の項目があった場合の対処方法(例えば、総合スコアの計算方法)が示されているが、適用が適切かどうか十分に確認する必要がある。(2)については、解析においては、データが欠測した理由についての仮定(データの欠測メカニズムの仮定)が必要となる。Complete case analysis、いくつかの補完法、モデルにもとづく方法など、様々な統計学的アプローチがあり、時点ごとの欠測状況を集計し、欠測理由に応じて適切な方法を用いなければならない。
プロトコルにはこれら欠測の対処法について十分記載する必要がある。ただし、欠測値に対処する方法で、普遍的に適用可能と薦められる方法はない。欠測値に対処する方法により解析結果がどの程度変わりやすいかを、欠測の数が多い場合には特に検討すべきである。欠測データが結論にどのような影響を与えるかを検討するためには、モンテカルロシミュレーションの適用が有効な手段かもしれない。
2.9.5. Estimandについて
Estimandとは、ICH E9(R1): ESTIMANDS AND SENSITIVITY ANALYSIS IN CLINICAL TRIALS(統計ガイドライン補遺)にて導入された概念であり 4,5、臨床試験において推定されるべきもの、と訳される。エンドポイント等、臨床試験を特徴付けるいくつかの要因で構成され、試験の目的に応じて、試験開始前にEstimandを明確にすることが重要である。PROが評価項目の場合は、ステークホルダーによって推定したい治療効果は異なるであろうから、例えば治療の中止といった中間事象の取扱い、中間事象に対応するためのストラテジーを含むEstimandの詳細をプロトコルに明記する必要がある。どのような治療効果を当該試験で求めるべきかを明確にすることで、どのイベントを中間事象とすべきかを考え、必要なデータを収集することが重要である。この場合、必要なデータが収集されなかった場合に欠測データの問題が生じる、という考え方になる
- Bottomley A, Pe M, Sloan J, Basch E, Bonnetain F, et al. Setting International Standards in Analyzing Patient-Reported Outcomes and Quality of Life Endpoints Data (SISAQOL) consortium. Analysing data from patient-reported outcome and quality of life endpoints for cancer clinical trials: a start in setting international standards. Lancet Oncol. 2016 Nov; 17(11): e510-e514.
- Coens C, Pe M, Dueck AC, Sloan J, et al. Setting International Standards in Analyzing Patient-Reported Outcomes and Quality of Life Endpoints Data Consortium. International standards for the analysis of quality-of-life and patient-reported outcome endpoints in cancer randomised controlled trials: recommendations of the SISAQOL Consortium. Lancet Oncol. 2020; 21(2): e83-e96.
- National Research Council (US) Panel on Handling Missing Data in Clinical Trials. The Prevention and Treatment of Missing Data in Clinical Trials. Washington (DC): National Academies Press (US); 2010. Available from: https://www.ncbi.nlm.nih.gov/books/NBK209904/ doi: 10.17226/12955(アクセス最終日2022年8月21日)
- Lawrance R, Degtyarev E, Griffiths P, et al. What is an estimand & how does it relate to quantifying the effect of treatment on patient-reported quality of life outcomes in clinical trials? J Patient Rep Outcomes. 2020; 4(1): 68.
- Fiero MH, Pe M, Weinstock C, et al. Demystifying the estimand framework: a case study using patient-reported outcomes in oncology. Lancet Oncol. 2020; 21 (10): e488-e494.
参考文献
(山口 拓洋)