厚生労働省科学研究班開発
患者報告アウトカム(Patient-Reported Outcome:PRO)
使用についてのガイダンス集
臨床試験のためのPatient-Reported Outcome(PRO)使用ガイダンス
2.7. 代表的な尺度と測定方法
PROを用いた研究でエビデンスを創出するためには、「ISOQOL Measure Selection Standards Checklist」で示されている通り、前章までに述べたFit-for-purpose、計量心理学的特性、患者や研究者の負担に配慮した上で、特に本邦において開発された尺度ではない場合は、適切な手順で翻訳された尺度を用いる必要がある 1。 また、臨床試験の中でも、例えばFDAへの申請を検討している場合は、FDAが公表している「Clinical Outcome Assessment Compendium」のCOA Tool & Typeの項目のうち、PROに関する箇所を参照されたい 2。そこではFDAにおける承認申請で既に活用されている実績のある尺度が確認できる。COA CompendiumはPRO選択を始める段階で、該当するものがある場合には参考に用いるとよいだろう。ただしこのCompendiumに全ての情報が網羅されているわけではなく、研究の目的によっては適切な尺度が存在しない場合もある。こうした他のCOAを含む尺度の選択について、FDAが「Patient-Focused Drug Development: Selecting, Developing, or Modifying Fit-for-Purpose Clinical Outcome Assessments」を策定中であり、2022年にドラフト版が公開されている。
2.7.1. PRO
2.7.1.1 有効性評価に用いられるPROの例
心不全の症状や機能の制限などを評価するKansas City Cardiomyopathy Questionnaire (KCCQ) 3、慢性閉塞性肺疾患(Chronic Obstructive Pulmonary Disease: COPD)の呼吸器症状を評価するEvaluating Respiratory Symptoms (E-RS) 4 やExacerbation of Chronic Pulmonary Disease Tool (EXACT) 5,6、大うつ病性障害に対するSymptoms of Major Depressive Disorder Scale (SMDDS) 7,8 など、各領域で様々な尺度が活用されている。ここでは痛みの評価について例示して解説する。
がん領域の痛みの評価では、Brief Pain Inventory – Short form(BPI-SF)がよく用いられる。BPI-SFはCleelandらが開発した15項目で構成される想起期間が過去24時間の調査票で、54の翻訳版がある 9,10。レスポンスオプションはNumeric Rating Scale(NRS)を用いているが、質問項目のうち4項目でPain intensity、7項目でPain interferenceという下位尺度を構成している。Pain intensityは痛みについて、「過去24時間で最も弱い痛み」「過去24時間で最も強い痛み」「平均の痛み」「今の痛み」と、詳細に尋ねる内容となっている。これらの下位尺度のスコアが解析で使用される他に、「過去24時間で最も強い痛み」のみが使用されることもある。このように、尺度選択時にはどのように解析で使用できるかも考慮する必要がある。
痛みについてはこうした尺度を用いないNRSやVisual Analogue Scale(VAS)が用いられることもあるが、その場合は研究によって質問文の設定が違うことなどがあり注意する必要がある。後述するePROを活用するような場合は、既存の尺度でVASに限定されていない限り、VASは推奨されないという見解もある 11。これはePROに用いるデバイスのスクリーンサイズによってVASの大きさが大きく影響を受けるためである。痛みのように複数の尺度が選択できる場合、その特性や測定に使用する方法なども総合的に考慮し、尺度を選択する必要があるだろう。
一方、化学療法に起因する末梢神経障害の治療やケアの評価では、Patient Neurotoxicity Questionnaire (PNQ) 12 がよく用いられる。PNQは元来、タキサン系抗がん薬やオキサリプラチンなどの白金系抗がん薬使用に伴う有害事象として頻度の比較的高い末梢神経障害に対する治療薬の開発における有効性検証のための指標として開発されたものである 13。正式な日本語版が開発され、日本の乳癌患者を対象とした妥当性が確認され 14、臨床試験においての有用性も確認されている 15。
2.7.1.2 安全性評価に用いられるPROの例
有害事象を評価するPROには、米国National Cancer Institute(NCI)が開発したPatient-Reported Outcomes version of Common Terminology Criteria for Adverse Events(PRO-CTCAE)がある 16。PRO-CTCAEは、主にがん領域の臨床試験で用いられるClinRO(COAの分類の中の臨床家報告アウトカム)であるCTCAEのversion 4のうち、患者の主観評価が可能な78症状を抽出し、患者が理解しやすい表現に置き換え、各症状によって属性(Attribute)といわれる症状の有無、頻度、程度、日常生活への影響を尋ねる質問文型になっている。回答はいずれも5段階のVerbal Ratingで、想起期間は原則として7日間となっている。2008年に開発が着手され、日本語版も使用可能であるが、小児・青少年版および介護者版の日本語版は開発段階である。紙媒体以外に、ePRO、自動音声応答システム(Interactive Voice Response System: IVRS)での使用が可能である 17。
PRO-CTCAEは1つの症状に対して複数の質問項目が設定されている場合があり、また症状ごとに属性が異なるため、最終的には80症状124項目となっている。臨床試験で用いる際には、これら全てを用いるのではなく、研究に応じて研究者が(場合によっては患者・市民らとともに)項目を抜粋・選択して用いる。しかし、例えば腹痛には頻度、程度、日常生活への影響の3つの属性があるが、そのうち程度のみを使用する、といった使用する属性の変更は認められていない(3つの属性が設定されている場合、その3つ全てを使用する必要がある。
PRO-CTCAEのスコアリングについてはまだ正式に定まったものはない。原則としてそれぞれの属性ごとに記述統計を用い、その際には対応する同時点のCTCAEのGradeを併記すべきとされている。また、属性をまとめ1つの症状について1つのスコアにするComposite gradingのアルゴリズムが提唱されている 18。また、ePROで使用する場合、質問項目数による患者負担を考慮し、Skip logicが使用できる。複数の属性が設定されている場合、例えば最初の頻度の質問項目で「なし」を選択した場合、続く程度や日常生活への影響の質問項目をスキップする方法である。こうした方法も含む情報はNIH(National Institute of Health)のサイトで頻回に更新されるため、常に新しい情報を参照されたい。
(川口 崇、兼安 貴子、下妻 晃二郎)
2.7.2. HRQL
1.1および1.2でも述べたように、PROとHRQLとの概念の関係性は、含む領域の範囲と深さにおいて若干異なるため、HRQL尺度についてはここでPRO尺度とは分けて説明する。臨床試験において使用されるPRO尺度の多くは、症状の一部についての重症度や頻度を尋ねているものが一般的である一方、HRQL尺度は、身体面、心理面、社会面、機能面などの概念領域についてより幅広く尋ねている尺度が多い。また測定する概念は、HRQL尺度はPRO尺度よりも若干深いことが多い。つまり、HRQL尺度では測定されたPROなどの主観的症状によって、実際に苦痛や苦悩をどのくらい感じているか、に評価の焦点があてられる場合が多い。PROの概念が生まれる以前は、このHRQL測定尺度が数多く開発され、現在もなお臨床試験で幅広く使用されている。
HRQL尺度は包括的尺度と疾患・状態特異的尺度に分類される。包括的尺度は、一般健康人や軽症の患者を対象として用いることが可能である。包括的尺度の代表例としてはSF-36 (Medical Outcome Study 36-item Short-Form Health Survey) 19,20 があげられる。SF-36は身体面、心理面、役割、社会面やそれらの組み合わせに関する8つの下位尺度から構成されている。年齢層別に示されている国民標準値は、測定結果の解釈に役立つ。短縮版であるSF-8 21 も開発されている。
疾患・状態特異的HRQL尺度も枚挙に暇がないほど数多く開発されている。ここではごく一部だけ紹介する。例えばがん領域では、EORTC-QLQ C30 (European Organization for Research and Treatment of Cancer Quality of Life Questionnaire Core 30) 22,23 やFACT-G(Functional Assessment of Cancer Therapy scale – General) 24,25 が世界的に汎用されている。これらの尺度には、さらに、がん種別、治療の種類別、症状別の追加尺度(EORTCではモジュールと呼ぶ)も複数開発され、様々な目的をもった臨床試験のニーズに対応できる。この2尺度については追加尺度を含めて正式な日本語版が多く開発されており、日本の臨床試験におけるエビデンス創出に役立っている 26-32。尺度の構成の詳細やスコアリングアルゴリズムは、それぞれのウェブサイトを参照されたい。また、これら2尺度では臨床的に意味のある差(MID)(2.10を参照)も検証されており、得られた結果の臨床的意義の解釈に役立つ。
(川口 崇、兼安 貴子、下妻 晃二郎)
2.7.3. 選好に基づく尺度(Preference-based measure: PBM)の例
2.7.1と2.7.2で示してきたPRO尺度やHRQL尺度は、複数の領域(多次元)の健康状態をそれぞれ測定し、得られた点数(スコア)をそのまま全体像として示すことから「プロファイル型尺度」と呼ばれている。そのため、この尺度は経時的な変化や集団間の差を解析・解釈することによって臨床現場に応用できる。プロファイル型では、項目ごとにスコアの上限と下限が決められており、下位尺度や尺度全体として、最高の健康や死などの統一したアンカーがあるわけではない。従って、個人内や集団間の相対的な比較に用いるのに適している。
一方、本項で説明するPBMでは、基本的に費用効果分析などの医療経済評価(公的な医療資源の適切な配分 33 に関する意思決定支援)の一つの指標として使うために開発された尺度であり、プロファイル型尺度とは、開発時の考え方や構成が異なる。
より具体的には、PBMは、健康に関する複数の概念領域(PBMでは属性と呼ぶ)を質問票形式で測定するところはプロファイル型尺度と似ているが、そこで得られた複数のスコアをそのまま結果として用いるのではなく、尺度ごとに作られた計算式(アルゴリズム)を用いて、「一般健康人」の選好や価値観に基づく一次元の値に変換した結果を解析・解釈に用いるのである。この一次元の値は、あらかじめアンカーとして、「最高の健康状態」を1、「死亡」を0とした値である。この最終的なPBMの測定値は、医療経済学では「健康状態効用値(Health-state utility values: HSUV)」、あるいは単に「効用値(utility、utility values)」などと呼ばれる(ちなみに、このPBMによる測定値を、日本の行政では「QOL値」と呼んでいる)。
このPBMで得られた値は、費用効果分析においてよく用いられる「効果」の指標としての「質調整生存年(Quality-adjusted life year: QALY)」の作成に「quality weight」として使用される。
PBMはプロファイル型尺度よりも一般に質問項目数が少ないためか、簡便に使えるプロファイル型尺度と誤解されて臨床試験に使用されているケースが散見されるが、上記の理由から、応用目的に合わせて適切に尺度を選択することが大事である 34。
PBMは、日本の厚生労働省において2019年度から始まった「費用対効果評価制度」の分析で用いられることになったため、今後臨床試験で使用する機会は飛躍的に増えると予想される。本制度は、保険償還価格が新たに決まった医薬品・医療機器製品の一部(高額だったり予算影響が大きいものなど)について社会的価値に基づく価格に調整するための意思決定を行う制度であり、医療技術評価(Health technology assessment: HTA)制度の一環である。
PBMの包括的尺度の代表例としては、EuroQol 5 dimension(EQ-5D) 35,36 があげられる。日本も含め、多くの国々のHTA制度では最もよく使われている。正式な日本語版とアルゴリズムも開発されている。その他の包括的PBMとして日本で使用可能な尺度には、Health Utilities Index(HUI) 37-40 とSF-6D 41,42 がある。一方、疾患・状態特異的PBM尺度として、EORTC QLU-C10D 43 、FACT-8D 44 などが開発されており、日本語版とアルゴリズムも現在開発中である。その他、介護の負担に関するPBM尺度として、Adult Social Care Outcomes Toolkit(ASCOT) 45-47 も開発されているが、疾患・状態特異的尺度と並んで、日本のHTAにおける使用方法は現時点では未定である。
(下妻 晃二郎、兼安 貴子、白岩 健)
2.7.4. 小児・代理人による評価
2.7.4.1 小児による評価
諸外国の規制当局のガイダンスでは、小児用 PRO 尺度の開発プロセスに関連した審査の問題は成人の場合と同様であるとされている。一方で代理人報告アウトカムの使用は、患者本人と代理回答者との結果に乖離が生じるため推奨されていない 48-50。ただし、自ら回答することができない患者(例えば、乳幼児)では、観察可能な事象または行動のみが含まれる観察者報告アウトカムの使用について、留意事項と合わせて提示されている 48,49。小児PRO研究の実施については、1)発達の違いを考慮した年齢別基準の設定、2)小児用PRO尺度の内容的妥当性を確立、3)代理人報告や観察者報告アウトカムの必要性を判断、4)対象となる年齢層に適した尺度のデザインとフォーマットの確保、5)異文化間の問題への配慮の5つが考慮すべき項目として示されている 51,52。以下に小児における尺度の例を挙げる。
PedsQL (Pediatric Quality of Life Inventory) 53-57 |
小児および若年者のHRQLを簡易的に測定するためのもので、23項目から構成される。子どもや若者だけでなく、親(代理人報告)も記入することが可能。対象年齢は2-18歳。 |
EQ-5D-Y (EuroQol 5 dimension youth) 58-60 |
子どもを対象にして開発され、5問の質問項目は大人版と基本的に同じであるが、子どもにもわかりやすい表現になっている。対象年齢は8歳から15歳(12-15歳は成人版も使用可能)。 |
2.7.4.2 認知障害患者またはコミュニケーションが不可能な患者の評価
諸外国の規制当局のガイダンスでは、小児と同様に本対象集団においても代理人報告アウトカム測定は推奨されない 48,49。自ら回答することのできない患者(例えば、認知障害を有する患者)では、観察者報告アウトカムの使用が考慮される。
なお、本項で使用した各種アウトカムの定義は次のとおりである 48,61。
代理人報告アウトカム: | 患者以外の人が、自分が患者であるかのように患者の状態を報告した内容に基づく測定値。 |
観察者報告アウトカム: | 患者の健康状態に関連する観察可能な症状や行動について、患者または医療従事者以外の者が報告した内容に基づく測定値。 |
(星野 絵里)
2.7.5. ePRO
2.7.5.1 ePROの規制要件
ePROとは、PROデータを電子的に収集する方法およびそのシステムを指す用語として臨床研究の分野で広く使われている。データ収集方法としては、評価の原データを電子的に直接収集する方法となるため、「eSource」の一種として位置付けられている 62。規制上は、臨床データの電子的収集(Electronic Data Capture: EDC)システムの一種として位置付けられており 62-64、EDCと同様に、e-文書法 65、厚生労働省令第44号 66、Electronic Record / Electronic Signature(ER/ES)指針 67、Good Clinical Practice(GCP) 68、GCP運用通知 69など、電磁的記録や電子データ処理システムの運用に係る規制要件に準じたシステム開発および運用が求められる。
薬事申請を前提としていない臨床研究の場合であっても、データの信頼性保証の観点から、これらの規制要件に従ってシステムの運用がなされることが望ましい。また、一般的に普及している健康管理アプリをデータ収集ツールとして研究に用いる場合も同様の注意が必要である。
EDCにかかる規制要件以外で、ePROに特化した留意事項としては、タブレットやスマートフォンの電子機器を用いて評価や回答を入力する際の入力画面の設計が挙げられる。多くのPRO尺度は、もともと紙媒体での評価を想定して開発されており、ePROでPRO尺度の評価を行う場合には、紙媒体による評価の同等性を保ちながら、電子媒体への尺度を落とし込むための「マイグレーション(Migration)」という作業が発生する。PRO尺度の説明文、質問文、回答形式、回答選択肢などについて、可能な限りオリジナルの尺度と同等に設定し、入力画面を設計する必要があり、特に回答形式の部分のデザインについては注意が必要である。
PRO尺度でよく用いられる回答形式としては、Likert Scale、NRS、VASなどがあげられるが、これらの回答形式をePROの入力画面上でどのようにデザインすべきかについては、Critical Path InstituteのePRO ConsortiumからBest Practiceが公開されている 11。また紙媒体とePROのPRO尺度の同等性の確認の方法については、ISPORのePRO Task ForceなどからRecommendationが公開されている 70,71。ePROシステムの選定において、上記の規制要件やRecommendationを満たしたシステムであるか、システムベンダーに確認を行った上で、研究デザイン、現場の運用プロセスに合致した仕様のePROシステムを選定されたい。
2.7.5.2 ePROのメリットとデメリット
歴史的には、PRO評価は紙媒体の調査票を用いて行われてきたが、臨床研究データのデジタル化(Digitization)と業務プロセスのデジタル化(Digitalization)によりePROへ移行しつつある。日本製薬工業協会(製薬協)のePROの普及状況の調査ではePROの使用経験が2012年調査 63 では24%、2015年調査 64 では33%、2021年調査では50%と製薬協加盟の製薬会社においても広く普及しているとは言えず、治験におけるePROの使用は、2021年時点では、まだ過渡期にあると言える。ePROの導入に至っていない理由としては、導入・運用コストが大きく、コストに見合ったベネフィットが見いだせないという理由が目立った 63。
表1に紙媒体のPRO評価とePROを用いた評価の特徴をまとめた 72。紙媒体の調査票による評価の利点としては、準備に時間を要さず、費用も安いことがあげられる。一方、欠点としては、ペンによる手書きの回答になるため、文字の判読性の問題や調査票が想定している回答方法に準じない形での回答が起こる可能性があり、データの取り扱いの問題が生じる可能性がある。また、調査票を回収後、回答をデータベースに入力する作業も発生する。また、評価のセッティングにおいては、いつ、誰が記入したかの記録が残らないため、データの信頼性を担保する事が難しいという欠点もある。
ePROを使用する場合においては、ePROシステムの選定や構築、コンピュータ化システムバリデーション(CSV)にかかるコストや 機器の購入やネットワークの確保など、準備段階でかかる金銭的、時間的コストが高くなるという欠点がある。一方で、データの品質に関しては、データ入力の方法を制限できるため、紙媒体の評価で起こる判読性の問題や意図しない回答を防げる利点がある。また、eSourceとして、評価のデータをリアルタイムに収集することができるため、入力状況のモニタリングができ、データの欠損を予防するための品質管理を行うことができる。また、EDCと同様に、監査証跡が残るので、データの信頼性確保のための重要な要素となるALCOA(Attributable、Legible、Contemporaneous、Original、Accurate)の観点からも、ePROを使うメリットがある。
検討項目 | 紙媒体による運用 | ePROによる運用 |
セットアップに要する時間 | あまり時間を要さない | ePROの運用経験が少ない場合、セットアップに時間を要する |
費用 | 印刷、郵送費用 | 機器購入、ePROの構築・ライセンス費用、ネットワークの確保 |
データの正確性 | 文字の判読性とALCOAの担保に問題がおこる傾向 | 操作ミスがない限り、エラーは少なくなる傾向 |
データへのアクセス | CRF*と一緒に回収されるので、リアルタイムではない | EDCと同様に、リアルタイムにデータ収集が可能 |
被験者のコンプライアンス | 自宅等で記入を依頼する場合、「日記のまとめ書き」のような問題がおこる傾向 | 電子データとタイムスタンプを用いて確認できるので、コンブライアンスがよい傾向 |
被験者のトレーニング | 一般的に必要ない | 機器操作のトレーニングが必要である |
*CRF: Case Report Form(症例報告書)
2.7.5.3 デバイス選定、アプリケーションの選定
ePROシステムや機器の選定においては、次の点を考慮すべきである 73。1)収集するデータの種類と目的、2)データ収集の頻度と品質設定、3)テクノロジの信頼性、成熟度、および機能、4)規制とガイダンス、5)参加者のコンプライアンスとデバイス機能の範囲、6)調査対象集団、7)データ収集が行われる地域、8)予算、スケジュール、およびサポート 73、である。
表2にデバイスの選定についてまとめた 73。ePROシステムを使うデバイスとしては、1)スマートフォン、2)タブレット端末、3)パーソナルコンピュータなどが挙げられる。デバイスの提供方法には、中央配布(Provisional)型と患者(調査対象者)本人のデバイスを用いるBring your own device(BYOD)型がある。治験ではこれまで、スポンサー側で統一したデバイスを準備して被験者に配布する中央配布型の方法を用いることが多かったが、大規模の試験になるとデバイスを準備するための費用面で課題が大きくなることが問題視されている。また、国際共同治験や臨床研究等において、デバイスを実施国に輸出入する場合には、各国の電波や電気用品に関する法令 74,75 に準拠する必要があるため、考慮が必要である。例えば、日本では電波を発する機能のある機器の利用は電波法で規制されているため、電波法令で定めている技術基準に適合している機器であることを証明する技適マークがついていない輸入デバイスの利用は、電波法違反となる可能性がある 76,77。また、デバイスを充電するACアダプターの輸入については、電気用品安全法で規制されており、ACアダプターを含む電気用品安全法の対象となる電気用品の輸入を行う事業者は、電気用品の輸入事業届の提出を行い、電気用品が電気用品安全法の定める技術基準に適合していることを確認する必要がある。BYOD型はその費用面の課題を解決できるため、大規模な対象数に長期に渡ってPROのフォローアップが必要な研究デザインに適していると言えるが、後述するNative Appと組みわせる場合には、デバイス依存の問題があり、また高齢者などスマートフォンやダブレットを保有してない場合もあるので、研究対象者を考慮する必要がある。前述の通り、どちらの仕様も長所、短所があり、対象者、サンプルサイズ、PRO評価の頻度、期間、セッティング(在宅で評価、来院もしくは入院での評価)などの研究デザインによって、ePROの仕様と運用を決定することが重要である。
表3にePROのアプリケーションについてまとめた 73。大きく分けて、1)スマートフォンやタブレット端末にアプリケーション(Application program: App(アプリ))をインストールする方法 (Native App)、2)ブラウザからWebページにアクセスする方法がある(Web App / Hybrid App)。Native Appの利点としては、機器にデータを保存できるため、インターネット環境に依存せず評価可能となる。一方でアプリケーションはデバイスに依存するため、使用できるオペレーティングシステム(Operating System: OS)やバージョンが限られる場合がある。Web App / Hybrid Appは、利点として、アプリをインストールする必要がなくデバイスに依存しないため、インターネット環境があれば、ブラウザ経由でePROシステムにアクセスすることができる。一方で、インターネット環境の確保が必須となり、来院時の評価を前提とする場合、医療機関によっては、ネットワーク使用の申請が必要であったり、ネットワーク(電波)が届かなかったりする場所もあるので注意が必要である。アプリ以外にも、電話回線を用いたIVRSなどが方法としては存在するが、実際の使用例は少ない。
データの送信手段としては、セルラーネットワーク(4G等)、Wi-Fi、Bluetooth、赤外線などがあり、機器として、スマートフォンやタブレットを使用する場合は、通信手段として、セルラーネットワークとWi-Fiが主に使われている。
Bring Your Own Device(BYOD)型 | 中央配布 (Provisional)型 | |
特徴 | 患者自身や所有する機器を用いる | 機器の中央配布、貸出しを行う |
利点 |
|
|
欠点 |
|
|
Native App | Web App / Hybrid App (Web-access 型) |
|
特徴 |
|
|
GPS: Global Positioning System, HTML: Hypertext markup language
2.7.5.4 ePROの機能とPROデータの品質管理
ePROの主な機能としては、1)評価日や期間をメールやテキストメッセージで伝える「リマインダー機能」、2)評価がなされた日時をシステム内に記録する監査証跡、3)回答不要な設問を非表示、スキップさせる「スキップ機能」、4)入力項目の桁ずれなどの誤入力を制御する「ロジカルチェック機能」、5)尺度の総合スコアなどを自動計算する機能、6)データをグラフ化し、可視化する機能、7)一定以上のスコア(閾値)が入力された場合に医療者へ通知するアラート機能、8)メール、テキストなどを用いた患者と医療者間のコミュニケーション機能などがあげられる。ePROシステムによっては,すべての機能が実装されているわけではないので、システム選定の際に確認されたい。
(宮路 天平)
2.7.6. Computer adaptive testing(CAT)
Computer adaptive testing(CAT)、コンピュータ適応型テストとは、コンピュータを利用して回答者の能力に最適な質問項目を選択して提示することにより、短時間で精度の高い結果を生み出すことを可能とするシステムのことである 78。
QOLやPROの測定尺度は、回答様式によって静的質問票(Static questionnaire)と動的質問票(Dynamic questionnaire)に二分することができる。静的質問票は、あらかじめ決められた質問項目セットに全て回答する方法である。従来、紙で提示して回答を書き込む形式で行われることを前提に開発された尺度は、静的質問票に該当する。それに対して、動的質問票は、ある質問への回答によって次に提示する質問が選択され提示される、という方法で行われる。コンピュータを利用して行われるため、コンピュータ適応型テスト(CAT)と呼ばれる。
CATは、その概念を測定するための数多くの項目の集合体である「項目バンク」を持ち、各項目は、項目反応理論(Item response theory: IRT)を用いてその難易度が決定され順序づけされている。最初に基準となる項目を提示し、その回答によって基準項目よりも難易度の高いあるいは低い項目が項目バンクの中から選択され提示される。そのため、回答者によって回答する項目群は異なる。しかも、その回答者の状態に見合う項目を集めて詳しく測定できるため、測定結果の制度は高くなる。
CATは、従来の紙とペンによるPRO評価に比べて大きな利点を持つ。その人の状態に合った質問群に集中的に回答してもらうことにより、回答者の負担を減らしながら、高い精度のスコアが得られる。一方で、そのプロセスは複雑であり、大規模な項目バンクの開発・検証・調整、システム設計などには膨大な時間や手間、費用がかかる。
PRO評価においてはすでにCATを応用したPROMISシステムが整備され、広く活用されている(2.7.7参照)。
(鈴鴨 よしみ)
2.7.7. PROMIS®
Patient-Reported Outcomes Measurement Information System(PROMIS)は、小児や成人を対象に身体的、精神的、社会的な健康を評価、モニターすることを目的に開発された、患者報告アウトカムの項目バンクである。この項目バンクから、Computer adaptive testing(CAT)版、短縮版、プロファイル版の質問紙を作成することが可能となっている。Northwestern Universityの研究者が中心となってPROMISの管理が行われている。
PROMIS開発プロジェクトは、米国のNIHの助成のもと、2004年にスタートした 79。公的に利用可能、効率的かつ柔軟性に富んだPRO測定尺度を開発、検証することを目的としていた。開発の第一段階では、オンラインパネルと病院にて対象集団のリクルートが行われた。2005年から2008年にかけて、21,133名に対して項目反応理論を用いたキャリブレーションが実施された。14の項目プールから11の項目バンクが使用可能となり、キャリブレーションが行われた912項目のうち454項目が項目バンクに収められた。それぞれの項目バンクから短縮版も作成され、一般に使用可能となった。さらに開発が進められ、一般集団や慢性疾患を有する患者を対象とした、300種類以上の患者報告アウトカム指標が提供されている(2022年8月時点)。
PROMISの主たる特徴は、最新の科学的な方法を用いて計量心理学的に適切に開発され、妥当性の検証がなされていることである。また、様々な研究や臨床の場において、臨床家と患者の間のコミュニケーションを反映するようにデザインされている。症状や機能の評価において、あらゆる状態に対応できるよう工夫されている。オリジナルの英語版のほか、翻訳版も多数作成されている。日本語版は2022年時点で開発中である。
フォーマットとして、紙媒体、コンピュータ、アプリでの使用が可能となっている。紙媒体は短縮版とプロファイル版の使用となる。コンピュータやアプリでは、PROMIS CAT版、短縮版やプロファイル版が使用可能である。コンピュータのプラットホームとして、REDCap 80、Epic 81、Assessment Center Application Programming Interface等がPROMISのウェブサイト 82 で紹介されている。アプリとして、PROMIS iPad AppとNational Institutes of Health Toolbox® iPad Appが利用可能である。
短縮版は、ひとつのドメインあたり4~10項目で構成されている。CAT版では対象者の回答パターンに応じて項目バンクから項目が選択され提示される。プロファイル版は、複数ドメインの短縮版あるいはCAT版の組み合わせで構成されている。ちなみに、CAT版はウェブサイト上で簡単なデモを行うことができる 83。
対象者の区分において、成人用(PROMIS Adult)および小児用(PROMIS Pediatric)に大別される。両者とも“Global Health”、“Physical Health”、“Mental Health”、“Social Health” で構成されている。PROMIS Pediatricは小児自身の回答と両親の代理回答で構成されている。PROMIS Adultは1903項目(102ドメイン)、PROMIS Pediatric Self-Report(8~17歳)and Parent Proxy Report(5~17歳)は602項目(25ドメイン)、PROMIS Early Childhood Parent-Report(1~5歳)は225項目(12ドメイン)、PROMIS Parent Proxy for Pediatric Patients(5~17歳)は520項目(22ドメイン)を有している。各々の詳細や使用方法については、ウェブサイト 84 を参照されたい。
(内藤 真理子)
- Reeve BB, Wyrwich KW, Wu AW, et al. ISOQOL recommends minimum standards for patient-reported outcome measures used in patient-centered outcomes and comparative effectiveness research. Qual Life Res. 2013; 22(8): 1889-905.
- US. Food and Drug Administration. Clinical Outcome Assessment Compendium. https://www.fda.gov/drugs/development-resources/clinical-outcome-assessment-compendium(最終アクセス日:2022年8月25日)
- Green CP, Porter CB, Bresnahan DR, et al. Development and evaluation of the Kansas City Cardiomyopathy Questionnaire: a new health status measure for heart failure. J Am Coll Cardiol. 2000; 35(5): 1245-55.
- Leidy NK, Murray LT, Monz BU, et al. Measuring respiratory symptoms of COPD: performance of the EXACT- Respiratory Symptoms Tool (E-RS) in three clinical trials. Respir Res. 2014; 15(1): 124.
- Leidy NK, Wilcox TK, Jones PW, et al. Standardizing measurement of chronic obstructive pulmonary disease exacerbations. Reliability and validity of a patient-reported diary. Am J Respir Crit Care Med. 2011; 183(3): 323-9.
- Leidy NK, Wilcox TK, Jones PW, et al. Development of the EXAcerbations of Chronic Obstructive Pulmonary Disease Tool (EXACT): a patient-reported outcome (PRO) measure. Value Health. 2010; 13(8): 965-75.
- McCarrier KP, Deal LS, Abraham L, et al. Patient-centered research to support the development of the Symptoms of Major Depressive Disorder Scale (SMDDS): Initial qualitative research. Patient. 2016; 9(2): 117-34.
- Bushnell DM, McCarrier KP, Bush EN, et al. Symptoms of major depressive Disorder Scale: Performance of a Novel Patient-Reported Symptom Measure. Value Health. 2019; 22(8): 906-15.
- aut RL, Cleeland CS, Flanery RC. Development of the Wisconsin Brief Pain Questionnaire to assess pain in cancer and other diseases. Pain. 1983; 17(2): 197-210.
- Cleeland CS, Ryan KM. Pain assessment: global use of the Brief Pain Inventory. Ann Acad Med Singap. 1994; 23(2): 129-38.
- ePRO Consortium, Critical Path Institute. Best Practices for Electronic Implementation of Response Scales for Patient-Reported Outcome Measures. https://c-path.org/wp-content/uploads/2022/02/BestPractices2_Response_Scales.pdf(最終アクセス日:2022年8月25日)
- Shimozuma K, Ohashi Y, Takeuchi A, et al. Feasibility and validity of the Patient Neurotoxicity Questionnaire during taxane chemotherapy in a phase III randomized trial in patients with breast cancer: N-SAS BC 02. Support Care Cancer. 2009; 17(12): 1483-91.
- Hausheer FH, Schilsky RL, Bain S, et al. Diagnosis, management, and evaluation of chemotherapy-induced peripheral neuropathy. Semin Oncol. 2006; 33: 15-49.
- Shimozuma K, Ohashi Y, Takeuchi A, et al. Feasibility and validity of the Patient Neurotoxicity Questionnaire during taxane chemotherapy in a phase III randomized trial in patients with breast cancer: N-SAS BC 02. Support Care Cancer. 2009; 17(12): 1483-91.
- Shimozuma K, Ohashi Y, Takeuchi A, et al. Taxane-induced peripheral neuropathy and health-related quality of life in postoperative breast cancer patients undergoing adjuvant chemotherapy: N-SAS BC 02, a randomized clinical trial. Support Care Cancer. 2012; 20(12): 3355-64.
- Basch E, Reeve BB, Mitchell SA, et al. Development of the National Cancer Institute's patient-reported outcomes version of the common terminology criteria for adverse events (PRO-CTCAE). J Natl Cancer Inst. 2014; 106(9): dju244.
- Bennett AV, Dueck AC, Mitchell SA, et al. Mode equivalence and acceptability of tablet computer-, interactive voice response system-, and paper-based administration of the U.S. National Cancer Institute's Patient -Reported Outcomes version of the Common Terminology Criteria for Adverse Events (PRO-CTCAE). Health Qual Life Outcomes. 2016; 14: 24.
- Basch E, Becker C, Rogak LJ, et al. Composite grading algorithm for the National Cancer Institute's Patient-Reported Outcomes version of the Common Terminology Criteria for Adverse Events (PRO-CTCAE). Clin Trials. 2021; 18(1): 104-14.
- Ware J, Snow K, Kosinki M, et al. SF-36 Health Survey: manual and interpretation guide. Boston: The Health Institut. 1993.
- Fukuhara S, Bito S, Green J, et al. Translation, adaptation, and validation of the SF-36 Health Survey for use in Japan. J Clin Epidemiol. 1998; 51(11): 1037-44.
- Ware J, Kosinski M, Dewey J. How to score and interpret single-item health status measures: a manual for users of the SF-8™ Health Survey. Lincoln: Quality Metrics 2001.
- Aaronson NK, Ahmedzai S, Bergman B, et al. The European Organization for Research and Treatment of Cancer QLQ-C30: a quality-of-life instrument for use in international clinical trials in oncology. J Natl Cancer Inst. 1993; 85(5): 365-76.
- Kobayashi K, Takeda F, Teramukai S, et al. A cross-validation of the European Organization for Research and Treatment of Cancer QLQ-C30 (EORTC QLQ-C30) for Japanese with lung cancer. Eur J Cancer. 1998; 34(6): 810-5.
- Cella DF, Tulsky DS, Gray G, et al. The Functional Assessment of Cancer Therapy scale: development and validation of the general measure. J Clin Oncol. 1993; 11(3): 570-9.
- Fumimoto H, Kobayashi K, Chang CH, et al. Cross-cultural validation of an international questionnaire, the General Measure of the Functional Assessment of Cancer Therapy scale (FACT-G), for Japanese. Qual Life Res. 2001; 10(8): 701-9.
- Watanabe T, Sano M, Takashima S, et al. Oral uracil and tegafur compared with classic cyclophosphamide, methotrexate, fluorouracil as postoperative chemotherapy in patients with node-negative, high-risk breast cancer: National Surgical Adjuvant Study for Breast Cancer 01 Trial. J Clin Oncol. 2009; 27: 1368-74.
- Ohsumi S, Shimozuma K, Ohashi Y, et al. Health-related quality of life and psychological distress of breast cancer patients after surgery during a phase III randomized trial comparing continuation of tamoxifen with switching to anastrozole after adjuvant tamoxifen for 1-4 years: N-SAS BC 03. Breast Cancer Res Treat. 2011; 127(1): 143-52.
- Shimozuma K, Ohashi Y, Takeuchi A, et al. Taxane-induced peripheral neuropathy and health-related quality of life in postoperative breast cancer patients undergoing adjuvant chemotherapy: N-SAS BC 02, a randomized clinical trial. Support Care Cancer. 2012; 20(12): 3355-64.
- Taira N, Iwata H, Hasegawa Y, et al. Health-related quality of life and psychological distress during neoadjuvant endocrine therapy with letrozole to determine endocrine responsiveness in postmenopausal breast cancer. Breast Cancer Res Treat. 2014; 145(1): 155-64.
- Yagata H, Ohtsu H, Komoike Y, et al. Joint symptoms and health-related quality of life in postmenopausal women with breast cancer who completed 5 years of anastrozole. Support Care Cancer. 2016; 24(2): 683-9.
- Kawahara T, Shimozuma K, Shiroiwa T, et al. Patient-reported outcome results from the open-label randomized phase III SELECT BC trial evaluating first-line S-1 therapy for metastatic breast cancer. Oncology. 2018; 94(2): 107-15.
- Oritani K, Ohishi K, Okamoto S, et al. Effect of ruxolitinib therapy on the quality-of-life of Japanese patients with myelofibrosis. Curr Med Res Opin. 2018; 34(3): 531-7.
- 下妻晃二郎.医療の効率性と公平性(総論).日内会誌. 2014; 103(5): 1203-9.
- 下妻 晃二郎. QOL評価研究の歴史と展望. 行動医学研究. 2015; 21(1): 4-7.
- Herdman M, Gudex C, Lloyd A, et al. Development and preliminary testing of the new five-level version of EQ-5D (EQ-5D-5L). Qual Life Res. 2011; 20(10): 1727-36.
- 池田俊也,白岩健,五十嵐中,他.日本語版EQ-5D-5Lにおけるスコアリング法の開発.保健医療科学. 2015; 64(1): 47-55.
- Feeny D, Furlong W, Boyle M, et al. Multi-attribute health status classification systems. Health Utilities Index. Pharmacoeconomics. 1995; 7(6): 490-502.
- Horsman J, Furlong W, Feeny D, et al. he Health Utilities Index (HUI): concepts, measurement properties and applications. Health Qual Life Outcomes. 2003; 16: 1-54.
- Noto S, Shiroiwa T, Kobayashi M, et al. Development of a multiplicative, multi-attribute utility function and eight single-attribute utility functions for the Health Utilities Index Mark 3 in Japan. J Patient Rep Outcomes. 2020; 4(1): 23.
- Shiroiwa T, Noto S, Fukuda T. Japanese Population Norms of EQ-5D-5L and Health Utilities Index Mark 3: Disutility Catalog by Disease and Symptom in Community Settings. Value Health. 2021; 24(8): 1193-202.
- Brazier J, Roberts J, Deverill M: The estimation of a preference-based measure of health from the SF-36. J Health Econ 2002; 21(2): 271-92.
- Brazier JE, Fukuhara S, Roberts J, et al. Estimating a preference-based index from the Japanese SF-36. J Clin Epidemiol. 2009; 62(12): 1323-31.
- King MT, Costa DSJ, Aaronson NK, et al. QLU-C10D: a health state classification system for a multi-attribute utility measure based on the EORTC QLQ-C30. Qual Life Res. 2016; 25(3): 625-36.
- King MT, Norman R, Mercieca-Bebber R, et al., Multi-Attribute Utility in Cancer Consortium. The Functional Assessment of Cancer Therapy Eight Dimension (FACT-8D), a Multi-Attribute Utility Instrument Derived From the Cancer-Specific FACT-General (FACT-G) Quality of Life Questionnaire: Development and Australian Value Set. Value Health. 2021; 24(6): 862-73.
- Rand S, Malley J, Towers AM, et al. Validity and test-retest reliability of the self-completion adult social care outcomes toolkit (ASCOT-SCT4) with adults with long-term physical, sensory and mental health conditions in England. Health Qual Life Outcomes. 2017; 15(1): 163.
- Malley JN, Towers N, Netten AM, et al. An assessment of the construct validity of the ASCOT measure of social care-related quality of life with older people. Health Qual Life Outcomes. 2012; 10: 21.
- Shiroiwa T, Moriyama Y, Nakamura-Thomas H, et al. Development of Japanese utility weights for the Adult Social Care Outcomes Toolkit (ASCOT) SCT4. Qual Life Res. 2020; 29(1): 253-63.
- US Food and Drug Administration.. Guidance for industry patient-reported outcome measures: Use in medical product development to support labeling claims. Silver Spring: US Food and Drug Administration, 2009.
- European Medicines Agency... Appendix 2 to the guideline on the evaluation of anticancer medicinal products in man. The use of patient-reported outcome (PRO) measures in oncology studies. London EMA, 2016.
- Sneeuw KC, Sprangers MA, & Aaronson NK. (2002). The role of health care providers and significant others in evaluating the quality of life of patients with chronic disease. J Clin Epidemiol. 2002; 55(11): 1130-43.
- Matza LS, Patrick DL, Riley AW, et.al. Pediatric patient-reported outcome instruments for research to support medical product labeling: report of the ISPOR PRO good research practices for the assessment of children and adolescents task force. Value Health. 2013; 16(4): 461-79.
- Matza LS, Swensen AR, Flood EM, et al. Assessment of health-related quality of life in children: a review of conceptual, methodological, and regulatory issues. Value Health. 2004; 7(1): 79-92.
- Varni JW, Seid M, and Rode CA. The PedsQL™: measurement model for the pediatric quality of life inventory. Medical care. 1999; 126-39.
- Varni, JW, Seid M, and Kurtin PS. PedsQL™ 4.0: Reliability and validity of the Pediatric Quality of Life Inventory™ Version 4.0 Generic Core Scales in healthy and patient populations. Medical care. 2001; 800-12.
- Kobayashi K, Okano Y, and Hohashi N. Reliability and validity of the PedsQL™ multidimensional fatigue scale in Japan. Qual Life Res 2011; 20(7): 1091-102.
- Wille N, Badia X, Bonsel G, et al. Development of the EQ-5D-Y: a child-friendly version of the EQ-5D. Qual Life Res 2010; 19(6): 875-86.
- Ravens-Sieberer U, Wille N, Badia X, et al. Feasibility, reliability, and validity of the EQ-5D-Y: results from a multinational study. Qual Life Res. 2010; 19(6): 887-97.
- Shiroiwa T, Fukuda T, and Shimozuma K. “Psychometric properties of the Japanese version of the EQ-5D-Y by self-report and proxy-report: reliability and construct validity.” Qual Life Res. 2019; 28(11): 3093-105.
- Shiroiwa T, Ikeda S, Noto S, et al. Valuation Survey of EQ-5D-Y Based on the International Common Protocol: Development of a Value Set in Japan. Med Decis Making. 2021; 41(5): 597-606.
- Shiroiwa T, Fukuda T. EQ-5D-Y Population Norms for Japanese Children and Adolescents. Pharmacoeconomics. 2021; 39(11): 1299-308.
- Morel, T., & Cano, S. J. Measuring what matters to rare disease patients - reflections on the work by the IRDiRC taskforce on patient-centered outcome measures. Orphanet journal of rare diseases. 2017; 12(1): 171.
- U.S. Department of Health and Human Services Food and Drug Administration. Guidance for Industry: Electronic Source Data in Clinical Investigations, (2013). Available from: https://www.fda.gov/media/85183/download(アクセス最終日2022年8月21日)
- 日本製薬工業協会 医薬品評価委員会. 臨床試験データの電子的取得に関するガイダンス追補. [Internet]. (2012). Available from: https://www.jpma.or.jp/basis/guide/lofurc0000001ywz-att/20120110guidance.pdf(アクセス最終日2022年8月21日)
- 日本製薬工業協会 医薬品評価委員会 電子化情報部会タスクフォース3. ePRO の普及に向けて. [Internet]. (2016). Available from: https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc0000005mry-att/epro.pdf(アクセス最終日2022年8月21日)
- e-Gov法令検索. 民間事業者等が行う書面の保存等における情報通信の技術の利用に関する法律. [Internet]. (2005). Available from: https://elaws.e-gov.go.jp/document?lawid=416AC0000000149_20200107_430AC0000000080(アクセス最終日2022年8月21日)
- e-Gov法令検索. 厚生労働省の所管する法令の規定に基づく民間事業者等が行う書面の保存等における情報通信の技術の利用に関する省令. [Internet]. (2005). Available from: https://elaws.e-gov.go.jp/document?lawid=417M60000100044(アクセス最終日2022年8月21日)
- 独立行政法人医薬品医療機器総合機構. 医薬品等の承認又は許可等に係る申請等における電磁的記録及び電子署名の利用について. [Internet]. (2005). Available from: https://www.pmda.go.jp/files/000158308.pdf(アクセス最終日2022年8月21日)
- 独立行政法人医薬品医療機器総合機構. 医薬品の臨床試験の実施の基準に関する省令. [Internet]. (1997). Available from: https://www.pmda.go.jp/int-activities/int-harmony/ich/0076.html(アクセス最終日2022年8月21日)
- 一般社団法人日本QA研究会.(厚生労働省発行).「医薬品の臨床試験の実施の基準に関する省令」の運用について. [Internet]. (2011). Available from: https://www.jsqa.com/download/doc/081225_1_1001001_pdf.pdf(アクセス最終日2022年8月21日)
- Coons SJ, Gwaltney CJ, Hays RD, et al. Recommendations on evidence needed to support measurement equivalence between electronic and paper-based patient-reported outcome (PRO) measures: ISPOR ePRO good research practices task force report. Value Health. 2009; 12(4): 419-29.
- Muehlhausen W, Byrom B, Skerritt B, et al. Standards for instrument migration when implementing paper patient-Reported Outcome Instruments Electronically: Recommendations from a Qualitative Synthesis of Cognitive Interview and Usability Studies. Value Health 2018; 21(1): 41-8.
- Society for Clinical Data Management. Good Clinical Data Management Practices. [Internet]. 2013. [cited 2022 Feb 15]. Available from: https://scdm.org/wp-content/uploads/2019/10/21117-Full-GCDMP-Oct-2013.pdf
- Society for Clinical Data Management. A Data Management Perspective on the Use of Mobile Health Technology. September 30. 2016. Available from: https://cdn.fs.pathlms.com/84do5ymqQ0Gaqw3i3kOj?cache=true(アクセス最終日2022年8月21日)
- 総務省. 電波利用ホームページ. Available from: https://www.tele.soumu.go.jp/index.htm(アクセス最終日2023年2月1日)
- 経済産業省. 電気用品安全法. Available from: https://www.meti.go.jp/policy/consumer/seian/denan/(アクセス最終日2023年2月1日)
- 日本製薬工業協会 医薬品評価委員会 臨床評価部会タスクフォース1. 医薬品開発におけるデジタルバイオマーカー(dBM)の利活用と要件.[Internet]. (2022). Available from: https://www.jpma.or.jp/information/evaluation/results/allotment/rfcmr0000000216e-att/digital_biomarker_202204.pdf(アクセス最終日2023年2月1日)
- 日本製薬工業協会 医薬品評価委員会 臨床評価部会. 医療機関への来院に依存しない臨床. [Internet]. (2022). Available from: https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc0000005jr6-att/tf3-cdt_00.pdf(アクセス最終日2023年2月1日)
- Revicki DA, Cella DF.; Health status assessment for the twenty-first century: item response theory, item banking and computer adaptive testing. Qual Life Res. 1997; (6): 595-600.
- Cella D, Riley W, Stone A, et al. The Patient-Reported Outcomes Measurement Information System (PROMIS) developed and tested its first wave of adult self-reported health outcome item banks: 2005-2008. J Clin Epidemiol. 2010;63(11):1179-94.
- Research Electronic Data Capture: https://projectredcap.org/(アクセス最終日2022年5月26日)
- EPIC: https://www.epic.com/ (アクセス最終日2022年5月26日)
- PROMIS®: https://www.healthmeasures.net/explore-measurement-systems/promis (アクセス最終日2022年5月26日)
- PROMIS® Assessment Center: https://www.assessmentcenter.net/ac1/Default.aspx?SID=B5770CA1-23F7-41D4-B209-5606EFEE1BED (アクセス最終日2022年5月26日)
- Intro to PROMIS®: https://www.healthmeasures.net/explore-measurement-systems/promis/intro-to-promis アクセス最終日(2022年5月26日)
参考文献