...

Laboratory Medicine Best Practices: Systematic

by user

on
Category: Documents
14

views

Report

Comments

Transcript

Laboratory Medicine Best Practices: Systematic
Laboratory Medicine Best Practices: Systematic Evidence Review and
Evaluation Methods for Quality Improvement
Robert H. Christenson1,*, Susan R. Snyder2, Colleen S. Shaw2, James H. Derzon3, Robert S. Black3, Diana
Mass4, Paul Epner5, Alessandra M. Favoretto3 and Edward B. Liebow3
1
University of Maryland School of Medicine, Baltimore, MD;
2
Centers for Disease Control and Prevention, Laboratory Research and Evaluation Branch, Division of
Laboratory Science and Standards, Office of Surveillance, Epidemiology, and Laboratory Services, Atlanta,
GA;
3
Battelle Centers for Public Health Research and Evaluation, North Seattle, WA;
4
Arizona State University, School of Life Sciences, Clinical Laboratory Sciences, Tempe, AZ;
5
Paul Epner LLC, 1501 Hinman Ave., Evanston, IL.
* Address correspondence to this author at:University of Maryland School of Medicine, 22 S. Greene St.,
Baltimore, MD 21201. Fax410-218-6454; e-mail [email protected].
Clinical Chemistry
2011; 57: 816-825
臨床検査医学ベストプラクティス:品質改良のための系統的な証
拠調査および評価方法
概要
目的: より良いヘルスケアを実現するという目標において、どの様な検査(Laboratory Medicine)
及び手法が、効果的であるかを評価することを目的とする、エビデンスの体系的な評価方法を確立
することを本検討の目的とした。
関連性: 様々なエビデンスの評価方法が確立されているが、ヘルスケアの改善という観点から、患
者の安全性と検査の質の向上を目的として、エビデンスに基づいて検査及び手法を評価する方法は
未だに確立されていない。
方法: 政府機関によって確立されたエビデンスに基づく医療、公衆衛生に関する指針及びそれ他の
指針を、臨床検査分野に合う様に改変した。主な変更点としては(a)検査の質の改善という観点か
らの評価を盛り込んだ点、(b)未発表のデータもエビデンスとして評価に含めることが出来る様に
した点、(c)試験の質、効果及び結果の妥当性に関する、個々の評価結果を合算することによって、
エビデンスの一貫性を評価出来る様にした点、(d)全体的なエビデンスの強さを算出することによ
って、エビデンスに基づいた最も推奨される手法(Best Practice)をサポート出来る様にした点であ
1
る。我々が確立した方法は、探求し(ask)、獲得し(acquire)、査定し(appraise)、分析し
(analyze)、適用し(apply)そして評価する(assess)というステップからなっている。米国医学
研究所(Institute of medicine)が掲げる、ヘルスケア改善目標(安全、迅速、実際的、公正、効果的、
患者中心)を実現することを目的に、手法の有効性に関して、体系的なエビデンスの評価を実施し
た。
結論:他分野で確立されたアプローチの方法を臨床検査分野に改変し、公表済み及び未発表のデー
タを検証して、検査分野における手法を体系的に評価することが可能であることを明らかにした。
このアプローチの方法によって、エビデンスを体系的に評価し、且つ統合することによって、最も
効果的な手法が何であるかを確認することができることが示された。我々が確立した、実際的で且
つ科学的に検証されたアプローチによって、治療の方針を決めるポジションにある臨床家が、ヘル
スケアの質及び公衆衛生を改善するために必要となるエビデンスを、確実に手に入れることができ
る様になるであろう。
年間 100,000 件にも及ぶ死亡例が、医療過誤によるものとなっており(1–3)、患者の安全とヘルス
ケアの質の改善を望む声が高まっている。120 以上のエビデンス評価システムが開発されているが
(4)、エビデンスに基づいて最も効果的な検査手法を同定する為のシステムは、存在していない。こ
の理由から、米国疾病管理予防センター(CDC)の検査学及び標準物質部門(Division of Laboratory
Science and Standards ;DLSS)は、体系的で透明性のあるエビデンスの評価方法、およびヘルスケ
アの質を改善する為に、最も効果的な手法を同定する方法の開発をサポートしてきた。本報告にお
いては、患者を中心におき、安全で、タイムリー、実際的で効果的、且つ公正なヘルスケアを提供
するという、米国医学研究所が掲げる 6 つのヘルスケア目標を実現することを目的に、ヘルスケア
の質及び患者の予後を改善することにおいて効果的な手法を同定する為に、CDC によるイニシアチ
ブ(LMBP)によって開発された、体系的なエビデンスの評価方法について論じる(1)。
本報告において論ずる手法(Practice)とは、プロトコール、手順、方針、技術、工程、システム、
基準、動機付け、活動、相互作用など、患者にヘルスケアを提供する為に用いられるものをいう。
検査の役割は、診断、治療、管理あるいは疾病の予防に関する判断に影響を与え、患者の予後を改
善する為のアクションに結びついて行く、各種試験サービスを提供することである(5)。一方で、試
験とは、プレアナリティカル(preanalytical)(試験方法の選択、患者の同定、検体の採取及び同
定)、アナリティカル(analytical)(分析対象の測定)及び ポストアナリティカル
(postanalytical)(結果の報告及びアクション)という、3 つのフェーズから成り立っている(6)。エ
ラーの殆どは、プレアナリティカル・フェーズとポストアナリティカル・フェーズで生じており
(7–10)、LMBP としてはそれらのフェーズにおける手法に焦点を当てている。
LMBP はエビデンスの注意深い評価と、エビデンスの統合に基づいて、推奨事項を纏めている。そ
のプロセスには透明性があり、科学的に健全で、タイムリー、包括的で、全ての利害関係者と公衆
に対してオープンなものとなっている。例え異なるチームがレビューしたとしても、同じエビデン
スに基づく限りは、同じ結論が導き出される様なシステムとなっている。最も推奨される手法
(Best-practice recommendations)は特定のグループ、スポンサー、あるいは政治的な配慮に影響を
受けない、独立した組織によってリリースされ、それに対する全ての対立する利害関係が開示され
る様なシステムとなっている。エビデンスに基づく手法を特定し、広めるにあたっては、LMBP は
2
既存の知見を単に繰り返し述べる様なことはせず、むしろそれらを更に統合していく様なプロセス
を構築している。
本報では、LMBP による体系的なエビデンス評価プロセスについて論ずる。LMBP のプロセスに関
する指針は参考例と共に、Phase 3 final technical report (11)に含まれている(本報のオンラインバー
ジョンの Supplement A も参照願いたい http://www.clinchem.org/content/vol57/issue6)。
検査において最も推奨される手法を同定する為の A6 サイクル
LMBP の体系的な評価プロセスの概要を、図 1 に示す。このプロセスは部分的にではあるが、エビ
デンスに基づいた医療手法の評価における標準的な方針("Ask、 Acquire、Appraise、Apply および
Assess") (12, 13)から導き出されたものである。LMBP のプロセスに加えられた重要なポイント
は、 Analysis(分析) である (14)。US Preventive Services Task Force(15, 16)、Agency for
Healthcare Research and Quality (17)、Guide to Community Preventive Services (18)及び Price and
Christenson (19)によって確立された、エビデンスに基づく医学の方法論の要素も盛り込まれてい
る。LMBP の方法を適用するには、独立した作業グループ、評価チームおよび分野毎の専門家グル
ープ等の、異なるグループ間の作業をコーディネイトする必要がある。作業グループは、検査の分
野における専門家及びそれ以外のヘルスケアやエビデンスの評価方法に関して、訓練を受けた人間
から成る。作業グループは CDC によって招集され、最も推奨される手法(Best-practice
recommendations)を決める最終的な権限を有している。評価チームはエビデンスとして使用する為
のデータを、各種試験からスクリーニングし、要約し、評価するトレーニングを受けた人達で構成
される。専門家グループは対象となる分野、エビデンスの評価方法及び検査室の運営に関して、知
識を持った人達で構成される。専門家グループは研究成果、所属組織及び活動実績を元に選出され
る。専門家グループは LMBP の方法に基づいて統合されたエビデンス、及び評価チームによって提
案された評点を、エビデンスの強さの観点から評価し、個々の手法に関する評価結果を纏め、知見
を推奨事項としてまとめる。専門家グループによって提案された推奨事項は、作業グループによっ
て審査されることとなる。
図 1.
LMBP の体系的な評価プロセスの概要
3
©Adapted with permission from the CDC on behalf of the LMBP initiative from CDC Laboratory Medicine
Best Practices Team (11). Supplements A and C can be found in the Data Supplement that accompanies the
online version of this special report at http://www.clinchem.org/content/vol57/issue6. The Evidence-Based
Practice Cycle and LMBP Systematic Review Process are transparent and replicable approaches to driving
continuous improvement by identifying evidence-based best practices, with special emphasis in the preanalytic
and postanalytic stages of the testing process, during which most preven 表 LM errors occur.
トピックの選定
トピックの候補は、個人あるいは組織によって www.futurelabmedicine.org で提案される。提案され
たトピックは作業グループによって選別され、優先順位が付けられる。選定されたトピックは検査
における特定の課題もしくは問題を議論するもので、以下の 3 つの基準を満たすものでなければな
らない:
エビデンス:
少なくとも中庸なレベルのエビデンスが存在すること。
結果の測定:
米国医学研究所の目標(1)の少なくとも一つと合致する結果が存在すること。
手法:
検査の質もしくは患者の予後に影響を与る、少なくとも 3 つの手法が存在すること。
作業グループの承認の後に、提案者及び関連する作業グループのメンバー、及びその分野の専門家
が協力して、評価にあたっての論点を少なくとも 1 つ設定する。
論点の設定
エビデンスの評価にあたって、1 つあるいは複数の論点が設定される。公表された文献のレビュー
を通じて収集された情報に基づいて、論点が設定される (online Data Supplement の Supplement B を
参照)。論点の設定にあたっては PICO ストラテジー(P, 対象となる患者群; I, 介入; C, コンパレー
ターの手法; O, 結果)(12–16, 19)を考慮しなければならない。評価のプロセスにおいて新たな知
見が得られた場合には、エビデンスの分析方針は適宜修正されなければならない。
エビデンスの基礎の獲得
関連するエビデンスを入手することが、その後の作業の基礎となる。PRISMA (Prevention Recovery
Information System for Monitoring and Analysis)グループ(20)の推奨に基づき、公表された文献か
ら得られるエビデンスを検討する一方で、試験のデザインが妥当であると判断される未発表のデー
タベースからのエビデンスも、積極的に探求している。評価における論点、想定される課題、治療
方針、期待効果から導き出されるキーワードが、エビデンスの獲得に関して有効なツールとなる。
文献の検索は包括的に行われる。専門家グループ、当該分野の権威、および作業グループメンバー
の意見を仰ぐことも、エビデンスの検索にあたっては有効である。
LMBP イニシアチブは、専門家、ラボ、病院及びその他のヘルスケア事業体のリーダーにコンタク
トすることによって、未発表の試験データにもアクセスするべく努力を払ってきた。通常、これら
4
の評価は 試験 もしくは 研究 と呼ばれるものでは無い。それでもなお、手法の効果を査定する上
で、妥当なエビデンスを提供するものとなっている(21–23)。未発表のエビデンスについては、発
表される試験データと同じ基準で信憑性が判定されることになっている。
透明性を維持する為に LMBP による評価レポートには、エビデンスの検索方針、キーワード、情報
源、未発表データの探索方法が記載されることになっている。文献検索によって見つけられた試験
の数も、レポートに記載されることになっている。
個々の試験結果の鑑定
鑑定のステップは、集められた試験結果のスクリーニングから始まる。スクリーニングは 2 人の鑑
定人によって、別々に行われる。鑑定は記述された手法が、同等な条件下で再現可能かどうか、ヘ
ルスケアの質に対して影響があるかどうかという観点で行われる(online Data Supplement の
Supplement C を参照)。 透明性を維持する目的で、LMBP によるエビデンスの鑑定報告には、どれ
だけの数の文献及び試験結果がピックアップされ、どれだけの数の文献及び試験がどんな理由で却
下されたか、どれだけの数の文献及び試験が最終的なレビューに残されたか、全ての潜在的なエビ
デンスに対する評価が盛り込まれることになっている (20)。
鑑定は抽出及び鑑定ツール(詳細は online Data Supplement の Supplement C を参照)を使って、試験
情報を要約することによって行われる。偏見を排除をする為に、二人の鑑定人が各試験を要約し、
お互いの結果を比較することになっている。試験の要約及び鑑定に関して、意見の相違が生じた場
合には、協議によって調整を図ることになっている。協議では調整できない場合には、三人目の鑑
定人が試験の要約を行い、結論を導き出すことになる。データが要約されるとそれぞれの試験に対
して、エビデンスの要旨表が作成される(表 1a)。表には筆者名、情報ソース、試験の質、試験の
概要、用いられた手法、結果の判定方法及び試験の結果が記載される。
5
表 1. 鑑定の為の試験の要旨表. ©CDC on behalf of the LMBP initiative, adapted with permission
from CDC Laboratory Medicine Best Practices Team (11)
個々の試験は(a)試験の質、(b)試験の効果、および(c)試験結果の判定方法の観点から設定さ
れて論点に照らして評点される。
個々の試験の質に関する評点
表 1a に示した様に、試験の質に係わる各側面は、0 点から最高得点までの間で採点される。鑑定人
は各ポイントの根拠を示した上で、各側面に関して採点案を起案する。この評点方法は既存の理論
などを応用して、LMBP によって開発されたものである(15, 16, 18, 22, 24–26)。試験そのものの確
かさには余り着眼せず、一般性及び外部要因によるバイアスの可能性にウェイトを置いている。い
ずれかの側面において 0 を与えられた試験は、選定から外されることになる。ガイダンス及び評点
の基準の詳細については、LMBP Guide to Rating Study Quality(Supplement D in the online Data
Supplement)及び LMBP Data Abstraction Codebook (Supplement C in the online Data Supplement)を参
照願いたい。
鑑定の為の試験の要旨表(表 1a)における各側面の評点は、エビデンスの鑑定サマリー表で取りま
とめられる(表 1b)。試験の各側面に対する評点が集計され(最大で 10 点)、各試験に対して評
点が、次の様に定められる: good = 8–10; fair = 5–7; poor 4 (表 1b)。"Poor"という評価を下された
6
試験は、エビデンスから外されることになる。各試験に対する評点が定められた後で影響の大きさ
に関する評点が、表の一番右側に書き込まれる(表 1b)。
影響の大きさに関する評価
影響の大きさに関する評価をする際、 鑑定人は LMBP の判断に一番大きな影響を与える試験結果の
判定方法に焦点を当てる。"関連性(Relevance)"は評価の論点、および報告されている結果の判定
方法と、ヘルスケアの質もしくは安全性の関係性に関して評価されるものである。"直接的
(Direct)" という評価は検証可能で、直接的で、問題あるいは品質における課題および米国医学研
究所の目標との間に、密接な関係があるということを示す。"やや直接的(Less direct)"という評価
は、直接的な関係が見られないか、もしくは大きく推論に大きく異存していると判断される場合に
付けられる。"(間接的)Indirect"という評価は、結果が推察に基づくものである場合、もしくは目
的に関連しているという理由だけで結論付けられている場合に付与される。結論に関して種々の異
なる分析方法が用いられている場合、比較しやすくする為に共通のメトリックスに当てはめられる。
エラーの比率、基準を満たす検体の比率、決められた時間内に報告される結果の割合などに応じて、
分析オッズ比が計算される。平均値、SD、発症までの時間、エラーの平均数等に関しては、対応す
る影響の大きさが標準化された指標となる(Cohen's d)(27)。
個々の試験に対して影響の大きさは次の様に分類される:
Substantial:
提案された手法の実施を推奨するに十分な(もしくは提案された手法を否定するに
十分な)影響力を有している
Moderate:
提案された手法を実施推奨するにあたって(あるいは否定するにあたって)、測定さ
れた影響力が十分大きい
Minimal/none:
提案された手法を実施するべきか、しない方が良いか、判断するだけの影響力を
有しない
専門家グループは要旨表(表 1a)に要約された情報をレビューし、APPRAISE の手法で得られた
個々の試験の質及び影響の度合いに関して、コンセンサスを確立する。最終的にコンセンサスが図
られた評価が、エビデンスの鑑定サマリー表 (表 1b)に記載される。
エビデンスの分析
APPRAISE の手法は、個々の試験に焦点を当てるものであるが、分析は取りまとめられたエビデン
スを対象に実施されるステップである。適当と判断される場合、全ての試験の効果を要約する手法
として、メタアナリシスが用いられる。個々の試験の影響度は、全ての試験の総合的な影響度およ
び不確かさ(95% CI)を評価する為に、ウェイト付けされる (27, 28)。Forest プロットを用いて、
個々の試験の影響度、95%信頼区間及びメタアナリシスによる全ての試験の総合的な影響度を、プ
ロットするのが効果的である (図 2)(29)。Forest プロットは関連する試験の全体的な一貫性を
示す意味でも有効である。メタアナリシスの手法における制約については、online Data Supplement
の Supplement E を参照願いたい。
7
図. 2
(A), オッズ比の Foreast プロット. NS, not significant; Std diff, standard difference. (B), 平均/SD
値の Forest プロット
8
影響度の一貫性及び全体的なエビデンスの強さに関して、個々の試験の評点及び個々の試験と全体
の影響度に関する Forest プロットを使用して、専門家グループが評点を付ける (表 2)。Agency for
Healthcare Research and Quality によって確立された先例(17)に基づいて、評価の対象となっている
手法に関する複数の試験間の全体的な一貫性が、その影響度の相同性を元に二分法的変数として処
理される 。もし影響度に関して試験間で矛盾が無く、一定の範囲内に収束している場合には、評価
の対象となっている手法に対して、集められたエビデンスに一貫性があると判定される。LMBP の
評価方法に関しては、各試験での知見の同等性と安定性に関して当該分野の専門家グループが、コ
ンセンサスに基づいて合理性を決定する。集められたエビデンスの強さは、試験数、試験の質及び
表 2 に示される影響度に対する評価に基づいて、決められることになる。
表2
エビデンスの集約表
9
評価の対象となっている手法を推奨する場合には、専門家グループは集約されたエビデンスの全体
的な強さを評価し、High、Moderate、Suggestive、Insufficient の 4 段階にグループ分けする(11)。
各カテゴリーに対する意味するところは、下記の通り。
HIGH
特に大きな制約も無く、複数の試験結果から評価の対象となっている手法が、ヘルスケアの質に与
える実質的な影響について、十分な量の一貫性あるエビデンスが得られている。
MODERATE
特に大きな制約も無く、複数の試験の結果から評価の対象となっている手法がヘルスケアの質に与
える実質的な影響について適切もしくはある程度の量の一貫性あるエビデンスが得られている。
SUGGESTIVE
特に大きな制約は無いが、いくつかの試験から評価の対象となっている手法が、ヘルスケアの質に
与える中程度の影響について、限定的なエビデンスが得られている。あるいはいくつかの試験の質
が、あまり理想的では無い状態である。
INSUFFICIENT
評価の対象となっている手法が、ヘルスケアの質に与える影響について評価することが不可能/不明
これらのカテゴリー分けは、Guyatt らによる仕事がベースとなっている が(24)、将来得られるで
あろうエビデンスは拠り所とせず、現存するエビデンスの質と影響度を反映する様に改変されてい
る。これらのカテゴリー分けの定義は US Preventive Services Task Force によって、体系化されてい
る(16)。
表 2 に示した通り、専門家グループが個々の試験の質に対する様々なカテゴリー毎の評点を決めた
後で、集約されたエビデンスの全体的な評価が、最小限の数の試験から導き出される。
評価の対象となっている手法に対する集約されたエビデンスの全体的な評価について、専門家グル
ープが合意した後、GRADE グループの知見に調和する形でエビデンスに基づいて LMBP の推奨事
項の草案が起案される(24)。予想される弊害とメリットに加えて、直接的に査定できない潜在的
な弊害とメリットも評価する。集約されたエビデンスの全体的な強さに関する LMBP のカテゴリー
分けは、それに引き続く推奨事項カテゴリー分けに翻訳されることになる。1 から 3 の評点で分類
される(www.futurelabmedicine.org)。
RECOMMEND
ヘルスケアの質の改善に関して、高いもしくは中庸な効果が期待できる (表 2b)
評価の対象となっている手法は 最も推奨される手法(best practice) として同定される。
10
NO RECOMMENDATION FOR OR AGAINST
暗示的もしくは不十分 (表 2b)
ヘルスケアの質の改善に於けるポジティブなインパクトが不十分、もしくはエビデンスによって十
分な裏付けがされていない。
RECOMMEND AGAINST
ヘルスケアの質に対してネガティブに作用するという、高いもしくは中庸な可能性がある (表 2b)
評価の対象となった手法は不具合の方が大きいことが予想され、最適な手法とはならない。
最終ステップは、専門家グループによって作られた草案を作業グループが検討するステップである。
作業グループは LMBP の推奨事項に関して最終的に判断する権限を有する。
結果の応用
エビデンスの応用には、困難を伴う事が多い。ある調査では、推奨される緊急治療が施された比率
が僅か 53.5%であり、推奨事項に従わないことがアメリカの公衆衛生において深刻な驚異となって
いると報告されている (30)。また、米国医学研究所は新しく、効果的な手法が一般的に実施され
る様になるまでには、平均で 17 年を要すると報告している (2)。公なガイダンスに従えない理由
は、複雑で多岐に渡っている(31–33)。一つ重要な事は、利害関係者間でエビデンスに基づく推奨
事項の周知を図ることであろう。その宣伝計画の立案においては、ラボの従事者、検査関係の学会
関係者、クリニシャン、ラボの運営者、政府等の規制団体、認証団体、ポリシーメーカー及び保険
の支払い企業等といった、キーとなる利害関係者を巻き込む必要がある。LMBP による推奨事項の
宣伝と教育は、学術雑誌、ニュースレター、プレスリリース及び学会や会議などでのプレゼンテー
ションを通じて、達成される必要がある。LMBP の推奨事項、エビデンスのサマリー及び教育用の
資料は、www.futurelabmedicine.org で入手することが出来る。
LMBP による推奨事項は、その効果について十分な根拠が存在するが、それらの根拠がその様な推
奨事項を実施するかしないかについて、決定権を有する人間が抱くであろう疑問、例えば コスト的
にはどうなのか?経費を削減できるのか? あるいは コスト的に見合うのか? と言った疑問に答え
るものとは限らない。その様な疑問に対する回答を提供する為には、患者及びその家族、ヘルスケ
アの提供者及び保険支払い業者を、包括的に含めたコストを評価する為の試験も実施されるべきで
あろう。
推奨される手法に関連する潜在的なデメリットとメリットは、常に考慮されなければならない。潜
在的なメリットとしては、手法の効果を評価する上で直接的に評価されないものも含まれるであろ
11
う。間接的なメリットもしくはデメリットとしては、患者、クリニシャン、もしくはヘルスケア従
事者の満足度、プロトコールの標準化などが挙げられるかもしれない。
影響の評価/査定
LMBP の推奨事項が、検査におけるサービスを改善する上で効果があるかどうか評価することは重
要である。LMBP の体系的な評価プロセスの内部、及び外部的なバリデーションに関するアプロー
チの概要を図 1 に示す。基本的な質問としては その方法は確かな結論を導き出すのか(内部
的)? 、 同様な状況で常に同じ結果が導き出させるのか(外部的)? といった点が挙げられる。
内部的なバリデーションは、各々のエビデンスの評価に対して実施されることになっている(online
Data Supplement の Supplement A を参照)。外部的なバリデーションは、メタアナリシス的手法で評
価される影響度の比較によって、実現することができるであろう。この評価は意図される結果に関
して、改善が実現出来たかどうかという観点で測定し、モニタリングすることで達成することが出
来る。推奨事項に対するエビデンスの質を更に改善する為、且つ手法の普遍性を評価する目的で、
それらの評価結果は LMBP に集約されるべきであろう。評価の為に必要となるデータは、必ずしも
新しい試験を必要とするものではなく、日々のモニタリング活動の中から得ることが出来ると思わ
れる。
新しいデータの収集を通じた方法と結果の評価、アップデート及び改訂は、基本的にエビデンスを
評価する為のコアとなる機能である。英国においては、National Institute for Health and Clinical
Excellence が技術の査定に関するガイダンスを提供し、臨床に関するガイドラインを制定し、治療
方法及び公衆衛生関するガイダンスを提供する独立した組織となっている。National Institute for
Health and Clinical Excellence 自身の努力の効果を査定することも主な活動の一つとなっている
(34)。
LMBP による評価と推奨事項をアップデートし、更に精錬するには A6 サイクルを ASK ステップか
ら改めて適用し、ヘルスケアの質の改善に与えるインパクトと効果を評価する為のエビデンスを新
たに同定して行く必要がある。
結論
検査に於ける質の改善を目的とした体系的なエビデンスの評価方法は、医療と公衆衛生とは異なる
分野で検証された方法から開発された。その方法は A6 サイクルとして要約されるものである:つ
まり評価にあたっての論点を設定し(ASKING)、未発表の試験も含めた中から関連するエビデン
スを獲得し(ACQUIRING)、個々のエビデンスを査定し(APPRAISING)、推奨事項を導き出すた
めに集約されたエビデンスを分析し(ANALYZING)、宣伝を通じて推奨事項を臨床の現場で応用
させ(APPLYING)、そして、推奨事項の効果を評価する(ASSESSING)というサイクルである。
この方法論は患者の予後を改善することを目的に、体系的にエビデンスを要約し、エビデンスに基
づいた LMBP の推奨事項を確立する為に、適用されるものである。
(訳者:目黒
12
洋介)
Acknowledgments:
Drs. Joe Boone and Roberta Carey provided substantial support and guidance, as did the LMBP
Workgroup members and Expert Panelists. Additional assistance has been provided by Malaika
Washington, Abrienne Patta (CDC), and Judy Berkowitz, Lisa John, Betsy Payn, and Shyanika Rose
(Battelle).
Footnotes
The findings and conclusions in this article are those of the authors and do not necessarily represent the
views of the CDC.
Nonstandard abbreviations:LM, laboratory medicine; DLSS, CDC Division of Laboratory Science and
Standards, previously Division of Laboratory Systems; LMBP, Laboratory Medicine Best Practices; IOM,
Institute of Medicine.
Author Contributions: All authors confirmed they have contributed to the intellectual content of this
paper and have met the following 3 requirements: (a) significant contributions to the conception and
design, acquisition of data, or analysis and interpretation of data; (b) drafting or revising the article for
intellectual content; and (c) final approval of the published article.
Authors' Disclosures or Potential Conflicts of Interest: Upon manuscript submission, all authors
completed the Disclosures of Potential Conflict of Interest form. Potential conflicts of interest:
Employment or Leadership: None declared.
Consultant or Advisory Role: R.H. Christenson, Battelle Memorial Institute, Siemens Healthcare
Diagnostics, Critical Care Diagnostics, and BG Medicine; D. Mass, Clinical Laboratory Management
Association, Battelle Memorial Institute, and Brookline College; P. Epner, Battelle Memorial Institute.
Stock Ownership: None declared.
Honoraria: R.H. Christenson, Siemens Healthcare Diagnostics; D. Mass, COLA.
Research Funding: CDC (W911NF-07-D-0001/DO 0191/TCN 07235) to Battelle Centers for Public
Health Research and Evaluation.
Role of Sponsor: The funding organizations played no role in the design of study, choice of enrolled
patients, review and interpretation of data, or preparation or approval of manuscript.
Received for publication October 4, 2010. Accepted for publication March 8, 2011.
13
References
Institute of Medicine. To err is human: building a safer health system. Washington (DC): National
Academy Press; 2000.
1. Institute of Medicine. Crossing the quality chasm: a new health care system for the 21st century.
Washington (DC): National Academy Press; 2001.
2. Simmons J. Patient safety incidents showed little change in 2009 says HealthGrades.
Healthleaders Media. http://www.healthleadersmedia.com/content/QUA-248824/PatientSafety-Incidents-Showed-Little-Change-in-2009-Says-HealthGrades (Accessed July 2010).
3. West S, King V, Carey TS, Lohr KN, McKoy N, Sutton SF, Lux L. Systems to rate the strength
of scientific evidence. Rockville (MD): Agency for Healthcare Research and Quality; 2002.
Evidence report/technology assessment no. 47. Prepared by the Research Triangle
Institute/University of North Carolina Evidence-Based Practice Center under contract no. 290-970011. AHRQ Publication No. 02-E016.
4. Chassin MR, Galvin R. The urgent need to improve health care quality: Institute of Medicine
National Round 表 on Health Care Quality. JAMA 1998;280:1000–5.
5. Barr JT, Silver S. The total testing process and its implications for laboratory administration and
education. Clin Lab Manage Rev 1994;8:526–42.
6. Bonini P, Plebani M, Ceriotti F, Rubboli F. Errors in laboratory medicine. Clin Chem 2002;48:
691–8.
7. Carraro P, Plebani M. Errors in a STAT laboratory: types and frequencies 10 years later. Clin
Chem 2007;53:1338–42.
8. Plebani M. Errors in clinical laboratories or errors in laboratory medicine. Clin Chem 2006;44:
750–9.
9. Plebani M. Exploring the iceberg of errors in laboratory medicine. Clin Chim Acta 2009;404:
16–23.
10. CDC Laboratory Medicine Best Practices Team. Laboratory medicine best practices:
developing systematic evidence review and evaluation methods for quality improvement: Phase
3 final technical report. https:
//www.futurelabmedicine.org/pdfs/LMBP%20Executive%20Summary%20%20YR%203%20Fin
al%20Report.pdf (Accessed April 2011).
11. Price CP, Lozar J, Christenson RH eds. Applying evidence-based laboratory medicine: a stepby-step guide. Washington (DC): AACC; 2009.
14
12. Shaneyfelt T, Baum KD, Bell D, Feldstein D, Houston TK, Kaatz S, et al. Instruments for
evaluating education in evidence-based practice: a systematic review. JAMA 2006;296:1116–
27.
13. Kingsnorth J, O'Connell K, Guzzetta CE, Edens JC, Atabaki S, Mecherikunnel A, Brown K.
Family presence during trauma activations and medical resuscitations in a pediatric emergency
department: an evidence-based practice project. J Emerg Nurs 2010;36:115–21.
14. Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM, Atkins D. Current
methods of the US Preventive Services Task Force: a review of the process. Am J Prev Med
2001;20:21–35.
15. US Preventive Services Task Force. GRADE definitions. Rockville (MD): Agency for
Healthcare Research and Quality; 2008.
16. Agency for Healthcare Research and Quality. Methods reference guide for effectiveness and
comparative effectiveness reviews. Version 1.0. Rockville (MD): Agency for Healthcare
Research and Quality; 2007.
17. Zaza S, Briss P, Harris KW. The guide to community preventive services: what works to
promote health? New York: Oxford University Press; 2005.
18. Price CP, Christenson RH eds. Evidence-based laboratory medicine principles, practice and
outcomes. Washington (DC): AACC; 2007.
19. Moher D, Liberati A, Tetzlaff J, Altman DG, and the PRISMA Group. Preferred reporting items
for systematic reviews and meta-analyses: the PRISMA statement. Ann Intern Med 2009;151:
264–9.
20. Dreyer NA, Scheneeweiss S, McNeil BJ, Berger ML, Walker AM, Ollendorf DA, Gliklich RE.
GRACE principles: recognizing high-quality observational studies of comparative effectiveness.
Am J Manag Care 2010;16:467–71.
21. Ogrinc G, Mooney SE, Estrada C, Foster T, Goldmann D, Hall LW, Huizinga MM, et al. The
SQUIRE (Standards for Quality Improvement Reporting Excellence) guidelines for quality
improvement reporting: explanation and elaboration. Qual Saf Health Care 2008;17(Suppl 1):
i13–32.
22. Horvath AR, Pewsner D. Systematic reviews in laboratory medicine: principles, processes and
practical considerations. Clin Chim Acta 2004;342:23–39.
23. Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, Schunemann HJ.
GRADE: an emerging consensus on rating quality of evidence and strength of
recommendations. BMJ 2008;336:924–6.
15
24. Higgins JPT, Green S eds. Cochrane handbook for systematic reviews of interventions 4.2.6.
Updated September 2006. Chichester (UK): John Wiley & Sons; 2006.
25. von Elm E AD, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP. STROBE Initiative.
Strengthening the reporting of observational studies in epidemiology (STROBE) statement:
guidelines for reporting observational studies. J Clin Epidemiol 2008;61:344–9.
26. Borenstein M, Hedges LV, Higgins JPT, Rothstein HR. Introduction to meta-analysis. West
Sussex (UK): Wiley & Sons; 2009.
27. Fleiss J. Measures of effect size for categorical data. In: LV Hedges ed. The handbook of
research synthesis. New York: Russell Sage Foundation; 1994. p 245–60.
28. Lewis S, Clarke M. Forest plots: trying to see the wood and the trees. BMJ 2001;322:1479–80.
29. McGlynn EA, Asch SM, Adams J, Keesey J, Hicks J, DeCristofaro A, Kerr EA. The quality of
health care delivered to adults in the United States. N Engl J Med 2003;348:2635–45.
30. Turkleson C, Hughes J. Why aren't you doing evidence-based practice? AAOS Bull 2006;54:1–
4.
31. Barnes MM. Why aren't community radiation oncologists adhering to evidence-based guidelines?
Commun Oncol 2006;3:625–6.
32. Edelson E. Many doctors don't know blood pressure guidelines. ABC News/Health. http:
//abcnews.go.com/Health/Healthday/story?id=5844753&page=1 (Accessed July 2010).
33. National Institute for Health and Clinical Excellence. How to change practice: understand,
identify and overcome barriers to change. London: National Institute for Health and Clinical
Excellence; 2007.
16
Fly UP