top of page

Annals of Internal Medicineの著者向けの一般的な統計ガイダンス

  • 執筆者の写真: 事務局 CRS-R
    事務局 CRS-R
  • 3月24日
  • 読了時間: 7分

わたヤク@AI臨床研究 様がX上で紹介されており、大変有用な内容かつ、繰り返し確認したい内容でしたので、まとめさせていただきました。


出典のリンクはこちらです。

👇

Annals of Internal Medicineの著者向けの一般的な統計ガイダンスhttps://www.acpjournals.org/journal/aim/authors/statistical-guidance



 

主要セクション

  1. プレゼンテーション

  2. 多変量解析

  3. 測定誤差

  4. 効果とリスクの指標

  5. 欠損データ

  6. 縦断的分析

  7. 感度分析と未測定の交絡

  8. メタ分析

  9. 統計的有意性とP値

  10. 図表


 

項目

報告ガイドライン

パーセンテージ

  • サンプルサイズが200以上の場合、小数点以下1桁まで報告する(例:xx.x%)

  • サンプルサイズが200未満の場合、小数点を使用しない(例:xx%、xx.xx%ではない)

標準偏差

「平均±標準偏差」ではなく、「平均(標準偏差)」の表記を使用する。±記号は曖昧で、標準偏差または標準誤差を表す可能性がある

標準誤差

可能な場合は、標準誤差ではなく信頼区間を報告する

P値

  • 0.001 ≤ P ≤ 0.20:1000分の1の単位まで報告

  • P > 0.20:100分の1の単位まで報告

  • P < 0.001:「P<0.001」と報告

「傾向」

  • 傾向検定または用量反応関係を記述する場合にのみ使用

  • P値が0.05に近いが下回らない場合は使用を避け、差異と信頼区間を報告する

記述的表

  • 正規分布データ:平均値と標準偏差を報告

  • 非正規分布データ:中央値(最小値, 最大値)または中央値(25パーセンタイル, 75パーセンタイル[IQR])を報告

  • P値の報告は避ける

  • 円グラフと3次元グラフィックスを避ける

  • 変動性の指標を示さない単純な棒グラフを避ける

  • メタ分析のフォレストプロット:欄外に生データを提供

  • 生存プロット:水平軸下にリスクにさらされている人数を提供

再現性

知識のある読者が元のデータにアクセスして報告された結果を検証できるよう、十分な詳細さで方法を記述する

統計ソフトウェアとコード

  • 使用した統計ソフトウェア(バージョン、製造元、特定の関数、手順、プログラム)を明記

  • ベイズ法の場合、開始値と事前分布を含む完全なコードを付録に提供

  • 付録内のコードは十分に注釈を付ける

技術的付録

本文で記述できないより詳細な方法と結果(感度分析など)を付録内に提供する


  1. 多変量解析

共変量のスクリーニング

「二変量スクリーニング」で「統計的に有意」な場合にのみ、多変量モデルに因子を含めるアプローチは最適ではない。因子は、それ自体では統計的に有意でなくても、モデルに含めると関心のある曝露の効果を変化させる場合、または他の共変量と一緒に含めた場合にのみ交絡因子となる場合があるため、交絡因子となる可能性がある。

有用なリソース:

Sun GW, Shook TL, Kay GL. Inappropriate use of bivariable analysis to screen risk factors for use in multivariable analysis. J Clin Epidemiol. 1996;49:907-16. PMID: 8699212


モデル構築

著者は、後続の研究のための仮説生成という狭い適用を除いて、段階的なモデル構築方法を避けるべきである。段階的方法には、事前に決定されたP値基準に基づいて統計モデルに変数を含めたり除外したりする前向き、後向き、または組み合わせた手順が含まれる。P値駆動型アプローチよりも優れた変数選択戦略は、外部の臨床判断を使用するものである。著者は、段階的変数選択手順を使用して、繰り返しサンプリングの下でどの変数がモデルに含まれるかを決定するためにブートストラップ手順を使用することがある。いずれにせよ、著者は読者にモデルの適合度がどのように評価されたか、どの交互作用が探索され、どのようにそしてなぜ探索されたか、そしてそれらの評価の結果を伝えるべきである。

有用なリソース:

  1. Collett D, Stepniewska K. Some practical issues in binary data analysis. Statist Med. 1999;18:2209-21. PMID: 10474134

  2. Mickey RM, Greenland S. The impact of confounder selection criteria on effect estimation. Am J Epidemiol. 1989;129:125-37. PMID: 2910056

  3. Steyerberg EW, Eijkemans MJC, Harrell FE, Jr., Habbema JDF. Prognostic modeling with logistic regression analysis: a comparison of selection and estimation methods in small data sets. Statist Med. 2000;19:1059-79. PMID: 10790680

  4. Steyerberg EW, Eijkemans MJC, Habbema DF. Stepwise selection in small data sets: a simulation study of bias in logistic regression analysis. J Clin Epidemiol. 1999;52:935-42. PMID: 10513756

  5. Altman D, Andersen PK. Bootstrap investigation of the stability of a Cox regression model. Statist Med. 1989;8:771-83. PMID:2672226

  6. Mick R, Ratain MJ. Bootstrap validation of pharmacodynamic models defined via stepwise linear regression. Clin Pharmacol Ther. 1994;56:217-22. PMID: 8062499

  7. Harrell FE, Jr, et al. Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statist Med. 1996;15:361-87. PMID: 8668867


多変量解析を報告する表

著者は時々、一つずつアウトカムと複数の個別因子を比較し、その後に交絡を調整した多変量解析を示す表を提示する。交絡が存在する場合(多くの場合そうである)、一対一の比較は単に中間的なステップであり、読者にとってほとんど有用な情報を提供しない。一般的に、これらの中間的なステップを原稿で提示することは省略し、結果や考察でそれらに焦点を当てないようにする。


  1. 測定誤差

疾病の複数のリスク因子がロジスティック回帰モデルで考慮され、これらのリスク因子のいくつかが誤差を伴って測定されている場合、これらの因子のいずれかに対応する相対リスクの点推定値と区間推定値は、ヌル値に向かってまたはヌル値から離れて偏る可能性がある。偏りの方向は決して確実ではない。潜在的に偏った推定値に加えて、正しく調整された推定値の信頼区間は、素朴な信頼区間よりも広くなることがあり、時には実質的に広くなる。著者はこの問題に対処するための戦略について、以下の参考文献を参照することが推奨される。

有用なリソース:

  1. Rosner B, Spiegelman D, Willett WC. Correction of logistic regression relative risk estimates and confidence intervals for measurement error: the case of multiple covariates measured with error. Am J Epidemiol. 1990;132:734-45. PMID: 2403114

  2. Carroll R. Measurement Error in epidemiologic studies. In Encyclopedia of Biostatistics. New York: John Wiley & Sons; 1998. ISBN: 0471975761


  1. 効果とリスクの指標

臨床的に意味のある推定値

著者は、ロジスティック回帰からのログオッズ比を報告するのではなく、意味のある指標の結果を報告すべきである。例えば、係数をオッズ比、相対リスク、またはリスク差などの適切な効果サイズの指標に変換すべきである。オッズ比や相対リスクなどの推定値は、関心のある因子の1単位の変化が臨床的な意味を持たない場合(年齢、血圧のmmHg、または他の小さな単位を持つ連続的または間隔的な測定)、1単位の変化に対して報告すべきではない。すべての推定値は、95%の信頼限界とともに、臨床的に意味のある変化を反映すべきである。


グループ間の差異

介入の比較(例えば、試験)では、グループ内の差異ではなく、グループ間の差異に焦点を当て、差異の95%信頼区間を示す。可能な場合は、絶対数(分子/分母)を使用して結果を述べる。効果について議論する際は、P値ではなく信頼区間を参照し、信頼区間が有意な臨床的利益または害の可能性を除外しているかどうかを読者に指摘する。


オッズ比と予測確率

著者は多変量結果についてオッズ比を報告することが多いが、オッズ比が解釈困難または意味がない場合がある。まず、参照リスクが高い場合、オッズ比は効果サイズを過大評価する可能性がある。例えば、参照リスクが25%(オッズ = 0.33)でオッズ比が3.0の場合、相対リスクは2.0にすぎない。「3倍のリスク増加」や「3倍のリスク」などの表現は不正確である。第二に、読者は治療、曝露、および共変量によって定義される異なるグループの患者のリスクレベル(およびその信頼区間)の容易に理解できる指標を求めている。関心のある各因子の予測確率の表、およびそれらの予測確率の信頼区間を提供することを検討する。さらに、最も重要な因子による予測確率を交差分類し、残りの因子を調整する多方向の表は、調整されたオッズ比の表よりも意味のあるものになることが多い。標準的な商用ソフトウェアは、予測確率と信頼限界を生成できる。

有用なリソース:

  • Altman DG, Deeks JJ, Sackett DL. Odds ratios should be avoided when events are common. BMJ. 1998;317:1318. PMID: 9804732


ハザード比と標準化累積発生率

著者は、比例ハザードCoxモデルから推定されたハザード比を使用して、生存または時間依存イベントデータの分析結果を報告することが多い。ハザード比は臨床的に解釈するのが非常に困難で、フォローアップの長さに敏感であり、比例ハザードなどのモデルの仮定に依存している。さらに、絶対的および相対的な両方の観点から効果の推定値を提示することで、結果が正しく解釈される可能性が高まる。これらすべての理由から、我々は著者が生存分析の結果を報告する際に、累積発生率曲線(逆カプランマイヤープロット)と、意味のある時点での累積発生率の絶対差の表形式の要約(95%信頼限界付き)を提示することを推奨する。そのような分析が共変量の調整を必要とする場合、著者は共変量標準化(加重)累積発生率曲線と、意味のある時点での調整済み累積発生率の差を推定して提示することができる。

有用なリソース:

  • Hernan MA. The hazards of hazard ratios. Epidemiology.

 
 
 

Comentários


CRS-R研究会事務局

​​場所:浜松医療センターリハビリテーション科 

   CRS-R研究会 事務局

住所:〒432-8580 静岡県浜松市中央区富塚町328

メールアドレス:coma.recovery.scale@gmail.com

bottom of page