Annals of Internal Medicineの著者向けの一般的な統計ガイダンス

事務局 CRS-R
3月24日
読了時間: 7分

わたヤク@AI臨床研究様がX上で紹介されており、大変有用な内容かつ、繰り返し確認したい内容でしたので、まとめさせていただきました。

出典のリンクはこちらです。

👇

Annals of Internal Medicineの著者向けの一般的な統計ガイダンスhttps://www.acpjournals.org/journal/aim/authors/statistical-guidance

主要セクション

プレゼンテーション
多変量解析
測定誤差
効果とリスクの指標
欠損データ
縦断的分析
感度分析と未測定の交絡
メタ分析
統計的有意性とP値
図表

項目	報告ガイドライン
パーセンテージ	サンプルサイズが200以上の場合、小数点以下1桁まで報告する（例：xx.x%）サンプルサイズが200未満の場合、小数点を使用しない（例：xx%、xx.xx%ではない）
標準偏差	「平均±標準偏差」ではなく、「平均(標準偏差)」の表記を使用する。±記号は曖昧で、標準偏差または標準誤差を表す可能性がある
標準誤差	可能な場合は、標準誤差ではなく信頼区間を報告する
P値	0.001 ≤ P ≤ 0.20：1000分の1の単位まで報告 P > 0.20：100分の1の単位まで報告 P < 0.001：「P<0.001」と報告
「傾向」	傾向検定または用量反応関係を記述する場合にのみ使用 P値が0.05に近いが下回らない場合は使用を避け、差異と信頼区間を報告する
記述的表	正規分布データ：平均値と標準偏差を報告非正規分布データ：中央値(最小値, 最大値)または中央値(25パーセンタイル, 75パーセンタイル[IQR])を報告 P値の報告は避ける
図	円グラフと3次元グラフィックスを避ける変動性の指標を示さない単純な棒グラフを避けるメタ分析のフォレストプロット：欄外に生データを提供生存プロット：水平軸下にリスクにさらされている人数を提供
再現性	知識のある読者が元のデータにアクセスして報告された結果を検証できるよう、十分な詳細さで方法を記述する
統計ソフトウェアとコード	使用した統計ソフトウェア（バージョン、製造元、特定の関数、手順、プログラム）を明記ベイズ法の場合、開始値と事前分布を含む完全なコードを付録に提供付録内のコードは十分に注釈を付ける
技術的付録	本文で記述できないより詳細な方法と結果（感度分析など）を付録内に提供する

多変量解析

共変量のスクリーニング

「二変量スクリーニング」で「統計的に有意」な場合にのみ、多変量モデルに因子を含めるアプローチは最適ではない。因子は、それ自体では統計的に有意でなくても、モデルに含めると関心のある曝露の効果を変化させる場合、または他の共変量と一緒に含めた場合にのみ交絡因子となる場合があるため、交絡因子となる可能性がある。

有用なリソース:

Sun GW, Shook TL, Kay GL. Inappropriate use of bivariable analysis to screen risk factors for use in multivariable analysis. J Clin Epidemiol. 1996;49:907-16. PMID: 8699212

モデル構築

著者は、後続の研究のための仮説生成という狭い適用を除いて、段階的なモデル構築方法を避けるべきである。段階的方法には、事前に決定されたP値基準に基づいて統計モデルに変数を含めたり除外したりする前向き、後向き、または組み合わせた手順が含まれる。P値駆動型アプローチよりも優れた変数選択戦略は、外部の臨床判断を使用するものである。著者は、段階的変数選択手順を使用して、繰り返しサンプリングの下でどの変数がモデルに含まれるかを決定するためにブートストラップ手順を使用することがある。いずれにせよ、著者は読者にモデルの適合度がどのように評価されたか、どの交互作用が探索され、どのようにそしてなぜ探索されたか、そしてそれらの評価の結果を伝えるべきである。

有用なリソース:

Collett D, Stepniewska K. Some practical issues in binary data analysis. Statist Med. 1999;18:2209-21. PMID: 10474134
Mickey RM, Greenland S. The impact of confounder selection criteria on effect estimation. Am J Epidemiol. 1989;129:125-37. PMID: 2910056
Steyerberg EW, Eijkemans MJC, Harrell FE, Jr., Habbema JDF. Prognostic modeling with logistic regression analysis: a comparison of selection and estimation methods in small data sets. Statist Med. 2000;19:1059-79. PMID: 10790680
Steyerberg EW, Eijkemans MJC, Habbema DF. Stepwise selection in small data sets: a simulation study of bias in logistic regression analysis. J Clin Epidemiol. 1999;52:935-42. PMID: 10513756
Altman D, Andersen PK. Bootstrap investigation of the stability of a Cox regression model. Statist Med. 1989;8:771-83. PMID:2672226
Mick R, Ratain MJ. Bootstrap validation of pharmacodynamic models defined via stepwise linear regression. Clin Pharmacol Ther. 1994;56:217-22. PMID: 8062499
Harrell FE, Jr, et al. Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statist Med. 1996;15:361-87. PMID: 8668867

多変量解析を報告する表

著者は時々、一つずつアウトカムと複数の個別因子を比較し、その後に交絡を調整した多変量解析を示す表を提示する。交絡が存在する場合(多くの場合そうである)、一対一の比較は単に中間的なステップであり、読者にとってほとんど有用な情報を提供しない。一般的に、これらの中間的なステップを原稿で提示することは省略し、結果や考察でそれらに焦点を当てないようにする。

測定誤差

疾病の複数のリスク因子がロジスティック回帰モデルで考慮され、これらのリスク因子のいくつかが誤差を伴って測定されている場合、これらの因子のいずれかに対応する相対リスクの点推定値と区間推定値は、ヌル値に向かってまたはヌル値から離れて偏る可能性がある。偏りの方向は決して確実ではない。潜在的に偏った推定値に加えて、正しく調整された推定値の信頼区間は、素朴な信頼区間よりも広くなることがあり、時には実質的に広くなる。著者はこの問題に対処するための戦略について、以下の参考文献を参照することが推奨される。

有用なリソース:

Rosner B, Spiegelman D, Willett WC. Correction of logistic regression relative risk estimates and confidence intervals for measurement error: the case of multiple covariates measured with error. Am J Epidemiol. 1990;132:734-45. PMID: 2403114
Carroll R. Measurement Error in epidemiologic studies. In Encyclopedia of Biostatistics. New York: John Wiley & Sons; 1998. ISBN: 0471975761

効果とリスクの指標

臨床的に意味のある推定値

著者は、ロジスティック回帰からのログオッズ比を報告するのではなく、意味のある指標の結果を報告すべきである。例えば、係数をオッズ比、相対リスク、またはリスク差などの適切な効果サイズの指標に変換すべきである。オッズ比や相対リスクなどの推定値は、関心のある因子の1単位の変化が臨床的な意味を持たない場合(年齢、血圧のmmHg、または他の小さな単位を持つ連続的または間隔的な測定)、1単位の変化に対して報告すべきではない。すべての推定値は、95%の信頼限界とともに、臨床的に意味のある変化を反映すべきである。

グループ間の差異

介入の比較(例えば、試験)では、グループ内の差異ではなく、グループ間の差異に焦点を当て、差異の95%信頼区間を示す。可能な場合は、絶対数(分子/分母)を使用して結果を述べる。効果について議論する際は、P値ではなく信頼区間を参照し、信頼区間が有意な臨床的利益または害の可能性を除外しているかどうかを読者に指摘する。

オッズ比と予測確率

著者は多変量結果についてオッズ比を報告することが多いが、オッズ比が解釈困難または意味がない場合がある。まず、参照リスクが高い場合、オッズ比は効果サイズを過大評価する可能性がある。例えば、参照リスクが25%(オッズ = 0.33)でオッズ比が3.0の場合、相対リスクは2.0にすぎない。「3倍のリスク増加」や「3倍のリスク」などの表現は不正確である。第二に、読者は治療、曝露、および共変量によって定義される異なるグループの患者のリスクレベル(およびその信頼区間)の容易に理解できる指標を求めている。関心のある各因子の予測確率の表、およびそれらの予測確率の信頼区間を提供することを検討する。さらに、最も重要な因子による予測確率を交差分類し、残りの因子を調整する多方向の表は、調整されたオッズ比の表よりも意味のあるものになることが多い。標準的な商用ソフトウェアは、予測確率と信頼限界を生成できる。

有用なリソース:

Altman DG, Deeks JJ, Sackett DL. Odds ratios should be avoided when events are common. BMJ. 1998;317:1318. PMID: 9804732

ハザード比と標準化累積発生率

著者は、比例ハザードCoxモデルから推定されたハザード比を使用して、生存または時間依存イベントデータの分析結果を報告することが多い。ハザード比は臨床的に解釈するのが非常に困難で、フォローアップの長さに敏感であり、比例ハザードなどのモデルの仮定に依存している。さらに、絶対的および相対的な両方の観点から効果の推定値を提示することで、結果が正しく解釈される可能性が高まる。これらすべての理由から、我々は著者が生存分析の結果を報告する際に、累積発生率曲線(逆カプランマイヤープロット)と、意味のある時点での累積発生率の絶対差の表形式の要約(95%信頼限界付き)を提示することを推奨する。そのような分析が共変量の調整を必要とする場合、著者は共変量標準化(加重)累積発生率曲線と、意味のある時点での調整済み累積発生率の差を推定して提示することができる。

有用なリソース:

Hernan MA. The hazards of hazard ratios. Epidemiology.

Annals of Internal Medicineの著者向けの一般的な統計ガイダンス

主要セクション

多変量解析

共変量のスクリーニング

モデル構築

多変量解析を報告する表

測定誤差

効果とリスクの指標

臨床的に意味のある推定値

グループ間の差異

オッズ比と予測確率

ハザード比と標準化累積発生率

最新記事

コメント