実務において、非線形な関係性を説明性の担保できる統計的手法でモデリングしたい状況となっております。David W. Hosmerの本において、分数多項式解析が使用されていたのでその実用例を調査します。
論文を読む目的
- 分数多項式を使用したモデル構築フローを理解する
- 分数多項式を使用することの優位点を理解する
何をした論文か
- 十分に確立されていなかった乳酸と死亡率の関係性を明らかにした
- 乳酸の正常化は、乳酸の正常化がない場合と比較して、死亡率を有意に低下させることを示した
- 乳酸の正常化の遅延は、ICU入室後150時間以内に測定された場合、死亡のリスクが高くなることを示した
先行研究と比較した優位点
- 既存研究のほとんどは観察研究であり、交絡因子の影響を受けているが、この影響を取り除くために多変数回帰分析が採用されていた。また、共変量の線形仮定がテストされていない。線形の仮定に違反した場合、モデルから得られたオッズ比は、乳酸値の全範囲には当てはまらない。本研究では分数多項式を使用しており、より柔軟なモデリングが可能となる。
- 治療後の迅速な乳酸正常化は良好な転帰と関連していることが示唆されている。既存研究では、乳酸正常化の時点が事前定義されており、臨床医が乳酸をいつ再チェックする必要があるかを判断するのが困難であった。モデルに乳酸正常化の時間を含めることで正規化時間と死亡の危険性との関連を調査した。
追加の議論
分数多項式を使用することによって明らかになったこと
分数多項式を使用することで、ある定義域における説明変数とアウトカムとの関係性が明らかとなる。
本論文においては、
- 初期乳酸レベルの増加(L0)はハザードに寄与し、その傾きは4〜10 mmol/Lの間で急勾配であり、その後、急勾配は徐々に減衰すること。これは組織灌流を改善し、乳酸クリアランスを伴う蘇生バンドルが、乳酸レベルが4〜10 mmol/Lの患者にとって最も有益である可能性があることを示唆。
- 乳酸正常化の患者では、150時間以内において正常化の時間(T)がかかるほど、臨床転帰は悪化すること。すなわち、ICU入室後150時間以内においては、乳酸の正常化を迅速に行う必要があることを示唆。
非線形性を許容することにより生じる非単調性は説明できるものなのか
Tについて単調性が保証されておらず、250時間辺りを境目に低下傾向が見えるが、これは説明できるのか。
→ 高い正常化時間を持ったデータ数が少ないため、信頼区間幅が150h以降広くなっている。150h以降はデータから述べることはできないとみなし、説明は不要
→ 負の値をとりうることになるからといって非線形モデルをあきらめる必要はない
その他メモ
多変量解析のステップ
統計的に有意でも交絡因子でもない変数のみを除外した後、非線形を考慮できる分数多項式モデルを作成している。
- 単変量解析で P-value <0.2 のすべての変数を使用して初期の多変数モデルを構築
- Wald検定からP>0.1の場合、初期モデルの変数は削除
- 除去された共変量が乳酸係数に有意な変化(> 20%の変化)をもたらした場合、それは交絡因子であると考えられ、モデルに戻す
- 共変量を削除できなくなるまで繰り返し、予備的主効果モデルを構築
- –2、–1、–0.5、0、0.5、1、2、3のセットから構築された二次の分数多項式回帰モデルと一次の回帰モデルの逸脱度を検定し、P<0.05の場合採用($\chi2$検定)
使用しているデータセット
データセットには、MIMIC-IIを使用。数万人の集中治療室(ICU)患者について、患者モニターから取得した生理学的信号とバイタルサインの時系列、および病院の医療情報システムから取得した包括的な臨床データが含まれている。
読むべき参考文献
分数多項式をSAS, STATA, Rで使用できる形で公開
Sauerbrei, W., C. Meier-Hirmer, A. Benner, and P. Royston. 2006. “Multivariable Regression Model Building by Using Fractional Polynomials: Description of SAS, STATA and R Programs.” Computational Statistics & Data Analysis 50 (12): 3464–85.
(https://www.sciencedirect.com/science/article/abs/pii/S0167947305001623)
本論文の著者が分数多項式を解説
Zhang, Zhongheng. 2016. “Multivariable Fractional Polynomial Method for Regression Model.” Annals of Translational Medicine 4 (9): 174.
(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4876277/)