生存時間分析
実務において、非線形な関係性を説明性の担保できる統計的手法でモデリングしたい状況となっております。David W. Hosmerの本において、分数多項式解析が使用されていたのでその実用例を調査します。 論文を読む目的 分数多項式を使用したモデル構築フローを…
生存時間データの分析に関してちょこちょこ取り上げていますが、今回はそんな生存時間データにDeep Learningを適用してみた論文、DeepSurv論文を読んでまとめてみました。 bmcmedresmethodol.biomedcentral.com 1分で理解するDeepSurv Cox比例ハザードモデル…
ここまでで紹介してきた生存関数の推定やハザード関数の推定、ログランク検定といったノンパラメトリックな手法は、一標本の生存時間データ解析、二群間の比較に有用な方法になります。 一方で、実際の医学研究では、個々の被験者について、生存・死亡といっ…
下記の定義で与えられるハザード関数(単にハザードともいう)は、各時点における瞬間的な死亡のリスクや危険度を表すために使われます。 $$ h(t)=\lim_{\delta t \to 0}\frac{P(t\leq T
2群以上のデータを比較する際に、最も簡単な方法として2つの生存関数を同じ軸の上にプロットすることが挙げられます。 from matplotlib import pyplot as plt from lifelines.datasets import load_dd from lifelines import KaplanMeierFitter data = load_…
前回の記事では様々な定義による生存関数を見ていきました。 今回はそんな生存関数について、重要な統計量である標準偏差を算出する方法について学んでいきます。 標準誤差を推定することで信頼区間を形成したり、種々の仮説検定に用いることができます。 前…
前回は生存関数とハザード関数の関係性について紹介しました。 www.kimoton.com 生存関数の推定には、確率分布を仮定しない(ノンパラメトリックな)推定法を用います。 これらについて定義を見直し、lifelinesを使ってカプラン・マイヤー推定量を算出・プロ…
生存時間解析とは 生存時間解析とは、明確な地点から特定のイベントもしくはエンドポイントまでの時系列データ(Time to event型のデータ)に対する解析を示す用語です。 応答変数に関しては文字通りの生存時間のみならず、心理学実験における課題完了までの…