18 - Données de survie ou censurées
Summary
TLDRCette vidéo introduit les données censurées et l'analyse de survie, expliquant comment étudier le délai jusqu'à la survenue d'un événement, comme la rechute alcoolique ou le retour à l'emploi. Elle décrit le vocabulaire clé, notamment les notions de survie et de censure (exclus vivants et perdus de vue), ainsi que les fonctions statistiques essentielles : fonction de survie et risque instantané. Le script illustre la représentation graphique avec la méthode Kaplan-Meier et son implémentation en R, incluant le calcul de la médiane de survie. Les exemples concrets permettent de comprendre comment traiter les données incomplètes et visualiser l'évolution des événements dans le temps.
Takeaways
- 📊 Les données de survie étudient le délai jusqu'à la survenue d'un évènement, pas nécessairement la mort.
- ⏳ Les durées mesurées peuvent être censurées si l'évènement n'est pas observé pour tous les sujets.
- ❌ Il existe deux types de censures : les 'exclus vivants' et les 'perdus de vue', qui doivent être distingués.
- 📈 La fonction de survie représente la proportion de sujets n'ayant pas encore eu l'évènement au fil du temps.
- ⚡ Le risque instantané h(t) indique la probabilité ponctuelle de survenue de l'évènement à un instant donné.
- 🧮 La méthode de Kaplan-Meier permet de calculer et de tracer la fonction de survie avec des données censurées.
- 👥 Il est possible de comparer la survie entre plusieurs groupes (ex. hommes vs femmes) en ajustant la syntaxe dans R.
- 💾 Les données utilisées dans l'exemple concernent 125 patients alcooliques hospitalisés et suivis pour la rechute.
- 📉 La médiane de survie correspond au moment où 50% des sujets ont eu l'évènement, mais peut ne pas être estimable si moins de 50% ont eu l'évènement.
- 🛠️ Les fonctions R essentielles pour l'analyse sont : Surv(), survfit() et plot(), toutes disponibles dans le package 'survival'.
- 🔍 Reproduire les analyses soi-même est fortement encouragé pour bien comprendre le traitement des données censurées.
Q & A
Qu'est-ce que signifie le terme 'données censurées' en statistique ?
-Les données censurées en statistique se réfèrent à des observations incomplètes. Par exemple, si un événement, comme le retour au travail après une période de chômage, n'est pas observé dans le cadre d'une étude, on connaît seulement la durée minimale avant cet événement, mais pas la durée exacte.
Pourquoi les données censurées sont-elles importantes dans les études de survie ?
-Les données censurées sont cruciales car elles permettent de prendre en compte les sujets pour lesquels l'événement d'intérêt (comme un décès ou une rechute) ne s'est pas produit durant la période de suivi. Elles aident à éviter les biais et à estimer correctement les probabilités d'événements sur une période donnée.
Quels sont les deux types de censures mentionnées dans le texte ?
-Les deux types de censures sont les 'exclus vivants', où les sujets sont encore en vie mais n'ont pas vécu l'événement à la fin de l'étude, et les 'perdus de vue', où les sujets ne sont plus suivis, souvent en raison de déménagements ou d'autres facteurs.
Que représente la 'fonction de survie' et comment est-elle calculée ?
-La fonction de survie représente le pourcentage de sujets qui n'ont pas encore expérimenté l'événement d'intérêt à un instant donné. Elle est calculée en mesurant, à chaque point dans le temps, la proportion de sujets encore en vie ou en bonne santé, ce qui donne une courbe décroissante.
Qu'est-ce que le 'risque instantané de décès' et pourquoi est-il difficile à représenter ?
-Le risque instantané de décès est la probabilité de mourir à un instant donné. Il est difficile à représenter car la probabilité de mourir à un moment précis est extrêmement faible, et en réalité, il s'agit plutôt d'une probabilité 'continue' qu'on calcule à l'aide de dérivées mathématiques.
Qu'est-ce que la médiane de survie et comment est-elle calculée ?
-La médiane de survie est le moment où 50% des sujets sont encore en vie et 50% sont décédés. Elle est souvent utilisée pour décrire les résultats d'une étude, mais dans le cas où plus de 50% des sujets sont encore en vie à la fin de l'étude, la médiane ne peut pas être estimée.
Pourquoi la méthode de Kaplan-Meier est utilisée dans l'analyse des données censurées ?
-La méthode de Kaplan-Meier est utilisée pour estimer la fonction de survie dans les données censurées. Elle permet de traiter les observations censurées (comme celles des patients qui n'ont pas encore connu l'événement étudié) tout en ajustant la courbe de survie pour refléter correctement ces données partielles.
Quels sont les avantages et les inconvénients d'étudier le 'pourcentage de survenue d'un événement' plutôt que le 'temps jusqu'à la survenue de l'événement' ?
-L'avantage d'étudier le 'pourcentage de survenue d'un événement' est qu'il est plus simple et plus direct. Cependant, cela ignore la durée exacte avant l'événement, ce qui peut conduire à des biais ou à une perte de puissance statistique, en particulier lorsque les sujets sont perdus de vue avant l'événement.
Quelles informations supplémentaires peut-on obtenir en utilisant la fonction survfit() dans R ?
-La fonction survfit() dans R permet d'estimer la fonction de survie en prenant en compte les données censurées. Elle peut aussi être utilisée pour calculer la médiane de survie et pour comparer les courbes de survie entre différents groupes de sujets, comme les hommes et les femmes.
Pourquoi l'étude sur les alcooliques n'a-t-elle pas permis d'estimer la médiane de survie ?
-Dans l'étude sur les alcooliques, la médiane de survie n'a pas pu être estimée car plus de 50% des patients étaient toujours sevrés à la fin du suivi, ce qui empêche de déterminer le point où 50% des patients ont rechuté ou sont restés abstinents.
Outlines

此内容仅限付费用户访问。 请升级后访问。
立即升级Mindmap

此内容仅限付费用户访问。 请升级后访问。
立即升级Keywords

此内容仅限付费用户访问。 请升级后访问。
立即升级Highlights

此内容仅限付费用户访问。 请升级后访问。
立即升级Transcripts

此内容仅限付费用户访问。 请升级后访问。
立即升级5.0 / 5 (0 votes)





