17 - Régression logistique multiple

Stat B.Falissard
24 Jun 201408:41

Summary

TLDRCe cours sur la régression logistique aborde l'analyse du risque suicidaire en prison, en utilisant des variables explicatives telles que la durée d'incarcération, les mesures disciplinaires et les antécédents d'abus dans l'enfance. En appliquant un modèle de régression logistique, on interprète les coefficients et les rapports de cotes pour évaluer l'impact de chaque facteur. Le cours insiste sur l'importance de la validité du modèle, notamment le nombre d'événements nécessaires par variable explicative. Enfin, des exemples pratiques et des recommandations sur la mise en œuvre des tests statistiques sont fournis pour guider les utilisateurs dans leurs analyses.

Takeaways

  • 😀 La régression logistique multiple permet d'inclure plusieurs variables explicatives pour étudier l'association avec une variable binaire dépendante.
  • 😀 La syntaxe R pour une régression logistique est : `glm(variable_expliquée ~ variables_explicatives, data=fichier, family='binomial')`.
  • 😀 Les p-values permettent de déterminer la significativité statistique des variables explicatives, avec < 0,05 indiquant une association significative.
  • 😀 Le signe des coefficients indique la direction de l'effet : positif = augmentation du risque, négatif = diminution du risque.
  • 😀 Pour interpréter l'amplitude des coefficients, il faut utiliser leur exponentielle afin d'obtenir les odds ratios.
  • 😀 Les variables binaires codées 0/1 permettent une interprétation directe des odds ratios, tandis que les variables ordinales ou continues nécessitent une interprétation par niveau de changement.
  • 😀 Les variables catégorielles à plus de deux classes sont automatiquement recodées en `k-1` variables binaires pour l'analyse.
  • 😀 Il est possible d'introduire des termes d'interaction pour étudier la synergie entre variables explicatives et voir si le risque combiné est supérieur à la somme des risques individuels.
  • 😀 Une règle de validité importante de la régression logistique est d'avoir au moins 5 à 10 événements par variable explicative incluse dans le modèle.
  • 😀 Les conditions de validité doivent être soigneusement vérifiées, surtout lorsque des variables catégorielles multiples augmentent le nombre total de variables explicatives.
  • 😀 Les commandes pratiques sur l'ordinateur aident à mieux comprendre le fonctionnement de la régression logistique et à interpréter correctement les résultats.

Q & A

  • Qu'est-ce que la régression logistique et pourquoi est-elle utilisée dans ce contexte ?

    -La régression logistique est un modèle statistique utilisé pour prédire la probabilité d'un événement binaire, comme un risque suicidaire en prison. Elle est utilisée ici pour examiner l'association entre des variables explicatives (abuses, mesures disciplinaires, durée d'incarcération) et le risque suicidaire chez les détenus.

  • Quelles sont les variables explicatives utilisées dans ce modèle ?

    -Les trois variables explicatives dans ce modèle sont : les antécédents d'abus dans l'enfance, les mesures disciplinaires et la durée d'incarcération.

  • Comment interpréter les p-values dans les résultats de la régression logistique ?

    -Les p-values permettent de tester l'hypothèse nulle. Si elles sont inférieures à 5%, cela indique que les variables explicatives sont statistiquement significatives et associées au risque suicidaire.

  • Pourquoi la durée d'incarcération a un coefficient négatif ?

    -Le coefficient négatif pour la durée d'incarcération suggère qu'une plus longue durée en prison diminue la probabilité de risque suicidaire. Cela pourrait être lié à une adaptation progressive à l'environnement carcéral ou une réduction de la vulnérabilité psychologique au fil du temps.

  • Comment interpréter les coefficients dans la régression logistique ?

    -Les coefficients doivent être interprétés en fonction du signe (positif ou négatif) et de leur amplitude. Un coefficient positif indique une augmentation du risque, tandis qu'un coefficient négatif indique une diminution du risque. L'exponentiation des coefficients permet de calculer les rapports de cotes (odds ratios).

  • Qu'est-ce qu'un odds ratio et comment l'interpréter dans ce contexte ?

    -Un odds ratio représente le rapport des chances d'un événement entre deux groupes. Par exemple, un odds ratio de 1.9 pour les antécédents d'abus dans l'enfance signifie que les détenus ayant des antécédents d'abus ont près de 2 fois plus de chances d'être à haut risque suicidaire que ceux n'ayant pas d'abus.

  • Quelles sont les implications des résultats pour la durée d'incarcération ?

    -Les résultats suggèrent qu'une durée d'incarcération plus longue réduit le risque suicidaire, avec un odds ratio de 0.7, ce qui signifie qu'à chaque étape de la durée, le risque de suicide diminue d'environ 30%.

  • Quelles sont les conditions de validité pour une régression logistique ?

    -Pour que les résultats de la régression logistique soient valides, il faut au moins 5 à 10 événements par variable explicative. Si le nombre d'événements est trop faible, les résultats peuvent ne pas être fiables.

  • Que signifie un test Chi-squared dans ce modèle ?

    -Un test Chi-squared est utilisé pour tester l'effet global d'une variable catégorielle. Dans ce cas, il permet d'évaluer si les différentes modalités d'une variable (par exemple, la profession) ont un effet significatif sur le risque suicidaire.

  • Comment les variables catégorielles sont-elles traitées dans la régression logistique ?

    -Les variables catégorielles avec plus de deux classes sont automatiquement recodées en variables binaires (k-1), permettant de les intégrer dans le modèle de régression logistique. L'effet global de la variable peut être testé avec le test Chi-squared.

Outlines

plate

Dieser Bereich ist nur für Premium-Benutzer verfügbar. Bitte führen Sie ein Upgrade durch, um auf diesen Abschnitt zuzugreifen.

Upgrade durchführen

Mindmap

plate

Dieser Bereich ist nur für Premium-Benutzer verfügbar. Bitte führen Sie ein Upgrade durch, um auf diesen Abschnitt zuzugreifen.

Upgrade durchführen

Keywords

plate

Dieser Bereich ist nur für Premium-Benutzer verfügbar. Bitte führen Sie ein Upgrade durch, um auf diesen Abschnitt zuzugreifen.

Upgrade durchführen

Highlights

plate

Dieser Bereich ist nur für Premium-Benutzer verfügbar. Bitte führen Sie ein Upgrade durch, um auf diesen Abschnitt zuzugreifen.

Upgrade durchführen

Transcripts

plate

Dieser Bereich ist nur für Premium-Benutzer verfügbar. Bitte führen Sie ein Upgrade durch, um auf diesen Abschnitt zuzugreifen.

Upgrade durchführen
Rate This

5.0 / 5 (0 votes)

Ähnliche Tags
Régression logistiqueRisque suicidairePrisonDurée incarcérationAbus enfanceMesures disciplinairesAnalyse statistiqueLogistique multipleFacteurs de risquePsychologie criminelleSanté mentale
Benötigen Sie eine Zusammenfassung auf Englisch?