2- Représentations graphiques - R

Stat B.Falissard
24 Jun 201412:40

Summary

TLDRCette vidéo explique comment représenter graphiquement des données statistiques à l'aide de R. Elle montre que les méthodes simples sont souvent les plus efficaces pour comprendre les résultats. Les principaux outils abordés incluent les diagrammes en bâtons et les camemberts pour les variables qualitatives, les histogrammes et boîtes à moustaches pour les variables quantitatives, ainsi que les diagrammes xy pour les relations entre deux variables. La vidéo présente également la visualisation de l'évolution dans le temps, à la fois pour la moyenne et pour chaque individu. Des exemples concrets avec des jeux de données sur la santé mentale en prison et des patients déprimés illustrent chaque méthode.

Takeaways

  • 😀 Les méthodes statistiques simples sont souvent plus efficaces, car elles sont compréhensibles par tous.
  • 😀 Les représentations graphiques sont privilégiées pour visualiser la distribution des variables.
  • 😀 Les variables qualitatives peuvent être représentées par des diagrammes en bâtons (barplot) ou des camemberts (pie).
  • 😀 Les diagrammes en bâtons sont souvent plus précis que les camemberts pour percevoir les proportions.
  • 😀 Les variables quantitatives continues se représentent idéalement avec des histogrammes (hist) ou des boîtes à moustaches (boxplot).
  • 😀 Les boîtes à moustaches montrent la distribution centrale et les valeurs extrêmes, bien que la définition exacte des moustaches soit complexe.
  • 😀 On peut comparer la distribution d'une variable quantitative entre sous-groupes avec boxplot et l'opérateur tilde (~).
  • 😀 La relation entre deux variables quantitatives se visualise via un graphique cartésien avec plot, éventuellement amélioré par jitter pour séparer les points superposés.
  • 😀 L'évolution temporelle d'une variable se représente avec plotmeans (pour la moyenne) ou interaction.plot (pour chaque individu), nécessitant parfois l'installation du package gplots.
  • 😀 La pratique en R inclut l'importation de fichiers CSV (read.csv2), la vérification de leur structure (str), et l'ajout de légendes et couleurs pour améliorer la lisibilité des graphiques.
  • 😀 L'expérimentation avec les différentes représentations graphiques permet de mieux comprendre les données et la variabilité individuelle.

Q & A

  • Pourquoi les méthodes statistiques simples sont-elles souvent plus efficaces ?

    -Parce qu'elles sont comprises par tout le monde, ce qui permet d'interpréter facilement les résultats et de tirer la substantifique moelle des données.

  • Quel fichier de données est utilisé dans le cours et quelles sont ses caractéristiques principales ?

    -Le fichier utilisé est 'smp1.csv', issu d'une étude de santé mentale en prison réalisée en 2004 sur 799 détenus masculins. Il contient des variables telles que l'âge, la profession, des diagnostics psychiatriques, le nombre d'enfants et trois variables de personnalité.

  • Comment vérifier rapidement le contenu d'un fichier importé dans R ?

    -En utilisant la fonction str(nom_du_fichier), qui affiche le nombre de sujets, de variables, les intitulés des variables et les premières valeurs.

  • Quelle fonction R permet de créer un diagramme en bâtons pour une variable qualitative ?

    -La fonction barplot(), souvent combinée avec table() pour calculer les effectifs de chaque catégorie.

  • Quels sont les avantages et limites des camemberts pour représenter des variables qualitatives ?

    -Avantage : ils montrent la part de chaque catégorie par rapport à l'ensemble. Limite : l'œil humain a des difficultés à percevoir les rapports de surface, ce qui rend l'interprétation moins intuitive que pour un diagramme en bâtons.

  • Quelle différence existe-t-il entre un histogramme et un diagramme en bâtons pour une variable quantitative ?

    -L'histogramme est utilisé pour des variables continues avec des bâtons contigus, tandis que le diagramme en bâtons est mieux adapté aux variables discrètes.

  • Comment interpréter une boîte à moustaches dans R ?

    -La boîte contient 50 % des données (entre le premier et le troisième quartile), les moustaches supérieures et inférieures représentent approximativement 25 % des données restantes, et les points en dehors sont les valeurs extrêmes ou outliers.

  • Comment représenter la distribution conjointe de deux variables quantitatives ?

    -Avec un graphique x-y en utilisant la fonction plot(x, y). Pour éviter les points superposés, on peut utiliser la fonction jitter() pour décaler légèrement les points.

  • Quelle fonction permet de représenter l'évolution moyenne d'une variable quantitative dans le temps ?

    -La fonction plotmeans() du package gplots permet de représenter graphiquement l'évolution moyenne d'une variable au fil du temps.

  • Comment visualiser l'évolution individuelle de chaque sujet au cours du temps ?

    -Avec la fonction interaction.plot(), qui permet de représenter la variable temporelle sur l'axe des x, chaque sujet sur le trace factor et la variable mesurée sur l'axe des y.

  • Pourquoi est-il important de connaître les différentes représentations graphiques dans R ?

    -Parce que chaque type de graphique est adapté à un type spécifique de données (qualitatives, quantitatives, conjointes ou temporelles) et permet d'interpréter les résultats de manière claire et efficace.

Outlines

plate

此内容仅限付费用户访问。 请升级后访问。

立即升级

Mindmap

plate

此内容仅限付费用户访问。 请升级后访问。

立即升级

Keywords

plate

此内容仅限付费用户访问。 请升级后访问。

立即升级

Highlights

plate

此内容仅限付费用户访问。 请升级后访问。

立即升级

Transcripts

plate

此内容仅限付费用户访问。 请升级后访问。

立即升级
Rate This

5.0 / 5 (0 votes)

相关标签
StatistiquesR ProgrammingVisualisationDonnées QuantitativesDonnées QualitativesHistogrammesBoîtes à moustachesDiagrammesAnalyse de donnéesÉvolution temporelleMéthodes simplesSanté mentale
您是否需要英文摘要?