Un fichier de données
Travaillons sur une enquête de satisfactions dans un hôpital, récupéré lors d’un cours de FUN (France Unité Numérique). Les fichiers sont disponibles ici.
Par la suite, ces données seront stockées dans la variable satis .
Dans ces données comme souvent, les observations sont en lignes et les variables en colonnes.
Les couleurs
Pour ne pas rester sur le gris par défaut, voici la liste des couleurs de R.
Un aperçu des données
Intéressons-nous aux âges.
summary(satis$age)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
18.00 45.00 60.00 58.21 72.00 97.00 6
Le diagramme par défaut
boxplot(satis$age)
En utilisant les options
boxplot(satis$age,horizontal=TRUE,col="brown",main="Répartition des âges",ylim=c(0,100))
NB : l’option range=0 assure que les moustaches se terminent aux valeurs minimales et maximales.
Pour comparer deux diagrammes en fonction d’un paramètre
Étudions la répartition des âges selon le sexe :
boxplot(satis$age~satis$sexe)
boxplot(satis$age~satis$sexe,names=c("Homme","Femme"),col=c("blue","pink"),main="Répartition des âges par sexe")