Etude d’une variable quantitative avec R

Un fichier de données

Travaillons sur une enquête de satisfactions dans un hôpital, récupéré lors d’un cours de FUN (France Unité Numérique). Les fichiers sont disponibles ici.

Par la suite, ces données seront stockées dans la variable satis .

Dans ces données comme souvent, les observations sont en lignes et les variables en colonnes.

La commande summary

Cette commande peut s’appliquer à un tableau de données (data frame) comme à une seule variable.

summary(satis)


service sexe age profession amelioration.sante
Min. :1.000 Min. :0.0000 Min. :18.00 Min. :1.000 Min. :0.000
1st Qu.:3.000 1st Qu.:0.0000 1st Qu.:45.00 1st Qu.:3.000 1st Qu.:2.000
Median :5.000 Median :0.0000 Median :60.00 Median :4.000 Median :2.000
Mean :4.549 Mean :0.4981 Mean :58.21 Mean :4.431 Mean :2.231
3rd Qu.:7.000 3rd Qu.:1.0000 3rd Qu.:72.00 3rd Qu.:5.500 3rd Qu.:3.000
Max. :8.000 Max. :1.0000 Max. :97.00 Max. :8.000 Max. :3.000
NA's :6 NA's :107 NA's :158
amelioration.moral recommander score.relation score.information
Min. :0.000 Min. :0.000 Min. :13.00 Min. :13.00
1st Qu.:1.000 1st Qu.:1.000 1st Qu.:33.00 1st Qu.:28.00
Median :1.000 Median :2.000 Median :36.00 Median :33.00
Mean :1.679 Mean :1.625 Mean :35.22 Mean :31.91
3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:39.00 3rd Qu.:38.00
Max. :3.000 Max. :2.000 Max. :40.00 Max. :40.00
NA's :151 NA's :129 NA's :185 NA's :176

Pour l’âge :

summary(satis$age)


Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
18.00 45.00 60.00 58.21 72.00 97.00 6

La commande describe

Cette commande demande charger la librairie prettyR.
Le paramètre num.desc prend la liste des paramètres souhaités :

mean : moyenne
sd : écart-type
median : médiane
valid.n : nombre de valeurs attribuées (non NA)
min : minimum
max : maximum

library(prettyR)
describe(satis,num.desc=c("mean","sd","median","valid.n","min","max"))


Description of satis


Numeric
mean sd median valid.n min max
service 4.549 2.277 5 534 1 8
sexe 0.4981 0.5005 0 534 0 1
age 58.21 17.81 60 528 18 97
profession 4.431 1.75 4 427 1 8
amelioration.sante 2.231 0.7675 2 376 0 3
amelioration.moral 1.679 0.951 1 383 0 3
recommander 1.625 0.5606 2 405 0 2
score.relation 35.22 4.624 36 349 13 40
score.information 31.91 6.793 33 358 13 40

Les quartiles ne sont pas prévus. On peut les rajouter par la création de deux fonctions Q1 et Q3 :

q1<-function(x,na.rm) {
  return(quantile(x,probs=0.25,na.rm=na.rm))
}
q3<-function(x,na.rm) {
  return(quantile(x,probs=0.75,na.rm=na.rm))
}
describe(satis,num.desc=c("min","q1","median","q3","max"))


Description of satis


Numeric
min q1 median q3 max
service 1 3 5 7 8
sexe 0 0 0 1 1
age 18 45 60 72 97
profession 1 3 4 5.5 8
amelioration.sante 0 2 2 3 3
amelioration.moral 0 1 1 3 3
recommander 0 1 2 2 2
score.relation 13 33 36 39 40
score.information 13 28 33 38 40

Les commandes séparées

Pour la moyenne :

mean(satis$age,na.rm=TRUE)


[1] 58.21212

Pour la médiane :

median(satis$age,na.rm=TRUE)


[1] 60

Pour l’écart-type :

sd(satis$age,na.rm=TRUE)


[1] 17.80925

Pour Q1 :

quantile.default(satis$age,probs=0.25,na.rm=TRUE)


25%
45

Pour Q3 :

quantile.default(satis$age,probs=0.75,na.rm=TRUE)


75%
72

Pour le minimum :

min(satis$age,na.rm=TRUE)


[1] 18

Pour le maximum :

max(satis$age,na.rm=TRUE)


[1] 97

Pour le nombre de valeurs valides (non NA) :

valid.n(satis$age)


[1] 528

Pour le nombre de valeurs totales :

valid.n(satis$age,na.rm=FALSE)


[1] 534

NB : la commande valid.n fait partie de la librairie prettyR.


Niveau supérieur : Généralités sur R