Risque relatif et odds-ratio avec R

Un fichier de données

Travaillons sur une enquête de satisfactions dans un hôpital, récupéré lors d’un cours de FUN (France Unité Numérique). Les fichiers sont disponibles ici.

Par la suite, ces données seront stockées dans la variable satis .

Dans ces données comme souvent, les observations sont en lignes et les variables en colonnes.

Présentation

$M$ $\overlineM$
$FR$ $a$ $b$
$\overlineFR$ $c$ $d$

Dans le tableau d’effectifs précédent, $M$ sont les malades et $FR$ ceux qui présentent un facteur de risque.

On a alors les définitions suivantes :

– Risque relatif : RR=\frac{\frac{a}{a+b}}{\frac{c}{c+d}}

– Odds-ratio :   OR=\frac{\frac{a}{b}}{\frac{c}{d}}

Le risque relatif est à utiliser lorsqu’on a les statistiques d’une population générale.
L’odds-ration est plus robuste sur un échantillon, et notamment en cas d’enquête cas-témoins.

Un cas concret

Etudions si le fait de recommander l’hôpital est lié au fait d’avoir la profession 2.

Pour cela, préparons les données binaires utiles.

satis$recommander.b<-ifelse(satis$recommander==2,1,0) 
satis$prof2.b<-ifelse(satis$profession==2,1,0)

Donnons le tableau associé :

table(satis$prof2.b,satis$recommander.b,deparse.level=2)


satis$recommander.b
satis$prof2.b 0 1
0 124 239
1 9 28

Comme la maladie et le facteur de risque sont normalement codé en 0 au lieu de 1, vaut mieux inverser le tableau :

table(1-satis$prof2.b,1-satis$recommander.b,deparse.level=2)


1 - satis$recommander.b
1 - satis$prof2.b 0 1
0 28 9
1 239 124

Pour réaliser le test, on utilise la commande twoby2(FR,Maladie). On respectera cet ordre pour que le risque relatif calculé soit le bon.

library(Epi)
twoby2(1-satis$prof2.b,1-satis$recommander.b)


2 by 2 table analysis:


Outcome : 0
Comparing : 0 vs. 1

0 1 P(0) 95% conf. interval
0 28 9 0.7568 0.5948 0.8683
1 239 124 0.6584 0.6081 0.7054

95% conf. interval
Relative Risk: 1.1494 0.9437 1.3998
Sample Odds Ratio: 1.6141 0.7387 3.5272
Conditional MLE Odds Ratio: 1.6123 0.7120 4.0092
Probability difference: 0.0984 -0.0664 0.2189

Exact P-value: 0.2737
Asymptotic P-value: 0.23



On constate que $OR$ est élevé mais la valeur de $p$ supérieure à $5~\%$ ne permet pas de conclure.


Niveau supérieur : Les tests avec R