Note publique d'information : L'objectif de ce travail est d'étudier l'intérêt des approches reposant sur le score
de propension (SP) dans le contexte des essais en clusters (ERC) avec biais de sélection.
Dans un premier temps, nous avons étudié à l'aide de simulations Monte Carlo, les
performances de 4 méthodes reposant sur le SP (ajustement direct, pondération inverse,
stratification et appariement) en comparaison à une régression multivariée classique
pour l'analyse d'ERC avec biais de sélection. Lorsque le critère de jugement est continu,
la régression multivariée et les méthodes reposant sur le SP (sauf l'appariement)
corrigent le biais. En revanche, seul l'ajustement sur le SP permet d'estimer un effet
non biaisé du traitement lorsqu'il s'agit d'un critère de jugement binaire de faible
incidence.Dans un second temps, nous avons développé un outil de détection du biais
de sélection, reposant sur la statistique c associée à un modèle de régression logistique.
Cet outil fournit, pour un nombre de covariables et un effectif total fixés, une valeur
seuil au-delà de laquelle on pourra conclure à la présence d'un biais de sélection.
Ce travail soulève également les difficultés de la mise en place des méthodes de SP
dans les ERC, liées à la structure hiérarchique des données, ainsi que les enjeux
associés au choix de la méthode d'analyse dans un cadre d'inférence causale.
Note publique d'information : This work aimed to study propensity score (PS)-based approaches for analysis of results
of cluster randomized trials (CRTs) with selection bias. First, we used Monte Carlo
simulations to compare the performance of 4 PS-based methods (direct adjustment, inverse
weighting, stratification and matching) and classical multivariable regression when
analyzing results of a CRT with selection bias. For continuous outcomes, both multivariable
regression and PS-based methods (except matching) removed the bias. Conversely, only
direct adjustment on PS provided an unbiased estimate of treatment effect for a low-incidence
binary outcome. Second, we developed a tool for detecting selection bias that relies
on the area under the receiver operating characteristic curve of the PS model. This
tool provides, for a fixed number of covariates and sample size, a threshold value
beyond which one could consider the existence of selection bias. This work also highlights
the complexity of implementing PS-based methods in the context of CRTs because of
the hierarchical structure of the data, as well as the challenges linked to the choice
of the statistical method in a causal inference framework.