Comment évaluer la performance effective des Centres FIV ?

La problématique

La performance globale des Centres FIV dépend essentiellement de 2 facteurs : la sélection initiale des patientes et la qualité du Centre (expertise des praticiens - qualité du laboratoire) , mais d'autres facteurs interviennent, notamment les critères utilisés pour définir le  succès et la complétude des bases de données. Il en résulte une grande difficulté d'évaluation et de comparaison des performances des Centres sur des critères objectifs et homogènes. Cependant, la question principale reste de déterminer la part de succès reposant sur la sélection initiale de couples de bon pronostic. Notre objectif est de développer un outil qui réponde à cette question, basé sur une très grande base de données, et utilisant le machine-learning.

Matériel et méthodes

Nous avons réalisé en 2020 une étude rétrospective non-interventionnelle sur un total de 113.253 cycles consécutifs (81.268 cycles de stimulation ovarienne en vue d'une ponction (COS), and 31985 cycles de transfert d'embryons congelés [TEC]), collectés dans 12 centres français de FIV pendant la période 2007–2016. Tous les cycles débutés ont été inclus, quel que soit l’issue du cycle, aucun critère d'exclusion n'a été appliqué, en dehors du don d'ovocyte et de l'autoconservation ovocytaire. Cette base de données contient des informations complètes et détaillées sur les antécédents et les caractéristiques des patientes, sur les protocoles utilisés, le monitorage de l'ovulation, la ponction, la production d'embryons, le transfert et la congélation, et le devenir des grossesses débutées.

Le critère d'évaluation principal était le taux cumulé de naissance par COS, incluant les résultats des transferts frais et des transferts d’embryons congelés provenant du même COS (CLBR).

Le modèle a été développé en utilisant le machine-learning sur un groupe d'apprentissage (n=56993), pour définir des covariables significatives à partir de régressions logistiques simples et multiples. A partir des odds ratios, un indicateur de sélection a été calculé avec une moyenne géométrique, et sa valeur a été divisé en 4 classes, la classe de meilleur pronostic pour chaque co-variable étant choisie comme référence. Les résultats obtenus sont ensuite confirmés sur un groupe de validation (n=24426).

Résultats

L'analyse multivariée sur le groupe d'apprentissage montre 7 indicateurs de population influençant le CLBR, à la fois hautement significatifs et indépendants: âge de la femme, BMI, AMH, présence d'anomalies utérines, antécédents de FCS, parité, rang de la tentative (cf. tableau 1).

Tableau 1 -  les covariables décrivant la population et leur influence sur le CLBR  (analyse multivariée)
CLBR : taux cumulé de naissance par cycle, IC : intervalle de confiance

Le tabagisme n’a pas montré de résultats significatifs en étude multivariée, quel que soit le niveau de consommation.

La distribution de ces 4 niveaux pronostic dans la population traitée montre aussi d'importantes différences inter-Centres dans la sélection initiale  des patientes (cf. figure 1), surtout dans les valeurs extrêmes (A=17,2% [6,5-25,0] – B= 48,9% [43,8-52,8] – C=17,3% [11,3-19,9] – D=16,6% [9,8-26,2]).

Figure  1 - répartition des niveaux pronostic dans les 12 centres
Les Centres sont classés par ordre décroissant de performance (CLBR)

Les Centres sont classés de 1 à 12 en fonction de leur CLBR global, puis le calcul donne le CLBR théorique de chaque Centre s'il avait traité une population de répartition standard (A=17% - B=49% - C=17% - D=17%), en appliquant leur propre taux de succès dans chaque classe pronostic A-B-C-D.

Avec ce mode de calcul, le classement final des Centres est sensiblement différent:  1-4-2-3-5-11-6-9-8-7-12-10.  (cf. tableau 2). 

Tableau 2 - CLBR observé et CLBR ajusté pour une population standard 

CONCLUSIONS

La segmentation en 4 classes pronostic permet une évaluation beaucoup plus précise de la population traitée. Elle permet de distinguer la performance liée à l’expertise des Centres, de celle qui résulte d’une sélection initiale de patientes à bon pronostic. De surcroit, les résultats obtenus dans chaque catégorie pronostic permettent d'identifier les Centres ayant une expertise particulière pour les cas les plus difficiles.