Le futur de l’Imagerie, l’émergence de l’intelligence artificielle et son apport à la mammographie

Introduction
Les premières techniques d’intelligence artificielle appliquées à l’imagerie ont vu leur émergence en 2000 avec le développement de technique dite de « radiomique » qui correspond à l’extraction et l’analyse de grande quantité de critères issus de l’image pour construire des modèles descriptifs et prédictifs et définir des phénotypes. L’hypothèse réside dans le fait que l’analyse mathématique de l’hétérogénéité contenue dans l’image (non perceptible à l’œil nu) puisse refléter la diversité génétique et créer de nouveaux facteurs de diagnostiques et pronostiques.
Les progrès de l’informatique ont permis dans les années 2010 l’essor d’un autre type d’intelligence artificielle nommé « machine learning » ou apprentissage automatique littéralement en français. Cet apprentissage se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Le « deep learning » est une forme de machine learning où le réseau est composé de dizaines voire de centaines de « couches » de neurones, chacune recevant et interprétant les informations de la couche précédente.
Si la qualité principale de l’intelligence humaine réside dans sa capacité d’abstraction et de généralisation des concepts, sa principale limite est son manque de précision dans le détail, caractéristique reine de la radiomique qui est à l’opposé incapable de généralisation ou d’abstraction. Le deep learning se situerait probablement à mi chemin entre ces deux concepts.
On distingue les modèles de deep learning supervisés (nécessitant une segmentation sémantique de chaque élément d’image) et les modèles dits non supervisés (dit modèle de cluster ou le principe est d’entrainer une machine avec les données elles même après les avoir divisées en deux et de vérifier que le modèle optimisé sur une portion de la cohorte est capable de prédire l’autre partie de la cohorte). Dans les deux cas, il est nécessaire de disposer de quantités de données importantes encore plus importante dans le cas de modèle non supervisé.
Les champs d’application de l’IA en médecine sont larges. Un consensus d’experts français fait de radiologues et de physiciens a réfléchi sur les actuelles et potentielles applications de l’IA sur la thématique du dépistage du cancer du sein qui se situent à la fois sur l’acquisition de l’image mammographique, sur l’analyse automatique du parenchyme mammaire et bien sur sur la détection automatique de cancer du sein dans l’image (1)

IA et lecture mammographie
Ce champ d’application de l’IA est celui qui fait clairement couler le plus d’encre ! En mammographie, l’émergence de systèmes de lecture par ordinateur fait rêver depuis longtemps ! La mauvaise expérience des CAD au début des années 2000, très vite validés et remboursés aux USA, conduit à une certaine prudence. Plusieurs études avaient finalement démontré non seulement que l’utilisation de ces CADs entrainait une baisse de la spécificité avec augmentation de 20% du nombre de biopsies (2) et même baisse de la sensibilité (89% sans CAD versus 83% avec CAD) dans une étude publiée dans le JAMA sur plus de 320 000 femmes (3). Ces CADs dits traditionnels n’étaient pas basés sur des techniques de deep learning du fait d’une puissance informatique limitée à ce moment là et du faible échantillon des datas utilisés pour les optimiser
De nouveaux CADs basés sur les techniques de deep learning sont aujourd’hui en plein développement: Les publications sont multiples mais souvent hétérogènes avec des limites méthodologiques plusieurs fois soulignés dans des revues majeures telles que le Lancet (4) ou le NEJM. Certaines études ont comparé la performance de modèles à ceux de la performance théorique sur des échantillons différents ce qui en limite la pertinence, d’autres ont comparés le modèle à des radiologues sur un sous échantillon très limité de patientes avec des performances du radiologue très inférieurs à celle attendu habituellement. C’est le cas de la publication de la firme Google dans le journal Nature en ce début d’année (5). Les auteurs ont implémenté un modèle de détection du cancer du sein en mammographie sur une cohorte de plus 500 000 femmes. L’essentiel de la communication autour de ce papier a résidé dans la capacité de l’algorithme à remplacer l’œil humain mais dans cette étude la comparaison IA et performance humaine n’a été conduite que sur 500 femmes avec des chiffres de sensibilité autour de 50% pour certains lecteurs. De plus, cette étude a été réalisée uniquement sur des mammographies réalisées par un seul constructeur (Hologic). Enfin, la validation externe a été faite sur une cohorte mono site où la prévalence de la maladie était trois fois supérieure à celle attendue (22/1000 au lieu de 7/1000) (5). Ce type d’étude comparant l’IA seule à la performance humaine réduit considérablement l’impact majeure que pourrait avoir l’IA pour améliorer les performances d’un dépistage largement décrié actuellement par son manque de spécificité. Les études ayant étudié la valeur de l’apport de l’IA combiné à une lecture humaine ont toutes montré que la performance de la lecture radiologue + IA était supérieure à la lecture par l’IA seule et supérieure à la lecture par le radiologue (supérieure à la moyenne de 101 radiologues) (6). L’IA peut constituer une avancée majeure dans nos pratiques si nous optimisons nos modèles pour améliorer nos performances diagnostiques avec des études combinant lecture humaine et analyse de deep learning. Réduire l’apport de l’intelligence artificielle au remplacement de radiologues non experts n’apporterait un bénéfice que très limité aux patientes françaises et pourrait même faire disparaitre pour raison économique la lecture par des radiologues experts dont la performance n’est atteinte par aucun logiciel de deep learning.

IA et optimisation de l’acquisition de la mammographie, optimisation du parcours patiente
Les autres domaines d’applications identifiés sont multiples. Tout d’abord des nombreuses implémentations sont tentés pour optimiser de la dose de rayonnement en mammographie 2D. Ainsi, des modèles sont entrainés pour calculer la compression optimale (première cause d’augmentation de la dose) mais également en permettant de diminuer le bruit dans l’image, ce qui permet de s’affranchir de grille anti diffusante (ce qui permet également de diminuer la dose). Un autre axe de développement est l’optimisation de la création d’une mammographie synthétique de qualité à partir des acquisitions de tomosynthèse. La tomosynthèse mammaire permet d’améliorer à la fois la sensibilité et la spécificité en mammographie. La principale limite à sa diffusion est la nécessité de supplément d’irradiation si l’on conserve la mammographie 2D classique. Le développement d’une mammographie synthétique à partir des acquisitions de tomosynthèse pourrait permettre de solutionner cette problématique. Plusieurs publications ont déjà montré pour un constructeur une équivalence de performance de la mammographie synthétique et de la mammographie 2D classique. Une implémentation en France nécessite un élargissement de cette validation à plusieurs constructeurs. Enfin, les industriels travaillent sur l’intelligence artificielle pour simplifier le contrôle qualité des appareils de mammographie qui est obligatoire en France pour participer à la campagne de dépistage organisé. Le nombre de machines en service et la complexité des tests à effectuer font espérer une solution humaine facilitée et accélérer par des modèles d’intelligence artificielle.
La qualité de l’acquisition en mammographie est un facteur essentiel pour la détection des cancers du sein. Plusieurs systèmes d’intelligence artificielle ont été développés pour optimiser le positionnement des patientes et pouvoir indiquer immédiatement au manipulateur que le cliché n’est pas techniquement suffisant et nécessite d’être refait.
D’autres systèmes sont développés actuellement pour calculer automatiquement la densité mammaire. La densité mammaire est un élément masquant diminuant la sensibilité de la mammographie et qui conditionne la réalisation d’une échographie mammaire (En France, tout sein de densité de type C et D doit bénéficier d’une échographie). De plus, la densité mammaire est reconnue comme un facteur de risque modéré de cancer du sein et qui combiné à d’autres facteurs comme l’âge, les antécédents familiaux, les antécédents personnels de biopsie augmente de façon significative le risque de cancer du sein. Pourtant, cette évaluation est peu reproductible entre les radiologues et pour un même radiologue au cours du temps. Plusieurs modèles de deep learning supervisés ont été récemment publiées qui montrent non seulement une bonne concordance avec la lecture humaine (7) mais également se révèlent aussi performant que l’œil humain pour prédire le risque de cancer du sein (8). Enfin, une étude plus récente à grâce à l’optimisation d’un modèle d’intelligence artificielle non supervisé créer un nouveau critère d’évaluation du parenchyme dit de « complexité » corrélé au risque de cancer du sein de façon indépendante à la densité mammaire. Ce résultat illustre parfaitement la capacité de l’intelligence artificielle à définir grâce à l’image de nouveaux critères non perceptibles par l’œil humain (9).

Isabelle THOMASSIN-NAGGARA
APHP Sorbonne Université, Service de radiologie, hôpital Tenon, Paris
Institut des Données des Sciences et du Calcul, Jussieu, Paris

 

References

1.   Thomassin-Naggara I, Balleyguier C, Ceugnart L, et al. Artificial intelligence and breast screening:  A position paper for the French radiological community. Diagn Interv Imaging. 2019;
2.   Fenton JJ, Taplin SH, Carney PA, et al. Influence of computer-aided detection on performance of screening mammography. N Engl J Med. 2007;356(14):1399–1409.
3.   Lehman CD, Wellman RD, Buist DSM, et al. Diagnostic Accuracy of Digital Screening Mammography With and Without Computer-Aided Detection. JAMA Intern Med. 2015;175(11):1828–1837.
4.   Liu X, Faes L, Kale AU, et al. A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. The Lancet Digital Health. 2019;1(6):e271–e297.
5.   McKinney SM, Sieniek M, Godbole V, et al. International evaluation of an AI system for breast cancer screening. Nature. 2020;577(7788):89–94.
6.   Rodriguez-Ruiz A, Lång K, Gubern-Merida A, et al. Stand-Alone Artificial Intelligence for Breast Cancer Detection in Mammography: Comparison With 101 Radiologists. J Natl Cancer Inst. 2019;
7.   Lehman CD, Yala A, Schuster T, et al. Mammographic Breast Density Assessment Using Deep Learning: Clinical Implementation. Radiology. 2019;290(1):52–58.
8.   Moshina N, Sebuødegård S, Lee CI, et al. Automated Volumetric Analysis of Mammographic Density in a Screening Setting: Worse Outcomes for Women with Dense Breasts. Radiology. 2018;288(2):343–352.
9.   Kontos D, Winham SJ, Oustimov A, et al. Radiomic Phenotypes of Mammographic Parenchymal Complexity: Toward Augmenting Breast Density in Breast Cancer Risk Assessment. Radiology. 2019;290(1):41–49.

 
Les articles sont édités sous la seule responsabilité de leurs auteurs.
Les informations fournies sur www.gyneco-online.com sont destinées à améliorer, non à remplacer, la relation directe entre le patient (ou visiteur du site) et les professionnels de santé.