Mélanome : l’IA fait mieux que l’œil des experts

Marine Cygler, Pam Harrison

Auteurs et déclarations

21 juin 2018

Heidelberg, Allemagne - Un réseau neuronal convolutif d’apprentissage profond (CNN, convolutional neural network), une forme d'intelligence artificielle, a surpassé des dermotologues aguerris pour distinguer à partir de photos des grains de beauté bénins de lésions cutanées plus inquiétantes. Les détails de l'étude ont été publiés en ligne dans les Annals of Oncology [1].

« Le CNN fonctionne comme un cerveau d'enfant » explique le Dr Holger Haenssle (Département de dermatologie, Université d'Heidelberg) dans un communiqué [2].

« Pour apprendre à la machine, nous ui avons montré plus de 100 000 images dermoscopiques de lésions cancéreuses et de grains de beauté. Pour chaque photo, on indiquait le diagnostic »

«Au final, le CNN passe à côté de moins de mélanome, ce qui signifie qu'il a une meilleure sensibilité que les dermatologues. De plus, il fait moins d'erreur en classant à tort des grains de beauté sans risque dans le groupe des cancers agressifs, autrement dit, il a une meilleure spécificité que les spécialistes ».

« Ces travaux montrent que les réseaux neuronaux convolutifs d’apprentissage profond sont plus efficaces que les dermatologues, même les plus experts, pour détecter un mélanome ».

Banque de 300 images dermatologiques

A partir d’une compilation de 300 images – dont 20 % de mélanomes (in situ et invasif) et 80 % de naevi mélanocytaires de différents types rencontrés fréquemment en clinique grossies dix fois, deux dermatologues ont sélectionné les 100 images les plus compliquées à interpréter. C'est cette sélection qui a été utilisée avec le CNN. Les résultats obtenus par la machine ont été comparés à ceux de 58 dermatologues dont 52 % d'entre eux, avec plus de cinq ans d'expérience, se considéraient comme expert dans la lecture des images dermoscopiques, 10 % d'entre eux, deux à cinq ans d'expérience, avaient une certaine compétence, les 29 % restants, des débutants en dermoscopie.

 
Les réseaux neuronaux convolutifs d’apprentissage profond sont plus efficaces que les dermatologues, même les plus experts, pour détecter un mélanome Dr Holger Haenssle
 

Distinguer un mélanome malin ou un naevus bénin à partir des seules images

Dans un premier temps, les dermatologues devaient distinguer un mélanome malin ou un naevus bénin à partir des seules images.

Les dermatologues aguerris ont réussi dans 86,6 % des cas à poser le diagnostic de mélanome (sensibilité = 86,9%), et ils ont identifié correctement les naevus bénins dans 71,3% des cas (spécificité = 71,3 %).

On peut traduire ces résultats sous forme d'une courbe de ROC (receiver operating characteristic) dont la surface sous la courbe est de 0,79.

Les auteurs indiquent que les dermatologues experts obtiennent de meilleurs résultats en termes de sensibilité, spécificité et aire sous la courbe de ROC que leurs collègues débutants.

Au même test, le CNN est capable d'identifier 95% des mélanomes malins (sensibilité) et 63,8% des grains de beauté bénins (spécificité), ce qui correspond à une aire sous la courbe de ROC de 0,86.

 
L’IA est capable d'identifier 95% des mélanomes malins (sensibilité) et 63,8% des grains de beauté bénins (spécificité).
 

Images dermoscopiques + informations cliniques

Après quatre semaines, les dermatologues ont été soumis à la deuxième étape de l'étude qui a consisté cette fois à leur fournir à la fois des images dermoscopiques et des informations cliniques.

Les informations supplémentaires ont permis aux dermatologues d'améliorer leurs performances : sensibilité à 88,9 %, spécificité de 75,7 % et aire sous la courbe ROC de 0,82 (p<0,01).

Ces améliorations sont uniquement liées aux meilleurs résultats des groupes les moins aguerris car pour les experts en dermoscopie les informations supplémentaires ne sont pas nécessaires et ne modifient pas les résultats.

Pour l'intelligence artificielle, la deuxième phase du test a fait grimper la sensibilité à 95 %, la spécificité à 90% et une aire sous la courbe ROC est de 0,95.

Algorithme vs dermatologues : c’est toujours l’IA qui gagne à la fin

Les investigateurs ont utilisé la sensibilité des dermatologues (86,6%) de la première phase de l'étude comme référence pour comparer les performances du CNN à celles de l'humain.

« Pour une sensibilité de 86,6 %, la spécificité du CNN était plus élevée (92,5%) que celle des dermatologues (71,3%) » indiquent les auteurs qui soulignent que cette différence est statistiquement significative (p<0,01).

L'aire sous la courbe de ROC pour le CNN à 0,86 est aussi meilleure que celle des dermatologues à 0,79 (p<0,01).

Dans des conditions plus réalistes, quand le médecin reçoit à la fois les images et des informations cliniques, la performance des dermatologues, même si elle s'améliore, est toujours dépassée par le CNN.

En utilisant la sensibilité des dermatologues (88,9%), « la spécificité du CNN est de 82,5%, supérieure à celle des dermatologues (75,7%) » indiquent les investigateurs (p<0,01). De même, l'aire sous la courbe de ROC pour le CNN à 0,86 est aussi meilleure que celle des dermatologues à 0,82 (p<0,01).

« Les résultats de notre étude démontrent qu'une intelligence artificielle correctement entraînée est capable de faire une classification diagnostique d'images dermoscopiques avec une précision excellente » écrivent les auteurs.

« Nos données montrent clairement qu'un algorithme fondé sur un CNN peut être une aide intéressante dans la détection des mélanomes, quel que soit le niveau d'expérience du praticien » ajoutent-ils.

 

 
Une intelligence artificielle correctement entraînée est capable de faire une classification diagnostique d'images dermoscopiques avec une précision excellente Les auteurs
 

IA pour des diagnostics plus standardisés et meilleurs

Dans un éditorial associé à l'article [3], le Dr Victoria Mar (Monash University, Melbourne, Australie) et le Dr Peter Soyer (University of Queensland, Brisbane, Australie) mentionnent une autre étude dans laquelle une intelligence artificielle, déjà un CNN, avait réussi à classer des images de cancer cutané avec un niveau comparable aux dermatologues.

Le recours à l'IA « promet des diagnostics plus standardisés et meilleurs pour les patients, quel que soit le lieu où ils habitent et le médecin qu'ils consultent ».

Les éditorialistes rappellent que les bénéfices attendus d'un diagnostic amélioré sont importants : diminution des procédures inutiles, de la morbidité et des dépenses collectives de santé.

Avant de voir l'IA au service de la détection des mélanomes, une amélioration est indispensable : il faudrait que l'algorithme soit capable d'identifier aussi les patients qui doivent être particulièrement surveillés.

Les éditorialistes suggèrent aussi que l'IA pourrait être utilisée, via des applications pour smartphone, par les patients eux-mêmes pour leur propre surveillance.

Quelques questions restent en suspens. On ne sait, par exemple, pas comment l'IA pourrait diagnostiquer des mélanomes atypiques, dont l'image n'est pas évidente.

On ne sait pas non plus comment l'IA pourrait aider à réaliser des examens de peau corps entier.

Ceci dit, les Drs Mar et Soyer imaginent que l'IA sera un jour intégrée en routine à la pratique clinique.

 

 

 

Commenter

3090D553-9492-4563-8681-AD288FA52ACE
Les commentaires peuvent être sujets à modération. Veuillez consulter les Conditions d'utilisation du forum.

Traitement....