Le développement rapide de l’intelligence artificielle (IA) et de l’apprentissage automatique (machine learning) au cours de la dernière décennie a fondamentalement transformé l’approche de nombreuses disciplines médicales [1]. Ces technologies reposent sur une composante essentielle : les datasets. Par définition, un dataset est une collection organisée d’éléments, utilisée pour entraîner, valider et tester des modèles algorithmiques [2].
La dermatologie est une spécialité fortement visuelle, où la reconnaissance des patterns morphologiques et des structures superficielles est centrale pour établir un diagnostic. Cette dépendance à l’imagerie fait de la discipline un terrain privilégié pour le développement d’algorithmes de vision [2]. Toutefois, l’efficacité et la généralisabilité de ces modèles dépendent directement de la qualité, de la diversité et de la taille des datasets utilisés lors de leur conception [3]. En effet, des bases de données riches et représentatives permettent non seulement d’entraîner des réseaux neuronaux profonds (DNN) capables de rivaliser avec des dermatologues experts, mais aussi de valider leur performance dans des contextes cliniques variés [4].
Intérêts des datasets d’images
L’intérêt des datasets en dermatologie ne se limite pas au développement d’outils diagnostiques. Ils constituent également une ressource précieuse pour :
– l’enseignement et la formation assistée par ordinateur ;
– la recherche épidémiologique pour mieux comprendre la prévalence des affections cutanées selon les groupes démographiques ;
– la création de modèles prédictifs pour anticiper l’évolution des maladies chroniques comme le psoriasis ou la dermatite atopique.
En premier lieu, les datasets permettent de former des modèles de classification et de détection des lésions cutanées. Les réseaux neuronaux convolutifs (CNN), par exemple, nécessitent des milliers, voire des millions d’images annotées pour apprendre à différencier des entités cliniques telles que les nævus bénins, les carcinomes cutanés, et les mélanomes [4]. Ce paradigme d’apprentissage supervisé, illustré par les travaux d’Esteva et al. [1] qui ont démontré une performance équivalente à celle de dermatologues experts, repose sur l’accès à des bases de données d’images dermatoscopiques et cliniques massives et correctement étiquetées.
Les datasets[...]
Connectez-vous pour consulter l'article dans son intégralité.
Vous êtes abonné(e)
IDENTIFIEZ-VOUS
Pas encore abonné(e)
INSCRIVEZ-VOUS
Inscrivez-vous gratuitement et profitez de tous les sites du groupe Performances Médicales
S'inscrire
