ChatGPT, un modèle de langage reposant sur l’apprentissage automatique, peut faciliter la gestion des tâches textuelles et administratives dans la pratique clinique. Sur le long terme, ChatGPT peut aider au diagnostic des maladies neurodégénératives.
Résumé
Le récent engouement médiatique autour de l’intelligence artificielle met en exergue les défis associés à son utilisation dans le domaine de la médecine. En particulier se pose la question de l’utilisation de ChatGPT, un modèle de langage fondé sur l’intelligence artificielle, dans le diagnostic des maladies neurodégénératives. Bien que ChatGPT ait montré des résultats prometteurs dans l’identification de certains diagnostics médicaux simples, cet outil reste limité pour le diagnostic de pathologies plus complexes qui nécessitent une anamnèse et un examen clinique approfondi, pouvant grandement faire varier la probabilité diagnostique. Ainsi, c’est principalement la précision des données renseignées dans ChatGPT, issues du bilan clinique et neuropsychologique, qui influencent la capacité de ChatGPT à générer un possible diagnostic, ce qui est un facteur limitant, notamment pour l’analyse des bilans neuropsychologiques complexes. À ce jour, ChatGPT ne peut donc pas être utilisé pour le diagnostic de maladies neurodégénératives même si cet outil peut être un outil complémentaire de la pratique clinique, par exemple comme assistance administrative (tâches textuelles, rédaction de compte rendu). Finalement, le principe de précaution demeure pour l’utilisation de ChatGPT, qui, point fondamental, doit se faire en respectant à la lettre le cadre déontologique, éthique et réglementaire.
Abstract: ChatGPT in neurological practice: diagnostic promises, applications, and limitations
The recent media frenzy surrounding artificial intelligence underscores challenges in its medical applications, especially regarding the use of ChatGPT for diagnosing neurodegenerative diseases. While ChatGPT has shown promise in identifying simpler medical conditions, its limitations become apparent when faced with the complexity of more intricate pathologies that necessitate a thorough medical history and clinical examination. These factors significantly impact diagnostic accuracy, emphasizing the importance of precise data input derived from clinical and neuropsychological assessments. Presently, ChatGPT cannot be relied upon for neurodegenerative disease diagnoses. However, it can serve as a supplementary tool in clinical settings, offering administrative assistance such as handling textual tasks and report writing. It is crucial to approach ChatGPT’s use with caution, ensuring strict adherence to ethical and regulatory guidelines.
Introduction
Le récent engouement médiatique autour de l’intelligence artificielle générative, à l’image de ChatGPT (Chat Generative Pre-trained Transformer), met en exergue les défis associés à l’utilisation de l’intelligence artificielle dans le domaine de la médecine. ChatGPT est un modèle de langage reposant sur l’apprentissage automatique qui a pour objectif de répondre naturellement aux questions posées. Cette réponse, qui s’appuie sur un réseau de neurones artificiels, peut se perfectionner, grâce à l’analyse approfondie de vastes ensembles de données textuelles. Ainsi, grâce à ce fonctionnement, ChatGPT peut examiner le contexte de la question et décomposer l’énoncé par étape, permettant d’aboutir à une déduction cohérente, illustrée par la “Chain of Thought” (i.e., l’enchaînement de pensées). Au-delà de ses compétences générales en compréhension et en génération de langage, l’application de ChatGPT dans le domaine des sciences médicales suscite un intérêt croissant. Notamment, car la méthodologie opérationnelle pourrait lui conférer la capacité à s’adapter à une gamme étendue de tâches en pratique clinique, depuis la synthèse élémentaire d’une lettre d’adressage jusqu’à des missions plus complexes, telles que la rédaction d’un compte rendu diagnostique ou la réalisation de recommandations de prises en soin individualisées. Dans cette rapide revue de littérature, nous avons souhaité nous focaliser sur l’apport potentiel de ChatGPT pour le diagnostic des maladies neurodégénératives.
Intérêt de ChatGPT dans le diagnostic en médecine
Un nombre croissant d’études met en évidence l’utilité de ChatGPT, en particulier dans le diagnostic de certaines pathologies ophtalmologiques. À titre d’exemple, Balas et Ing [1] ont fourni à ChatGPT des données cliniques de 11 cas d’ophtalmologie, et ont constaté que ChatGPT avait correctement identifié le diagnostic dans neuf cas (81,8 %). Toujours en ophtalmologie, Delsoz et al. [2] ont évalué la capacité de ChatGPT à diagnostiquer le glaucome chez 11 patients, et ont constaté un diagnostic correct chez huit (71,7 %) d’entre eux. Enfin, dans une autre étude menée par Rao et al. [3], ChatGPT a identifié avec succès le diagnostic dans 72,7 % des 36 vignettes médicales variées. Ces résultats suggèrent que ChatGPT aurait le potentiel de contribuer significativement au diagnostic médical, représentant une avancée majeure dans le domaine des applications médicales fondées sur l’intelligence artificielle.
Dans le bilan neuropsychologique
Sur la base des études ayant testé les capacités diagnostiques de ChatGPT, nous avons évalué sa capacité à fournir une interprétation précise d’un bilan neuropsychologique [4]. Pour ce faire, nous l’avons alimenté avec des données neuropsychologiques d’un patient atteint de la maladie d’Alzheimer à un stade léger. Il s’agissait des scores bruts d’une batterie de tests neuropsychologiques (i.e., tests d’efficience cognitive globale, mémoire de travail, mémoire épisodique verbale et spatiale, fonctions exécutives, fluence verbale). Nous avons ensuite comparé les interprétations de ces scores à celles de deux neuropsychologues. Notre étude a montré que, bien que ChatGPT ait pu fournir une interprétation précise des résultats bruts de chaque test neuropsychologique, il n’a pas été en capacité de réaliser une interprétation globale et standardisée, tenant compte des résultats des tests, les uns par rapport aux autres. Ainsi, dans notre étude, ChatGPT n’a pas pu spécifier que le domaine cognitif le plus affecté chez notre patient était la mémoire. À l’inverse, les interprétations des tests par des neuropsychologues ont pu permettre de souligner chez notre patient la présence d’un déclin principalement mnésique. On observe donc que, bien que ChatGPT puisse permettre l’interprétation générale du bilan neuropsychologique, du moins chez les patients atteints de la maladie d’Alzheimer, il ne peut pas encore appliquer des compétences neuropsychologiques de base (par exemple, transformer les scores bruts) pour préciser la nature de l’altération neuropsychologique.
Synthèse de données médicales
Par la suite, nous avons eu pour projet de tester la capacité de ChatGPT à synthétiser efficacement différentes données médicales (anamnèse, examen physique, résultats d’examens complémentaires) et à contribuer au diagnostic de probabilité de maladie d’Alzheimer [5]. Les premières analyses tendent à montrer que, bien que ChatGPT puisse diagnostiquer la présence d’une maladie neurodégénérative, il n’est pas en capacité de caractériser précisément les stades de sévérité de la maladie, et ne permet pas l’évaluation du retentissement de la maladie sur le patient, et son entourage. Finalement, bien que ChatGPT ait démontré une certaine aptitude à diagnostiquer certaines pathologies, en particulier celles impliquant une description détaillée de la symptomatologie, et en se fondant sur des symptômes pathognomoniques, il n’est pas en mesure de réaliser des diagnostics précis de maladies neurodégénératives complexes et intriquées. Ainsi, à ce jour, les neurologues, gériatres et psychiatres, de par leur formation, demeurent plus compétents pour fournir un diagnostic de probabilité diagnostique, et de sévérité, en se fondant sur un sens clinique et une anamnèse rigoureuse.
Les limites de l’utilisation de ChatGPT : aspects déontologiques, éthiques et réglementaires
L’utilisation de ChatGPT, pour le diagnostic de pathologies neurodégénératives, se base sur des éléments cliniques et neuropsychologiques recueillis lors d’un entretien. Ainsi, c’est principalement la précision des données renseignées par le clinicien dans ChatGPT qui influence sa capacité à générer un diagnostic adapté. Se pose la question des compétences nécessaires à l’utilisation de Chat-GPT pour le diagnostic des maladies complexes, nécessitant une exploration approfondie.
Par ailleurs, un diagnostic de maladie neurodégénérative doit être posé par un professionnel formé, qui respecte un cadre déontologique, éthique et réglementaire, tout au long du parcours diagnostique qui va de la première consultation à l’annonce de la maladie [6]. Cet entretien est indispensable au maintien de la relation médecin/patient et permet une prise en soin individualisée [6]. Or, à ce jour, et à notre connaissance, Chat-GPT n’a pas la capacité de prendre en compte tout cela, et, en conséquence, il existe un risque théorique que le patient se retrouve isolé face à l’IA, au moment du diagnostic, car l’IA n’aurait pas la capacité d’apporter les « bonnes » réponses. Par ailleurs, l’utilisation de ChatGPT pour le diagnostic médical soulève plusieurs questions éthiques. Par exemple, la question de la responsabilité en cas d’erreur et de la fiabilité des résultats doit être soigneusement examinées. L’opacité du processus de prise de décision de l’IA lors du diagnostic peut être une autre préoccupation éthique. L’utilisation de données médicales pour former des modèles soulève des préoccupations en matière de confidentialité et de sécurité. Il est essentiel de garantir que les informations médicales sensibles des patients soient correctement protégées contre tout accès non autorisé ou utilisation abusive.
Une autre question se pose : si les données utilisées pour former le modèle sont biaisées (par exemple, en sous-représentant certaines populations ou en ne couvrant pas certains types de symptômes), le modèle risque de reproduire ces biais dans ses prédictions.
L’utilisation de ChatGPT, des avantages pour la pratique clinique ?
Bien que ChatGPT ne soit pas encore apte à effectuer des diagnostics de maladies neurodégénératives, il pourrait tout de même être utilisé pour faciliter la pratique clinique, notamment concernant les aspects administratifs (traitement de texte et aide à la rédaction de comptes rendus). En effet, ChatGPT offre des capacités d’assistance exceptionnelles, pouvant résumer des dossiers médicaux, synthétiser des éléments dispersés dans différents documents (i.e., observations, examens médicaux, comptes rendus) et les regrouper sous des catégories distinctes. De plus, ChatGPT peut également aider à la rédaction d’ordonnances ou de comptes rendus médicaux, automatiser le codage, la rédaction de courriels, et simplifier des messages techniques pour les non-professionnels. Dans le domaine de la recherche, ChatGPT peut aussi aider à la traduction et à la rédaction d’articles scientifiques ou de vulgarisation médicale.
Conclusion
À ce jour, pour poser un diagnostic de maladie neurodégénérative, ChatGPT doit surtout être considéré comme un outil complémentaire au jugement clinique, et pourrait être utilisé par des médecins possédant une formation et une expertise leur permettant de détecter et d’interpréter les symptômes des maladies neurodégénératives. En outre, les considérations éthiques, déontologiques, et réglementaires doivent être scrupuleusement respectées lors de l’intégration de ChatGPT dans la pratique clinique, au risque d’un mésusage de l’outil par le patient, ce qui pourrait entraîner des conséquences désastreuses sur la prise en soin individualisée de sa maladie neurodégénérative.
Correspondance
Mohamad.Elhaj@univ-nantes.fr
guillaume.chapelet@chu-nantes.fr
claire.boutoleaubretonniere
@chu-nantes.fr
Les auteurs déclarent ne pas avoir de lien d’intérêt.
Bibliographie
1. Balas M, Ing EB. Conversational AI Models for ophthalmic diagnosis: Comparison of ChatGPT and the Isabel Pro Differential Diagnosis Generator. JFO Open Ophthalmology 2023 ; 1 : 100005.
2. Delsoz M, Raja H, Madadi Y et al. The Use of ChatGPT to Assist in Diagnosing Glaucoma Based on Clinical Case Reports. Ophthalmol Ther 2023 ; 12 : 3121-32.
3. Rao A, Pang M, Kim J et al. Assessing the Utility of ChatGPT Throughout the Entire Clinical Workflow: Development and Usability Study. J Med Internet Res 2023 ; 25 : e48659.
4. El Haj M, Boutoleau-Bretonnière C, Chapelet G. ChatGPT’s Dance with Neuropsychological Data: a case study in Alzheimer’s Disease. Ageing Res Rev 2023 : 102117.
5. Dubois B, Villain N, Frisoni GB et al. Clinical diagnosis of Alzheimer’s disease: recommendations of the International Working Group. Lancet Neurol 2021 ; 20 : 484-96.
6. Liss JL, Seleri Assunção S, Cummings J et al. Practical recommendations for timely, accurate diagnosis of symptomatic Alzheimer’s disease (MCI and dementia) in primary care: a review and synthesis. J Intern Med 2021 ; 290 : 310-34.