Gràcies per visitar Nature.com. La versió del navegador que utilitzeu té un suport CSS limitat. Per obtenir els millors resultats, us recomanem que utilitzeu una versió més recent del vostre navegador (o desactiveu el mode de compatibilitat a Internet Explorer). Mentrestant, per assegurar el suport continuat, mostrem el lloc sense dissenyar ni JavaScript.
Les aplicacions d’intel·ligència artificial clínica (IA) creixen ràpidament, però els currículums existents de l’escola de medicina ofereixen un ensenyament limitat que cobreix aquesta àrea. Aquí descrivim un curs de formació d’intel·ligència artificial que vam desenvolupar i lliurar als estudiants de medicina canadenc i fer recomanacions per a la formació futura.
La intel·ligència artificial (AI) en medicina pot millorar l’eficiència del lloc de treball i ajudar a la presa de decisions clíniques. Per guiar amb seguretat l’ús de la intel·ligència artificial, els metges han de comprendre la intel·ligència artificial. Molts comentaris defensen l’ensenyament de conceptes d’AI1, com ara explicar models d’AI i processos de verificació2. Tot i això, s’han implementat pocs plans estructurats, especialment a nivell nacional. Pinto Dos Santos et al.3. 263 estudiants de medicina van ser enquestats i el 71% va acordar que necessitaven formació en intel·ligència artificial. L’ensenyament d’intel·ligència artificial a un públic mèdic requereix un disseny minuciós que combina conceptes tècnics i no tècnics per als estudiants que sovint tenen un ampli coneixement previ. Descrivim la nostra experiència proporcionant una sèrie de tallers d’AI a tres grups d’estudiants de medicina i fem recomanacions per a l’educació mèdica futura en IA.
La nostra introducció de cinc setmanes a la intel·ligència artificial en medicina per a estudiants de medicina es va celebrar tres vegades entre febrer de 2019 i abril de 2021. Es mostra a la figura 1 un calendari per a cada taller, amb una breu descripció dels canvis al curs. Tres objectius d’aprenentatge primari: els estudiants entenen com es processen les dades en aplicacions d’intel·ligència artificial, analitzen la literatura d’intel·ligència artificial per a aplicacions clíniques i aprofiten les oportunitats de col·laborar amb els enginyers que desenvolupen intel·ligència artificial.
El blau és el tema de la conferència i el blau clar és el període interactiu de preguntes i respostes. La secció gris és el focus de la breu revisió de la literatura. Les seccions taronja són estudis de cas seleccionats que descriuen models o tècniques d’intel·ligència artificial. Green és un curs de programació guiat dissenyat per ensenyar intel·ligència artificial per resoldre problemes clínics i avaluar models. El contingut i la durada dels tallers varien en funció d’una avaluació de les necessitats dels estudiants.
El primer taller es va celebrar a la Universitat de la Colúmbia Britànica de febrer a abril de 2019, i els 8 participants van donar comentaris positius4. A causa del COVID-19, el segon taller es va celebrar pràcticament a l'octubre-novembre del 2020, amb 222 estudiants de medicina i 3 residents de 8 escoles de medicina canadenques. Les diapositives i el codi de presentació s’han penjat a un lloc d’accés obert (http://ubcaimed.github.io). El feedback clau de la primera iteració va ser que les conferències eren massa intenses i el material massa teòric. El servei a les sis zones horàries diferents del Canadà suposa reptes addicionals. Així, el segon taller va escurçar cada sessió a 1 hora, va simplificar el material del curs, va afegir més estudis de cas i va crear programes de placa de caldera que permetia als participants completar els fragments de codi amb una depuració mínima (casella 1). Els comentaris clau de la segona iteració van incloure comentaris positius sobre els exercicis de programació i una sol·licitud per demostrar la planificació d’un projecte d’aprenentatge automàtic. Per tant, al nostre tercer taller, celebrat pràcticament per a 126 estudiants de medicina el març-abril 2021, vam incloure més exercicis de codificació interactius i sessions de retroalimentació del projecte per demostrar l’impacte d’utilitzar conceptes de taller en projectes.
Anàlisi de dades: un camp d’estudi en estadístiques que identifiquen patrons significatius en dades mitjançant l’anàlisi, el processament i la comunicació de patrons de dades.
Mineria de dades: el procés d’identificació i extracció de dades. En el context de la intel·ligència artificial, sovint és gran, amb múltiples variables per a cada mostra.
Reducció de la dimensionalitat: el procés de transformació de dades amb moltes funcions individuals en menys funcions, conservant les propietats importants del conjunt de dades original.
Característiques (en el context de la intel·ligència artificial): propietats mesurables d’una mostra. Sovint s'utilitza intercanviablement amb "propietat" o "variable".
Mapa d’activació de gradients: una tècnica que s’utilitza per interpretar models d’intel·ligència artificial (especialment xarxes neuronals convolutives), que analitza el procés d’optimització de la darrera part de la xarxa per identificar regions de dades o imatges altament predictives.
Model estàndard: un model AI existent que s’ha format prèviament per realitzar tasques similars.
Prova (en el context de la intel·ligència artificial): Observar com un model realitza una tasca mitjançant dades que no s’ha trobat abans.
Formació (en el context de la intel·ligència artificial): proporcionar un model amb dades i resultats de manera que el model ajusti els seus paràmetres interns per optimitzar la seva capacitat per realitzar tasques mitjançant noves dades.
Vector: matriu de dades. En l'aprenentatge automàtic, cada element de matriu sol ser una característica única de la mostra.
La taula 1 mostra els darrers cursos per a l’abril de 2021, inclosos els objectius d’aprenentatge orientats a cada tema. Aquest taller està destinat a aquells nous al nivell tècnic i no requereix cap coneixement matemàtic més enllà del primer any de grau mèdic. El curs va ser desenvolupat per 6 estudiants de medicina i 3 professors amb titulacions avançades en enginyeria. Els enginyers desenvolupen la teoria de la intel·ligència artificial per ensenyar i els estudiants de medicina aprenen material clínicament rellevant.
Els tallers inclouen conferències, estudis de cas i programació guiada. A la primera conferència, revisem els conceptes seleccionats d’anàlisi de dades en biostatística, incloent la visualització de dades, la regressió logística i la comparació d’estadístiques descriptives i inductives. Tot i que l’anàlisi de dades és el fonament de la intel·ligència artificial, excloem temes com la mineria de dades, les proves de significació o la visualització interactiva. Això es va deure a restriccions de temps i també perquè alguns estudiants de grau tenien formació prèvia en biostatística i volien tractar temes d’aprenentatge automàtic més únics. La conferència posterior introdueix mètodes moderns i discuteix la formulació de problemes de l'AI, els avantatges i les limitacions dels models d'AI i les proves de models. Les conferències es complementen amb la literatura i la investigació pràctica sobre dispositius d’intel·ligència artificial existents. Destaquem les habilitats necessàries per avaluar l'efectivitat i la viabilitat d'un model per abordar qüestions clíniques, inclosa la comprensió de les limitacions dels dispositius d'intel·ligència artificial existents. Per exemple, vam demanar als estudiants que interpretessin les directrius de lesions del cap pediàtric proposades per Kupperman et al., 5 que van implementar un algoritme d’arbre de decisions d’intel·ligència artificial per determinar si una exploració TC seria útil en funció de l’examen d’un metge. Destaquem que es tracta d’un exemple comú d’IA que proporciona analítica predictiu perquè els metges interpretin, en lloc de substituir els metges.
En els exemples de programació de bootstrap de codi obert disponibles (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_exemples), demostrem com realitzar anàlisis de dades exploratòries, reducció de dimensionalitat, càrrega de models estàndard i formació . i proves. Utilitzem els quaderns de Google Colaboratory (Google LLC, Mountain View, CA), que permeten executar el codi Python des d’un navegador web. A la figura 2, la figura 2 proporciona un exemple d’exercici de programació. Aquest exercici consisteix en predir malalties malignes mitjançant el conjunt de dades d’imatge de mama oberta de Wisconsin i un algorisme d’arbre de decisions.
Presenten programes al llarg de la setmana sobre temes relacionats i seleccioneu exemples de les aplicacions de IA publicades. Els elements de programació només s’inclouen si es consideren rellevants per proporcionar informació sobre la pràctica clínica futura, com ara com avaluar els models per determinar si estan preparats per al seu ús en assaigs clínics. Aquests exemples culminen en una aplicació de punta a punta completa que classifica els tumors com a benignes o malignes basades en paràmetres d’imatge mèdica.
Heterogeneïtat del coneixement previ. Els nostres participants van variar en el seu nivell de coneixement matemàtic. Per exemple, els estudiants amb antecedents d’enginyeria avançada busquen més material en profunditat, com ara com realitzar les seves pròpies transformacions de Fourier. No obstant això, no és possible discutir l'algoritme de Fourier a classe perquè requereix un coneixement en profunditat del processament del senyal.
Sortida d’assistència. L’assistència a les reunions de seguiment va disminuir, sobretot en formats en línia. Una solució pot ser fer un seguiment de l’assistència i proporcionar un certificat de finalització. Es coneix que les escoles de medicina reconeixen les transcripcions de les activitats acadèmiques extracurriculars dels estudiants, que poden animar els estudiants a cursar un títol.
Disseny del curs: perquè la IA abasta tants subcampistes, seleccionar conceptes bàsics de profunditat i amplitud adequades pot ser difícil. Per exemple, la continuïtat de l’ús d’eines d’AI del laboratori a la clínica és un tema important. Si bé cobreixem el preprocessament de dades, la creació de models i la validació, no inclouem temes com ara analítica de dades grans, visualització interactiva o realitzant assajos clínics de la IA, sinó que ens centrem en els conceptes de IA més singulars. El nostre principi de guia és millorar l’alfabetització, no les habilitats. Per exemple, comprendre com un model processa les funcions d’entrada és important per a la interpretabilitat. Una forma de fer -ho és utilitzar mapes d’activació de gradients, que poden visualitzar quines regions de les dades són previsibles. Tot i això, això requereix càlcul multivariant i no es pot introduir8. El desenvolupament d’una terminologia comuna va ser un repte perquè estàvem intentant explicar com treballar amb les dades com a vectors sense formalisme matemàtic. Tingueu en compte que diferents termes tenen el mateix significat, per exemple, en epidemiologia, una "característica" es descriu com una "variable" o "atribut".
Retenció de coneixement. Com que l’aplicació de l’IA és limitada, encara queda per veure els participants. Els currículums de l'escola de medicina sovint es basen en la repetició espaiada per reforçar el coneixement durant les rotacions pràctiques, 9 que també es poden aplicar a l'educació de l'AI.
La professionalitat és més important que l’alfabetització. La profunditat del material està dissenyada sense rigor matemàtic, que va ser un problema a l’hora de llançar cursos clínics en intel·ligència artificial. En els exemples de programació, utilitzem un programa de plantilla que permet als participants omplir camps i executar el programari sense haver de descobrir com configurar un entorn de programació complet.
Es tracta de preocupacions sobre la intel·ligència artificial: hi ha una gran preocupació perquè la intel·ligència artificial pugui substituir alguns deures clínics3. Per solucionar aquest problema, expliquem les limitacions de la IA, inclòs el fet que gairebé totes les tecnologies d’AI aprovades pels reguladors requereixen la supervisió del metge11. També destaquem la importància del biaix perquè els algoritmes són propensos al biaix, sobretot si el conjunt de dades no és divers. En conseqüència, es pot modelar de manera incorrecta un determinat subgrup, donant lloc a decisions clíniques injustes.
Els recursos estan disponibles públicament: hem creat recursos disponibles públicament, incloses les diapositives i el codi de conferències. Tot i que l’accés a contingut síncron és limitat a causa de les zones horàries, el contingut de codi obert és un mètode convenient per a l’aprenentatge asíncron, ja que l’experiència de l’IA no està disponible a totes les escoles de medicina.
Col·laboració interdisciplinària: aquest taller és una empresa conjunta iniciada pels estudiants de medicina per planificar cursos juntament amb enginyers. Això demostra oportunitats de col·laboració i llacunes de coneixement en ambdues àrees, permetent als participants comprendre el paper potencial que poden contribuir en el futur.
Definiu les competències bàsiques d’AI. Definir una llista de competències proporciona una estructura normalitzada que es pot integrar en els currículums mèdics basats en competències existents. Actualment, aquest taller utilitza els nivells d’objectius d’aprenentatge 2 (comprensió), 3 (aplicació) i 4 (anàlisi) de la taxonomia de Bloom. Tenir recursos a nivells més alts de classificació, com ara crear projectes, pot reforçar encara més el coneixement. Això requereix treballar amb experts clínics per determinar com es poden aplicar temes de la IA als fluxos de treball clínics i prevenir l’ensenyament de temes repetitius ja inclosos en els currículums mèdics estàndard.
Creeu estudis de cas mitjançant AI. De forma similar als exemples clínics, l’aprenentatge basat en casos pot reforçar els conceptes abstractes destacant la seva rellevància per a les qüestions clíniques. Per exemple, un estudi de taller va analitzar el sistema de detecció de retinopatia diabètica basat en IA de Google 13 per identificar reptes al llarg del camí des del laboratori fins a la clínica, com ara els requisits de validació externa i les vies d’aprovació reguladora.
Utilitzeu l’aprenentatge experiencial: les habilitats tècniques requereixen pràctiques centrades i aplicació repetida per dominar, similars a les experiències d’aprenentatge rotatives dels entrenadors clínics. Una solució potencial és el model d’aula flipped, que s’ha informat que millora la retenció de coneixement en l’educació en enginyeria14. En aquest model, els estudiants revisen el material teòric de manera independent i el temps de classe es dedica a resoldre problemes mitjançant estudis de cas.
Escala per a participants multidisciplinaris: preveiem l’adopció de l’IA que implica la col·laboració en múltiples disciplines, inclosos els metges i professionals de la salut aliats amb diversos nivells de formació. Per tant, és possible que els currículums puguin ser desenvolupats en consulta amb professors de diferents departaments per adaptar el seu contingut a diferents àrees d’atenció sanitària.
La intel·ligència artificial és alta tecnologia i els seus conceptes bàsics estan relacionats amb les matemàtiques i les informàtiques. Formació del personal sanitari per comprendre la intel·ligència artificial presenta reptes únics en la selecció de contingut, la rellevància clínica i els mètodes de lliurament. Esperem que els coneixements obtinguts de la IA en tallers d’educació ajudaran els futurs educadors a abraçar maneres innovadores d’integrar la IA en l’educació mèdica.
El script de Google Colaboratory Python és de codi obert i està disponible a: https://github.com/ubcaimed/ubcaimed.github.io/tree/master/.
Prober, KG i Khan, S. Repensar l’educació mèdica: una crida a l’acció. Akkad. medicament. 88, 1407–1410 (2013).
McCoy, LG, etc. Què han de saber realment els estudiants de medicina sobre la intel·ligència artificial? Nombres NPZH. Medicina 3, 1-3 (2020).
Dos Santos, DP, et al. Actituds dels estudiants de medicina envers la intel·ligència artificial: una enquesta multicèntrica. Euro. radiació. 29, 1640–1646 (2019).
Fan, Ky, Hu, R., i Singla, R. Introducció a l’aprenentatge automàtic per a estudiants de medicina: un projecte pilot. J. Med. ensenyar. 54, 1042–1043 (2020).
Cooperman N, et al. Identificar els nens amb un risc molt baix de lesions cerebrals clínicament significatives després de lesions al cap: un estudi potencial de cohort. Lancet 374, 1160–1170 (2009).
Street, WN, Wolberg, WH i Mangasare, Ol. Extracció de funcions nuclears per al diagnòstic del tumor de mama. Ciència biomèdica. Processament d’imatges. Ciència biomèdica. Weiss. 1905, 861–870 (1993).
Chen, Phc, Liu, Y. i Peng, L. Com desenvolupar models d’aprenentatge automàtic per a l’assistència sanitària. Nat. Mat. 18, 410–414 (2019).
Selvaraju, RR et al. Grad-Cam: Interpretació visual de xarxes profundes mitjançant localització basada en gradients. Proceedings of the IEEE International Conference on Computer Vision, 618–626 (2017).
Kumaravel B, Stewart K i Ilic D. Desenvolupament i avaluació d’un model en espiral per avaluar les competències de medicina basades en evidències mitjançant OSCE en educació mèdica de grau. Medicina BMK. ensenyar. 21, 1–9 (2021).
Kolachalama VB i Garg PS Machine Learning and Medical Education. Nombres NPZH. medicament. 1, 1-3 (2018).
Van Leeuwen, KG, Schalekamp, S., Rutten, MJ, Van Ginneken, B. i De Rooy, M. Intel·ligència artificial en radiologia: 100 productes comercials i les seves proves científiques. Euro. radiació. 31, 3797–3804 (2021).
Topol, EJ Medicina d’alt rendiment: la convergència de la intel·ligència humana i artificial. Nat. medicament. 25, 44–56 (2019).
Bede, E. et al. L’avaluació centrada en l’ésser humà d’un sistema d’aprenentatge profund desplegat a la clínica per a la detecció de retinopatia diabètica. Actes de la Conferència de CHI 2020 sobre factors humans en sistemes informàtics (2020).
Kerr, B. L’aula flipped in Engineering Education: A Research Review. Proceedings of the International Conference on Interactive Collaborative Learning (2015).
Els autors agraeixen a Danielle Walker, Tim Salcudin i Peter Zandstra del clúster de recerca en imatge biomèdica i artificial a la Universitat de Colúmbia Britànica per suport i finançament.
RH, PP, ZH, RS i MA van ser els responsables de desenvolupar el contingut docent del taller. RH i PP van ser els responsables de desenvolupar els exemples de programació. KYF, OY, MT i PW van ser els responsables de l’organització logística del projecte i de l’anàlisi dels tallers. RH, OY, MT, RS van ser els responsables de crear les figures i les taules. RH, KYF, PP, ZH, OY, MY, PW, TL, MA, RS van ser els responsables de redactar i editar el document.
Medicina de comunicació gràcies a Carolyn McGregor, Fabio Moraes i Aditya Borakati per les seves contribucions a la revisió d’aquest treball.
Posada Posada: 19 de febrer-2024