• nosaltres

Validació d’un model de mineria de dades contra mètodes d’estimació de l’edat dental tradicional entre adolescents coreans i adults joves

Gràcies per visitar Nature.com. La versió del navegador que utilitzeu té un suport CSS limitat. Per obtenir els millors resultats, us recomanem que utilitzeu una versió més recent del vostre navegador (o desactiveu el mode de compatibilitat a Internet Explorer). Mentrestant, per assegurar el suport continuat, mostrem el lloc sense dissenyar ni JavaScript.
Les dents es consideren l’indicador més precís de l’edat del cos humà i sovint s’utilitzen en l’avaluació de l’edat forense. Teníem com a objectiu validar les estimacions de l’edat dental basades en la mineria de dades comparant la precisió d’estimació i el rendiment de classificació del llindar de 18 anys amb mètodes tradicionals i estimacions d’edat basades en la mineria de dades. Es van recollir un total de 2657 radiografies panoràmiques de ciutadans coreans i japonesos de 15 a 23 anys. Es van dividir en un conjunt d’entrenament, cadascuna que contenia 900 radiografies coreanes i un conjunt de proves intern que conté 857 radiografies japoneses. Hem comparat la precisió i l'eficiència de la classificació dels mètodes tradicionals amb conjunts de proves de models de mineria de dades. La precisió del mètode tradicional del conjunt de proves intern és lleugerament superior a la del model de mineria de dades, i la diferència és petita (error absolut mitjà <0,21 anys, error quadrat mitjà de l’arrel <0,24 anys). El rendiment de classificació del tall de 18 anys també és similar entre els mètodes tradicionals i els models de mineria de dades. Així, els mètodes tradicionals es poden substituir per models de mineria de dades quan realitzen una avaluació de l'edat forense mitjançant la maduresa de segon i tercer molars en adolescents coreans i adults joves.
L’estimació de l’edat dental s’utilitza àmpliament en la medicina forense i l’odontologia pediàtrica. En particular, a causa de l’elevada correlació entre l’edat cronològica i el desenvolupament dental, l’avaluació de l’edat per etapes de desenvolupament dental és un criteri important per avaluar l’edat dels nens i adolescents1,2,3. No obstant això, per als joves, l'estimació de l'edat dental basada en la maduresa dental té les seves limitacions perquè el creixement dental és gairebé complet, a excepció dels tercers molars. L’objectiu legal de determinar l’edat dels joves i adolescents és proporcionar estimacions precises i proves científiques de si han arribat a l’edat majoritària. A la pràctica medico-legal d’adolescents i adults joves a Corea, es va estimar l’edat mitjançant el mètode de Lee, i es va predir un llindar legal de 18 anys a partir de les dades reportades per OH et al 5.
L’aprenentatge automàtic és un tipus d’intel·ligència artificial (AI) que aprèn i classifica repetidament grans quantitats de dades, resol problemes per si soles i impulsa la programació de dades. L’aprenentatge automàtic pot descobrir patrons ocults útils en grans volums de dades6. En canvi, els mètodes clàssics, que consumeixen la mà d’obra i que requereixen temps, poden tenir limitacions quan es tracta de grans volums de dades complexes difícils de processar manualment7. Per tant, molts estudis s’han realitzat recentment utilitzant les últimes tecnologies informàtiques per minimitzar els errors humans i processar de manera eficient les dades multidimensionals8,9,10,11,12. En particular, s’han utilitzat àmpliament l’aprenentatge profund en l’anàlisi d’imatges mèdiques i s’han informat que s’han informat de diversos mètodes per a l’estimació d’edat mitjançant l’anàlisi automàticament de radiografies per millorar la precisió i l’eficiència de l’estimació d’edat13,14,15,16,17,18,19,20 . Per exemple, Halabi et al 13 van desenvolupar un algorisme d’aprenentatge automàtic basat en xarxes neuronals convolutives (CNN) per estimar l’edat esquelètica mitjançant radiografies de mans dels nens. Aquest estudi proposa un model que aplica l’aprenentatge de màquines a les imatges mèdiques i demostra que aquests mètodes poden millorar la precisió diagnòstica. Li et al14 estimaven l'edat de les imatges de raigs X pèlvics mitjançant un CNN d'aprenentatge profund i les van comparar amb resultats de regressió mitjançant l'estimació en fase d'osificació. Van trobar que el model de CNN d’aprenentatge profund mostrava el mateix rendiment d’estimació d’edat que el model de regressió tradicional. L’estudi de Guo et al. [15] va avaluar el rendiment de la classificació de la tolerància a l’edat de la tecnologia CNN basada en ortofotos dentals i els resultats del model CNN van demostrar que els humans van superar el seu rendiment de classificació d’edat.
La majoria dels estudis sobre l'estimació de l'edat mitjançant l'aprenentatge automàtic utilitzen mètodes d'aprenentatge profund13,14,15,16,17,18,19,20. L’estimació d’edat basada en un aprenentatge profund es diu que és més precisa que els mètodes tradicionals. Tot i això, aquest enfocament proporciona poca oportunitat per presentar la base científica per a les estimacions d’edat, com els indicadors d’edat utilitzats en les estimacions. També hi ha una disputa legal sobre qui realitza les inspeccions. Per tant, l’estimació d’edat basada en un aprenentatge profund és difícil d’acceptar per les autoritats administratives i judicials. La mineria de dades (DM) és una tècnica que pot descobrir no només s’esperava, sinó també informació inesperada com a mètode per descobrir correlacions útils entre grans quantitats de dades6,21,22. L’aprenentatge automàtic s’utilitza sovint en la mineria de dades, i tant la mineria de dades com l’aprenentatge automàtic utilitzen els mateixos algoritmes clau per descobrir patrons en dades. L’estimació d’edat mitjançant el desenvolupament dental es basa en l’avaluació de l’examinador de la maduresa de les dents objectiu, i aquesta avaluació s’expressa com a etapa per a cada dent objectiu. La DM es pot utilitzar per analitzar la correlació entre l’etapa d’avaluació dental i l’edat real i té el potencial de substituir l’anàlisi estadística tradicional. Per tant, si apliquem tècniques de DM a l'estimació d'edat, podem implementar l'aprenentatge automàtic en l'estimació de l'edat forense sense preocupar -nos de la responsabilitat legal. S'han publicat diversos estudis comparatius sobre possibles alternatives als mètodes manuals tradicionals utilitzats en la pràctica forense i els mètodes basats en EBM per determinar l'edat dental. Shen et al23 van demostrar que el model DM és més precís que la fórmula tradicional de Camerer. Galibourg et al24 van aplicar diferents mètodes DM per predir l'edat segons el criteri de Demirdjian i els resultats van demostrar que el mètode DM va superar els mètodes Demirdjian i Willems per estimar l'edat de la població francesa.
Per estimar l’edat dental dels adolescents coreans i els adults joves, el mètode 4 de Lee s’utilitza àmpliament en la pràctica forense coreana. Aquest mètode utilitza l’anàlisi estadística tradicional (com la regressió múltiple) per examinar la relació entre els subjectes coreans i l’edat cronològica. En aquest estudi, els mètodes d’estimació d’edat obtinguts mitjançant mètodes estadístics tradicionals es defineixen com a “mètodes tradicionals”. El mètode de Lee és un mètode tradicional i la seva precisió ha estat confirmada per Oh et al. 5; Tanmateix, l’aplicabilitat de l’estimació d’edat basada en el model DM en la pràctica forense coreana encara és qüestionable. El nostre objectiu era validar científicament la potencial utilitat de l’estimació d’edat basada en el model DM. L’objectiu d’aquest estudi va ser (1) comparar la precisió de dos models DM en l’estimació de l’edat dental i (2) comparar el rendiment de classificació de 7 models DM a l’edat de 18 anys amb els obtinguts mitjançant la maduresa dels mètodes estadístics tradicionals de la segona i tercers molars a les dues mandíbules.
Els mitjans i les desviacions estàndard de l’edat cronològica per etapa i tipus de dent es mostren en línia a la taula suplementària S1 (conjunt d’entrenament), a la taula suplementària S2 (conjunt de proves internes) i a la taula suplementària S3 (conjunt de proves externes). Els valors de Kappa per a la fiabilitat intra i interobserver obtinguda del conjunt de formació van ser de 0,951 i 0,947, respectivament. Els valors P i els intervals de confiança del 95% dels valors de Kappa es mostren a la taula suplementària en línia S4. El valor kappa es va interpretar com a "gairebé perfecte", d'acord amb els criteris de Landis i Koch26.
Quan es compara un error absolut mitjà (MAE), el mètode tradicional supera lleugerament el model DM per a tots els gèneres i en el conjunt de proves masculins externs, a excepció de Perceptron multicapa (MLP). La diferència entre el model tradicional i el model DM del conjunt de proves de MAE intern va ser de 0,12–0,19 anys per a homes i 0,17–0,21 anys per a les dones. Per a la bateria de prova externa, les diferències són menors (0,001–0,05 anys per a homes i 0,05–0,09 anys per a les dones). A més, l’error quadrat mitjà d’arrel (RMSE) és lleugerament inferior al mètode tradicional, amb diferències menors (0,17–0,24, 0,2–0,24 per al conjunt de proves internes masculines i 0,03–0,07, 0,04–0,08 per al conjunt de proves externs). )). El MLP mostra un rendiment lleugerament millor que el Perceptron de la capa única (SLP), excepte en el cas del conjunt de proves externes femenines. Per a MAE i RMSE, les puntuacions de conjunt de proves externes superiors al conjunt de proves internes per a tots els gèneres i models. Tots els MAE i RMSE es mostren a la taula 1 i a la figura 1.
MAE i RMSE de models de regressió de mines tradicionals i de dades. Error absolut mitjà MAE, error quadrat mitjà RMSE, Perceptron de capa única SLP, MLP de Perceptron multicapa, mètode CM tradicional.
El rendiment de classificació (amb un tall de 18 anys) dels models tradicionals i DM es va demostrar en termes de sensibilitat, especificitat, valor predictiu positiu (PPV), valor predictiu negatiu (NPV) i àrea sota la corba característica operativa del receptor (AUROC) 27 (Taula 2, Figura 2 i Figura suplementària 1 en línia). Pel que fa a la sensibilitat de la bateria de prova interna, els mètodes tradicionals van funcionar millor entre els homes i pitjors entre les dones. Tanmateix, la diferència en el rendiment de classificació entre els mètodes tradicionals i la SD és del 9,7% per als homes (MLP) i només el 2,4% per a les dones (XGBoost). Entre els models de DM, la regressió logística (LR) va mostrar una millor sensibilitat en ambdós sexes. Pel que fa a l’especificitat del conjunt de proves internes, es va observar que els quatre models SD funcionaven bé en els homes, mentre que el model tradicional va funcionar millor en les dones. Les diferències en el rendiment de classificació per a homes i dones són del 13,3% (MLP) i del 13,1% (MLP), respectivament, que indiquen que la diferència en el rendiment de classificació entre els models supera la sensibilitat. Entre els models de DM, la màquina vectorial de suport (SVM), l’arbre de decisions (DT) i els models de bosc aleatori (RF) es van realitzar millor entre els homes, mentre que el model LR va funcionar millor entre les dones. L’Auroc del model tradicional i de tots els models SD va ser superior a 0,925 (K-K-Nearest Veight (KNN) en homes), demostrant un excel·lent rendiment de classificació en la discriminació de mostres de 18 anys28. Per al conjunt de proves externs, hi va haver una disminució del rendiment de classificació en termes de sensibilitat, especificitat i AUROC en comparació amb el conjunt de proves internes. A més, la diferència de sensibilitat i especificitat entre el rendiment de classificació dels millors i els pitjors models va oscil·lar entre el 10% i el 25% i va ser més gran que la diferència en el conjunt de proves internes.
Sensibilitat i especificitat dels models de classificació de la mineria de dades en comparació amb els mètodes tradicionals amb un tall de 18 anys. KNN K NEARID més proper, màquina vectorial de suport SVM, regressió logística de LR, arbre de decisions DT, bosc aleatori RF, XGB XGBOOST, MLP multicapa Perceptron, Mètode CM tradicional.
El primer pas en aquest estudi va ser comparar la precisió de les estimacions de l’edat dental obtingudes a partir de set models de DM amb els obtinguts mitjançant la regressió tradicional. MAE i RMSE es van avaluar en conjunts de proves interns per a tots dos sexes, i la diferència entre el mètode tradicional i el model DM va oscil·lar entre 44 i 77 dies per a MAE i de 62 a 88 dies per a RMSE. Tot i que el mètode tradicional era lleugerament més precís en aquest estudi, és difícil concloure si una diferència tan petita té una importància clínica o pràctica. Aquests resultats indiquen que la precisió de l'estimació de l'edat dental mitjançant el model DM és gairebé la mateixa que la del mètode tradicional. La comparació directa amb els resultats d’estudis anteriors és difícil perquè cap estudi ha comparat la precisió dels models de DM amb mètodes estadístics tradicionals que utilitzen la mateixa tècnica de gravar dents en el mateix rang d’edat que en aquest estudi. Galibourg et al24 van comparar MAE i RMSE entre dos mètodes tradicionals (Method25 Demirjian i Willems Method29) i 10 models DM en una població francesa de 2 a 24 anys. Van informar que tots els models DM eren més precisos que els mètodes tradicionals, amb diferències de 0,20 i 0,38 anys en MAE i 0,25 i 0,47 anys en RMSE en comparació amb els mètodes Willems i Demirdjian, respectivament. La discrepància entre el model SD i els mètodes tradicionals mostrats en l'estudi Halibourg té en compte nombrosos informes30,31,32,33 que el mètode Demirdjian no estima amb precisió l'edat dental en poblacions diferents dels canadencs francesos en què es va basar l'estudi. En aquest estudi. Tai et al 34 van utilitzar l'algoritme MLP per predir l'edat de la dent de 1636 fotografies d'ortodòncia xinesa i van comparar la seva precisió amb els resultats del mètode Demirjian i Willems. Van informar que la MLP té una precisió més alta que els mètodes tradicionals. La diferència entre el mètode Demirdjian i el mètode tradicional és de <0,32 anys, i el mètode Willems és de 0,28 anys, que és similar als resultats del present estudi. Els resultats d’aquests estudis anteriors24,34 també són consistents amb els resultats del present estudi i la precisió d’estimació d’edat del model DM i el mètode tradicional són similars. Tanmateix, a partir dels resultats presentats, només podem concloure amb precaució que l’ús de models de DM per estimar l’edat pot substituir els mètodes existents a causa de la manca d’estudis anteriors comparatius i de referència. Es necessiten estudis de seguiment mitjançant mostres més grans per confirmar els resultats obtinguts en aquest estudi.
Entre els estudis que van provar la precisió de la SD en l'estimació de l'edat dental, alguns van mostrar una precisió més alta que el nostre estudi. Stepanovsky et al 35 Models aplicats 22 SD a radiografies panoràmiques de 976 residents txecs de 2,7 a 20,5 anys i van provar la precisió de cada model. Van valorar el desenvolupament d’un total de 16 dents permanents superiors i inferiors a l’esquerra mitjançant els criteris de classificació proposats per Moorrees et al 36. La MAE oscil·la entre 0,64 i 0,94 anys i la RMSE oscil·la entre 0,85 i 1,27 anys, que són més precises que els dos models DM utilitzats en aquest estudi. Shen et al23 van utilitzar el mètode Cameriere per estimar l'edat dental de set dents permanents a la mandíbula esquerra a l'est de residents xinesos de 5 a 13 anys i el van comparar amb edats estimades mitjançant regressió lineal, SVM i RF. Van demostrar que els tres models DM tenen una precisió més gran en comparació amb la fórmula tradicional de Cameriere. La MAE i la RMSE de l'estudi de Shen van ser inferiors als del model DM en aquest estudi. La major precisió dels estudis de Stepanovsky et al. 35 i Shen et al. 23 pot ser degut a la inclusió de subjectes més joves en les seves mostres d’estudi. Com que les estimacions d’edat per als participants amb dents en desenvolupament es fan més precises a mesura que el nombre de dents augmenta durant el desenvolupament dental, la precisió del mètode d’estimació d’edat resultant es pot veure compromesa quan els participants de l’estudi siguin més joves. A més, l'error de l'estimació d'edat de MLP és lleugerament menor que el SLP, el que significa que el MLP és més precís que SLP. El MLP es considera lleugerament millor per a l'estimació de l'edat, possiblement a causa de les capes ocultes de MLP38. Tot i això, hi ha una excepció per a la mostra exterior de dones (SLP 1.45, MLP 1.49). La constatació que el MLP és més precisa que el SLP per avaluar l'edat requereix estudis retrospectius addicionals.
També es va comparar el rendiment de classificació del model DM i el mètode tradicional en un llindar de 18 anys. Tots els models SD provats i els mètodes tradicionals del conjunt de proves interns van mostrar nivells de discriminació pràcticament acceptables per a la mostra de 18 anys. La sensibilitat per a homes i dones era superior al 87,7% i el 94,9%, respectivament, i l’especificitat era superior al 89,3% i el 84,7%. L’Auroc de tots els models provats també supera els 0,925. Segons el que sabem, cap estudi ha provat el rendiment del model DM per a la classificació de 18 anys basada en la maduresa dental. Podem comparar els resultats d’aquest estudi amb el rendiment de classificació dels models d’aprenentatge profund en radiografies panoràmiques. Guo et al.15 van calcular el rendiment de classificació d’un model d’aprenentatge profund basat en CNN i un mètode manual basat en el mètode de Demirjian per a un determinat llindar d’edat. La sensibilitat i l’especificitat del mètode manual van ser del 87,7% i del 95,5%, respectivament, i la sensibilitat i l’especificitat del model CNN van superar el 89,2% i el 86,6%, respectivament. Van concloure que els models d’aprenentatge profund poden substituir o superar l’avaluació manual en la classificació dels llindars d’edat. Els resultats d’aquest estudi van mostrar un rendiment de classificació similar; Es creu que la classificació mitjançant models DM pot substituir els mètodes estadístics tradicionals per estimació d’edat. Entre els models, DM LR va ser el millor model en termes de sensibilitat per a la mostra masculina i la sensibilitat i l’especificitat de la mostra femenina. El LR ocupa el segon lloc en l'especificitat dels homes. A més, es considera que LR és un dels models DM35 més fàcils d’utilitzar i és menys complex i difícil de processar. A partir d’aquests resultats, LR es va considerar el millor model de classificació de tall per a nens de 18 anys a la població coreana.
En general, la precisió de l'estimació d'edat o el rendiment de classificació del conjunt de proves externs va ser deficient o inferior en comparació amb els resultats del conjunt de proves intern. Alguns informes indiquen que la precisió o l'eficiència de la classificació disminueix quan les estimacions de l'edat basades en la població coreana s'apliquen a la població japonesa5,39 i es va trobar un patró similar en el present estudi. Aquesta tendència de deteriorament també es va observar en el model DM. Per tant, per estimar amb precisió l’edat, fins i tot quan s’utilitzen DM en el procés d’anàlisi, els mètodes derivats de les dades de població autòctona, com els mètodes tradicionals, s’han de preferir5,39,40,41,42. Com que no està clar si els models d’aprenentatge profund poden mostrar tendències similars, es necessiten estudis que comparen la precisió i l’eficiència de la classificació mitjançant mètodes tradicionals, models de DM i models d’aprenentatge profund de les mateixes mostres per confirmar si la intel·ligència artificial pot superar aquestes disparitats racials en edat limitada. avaluacions.
Demostrem que els mètodes tradicionals es poden substituir per estimació d’edat basada en el model DM en la pràctica d’estimació d’edat forense a Corea. També vam descobrir la possibilitat d’implementar l’aprenentatge automàtic per a l’avaluació de l’edat forense. Tanmateix, hi ha limitacions clares, com ara el nombre insuficient de participants en aquest estudi per determinar definitivament els resultats i la manca d’estudis anteriors per comparar i confirmar els resultats d’aquest estudi. En el futur, els estudis de DM s’han de realitzar amb un nombre més gran de mostres i poblacions més diverses per millorar la seva aplicabilitat pràctica en comparació amb els mètodes tradicionals. Per validar la viabilitat d’utilitzar la intel·ligència artificial per estimar l’edat en diverses poblacions, calen futurs estudis per comparar la precisió de la classificació i l’eficiència dels models DM i d’aprenentatge profund amb mètodes tradicionals en les mateixes mostres.
L’estudi va utilitzar 2.657 fotografies ortogràfiques recollides per adults coreans i japonesos de 15 a 23 anys. Les radiografies coreanes es van dividir en 900 conjunts de formació (19,42 ± 2,65 anys) i 900 conjunts de proves internes (19,52 ± 2,59 anys). El conjunt de formació es va recollir en una institució (Hospital de Seül St. Mary), i el conjunt de proves es va recollir a dues institucions (Hospital Dental de la Universitat Nacional de Seül i a la Universitat Dental de la Universitat de Yonsei). També es van recollir 857 radiografies d’altres dades basades en la població (Iwate Medical University, Japó) per a proves externes. Les radiografies de subjectes japonesos (19,31 ± 2,60 anys) van ser seleccionades com a conjunt de proves externs. Les dades es van recollir retrospectivament per analitzar les etapes del desenvolupament dental en radiografies panoràmiques preses durant el tractament dental. Totes les dades recollides eren anònimes, tret del gènere, la data de naixement i la data de la radiografia. Els criteris d’inclusió i exclusió eren els mateixos que els estudis publicats anteriorment 4, 5. L’edat real de la mostra es va calcular restant la data de naixement des de la data en què es va prendre la radiografia. El grup de mostres es va dividir en nou grups d’edat. Les distribucions d’edat i sexe es mostren a la taula 3 Aquest estudi es va realitzar d’acord amb la Declaració d’Hèlsinki i aprovat per la Institucional Review Board (IRB) de l’Hospital de Seül Santa Maria de la Universitat Catòlica de Corea (KC22WISI0328). A causa del disseny retrospectiu d’aquest estudi, no es pot obtenir el consentiment informat de tots els pacients sotmesos a un examen radiogràfic amb finalitats terapèutiques. L’Hospital St. Mary de la Universitat de Corea de Seül (IRB) va renunciar al requisit de consentiment informat.
Es van avaluar les etapes de desenvolupament dels molars bimaxil·lars segons i tercers segons els criteris Demircan25. Només es va seleccionar una dent si es trobava el mateix tipus de dent als costats esquerre i dret de cada mandíbula. Si les dents homòlogues a banda i banda estaven en diferents etapes de desenvolupament, es va seleccionar la dent amb la fase de desenvolupament inferior per tenir en compte la incertesa en l'edat estimada. Dos observadors experimentats van anotar un centenar de radiografies seleccionades aleatòriament del conjunt d'entrenament per provar la fiabilitat interobserver després de la precalibració per determinar la fase de maduresa dental. L’observador primari es va avaluar la fiabilitat intraobserver dues vegades a intervals de tres mesos.
L’observador de sexe i desenvolupament de la segona i tercera molars de cada mandíbula al conjunt d’entrenament es va estimar per un observador primari format amb diferents models de DM, i l’edat real es va establir com a valor objectiu. Els models SLP i MLP, que s’utilitzen àmpliament en l’aprenentatge de màquines, es van provar contra algoritmes de regressió. El model DM combina funcions lineals mitjançant les etapes de desenvolupament de les quatre dents i combina aquestes dades per estimar l’edat. SLP és la xarxa neuronal més senzilla i no conté capes ocultes. SLP funciona basat en la transmissió de llindar entre nodes. El model SLP en regressió és matemàticament similar a la regressió lineal múltiple. A diferència del model SLP, el model MLP té múltiples capes ocultes amb funcions d'activació no lineals. Els nostres experiments van utilitzar una capa oculta amb només 20 nodes ocults amb funcions d'activació no lineals. Utilitzeu el descens de gradient com a mètode d’optimització i MAE i RMSE com a funció de pèrdua per entrenar el nostre model d’aprenentatge automàtic. El model de regressió més ben obtingut es va aplicar als conjunts de proves interns i externs i es va estimar l’edat de les dents.
Es va desenvolupar un algorisme de classificació que utilitza la maduresa de quatre dents en el conjunt d’entrenament per predir si una mostra té 18 anys o no. Per construir el model, vam derivar set algoritmes d’aprenentatge de màquines de representació6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) xgboost i (7) MLP . LR és un dels algoritmes de classificació més utilitzats44. És un algorisme d’aprenentatge supervisat que utilitza la regressió per predir la probabilitat de dades que pertanyen a una determinada categoria de 0 a 1 i classifica les dades com a pertanyents a una categoria més probable basada en aquesta probabilitat; S'utilitza principalment per a la classificació binària. KNN és ​​un dels algoritmes d’aprenentatge de màquines més simples45. Quan es donen dades d’entrada noves, es troba K Dades a prop del conjunt existent i les classifica a la classe amb la freqüència més alta. Vam establir 3 per al nombre de veïns considerats (k). SVM és un algorisme que maximitza la distància entre dues classes mitjançant una funció del nucli per ampliar l’espai lineal en un espai no lineal anomenat Fields46. Per a aquest model, utilitzem biaix = 1, potència = 1 i gamma = 1 com a hiperparametres per al nucli polinomi. La DT s’ha aplicat en diversos camps com a algorisme per dividir tot un conjunt de dades en diversos subgrups representant les regles de decisió en una estructura d’arbre47. El model es configura amb un nombre mínim de registres per node de 2 i utilitza l’índex Gini com a mesura de qualitat. RF és un mètode de conjunt que combina diversos DT per millorar el rendiment mitjançant un mètode d’agregació de bootstrap que genera un classificador feble per a cada mostra dibuixant mostres aleatòries de la mateixa mida diverses vegades del DataSet48 original. Hem utilitzat 100 arbres, 10 profunditats d’arbre, 1 mida mínima del node i índex d’admissió de Gini com a criteris de separació de nodes. La classificació de noves dades està determinada per un vot majoritari. XGBOOST és un algorisme que combina tècniques d’impulsió mitjançant un mètode que pren com a dades de formació L’error entre els valors reals i els previstos del model anterior i augmenta l’error mitjançant gradients49. Es tracta d’un algoritme àmpliament utilitzat a causa del seu bon rendiment i eficiència de recursos, així com una alta fiabilitat com una funció de correcció de sobrefinament. El model està equipat amb 400 rodes de suport. MLP és una xarxa neuronal en la qual una o més perceptrons formen diverses capes amb una o més capes ocultes entre les capes d’entrada i sortida38. Utilitzant-ho, podeu realitzar una classificació no lineal quan afegiu una capa d’entrada i obteniu un valor de resultat, el valor del resultat previst es compara amb el valor del resultat real i l’error es propaga. Hem creat una capa oculta amb 20 neurones ocultes a cada capa. Cada model que hem desenvolupat es va aplicar a conjunts interns i externs per provar el rendiment de classificació calculant la sensibilitat, l’especificitat, el PPV, el NPV i Auroc. La sensibilitat es defineix com la proporció d’una mostra estimada com a 18 anys o més a una mostra que s’estima que tenia 18 anys o més. L’especificitat és la proporció de mostres menors de 18 anys i les que s’estimen menys de 18 anys.
Les etapes dentals avaluades al conjunt de formació es van convertir en etapes numèriques per a l'anàlisi estadística. Es va realitzar una regressió lineal i logística multivariant per desenvolupar models predictius per a cada sexe i derivar fórmules de regressió que es poden utilitzar per estimar l'edat. Hem utilitzat aquestes fórmules per estimar l’edat de dents tant per a conjunts de proves interns com externs. La taula 4 mostra la regressió i els models de classificació utilitzats en aquest estudi.
La fiabilitat intra i interobserver es va calcular mitjançant l'estadística Kappa de Cohen. Per provar la precisió dels models de regressió de DM i tradicionals, es va calcular MAE i RMSE mitjançant les edats estimades i reals dels conjunts de proves interns i externs. Aquests errors s’utilitzen habitualment per avaluar la precisió de les prediccions del model. Com més petit sigui l’error, més gran és la precisió de la previsió24. Compareu la MAE i la RMSE de conjunts de proves interns i externs calculats mitjançant DM i regressió tradicional. El rendiment de classificació del tall de 18 anys en estadístiques tradicionals es va avaluar mitjançant una taula de contingència 2 × 2. La sensibilitat calculada, l’especificitat, el PPV, la NPV i Auroc del conjunt de proves es van comparar amb els valors mesurats del model de classificació DM. Les dades s’expressen com a mitjana ± desviació o nombre estàndard (%) segons les característiques de les dades. Els valors de P a dues cares <0,05 es van considerar estadísticament significatius. Totes les anàlisis estadístiques rutinàries es van realitzar mitjançant la versió 9.4 de SAS (SAS Institute, Cary, NC). El model de regressió DM es va implementar a Python mitjançant Keras50 2.2.4 Backend i tensorFlow51 1.8.0 específicament per a operacions matemàtiques. El model de classificació DM es va implementar a l’entorn de l’anàlisi del coneixement Waikato i al miner d’informació de Konstanz (KNIME) 4.6.152 Plataforma d’anàlisi.
Els autors reconeixen que les dades que donen suport a les conclusions de l’estudi es poden trobar a l’article i als materials suplementaris. Els conjunts de dades generats i/o analitzats durant l'estudi estan disponibles a l'autor corresponent a petició raonable.
Ritz-Timme, S. et al. Avaluació de l'edat: l'estat de l'art per complir els requisits específics de la pràctica forense. Internacionalitat. J. Medicina Jurídica. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. i Olze, A. Estat actual de l’avaluació de l’edat forense dels subjectes de vida amb finalitats de persecució penal. Forenses. medicament. Patologia. 1, 239–246 (2005).
Pan, J. et al. Un mètode modificat per avaluar l’edat dental dels nens de 5 a 16 anys a l’est de la Xina. Clínica. Enquesta oral. 25, 3463–3474 (2021).
Lee, SS, etc. Cronologia del desenvolupament de segones i terceres molars en coreans i la seva aplicació per a l'avaluació de l'edat forense. Internacionalitat. J. Medicina Jurídica. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY i Lee, SS Precisió de l'estimació de l'edat i l'estimació del llindar de 18 anys basat en la maduresa de segon i tercer molars en coreans i japonesos. PLOS ONE 17, E0271247 (2022).
Kim, Jy, et al. L’anàlisi de dades preoperatòria basada en l’aprenentatge pot predir el resultat del tractament de la cirurgia del son en pacients amb OSA. la ciència. Informe 11, 14911 (2021).
Han, M. et al. Estimació d’edat precisa de l’aprenentatge automàtic amb o sense intervenció humana? Internacionalitat. J. Medicina Jurídica. 136, 821–831 (2022).
Khan, S. i Shaheen, M. Des de la mineria de dades fins a la mineria de dades. J.Informació. la ciència. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. i Shaheen, M. Wisrule: El primer algorisme cognitiu per a la mineria de regles d'associació. J.Informació. la ciència. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. i Abdullah U. Karm: mineria tradicional de dades basada en regles d'associació basades en context. calcular. Mat. continuar. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. i Habib M. Detecció de similitud semàntica basada en l’aprenentatge profund mitjançant dades de text. informar. tecnologies. control. https://doi.org/10.5755/j01.itc.49.4.271118 (2020).
Tabish, M., Tanoli, Z. i Shahin, M. Un sistema per reconèixer l’activitat en vídeos esportius. Multimèdia. Aplicacions d’eines https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge in Pediatric osse Edat. Radiologia 290, 498–503 (2019).
Li, Y. et al. Estimació de l'edat forense de radiografies pèlviques mitjançant l'aprenentatge profund. Euro. radiació. 29, 2322–2329 (2019).
Guo, YC, et al. Classificació precisa d’edat mitjançant mètodes manuals i xarxes neuronals convolutives profundes a partir d’imatges de projecció ortogràfica. Internacionalitat. J. Medicina Jurídica. 135, 1589–1597 (2021).
Alabama Dalora et al. Estimació de l’edat òssia mitjançant diferents mètodes d’aprenentatge automàtic: una revisió sistemàtica de la literatura i la metaanàlisi. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., i Yang, J. Estimació de l'edat específica de la població dels afroamericans i els xinesos basats en els volums de la cambra de polpa de primers molars mitjançant tomografia computada per feixos de con. Internacionalitat. J. Medicina Jurídica. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK i OH KS que determinen grups d’edat de persones vives que utilitzen imatges artificials basades en la intel·ligència de primers molars. la ciència. Informe 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., i Urschler, M. Estimació automàtica de l’edat i classificació de la majoria d’edat a partir de dades de ressonància magnètica multivariant. IEEE J. Biomed. Alertes de salut. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. i Li, G. Estimació de l’edat basada en la segmentació de la cambra de polpa 3D de primers molars de la tomografia computada per feixos de con integrant conjunts d’aprenentatge profund i de nivell. Internacionalitat. J. Medicina Jurídica. 135, 365–373 (2021).
Wu, WT, et al. Mineria de dades en dades clíniques grans: bases de dades comunes, passos i models de mètodes. Món. medicament. recurs. 8, 44 (2021).
Yang, J. et al. Introducció a bases de dades mèdiques i tecnologies de mineria de dades en l'era Big Data. J. Avid. Medicina bàsica. 13, 57–69 (2020).
Shen, S. et al. Mètode de Camerer per estimar l'edat de les dents mitjançant l'aprenentatge automàtic. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Comparació de diferents mètodes d’aprenentatge automàtic per predir l’edat dental mitjançant el mètode d’escenificació de Demirdjian. Internacionalitat. J. Medicina Jurídica. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. i Tanner, JM, un nou sistema per avaluar l'edat dental. Snort. Biologia. 45, 211–227 (1973).
Landis, Jr i Koch, GG Mesures de l’acord d’observador sobre dades categòriques. Biomètrica 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK i Choi HK. Anàlisi textural, morfològica i estadística de la ressonància magnètica bidimensional mitjançant tècniques d’intel·ligència artificial per a la diferenciació de tumors cerebrals primaris. Informació sobre salut. recurs. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Post Horari: 04 de gener de 2014