• my

Ověření modelu dolování dat proti tradičním metodám odhadu věku zubů mezi korejskými adolescenty a mladými dospělými

Děkujeme, že jste navštívili Nature.com.Verze prohlížeče, kterou používáte, má omezenou podporu CSS.Pro dosažení nejlepších výsledků doporučujeme používat novější verzi prohlížeče (nebo vypnout režim kompatibility v aplikaci Internet Explorer).Mezitím, abychom zajistili trvalou podporu, zobrazujeme stránky bez stylů nebo JavaScriptu.
Zuby jsou považovány za nejpřesnější ukazatel stáří lidského těla a často se používají při forenzním posuzování věku.Naším cílem bylo ověřit odhady stáří zubů založené na dolování dat porovnáním přesnosti odhadu a klasifikace 18letého prahu s tradičními metodami a odhady stáří založenými na dolování dat.Od korejských a japonských občanů ve věku 15 až 23 let bylo shromážděno celkem 2657 panoramatických rentgenových snímků.Byly rozděleny na cvičnou sadu, z nichž každá obsahovala 900 korejských rentgenových snímků, a interní testovací sadu obsahující 857 japonských rentgenových snímků.Porovnali jsme přesnost a efektivitu klasifikace tradičních metod s testovacími sadami modelů dolování dat.Přesnost tradiční metody na interní testovací sadě je o něco vyšší než u modelu dolování dat a rozdíl je malý (průměrná absolutní chyba <0,21 let, střední kvadratická chyba <0,24 let).Klasifikační výkon pro 18letou hranici je také podobný mezi tradičními metodami a modely dolování dat.Tradiční metody tak mohou být u korejských adolescentů a mladých dospělých nahrazeny modely data miningu při provádění forenzního hodnocení věku pomocí zralosti druhého a třetího moláru.
Odhad věku zubů je široce používán v soudním lékařství a dětské stomatologii.Zejména kvůli vysoké korelaci mezi chronologickým věkem a vývojem chrupu je důležitým kritériem pro hodnocení věku dětí a dospívajících hodnocení věku podle vývojových stádií chrupu1,2,3.U mladých lidí má však odhad zubního věku na základě zralosti chrupu svá omezení, protože růst chrupu je téměř úplný, s výjimkou třetích molárů.Právním účelem určování věku mladých lidí a mladistvých je poskytnout přesné odhady a vědecké důkazy o tom, zda dosáhli plnoletosti.V lékařsko-právní praxi dospívajících a mladých dospělých v Koreji byl věk odhadován pomocí Leeovy metody a na základě údajů uváděných Ohem a kol.5 byla předpovězena právní hranice 18 let.
Strojové učení je typ umělé inteligence (AI), který se opakovaně učí a klasifikuje velké množství dat, samostatně řeší problémy a řídí programování dat.Strojové učení může objevit užitečné skryté vzorce ve velkých objemech dat6.Naproti tomu klasické metody, které jsou pracné a časově náročné, mohou mít omezení při práci s velkými objemy složitých dat, která je obtížné ručně zpracovat7.Proto bylo v poslední době provedeno mnoho studií využívajících nejnovější počítačové technologie k minimalizaci lidských chyb a efektivnímu zpracování vícerozměrných dat8,9,10,11,12.Zejména hluboké učení bylo široce používáno v analýze lékařských obrazů a byly hlášeny různé metody pro odhad věku pomocí automatické analýzy rentgenových snímků, které zlepšují přesnost a efektivitu odhadu věku13,14,15,16,17,18,19,20 .Například Halabi et al 13 vyvinuli algoritmus strojového učení založený na konvolučních neuronových sítích (CNN) k odhadu kosterního věku pomocí rentgenových snímků dětských rukou.Tato studie navrhuje model, který aplikuje strojové učení na lékařské snímky, a ukazuje, že tyto metody mohou zlepšit diagnostickou přesnost.Li et al14 odhadli věk z rentgenových snímků pánve pomocí hlubokého učení CNN a porovnali je s výsledky regrese pomocí odhadu stadia osifikace.Zjistili, že model hlubokého učení CNN vykazoval stejnou výkonnost při odhadu věku jako tradiční regresní model.Studie Guo et al. [15] hodnotila výkonnost klasifikace věkové tolerance technologie CNN na základě dentálních ortofotografií a výsledky modelu CNN prokázaly, že lidé její výkonnost podle věkové klasifikace překonali.
Většina studií o odhadu věku pomocí strojového učení využívá metody hlubokého učení13,14,15,16,17,18,19,20.Odhad věku založený na hlubokém učení se uvádí jako přesnější než tradiční metody.Tento přístup však poskytuje malou příležitost prezentovat vědecký základ pro odhady věku, jako jsou ukazatele věku používané v odhadech.Soudní spor je i o to, kdo kontroly provádí.Správní a soudní orgány proto těžko přijímají odhad věku na základě hlubokého učení.Data mining (DM) je technika, která dokáže objevit nejen očekávané, ale i neočekávané informace jako metoda pro objevování užitečných korelací mezi velkým množstvím dat6,21,22.Strojové učení se často používá při dolování dat a dolování dat i strojové učení používají stejné klíčové algoritmy k objevování vzorců v datech.Odhad věku pomocí dentálního vývoje je založen na hodnocení zralosti cílových zubů zkoušejícím a toto hodnocení je vyjádřeno jako stádium pro každý cílový zub.DM lze použít k analýze korelace mezi stadiem zubního hodnocení a skutečným věkem a má potenciál nahradit tradiční statistickou analýzu.Pokud tedy aplikujeme techniky DM na odhad věku, můžeme implementovat strojové učení do forenzního odhadu věku bez obav z právní odpovědnosti.Bylo publikováno několik srovnávacích studií o možných alternativách k tradičním manuálním metodám používaným ve forenzní praxi a metodám založeným na EBM pro stanovení věku zubů.Shen et al23 ukázali, že model DM je přesnější než tradiční Camererův vzorec.Galibourg et al24 použili různé metody DM k predikci věku podle Demirdjianova kritéria25 a výsledky ukázaly, že metoda DM předčila Demirdjianovy a Willemsovy metody v odhadu věku francouzské populace.
K odhadu zubního věku korejských adolescentů a mladých dospělých se v korejské forenzní praxi široce používá Leeova metoda 4.Tato metoda využívá tradiční statistickou analýzu (jako je vícenásobná regrese) ke zkoumání vztahu mezi korejskými subjekty a chronologickým věkem.V této studii jsou metody odhadu věku získané pomocí tradičních statistických metod definovány jako „tradiční metody“.Leeova metoda je tradiční metodou a její přesnost byla potvrzena Oh et al.5;nicméně použitelnost odhadu věku na základě modelu DM v korejské forenzní praxi je stále sporná.Naším cílem bylo vědecky ověřit potenciální užitečnost odhadu věku na základě modelu DM.Účelem této studie bylo (1) porovnat přesnost dvou modelů DM při odhadu zubního věku a (2) porovnat klasifikační výkon 7 modelů DM ve věku 18 let s těmi získanými tradičními statistickými metodami Zralost sekund a třetí stoličky v obou čelistech.
Průměry a standardní odchylky chronologického věku podle stadia a typu zubu jsou zobrazeny online v doplňkové tabulce S1 (tréninková sada), doplňkové tabulce S2 (interní testovací sada) a doplňkové tabulce S3 (externí testovací sada).Hodnoty kappa pro intra- a interobserver spolehlivost získané z trénovacího souboru byly 0,951 a 0,947.Hodnoty P a 95% intervaly spolehlivosti pro hodnoty kappa jsou uvedeny v online doplňkové tabulce S4.Hodnota kappa byla interpretována jako „téměř dokonalá“, v souladu s kritérii Landise a Kocha26.
Při porovnávání střední absolutní chyby (MAE) tradiční metoda mírně překonává model DM pro všechna pohlaví a v externím mužském testovacím souboru, s výjimkou vícevrstvého perceptronu (MLP).Rozdíl mezi tradičním modelem a modelem DM na interní testovací sadě MAE byl 0,12–0,19 roku u mužů a 0,17–0,21 roku u žen.U externí testovací baterie jsou rozdíly menší (0,001–0,05 roku pro muže a 0,05–0,09 roku pro ženy).Kromě toho je střední kvadratická chyba (RMSE) o něco nižší než u tradiční metody s menšími rozdíly (0,17–0,24, 0,2–0,24 pro mužský interní testovací soubor a 0,03–0,07, 0,04–0,08 pro externí testovací soubor).).MLP vykazuje o něco lepší výkon než Single Layer Perceptron (SLP), s výjimkou případu ženské externí testovací sady.U MAE a RMSE má externí testovací sada vyšší skóre než interní testovací sada pro všechna pohlaví a modely.Všechny MAE a RMSE jsou uvedeny v tabulce 1 a na obrázku 1.
MAE a RMSE tradičních a data miningových regresních modelů.Střední absolutní chyba MAE, střední kvadratická chyba RMSE, jednovrstvý perceptron SLP, vícevrstvý perceptron MLP, tradiční metoda CM.
Klasifikační výkon (s mezní hodnotou 18 let) tradičních a DM modelů byl prokázán z hlediska citlivosti, specifičnosti, pozitivní prediktivní hodnoty (PPV), negativní prediktivní hodnoty (NPV) a oblasti pod křivkou provozní charakteristiky přijímače (AUROC). 27 (Tabulka 2, Obrázek 2 a Doplňkový obrázek 1 online).Z hlediska citlivosti interní testové baterie dopadly tradiční metody nejlépe u mužů a hůře u žen.Rozdíl v klasifikační výkonnosti mezi tradičními metodami a SD je však 9,7 % u mužů (MLP) a pouze 2,4 % u žen (XGBoost).Mezi modely DM vykazovala logistická regrese (LR) lepší citlivost u obou pohlaví.Pokud jde o specifičnost interního testovacího souboru, bylo pozorováno, že čtyři SD modely fungovaly dobře u mužů, zatímco tradiční model fungoval lépe u žen.Rozdíly v klasifikační výkonnosti pro muže a ženy jsou 13,3 % (MLP) a 13,1 % (MLP), v daném pořadí, což ukazuje, že rozdíl v klasifikační výkonnosti mezi modely převyšuje citlivost.Mezi modely DM se mezi muži nejlépe dařilo modelům podpůrného vektorového stroje (SVM), rozhodovacího stromu (DT) a náhodného lesa (RF), zatímco u žen se nejlépe dařilo modelu LR.AUROC tradičního modelu a všech SD modelů byl větší než 0,925 (k-nejbližší soused (KNN) u mužů), což prokazuje vynikající klasifikační výkon při rozlišování vzorků ve věku 18 let28.U externího testovacího souboru došlo ve srovnání s interním testovacím souborem ke snížení klasifikačního výkonu z hlediska senzitivity, specificity a AUROC.Rozdíl v citlivosti a specificitě mezi klasifikačním výkonem nejlepších a nejhorších modelů se navíc pohyboval od 10 % do 25 % a byl větší než rozdíl v sadě interních testů.
Citlivost a specifičnost klasifikačních modelů data miningu ve srovnání s tradičními metodami s limitem 18 let.KNN k nejbližšímu sousedovi, vektorový stroj podpory SVM, LR logistická regrese, rozhodovací strom DT, RF náhodný les, XGB XGBoost, vícevrstvý perceptron MLP, tradiční metoda CM.
Prvním krokem v této studii bylo porovnat přesnost odhadů věku zubů získaných ze sedmi modelů DM s těmi, které byly získány pomocí tradiční regrese.MAE a RMSE byly hodnoceny v interních testovacích sadách pro obě pohlaví a rozdíl mezi tradiční metodou a modelem DM se pohyboval od 44 do 77 dnů pro MAE a od 62 do 88 dnů pro RMSE.Přestože tradiční metoda byla v této studii o něco přesnější, je obtížné usoudit, zda má tak malý rozdíl klinický nebo praktický význam.Tyto výsledky naznačují, že přesnost odhadu zubního věku pomocí modelu DM je téměř stejná jako u tradiční metody.Přímé srovnání s výsledky předchozích studií je obtížné, protože žádná studie neporovnávala přesnost modelů DM s tradičními statistickými metodami využívajícími stejnou techniku ​​záznamu zubů ve stejném věkovém rozmezí jako v této studii.Galibourg et al24 porovnávali MAE a RMSE mezi dvěma tradičními metodami (Demirjianova metoda25 a Willemsova metoda29) a 10 modely DM ve francouzské populaci ve věku 2 až 24 let.Uvedli, že všechny modely DM byly přesnější než tradiční metody, s rozdíly 0,20 a 0,38 roku u MAE a 0,25 a 0,47 roku u RMSE ve srovnání s Willemsovou a Demirdjianovou metodou.Nesoulad mezi modelem SD a tradičními metodami ukázaný ve studii z Halibourgu zohledňuje četné zprávy30,31,32,33 o tom, že metoda Demirdjian přesně neodhaduje věk zubů u jiných populací než u francouzských Kanaďanů, na kterých byla studie založena.V této studii.Tai et al 34 použili algoritmus MLP k predikci stáří zubů z 1636 čínských ortodontických fotografií a porovnali jeho přesnost s výsledky Demirjianovy a Willemsovy metody.Uvedli, že MLP má vyšší přesnost než tradiční metody.Rozdíl mezi Demirdjianovou metodou a tradiční metodou je <0,32 roku a Willemsovou metodou je 0,28 roku, což je podobné výsledkům této studie.Výsledky těchto předchozích studií24,34 jsou také v souladu s výsledky této studie a přesnost odhadu věku modelu DM a tradiční metody jsou podobné.Na základě prezentovaných výsledků však můžeme jen opatrně usuzovat, že použití modelů DM k odhadu věku může nahradit stávající metody z důvodu nedostatku srovnávacích a referenčních předchozích studií.K potvrzení výsledků získaných v této studii jsou zapotřebí následné studie využívající větší vzorky.
Mezi studiemi testujícími přesnost SD při odhadu zubního věku některé ukázaly vyšší přesnost než naše studie.Stepanovsky et al 35 aplikovali 22 SD modelů na panoramatické rentgenové snímky 976 českých obyvatel ve věku 2,7 až 20,5 let a otestovali přesnost každého modelu.Hodnotili vývoj celkem 16 horních a dolních levých stálých zubů pomocí klasifikačních kritérií navržených Moorreesem et al 36 .MAE se pohybuje od 0,64 do 0,94 roku a RMSE se pohybuje od 0,85 do 1,27 roku, což je přesnější než dva modely DM použité v této studii.Shen et al23 použili metodu Cameriere k odhadu zubního věku sedmi stálých zubů v levé dolní čelisti u obyvatel východní Číny ve věku 5 až 13 let a porovnali jej s věkem odhadovaným pomocí lineární regrese, SVM a RF.Ukázali, že všechny tři modely DM mají vyšší přesnost ve srovnání s tradiční formulí Cameriere.MAE a RMSE v Shenově studii byly nižší než v modelu DM v této studii.Zvýšená přesnost studií Stepanovského et al.35 a Shen a kol.23 může být způsobeno zahrnutím mladších subjektů do jejich studijních vzorků.Vzhledem k tomu, že odhady věku pro účastníky s vyvíjejícími se zuby se stávají přesnějšími, když se počet zubů během zubního vývoje zvyšuje, přesnost výsledné metody odhadu věku může být ohrožena, když jsou účastníci studie mladší.Chyba MLP v odhadu věku je navíc o něco menší než u SLP, což znamená, že MLP je přesnější než SLP.MLP je považováno za mírně lepší pro odhad věku, možná kvůli skrytým vrstvám v MLP38.Existuje však výjimka pro vnější vzorek žen (SLP 1,45, MLP 1,49).Zjištění, že MLP je při hodnocení věku přesnější než SLP, vyžaduje další retrospektivní studie.
Byla také porovnána klasifikační výkonnost modelu DM a tradiční metody na 18leté hranici.Všechny testované SD modely a tradiční metody na interní testovací sadě vykazovaly prakticky přijatelné úrovně diskriminace pro 18letý vzorek.Senzitivita u mužů byla vyšší než 87,7 % au žen 94,9 % a specificita byla vyšší než 89,3 % a 84,7 %.AUROC všech testovaných modelů také přesahuje 0,925.Pokud je nám známo, žádná studie netestovala výkonnost modelu DM pro 18letou klasifikaci na základě dentální zralosti.Výsledky této studie můžeme porovnat s klasifikační výkonností modelů hlubokého učení na panoramatických rentgenových snímcích.Guo et al.15 vypočítali klasifikační výkon modelu hlubokého učení založeného na CNN a manuální metody založené na Demirjianově metodě pro určitou věkovou hranici.Senzitivita a specificita manuální metody byla 87,7 %, resp. 95,5 %, senzitivita a specificita modelu CNN přesáhla 89,2 %, resp. 86,6 %.Došli k závěru, že modely hlubokého učení mohou nahradit nebo překonat manuální hodnocení při klasifikaci věkových hranic.Výsledky této studie ukázaly podobnou klasifikaci;Předpokládá se, že klasifikace pomocí modelů DM může nahradit tradiční statistické metody pro odhad věku.Mezi modely byl DM LR nejlepší model z hlediska citlivosti pro mužský vzorek a citlivosti a specificity pro ženský vzorek.LR je na druhém místě ve specifičnosti pro muže.Navíc je LR považován za jeden z uživatelsky přívětivějších modelů DM35 a je méně složitý a obtížně zpracovatelný.Na základě těchto výsledků byl LR považován za nejlepší model klasifikace cutoff pro 18leté v korejské populaci.
Celkově byla přesnost odhadu věku nebo klasifikace výkonu na externím testovacím souboru špatná nebo nižší ve srovnání s výsledky na interní testovací sadě.Některé zprávy naznačují, že přesnost nebo účinnost klasifikace klesá, když jsou odhady věku založené na korejské populaci aplikovány na japonskou populaci5,39 a podobný vzorec byl nalezen v této studii.Tento trend zhoršování byl také pozorován u modelu DM.Pro přesný odhad věku by proto i při použití DM v procesu analýzy měly být preferovány metody odvozené z dat původní populace, jako jsou tradiční metody5,39,40,41,42.Protože není jasné, zda modely hlubokého učení mohou vykazovat podobné trendy, jsou zapotřebí studie porovnávající přesnost a efektivitu klasifikace pomocí tradičních metod, modelů DM a modelů hlubokého učení na stejných vzorcích, aby se potvrdilo, zda umělá inteligence dokáže překonat tyto rasové rozdíly v omezeném věku.hodnocení.
Ukazujeme, že tradiční metody lze ve forenzní praxi odhadu věku v Koreji nahradit odhadem věku na základě modelu DM.Objevili jsme také možnost implementace strojového učení pro forenzní hodnocení věku.Existují však jasná omezení, jako je nedostatečný počet účastníků této studie k definitivnímu stanovení výsledků a nedostatek předchozích studií k porovnání a potvrzení výsledků této studie.V budoucnu by měly být studie DM prováděny s větším počtem vzorků a rozmanitějšími populacemi, aby se zlepšila jeho praktická použitelnost ve srovnání s tradičními metodami.K ověření proveditelnosti použití umělé inteligence k odhadu věku ve více populacích jsou zapotřebí budoucí studie, které by porovnaly přesnost klasifikace a účinnost modelů DM a hlubokého učení s tradičními metodami na stejných vzorcích.
Studie použila 2 657 ortografických fotografií shromážděných od dospělých Korejců a Japonců ve věku 15 až 23 let.Korejské rentgenové snímky byly rozděleny do 900 tréninkových sad (19,42 ± 2,65 let) a 900 interních testovacích sad (19,52 ± 2,59 let).Tréninková sada byla shromážděna v jedné instituci (Soul St. Mary's Hospital) a vlastní testovací sada byla shromážděna ve dvou institucích (Seoul National University Dental Hospital a Yonsei University Dental Hospital).Také jsme shromáždili 857 rentgenových snímků z jiných populačních dat (Iwate Medical University, Japonsko) pro externí testování.Jako externí testovací soubor byly vybrány rentgenové snímky japonských subjektů (19,31 ± 2,60 let).Data byla sbírána retrospektivně pro analýzu stádií vývoje chrupu na panoramatických rentgenových snímcích pořízených během zubního ošetření.Všechna shromážděná data byla anonymní kromě pohlaví, data narození a data rentgenového snímku.Kritéria pro zařazení a vyloučení byla stejná jako dříve publikované studie 4 , 5 .Skutečné stáří vzorku bylo vypočteno odečtením data narození od data pořízení rentgenového snímku.Vzorová skupina byla rozdělena do devíti věkových skupin.Rozdělení podle věku a pohlaví jsou uvedena v tabulce 3. Tato studie byla provedena v souladu s Helsinskou deklarací a schválena Institutional Review Board (IRB) nemocnice Soul St. Mary's Hospital na Katolické univerzitě v Koreji (KC22WISI0328).Vzhledem k retrospektivnímu uspořádání této studie nebylo možné získat informovaný souhlas od všech pacientů podstupujících radiografické vyšetření pro terapeutické účely.Nemocnice Panny Marie (IRB) v Soulu Korea University St. Mary's Hospital upustila od požadavku na informovaný souhlas.
Vývojová stadia bimaxilárních druhých a třetích molárů byla hodnocena podle Demircanových kritérií25.Byl vybrán pouze jeden zub, pokud byl nalezen stejný typ zubu na levé a pravé straně každé čelisti.Pokud byly homologní zuby na obou stranách v různých vývojových stádiích, byl vybrán zub s nižším vývojovým stádiem, aby se zohlednila nejistota odhadovaného věku.Sto náhodně vybraných rentgenových snímků z cvičné sady bylo hodnoceno dvěma zkušenými pozorovateli, aby se otestovala spolehlivost mezi pozorovateli po předkalibraci pro určení stadia dentální zralosti.Intraobserver spolehlivost byla hodnocena dvakrát v tříměsíčních intervalech primárním pozorovatelem.
Pohlaví a vývojová fáze druhého a třetího moláru každé čelisti v tréninkové sadě byly odhadnuty primárním pozorovatelem trénovaným s různými modely DM a skutečný věk byl stanoven jako cílová hodnota.SLP a MLP modely, které jsou široce používány ve strojovém učení, byly testovány proti regresním algoritmům.Model DM kombinuje lineární funkce pomocí vývojových stádií čtyř zubů a kombinuje tato data pro odhad věku.SLP je nejjednodušší neuronová síť a neobsahuje skryté vrstvy.SLP funguje na základě prahového přenosu mezi uzly.Model SLP v regresi je matematicky podobný vícenásobné lineární regresi.Na rozdíl od modelu SLP má model MLP více skrytých vrstev s nelineárními aktivačními funkcemi.Naše experimenty používaly skrytou vrstvu s pouze 20 skrytými uzly s nelineárními aktivačními funkcemi.Použijte gradientní sestup jako optimalizační metodu a MAE a RMSE jako ztrátovou funkci k trénování našeho modelu strojového učení.Nejlepší získaný regresní model byl aplikován na interní a externí testovací sady a bylo odhadnuto stáří zubů.
Byl vyvinut klasifikační algoritmus, který využívá zralost čtyř zubů na trénovací sadě k předpovědi, zda je vzorek starý 18 let nebo ne.K sestavení modelu jsme odvodili sedm reprezentačních algoritmů strojového učení6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost a (7) MLP .LR je jedním z nejpoužívanějších klasifikačních algoritmů44.Jde o algoritmus řízeného učení, který využívá regresi k předpovědi pravděpodobnosti dat patřících do určité kategorie od 0 do 1 a klasifikuje data jako náležející do pravděpodobnější kategorie na základě této pravděpodobnosti;používá se hlavně pro binární klasifikaci.KNN je jedním z nejjednodušších algoritmů strojového učení45.Po zadání nových vstupních dat najde k dat blízkých existující množině a poté je zařadí do třídy s nejvyšší frekvencí.Nastavíme 3 pro počet uvažovaných sousedů (k).SVM je algoritmus, který maximalizuje vzdálenost mezi dvěma třídami pomocí funkce jádra k rozšíření lineárního prostoru do nelineárního prostoru zvaného pole46.Pro tento model používáme zkreslení = 1, mocninu = 1 a gama = 1 jako hyperparametry pro polynomiální jádro.DT se používá v různých oblastech jako algoritmus pro rozdělení celého souboru dat do několika podskupin reprezentováním rozhodovacích pravidel ve stromové struktuře47.Model je nakonfigurován s minimálním počtem záznamů na uzel 2 a používá Gini index jako měřítko kvality.RF je souborová metoda, která kombinuje více DT za účelem zlepšení výkonu pomocí metody bootstrap agregace, která generuje slabý klasifikátor pro každý vzorek náhodným výběrem vzorků stejné velikosti několikrát z původní datové sady48.Jako kritéria pro oddělení uzlů jsme použili 100 stromů, 10 hloubek stromů, 1 minimální velikost uzlu a index příměsi Gini.Klasifikace nových údajů je určena většinou hlasů.XGBoost je algoritmus, který kombinuje techniky zesílení pomocí metody, která bere jako trénovací data chybu mezi skutečnými a předpokládanými hodnotami předchozího modelu a zvyšuje chybu pomocí gradientů49.Je to široce používaný algoritmus díky svému dobrému výkonu a efektivitě zdrojů, stejně jako vysoké spolehlivosti jako funkce korekce přetížení.Model je vybaven 400 opěrnými koly.MLP je neuronová síť, ve které jeden nebo více perceptronů tvoří více vrstev s jednou nebo více skrytými vrstvami mezi vstupní a výstupní vrstvou38.Pomocí toho můžete provádět nelineární klasifikaci, kde když přidáte vstupní vrstvu a získáte výslednou hodnotu, předpokládaná výsledná hodnota se porovná se skutečnou výslednou hodnotou a chyba se přenese zpět.Vytvořili jsme skrytou vrstvu s 20 skrytými neurony v každé vrstvě.Každý model, který jsme vyvinuli, byl aplikován na interní a externí sady pro testování výkonnosti klasifikace výpočtem citlivosti, specificity, PPV, NPV a AUROC.Citlivost je definována jako poměr vzorku, jehož věk se odhaduje na 18 let nebo starší, k vzorku, jehož věk se odhaduje na 18 let nebo více.Specifita je podíl vzorků mladších 18 let a vzorků mladších 18 let.
Zubní stadia hodnocená v tréninkovém souboru byla převedena na numerická stadia pro statistickou analýzu.Byla provedena vícerozměrná lineární a logistická regrese za účelem vytvoření prediktivních modelů pro každé pohlaví a odvození regresních vzorců, které lze použít k odhadu věku.Tyto vzorce jsme použili k odhadu stáří zubů pro interní i externí testovací sady.Tabulka 4 ukazuje regresní a klasifikační modely použité v této studii.
Spolehlivost uvnitř a mezi pozorovateli byla vypočtena pomocí Cohenovy statistiky kappa.Abychom otestovali přesnost DM a tradičních regresních modelů, vypočítali jsme MAE a RMSE pomocí odhadovaného a skutečného stáří sady interních a externích testů.Tyto chyby se běžně používají k hodnocení přesnosti předpovědí modelu.Čím menší je chyba, tím vyšší je přesnost předpovědi24.Porovnejte MAE a RMSE sady interních a externích testů vypočítané pomocí DM a tradiční regrese.Klasifikační výkonnost 18letého limitu v tradiční statistice byla hodnocena pomocí kontingenční tabulky 2 × 2.Vypočtená senzitivita, specificita, PPV, NPV a AUROC testovaného souboru byly porovnány s naměřenými hodnotami modelu klasifikace DM.Data jsou vyjádřena jako průměr ± standardní odchylka nebo číslo (%) v závislosti na charakteristikách dat.Dvoustranné hodnoty P <0,05 byly považovány za statisticky významné.Všechny rutinní statistické analýzy byly provedeny pomocí SAS verze 9.4 (SAS Institute, Cary, NC).DM regresní model byl implementován v Pythonu pomocí backendu Keras50 2.2.4 a Tensorflow51 1.8.0 speciálně pro matematické operace.Model klasifikace DM byl implementován v prostředí Waikato Knowledge Analysis Environment a analytické platformě Konstanz Information Miner (KNIME) 4.6.152.
Autoři berou na vědomí, že údaje podporující závěry studie lze nalézt v článku a doplňkových materiálech.Soubory dat generované a/nebo analyzované v průběhu studie jsou na přiměřenou žádost k dispozici od odpovídajícího autora.
Ritz-Timme, S. a kol.Posouzení věku: současný stav techniky splňující specifické požadavky forenzní praxe.mezinárodnost.J. Právní lékařství.113, 129-136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. a Olze, A. Současný stav forenzního posuzování věku žijících subjektů pro účely trestního stíhání.Forenzní.lék.Patologie.1, 239-246 (2005).
Pan, J. a kol.Upravená metoda pro hodnocení zubního věku dětí ve věku 5 až 16 let ve východní Číně.klinický.Ústní průzkum.25, 3463–3474 (2021).
Lee, SS atd. Chronologie vývoje druhých a třetích molárů u Korejců a její aplikace pro forenzní posouzení věku.mezinárodnost.J. Právní lékařství.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY a Lee, SS Přesnost odhadu věku a odhad 18letého prahu na základě zralosti druhých a třetích molárů u Korejců a Japonců.PLoS ONE 17, e0271247 (2022).
Kim, JY, a kol.Předoperační analýza dat založená na strojovém učení může předpovědět výsledek léčby spánkové chirurgie u pacientů s OSA.věda.Zpráva 11, 14911 (2021).
Han, M. a kol.Přesný odhad věku ze strojového učení s lidským zásahem nebo bez něj?mezinárodnost.J. Právní lékařství.136, 821–831 (2022).
Khan, S. a Shaheen, M. Od dolování dat k dolování dat.J.Informace.věda.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. a Shaheen, M. WisRule: The First Cognitive Algorithm for Association Rule Mining.J.Informace.věda.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. a Abdullah U. Karm: Tradiční dolování dat založené na asociačních pravidlech založených na kontextu.vypočítat.Matt.pokračovat.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. a Habib M. Detekce sémantické podobnosti založená na hlubokém učení pomocí textových dat.informovat.technologií.řízení.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. a Shahin, M. Systém pro rozpoznávání aktivity ve sportovních videích.multimédia.Nástroje Aplikace https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS a kol.Výzva RSNA Machine Learning v dětském věku kostí.Radiologie 290, 498–503 (2019).
Li, Y. a kol.Forenzní odhad věku z RTG pánve pomocí hlubokého učení.EURO.záření.29, 2322–2329 (2019).
Guo, YC, a kol.Přesná věková klasifikace pomocí manuálních metod a hlubokých konvolučních neuronových sítí z ortografických projekčních snímků.mezinárodnost.J. Právní lékařství.135, 1589–1597 (2021).
Alabama Dalora a kol.Odhad kostního věku pomocí různých metod strojového učení: systematický přehled literatury a metaanalýza.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. a Yang, J. Populační specifický odhad věku Afroameričanů a Číňanů na základě objemů dřeňové komory prvních molárů pomocí kuželové počítačové tomografie.mezinárodnost.J. Právní lékařství.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK a Oh KS Určení věkových skupin žijících lidí pomocí snímků prvních molárů založených na umělé inteligenci.věda.Zpráva 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. a Urschler, M. Automatický odhad věku a většinová věková klasifikace z vícerozměrných dat MRI.IEEE J. Biomed.Zdravotní upozornění.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. a Li, G. Odhad stáří založený na 3D segmentaci dřeňové komory prvních molárů z počítačové tomografie s kuželovým paprskem integrací hlubokého učení a sad úrovní.mezinárodnost.J. Právní lékařství.135, 365–373 (2021).
Wu, WT, a kol.Data mining v klinických velkých datech: běžné databáze, kroky a modely metod.Svět.lék.zdroj.8, 44 (2021).
Yang, J. a kol.Úvod do lékařských databází a technologií dolování dat v éře velkých dat.J. Avid.Základní medicína.13, 57–69 (2020).
Shen, S. a kol.Camererova metoda pro odhad stáří zubů pomocí strojového učení.BMC Oral Health 21, 641 (2021).
Galliburg A. a kol.Porovnání různých metod strojového učení pro predikci zubního věku pomocí metody Demirdjian staging.mezinárodnost.J. Právní lékařství.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. and Tanner, JM Nový systém pro hodnocení věku zubů.šňupat.biologie.45, 211-227 (1973).
Landis, JR, a Koch, GG Opatření pozorovatelské dohody o kategorických datech.Biometrie 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK a Choi HK.Texturní, morfologická a statistická analýza dvourozměrného zobrazování magnetickou rezonancí s využitím technik umělé inteligence pro diferenciaci primárních mozkových nádorů.Zdravotní informace.zdroj.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Čas odeslání: leden-04-2024