• my

Validace modelu těžby dat proti tradičním metodám odhadu věku zubního věku mezi korejskými adolescenty a mladými dospělými

Děkujeme za návštěvu Nature.com. Verze prohlížeče, kterou používáte, má omezenou podporu CSS. Pro dosažení nejlepších výsledků doporučujeme použít novější verzi vašeho prohlížeče (nebo vypíná režim kompatibility v Internet Explorer). Mezitím, abychom zajistili pokračující podporu, zobrazujeme web bez stylu nebo JavaScriptu.
Zuby jsou považovány za nejpřesnější indikátor věku lidského těla a často se používají při hodnocení forenzního věku. Zaměřili jsme se na ověření odhadů věku zubního věku založeného na datech porovnáním přesnosti odhadu a klasifikační výkonnosti 18letého prahu s tradičními metodami a odhady věku dolování dat. Od korejských a japonských občanů ve věku 15 až 23 let bylo shromážděno celkem 2657 panoramatických rentgenových snímků. Byly rozděleny do tréninkového souboru, z nichž každá obsahovala 900 korejských rentgenových snímků a interní testovací sadu obsahující 857 japonských rentgenových snímků. Srovnali jsme přesnost klasifikace a účinnost tradičních metod pomocí testovacích sad modelů těžby dat. Přesnost tradiční metody na vnitřní testovací sadě je o něco vyšší než přesnost modelu těžby dat a rozdíl je malý (průměrná absolutní chyba <0,21 let, střední průměrná čtvercová chyba <0,24 let). Klasifikační výkon pro osmnáctiletý mezní hodnotu je také podobný mezi tradičními metodami a modely těžby dat. Tradiční metody tedy mohou být nahrazeny modely těžby dat při provádění hodnocení forenzního věku pomocí zralosti druhého a třetího stoličení u korejských adolescentů a mladých dospělých.
Odhad věku zubního věku se široce používá ve forenzní medicíně a pediatrické stomatologii. Zejména kvůli vysoké korelaci mezi chronologickým věkem a vývojem zubů je hodnocení věku vývojovými stádii dentálního vývoje důležitým kritériem pro hodnocení věku dětí a dospívajících1,2,3. U mladých lidí však má odhad věku zubního věku založeného na zralosti zubního lékaře svá omezení, protože růst zubů je téměř úplný, s výjimkou třetích stoliček. Právním účelem stanovení věku mladých lidí a dospívajících je poskytnout přesné odhady a vědecké důkazy o tom, zda dosáhli věku většiny. V medicíně-legální praxi adolescentů a mladých dospělých v Koreji byl věk odhadnut pomocí Leeovy metody a na základě údajů OH et al 5 byl předpovídán právní práh 18 let.
Machine Learning je typ umělé inteligence (AI), který se opakovaně učí a klasifikuje velké množství dat, řeší problémy samy o sobě a řídí programování dat. Strojové učení může objevit užitečné skryté vzory ve velkých objemech dat6. Naproti tomu klasické metody, které jsou náročné na práci a časově náročné, mohou mít omezení při řešení velkých objemu složitých dat, které je obtížné zpracovat ručně7. Proto bylo nedávno provedeno mnoho studií s použitím nejnovějších počítačových technologií k minimalizaci lidských chyb a efektivně zpracování vícerozměrných dat8,9,10,11,12. Zejména hluboké učení bylo široce používáno při analýze lékařských obrazu a bylo hlášeno, že různé metody pro odhad věku automaticky analýzou rentgenových snímků zlepšují přesnost a účinnost odhadu věku 13,14,16,17,18,19,20 . Například Halabi et al 13 vyvinuli algoritmus strojového učení založený na konvolučních neuronových sítích (CNN) pro odhad kosterního věku pomocí rentgenových snímků dětských rukou. Tato studie navrhuje model, který aplikuje strojové učení na lékařské obrazy a ukazuje, že tyto metody mohou zlepšit diagnostickou přesnost. Li et al14 Odhadovaný věk z pánevních rentgenových obrazů pomocí hlubokého učení CNN a porovnával je s výsledky regrese pomocí odhadu fáze osifikace. Zjistili, že model hlubokého učení CNN vykazoval stejný výkon odhadu věku jako tradiční regresní model. Studie Guo et al. [15] vyhodnotila výkon klasifikace tolerance věku technologie CNN založené na zubních ortofototech a výsledky modelu CNN prokázaly, že lidé překonali jeho výkonnost věku.
Většina studií odhadu věku pomocí strojového učení používá metody hlubokého učení13,14,15,16,17,18,19,20. Odhad věku založeného na hlubokém učení se uvádí, že je přesnější než tradiční metody. Tento přístup však poskytuje malou příležitost představit vědecký základ pro odhady věku, jako jsou věkové ukazatele použité v odhadech. Existuje také právní spor o tom, kdo provádí inspekce. Odhad věku založeného na hlubokém učení je proto obtížné přijmout administrativními a soudními orgány. Dolování dat (DM) je technika, která může objevit nejen očekávané, ale také neočekávané informace jako metodu pro objevování užitečných korelací mezi velkým množstvím dat6,21,22. Strojové učení se často používá při těžbě dat a jak dolování dat, tak strojové učení používají stejné klíčové algoritmy k objevování vzorů v datech. Odhad věku využívajícího vývoje zubního lékaře je založen na posouzení zralosti cílových zubů zkoušejícího a toto hodnocení je vyjádřeno jako fáze pro každý cílový zub. DM lze použít k analýze korelace mezi fází zubního hodnocení a skutečným věkem a má potenciál nahradit tradiční statistickou analýzu. Pokud tedy použijeme techniky DM na odhad věku, můžeme implementovat strojové učení v odhadu forenzního věku bez obav z právní odpovědnosti. Bylo zveřejněno několik srovnávacích studií o možných alternativách k tradičním manuálním metodám používaným ve forenzní praxi a metodách založených na EBM pro stanovení věku zubního věku. Shen et al23 ukázali, že model DM je přesnější než tradiční vzorec kamera. Galibourg et al24 aplikoval různé metody DM k predikci věku podle Demirdjian Criterion25 a výsledky ukázaly, že metoda DM překonávala metody Demirdjian a Willems při odhadu věku francouzské populace.
Pro odhad zubního věku korejských adolescentů a mladých dospělých se Leeova metoda 4 v korejské forenzní praxi široce používá. Tato metoda používá tradiční statistickou analýzu (jako je vícenásobná regrese) ke zkoumání vztahu mezi korejskými subjekty a chronologickým věkem. V této studii jsou metody odhadu věku získané pomocí tradičních statistických metod definovány jako „tradiční metody“. Leeova metoda je tradiční metoda a její přesnost potvrdila Oh et al. 5; Použitelnost odhadu věku založená na modelu DM v korejské forenzní praxi je však stále sporná. Naším cílem bylo vědecky ověřit potenciální užitečnost odhadu věku na základě modelu DM. Účelem této studie bylo (1) porovnat přesnost dvou modelů DM při odhadu zubního věku a (2) porovnat klasifikační výkon 7 DM modelů ve věku 18 let s těmi, které byly získany pomocí tradičních statistických metod splatnosti druhého a třetí stoličky v obou čelistech.
Prostředky a standardní odchylky chronologického věku podle typu fáze a zubu jsou zobrazeny online v doplňkové tabulce S1 (tréninková sada), doplňkové tabulce S2 (vnitřní testovací sada) a doplňkové tabulce S3 (externí testovací sada). Hodnoty kappa pro spolehlivost intra- a interobserveru získané ze tréninkové sady byly 0,951, respektive 0,947. Hodnoty p a 95% intervaly spolehlivosti pro hodnoty Kappa jsou uvedeny v online doplňkové tabulce S4. Hodnota Kappa byla interpretována jako „téměř dokonalá“, v souladu s kritérii Landis a Koch26.
Při porovnání průměrné absolutní chyby (MAE) tradiční metoda mírně překonává model DM pro všechny pohlaví a v externí sadě mužů, s výjimkou vícevrstvého vnímání (MLP). Rozdíl mezi tradičním modelem a modelem DM na testovací sadě MAE byl 0,12–0,19 let u mužů a 0,17–0,21 let u žen. U externí testovací baterie jsou rozdíly menší (0,001–0,05 let u mužů a 0,05–0,09 let pro ženy). Kromě toho je kořenová střední čtvercová chyba (RMSE) o něco nižší než tradiční metoda, s menšími rozdíly (0,17–0,24, 0,2–0,24 pro mužskou vnitřní testovací sadu a 0,03–0,07, 0,04–0,08 pro externí testovací sadu). ). MLP ukazuje o něco lepší výkon než jediná vrstva Perceptron (SLP), s výjimkou v případě externí testovací sady žen. Pro MAE a RMSE je externí testovací sada skóre vyšší než interní testovací sada pro všechny pohlaví a modely. Všechny MAE a RMSE jsou uvedeny v tabulce 1 a obrázku 1.
MAE a RMSE tradičních a regresních modelů těžby dat. Průměrná absolutní chyba MAE, kořenová střední čtvercová chyba RMSE, jediná vrstva Perceptron SLP, vícevrstvá perceptron MLP, tradiční metoda CM.
Klasifikační výkon (s mezní hodnotou 18 let) tradičních a DM modelů byl prokázán z hlediska citlivosti, specifičnosti, pozitivní prediktivní hodnoty (PPV), negativní prediktivní hodnoty (NPV) a oblast pod přijímací charakteristickou charakteristickou křivkou (AUROC) 27 (Tabulka 2, obrázek 2 a doplňkový obrázek 1 online). Pokud jde o citlivost interní testovací baterie, tradiční metody fungovaly nejlépe mezi muži a horší mezi ženami. Rozdíl v klasifikační výkonnosti mezi tradičními metodami a SD je však 9,7% u mužů (MLP) a pouze 2,4% u žen (XGBOost). Mezi modely DM vykazovala logistická regrese (LR) lepší citlivost obou pohlaví. Pokud jde o specificitu vnitřní testovací sady, bylo pozorováno, že čtyři modely SD se u mužů fungovaly dobře, zatímco tradiční model u žen fungoval lépe. Rozdíly v klasifikační výkonnosti pro muže a ženy jsou 13,3% (MLP) a 13,1% (MLP), což naznačuje, že rozdíl v klasifikační výkonnosti mezi modely přesahuje citlivost. Mezi modely DM se mezi muži staly nejlépe mezi muži, mezi muži, zatímco model LR se mezi ženami nejlépe stal nejlépe mezi muži, který byl nejlépe mezi ženami nejlépe nejlépe. Auroc tradičního modelu a všech SD modelů byl větší než 0,925 (K-Nejbližší soused (KNN) u mužů), což prokazuje vynikající klasifikační výkon při rozlišování 18letých vzorků28. Pro externí testovací sadu došlo ke snížení klasifikační výkonnosti, pokud jde o citlivost, specificitu a Auroc ve srovnání s vnitřní testovací sadou. Kromě toho se rozdíl v citlivosti a specificitě mezi klasifikačním výkonem nejlepších a nejhorších modelů pohyboval od 10% do 25% a byl větší než rozdíl ve vnitřní testovací sadě.
Citlivost a specifičnost modelů klasifikace dolování dat ve srovnání s tradičními metodami s mezní hodnotou 18 let. KNN K nejbližší soused, SVM Support Vector Machine, LR logistická regrese, DT rozhodovací strom, RF Random Forest, XGB XGBOost, MLP MultiLyer Perceptron, tradiční metoda CM.
Prvním krokem v této studii bylo porovnání přesnosti odhadů zubního věku získaných ze sedmi modelů DM s odhady získanými pomocí tradiční regrese. MAE a RMSE byly hodnoceny ve vnitřních testovacích sadách pro obě pohlaví a rozdíl mezi tradiční metodou a modelem DM se pohyboval od 44 do 77 dnů pro MAE a od 62 do 88 dnů pro RMSE. Ačkoli tradiční metoda byla v této studii o něco přesnější, je obtížné dospět k závěru, zda takový malý rozdíl má klinický nebo praktický význam. Tyto výsledky ukazují, že přesnost odhadu zubního věku pomocí modelu DM je téměř stejná jako u tradiční metody. Přímé srovnání s výsledky z předchozích studií je obtížné, protože žádná studie neporovnávala přesnost modelů DM s tradičními statistickými metodami pomocí stejné techniky zaznamenávání zubů ve stejném věkovém rozmezí jako v této studii. Galibourg et al24 porovnávali MAE a RMSE mezi dvěma tradičními metodami (Demirjian Method25 a Willems Method29) a 10 dm modelů ve francouzské populaci ve věku 2 až 24 let. Uvedli, že všechny modely DM byly přesnější než tradiční metody, s rozdíly 0,20 a 0,38 let v MAE a 0,25 a 0,47 let v RMSE ve srovnání s metodami Willems a Demirdjian. Rozdíl mezi modelem SD a tradičními metodami uvedenými ve studii Halibourg bere v úvahu četné zprávy 30,31,32,33, že Demirdjianská metoda přesně neodhaduje věk zubního věku v jiných populacích než francouzští Kanaďané, na nichž byla studie založena. V této studii. Tai et al 34 použil algoritmus MLP k predikci věku zubů z 1636 čínských ortodontických fotografií a porovnal jeho přesnost s výsledky metody Demirjian a Willems. Uvedli, že MLP má vyšší přesnost než tradiční metody. Rozdíl mezi metodou Demirdjian a tradiční metodou je <0,32 let a metoda Willems je 0,28 let, což je podobné výsledkům této studie. Výsledky těchto předchozích studií24,34 jsou také v souladu s výsledky této studie a přesnost odhadu věku modelu DM a tradiční metoda jsou podobné. Na základě prezentovaných výsledků však můžeme pouze opatrně závěr, že použití modelů DM k odhadu věku může nahradit stávající metody v důsledku nedostatku srovnávacích a referenčních předchozích studií. K potvrzení výsledků získaných v této studii jsou zapotřebí následné studie využívající větší vzorky.
Mezi studiemi testujícími přesnost SD při odhadu věku zubního věku, někteří vykazovali vyšší přesnost než naše studie. Stepanovsky et al 35 použili 22 SD modelů na panoramatické rentgenové snímky 976 českých obyvatel ve věku 2,7 až 20,5 let a testovaly přesnost každého modelu. Posoudili vývoj celkem 16 horních a dolních levých trvalých zubů pomocí klasifikačních kritérií navržených Moorrees et al 36. MAE se pohybuje od 0,64 do 0,94 let a RMSE se pohybuje od 0,85 do 1,27 let, které jsou přesnější než dva modely DM použité v této studii. Shen et al23 použili metodu Cameriere k odhadu zubního věku sedmi permanentních zubů v levé čelisti u východní čínské obyvatele ve věku 5 až 13 let a porovnali ji s věkem odhadovaným pomocí lineární regrese, SVM a RF. Ukázali, že všechny tři modely DM mají vyšší přesnost ve srovnání s tradičním vzorcem Cameriere. Mae a RMSE v Shen's Study byly v této studii nižší než v modelu DM. Zvýšená přesnost studií Stepanovsky et al. 35 a Shen et al. 23 může být způsobeno zahrnutím mladších subjektů do jejich studijních vzorků. Protože odhady věku pro účastníky s vyvíjejícími se zuby se stávají přesnějšími, protože se počet zubů během vývoje zubů zvyšuje, může být přesnost výsledné metody odhadu věku ohrožena, když jsou účastníci studie mladší. Kromě toho je chyba MLP v odhadu věku o něco menší než SLP, což znamená, že MLP je přesnější než SLP. MLP je považován za o něco lepší pro odhad věku, pravděpodobně v důsledku skrytých vrstev v MLP38. Existuje však výjimka pro vnější vzorek žen (SLP 1,45, MLP 1,49). Zjištění, že MLP je přesnější než SLP v hodnocení věku, vyžaduje další retrospektivní studie.
Rovněž byl porovnán klasifikační výkon modelu DM a tradiční metoda při 18letém prahu. Všechny testované modely SD a tradiční metody na vnitřní testovací sadě ukázaly prakticky přijatelné úrovně diskriminace pro osmnáctiletý vzorek. Citlivost pro muže a ženy byla větší než 87,7% a 94,9%, a specificita byla větší než 89,3% a 84,7%. Auroc všech testovaných modelů také přesahuje 0,925. Podle našich nejlepších znalostí nebyla žádná studie testována výkonnost modelu DM pro 18letou klasifikaci založenou na zubní zralosti. Výsledky této studie můžeme porovnat s klasifikačním výkonem modelů hlubokého učení na panoramatických rentgenových snímcích. Guo et al.15 vypočítal klasifikační výkon modelu hlubokého učení založeného na CNN a manuální metody založené na Demirjianově metodě pro určitý prahová hodnota věku. Citlivost a specificita manuální metody byla 87,7%, respektive 95,5%, a citlivost a specificita modelu CNN překročila 89,2% a 86,6%. Došli k závěru, že modely hlubokého učení mohou nahradit nebo překonat manuální hodnocení při klasifikaci věkových prahů. Výsledky této studie ukázaly podobnou klasifikační výkon; Předpokládá se, že klasifikace pomocí modelů DM může nahradit tradiční statistické metody pro odhad věku. Mezi modely byl DM LR nejlepším modelem z hlediska citlivosti pro mužský vzorek a citlivost a specificitu pro ženský vzorek. LR je na druhém místě ve specificitě pro muže. Navíc je LR považován za jeden z uživatelsky přívětivějších modelů DM35 a je méně složitý a obtížně zpracovatelný. Na základě těchto výsledků byl LR považován za nejlepší model klasifikace pro 18 let v korejské populaci.
Celkově byla přesnost odhadu věku nebo klasifikačního výkonu na externí testovací sadě špatná nebo nižší ve srovnání s výsledky na vnitřní testovací sadě. Některé zprávy naznačují, že přesnost klasifikace nebo účinnost klesá, když se odhady věku založené na korejské populaci aplikují na japonskou populaci 5,39 a v této studii byl nalezen podobný vzorec. Tento trend zhoršení byl také pozorován v modelu DM. Proto, aby bylo možné přesně odhadnout věk, i když používání DM v procesu analýzy, měly by být upřednostňovány metody odvozené z údajů o nativní populaci, jako jsou tradiční metody, 5,39,40,41,42. Protože není jasné, zda modely hlubokého učení mohou vykazovat podobné trendy, studie porovnávající přesnost a účinnost klasifikace pomocí tradičních metod, modelů DM a modelů hlubokého učení na stejných vzorcích jsou zapotřebí k potvrzení, zda umělá inteligence může tyto rasové rozdíly překonat v omezeném věku. hodnocení.
Ukazujeme, že tradiční metody mohou být nahrazeny odhadem věku na základě modelu DM v praxi forenzního věku v Koreji. Zjistili jsme také možnost implementace strojového učení pro posouzení forenzního věku. Existují však jasná omezení, jako je nedostatečný počet účastníků v této studii, aby definitivně určili výsledky, a nedostatek předchozích studií pro porovnání a potvrzení výsledků této studie. V budoucnu by měly být studie DM prováděny s větším počtem vzorků a rozmanitějšími populacemi, aby se zlepšila jeho praktická použitelnost ve srovnání s tradičními metodami. Pro ověření proveditelnosti používání umělé inteligence k odhadu věku ve více populacích je zapotřebí budoucích studií pro porovnání přesnosti klasifikace a účinnosti modelů DM a hlubokého učení s tradičními metodami ve stejných vzorcích.
Studie použila 2 657 ortografických fotografií shromážděných od korejských a japonských dospělých ve věku 15 až 23 let. Korejské rentgenové snímky byly rozděleny do 900 tréninkových sad (19,42 ± 2,65 let) a 900 interních testovacích sad (19,52 ± 2,59 let). Výcviková sada byla shromážděna v jedné instituci (Seoul St. Mary's Hospital) a vlastní testovací sada byla shromážděna ve dvou institucích (Dentální nemocnice v Soulu a zubní nemocnici Yonsei University). Shromáždili jsme také 857 rentgenových snímků z dalších údajů založených na populaci (Iwate Medical University, Japonsko) pro externí testování. Jako externí testovací sada byly vybrány rentgenové snímky japonských subjektů (19,31 ± 2,60 let). Data byla shromažďována retrospektivně pro analýzu fází vývoje zubů na panoramatických rentgenových snímcích pořízených během zubního ošetření. Všechna shromážděná data byla anonymní s výjimkou pohlaví, datum narození a datum rentgenového snímku. Kritéria pro zařazení a vyloučení byla stejná jako dříve publikovaná studie 4, 5. Skutečný věk vzorku byl vypočten odečtením data narození ode dne, kdy byl rentgen pořízen. Skupina vzorků byla rozdělena do devíti věkových skupin. Distribuce věku a pohlaví jsou uvedeny v tabulce 3 Tato studie byla provedena v souladu s Helsinskou deklarací a schváleno Institucionální revizní radou (IRB) Hospital St. Mary's Hospital na Katolické univerzitě v Korejské univerzitě (KC22WISI0328). Vzhledem k retrospektivnímu návrhu této studie nemohl být informovaný souhlas získán od všech pacientů podstupujících radiografické vyšetření pro terapeutické účely. Nemocnice v Korejské univerzitě v Koreji v Koreji (IRB) se vzdala požadavku na informovaný souhlas.
Vývojové fáze bimaxilárních druhých a třetích stoliček byly hodnoceny podle kritérií Demircan25. Pouze jeden zub byl vybrán, pokud byl na levé a pravé straně každé čelisti nalezen stejný typ zubu. Pokud byly homologní zuby na obou stranách v různých vývojových stádiích, byl zub s dolním vývojovým stádiem vybrán, aby zohlednil nejistotu v odhadovaném věku. Sto náhodně vybraných rentgenových snímků z tréninkové sady bylo zaznamenáno dvěma zkušenými pozorovateli, aby testovali spolehlivost interobserveru po prekalibraci, aby se stanovila fáze zubní zralosti. Spolehlivost intraobserveru byla primárním pozorovatelem hodnocena dvakrát ve třech měsících.
Pohlaví a vývojová fáze druhé a třetích stoliček každé čelisti v tréninkové sadě byla odhadnuta primárním pozorovatelem vyškoleným s různými modely DM a skutečný věk byl stanoven jako cílová hodnota. Modely SLP a MLP, které se široce používají ve strojovém učení, byly testovány proti regresním algoritmům. Model DM kombinuje lineární funkce pomocí vývojových fází čtyř zubů a kombinuje tato data pro odhad věku. SLP je nejjednodušší neuronová síť a neobsahuje skryté vrstvy. SLP funguje na základě prahové přenosu mezi uzly. Model SLP v regresi je matematicky podobný vícenásobné lineární regresi. Na rozdíl od modelu SLP má model MLP více skrytých vrstev s nelineárními aktivačními funkcemi. Naše experimenty používaly skrytou vrstvu s pouze 20 skrytými uzly s nelineárními aktivačními funkcemi. Jako metodu optimalizace použijte sestup gradientu a jako funkci ztráty MAE a RMSE pro trénink našeho modelu strojového učení. Nejlépe získaný regresní model byl aplikován na vnitřní a externí testovací sady a byl odhadnut věk zubů.
Byl vyvinut klasifikační algoritmus, který využívá zralost čtyř zubů na tréninkové sadě k predikci, zda je vzorek 18 let nebo ne. Pro vytvoření modelu jsme odvodili sedm algoritmů reprezentačního stroje . LR je jedním z nejpoužívanějších klasifikačních algoritmů44. Jedná se o algoritmus učení pod dohledem, který používá regresi k predikci pravděpodobnosti dat patřících do určité kategorie od 0 do 1 a klasifikuje data jako patřící do pravděpodobnější kategorie na základě této pravděpodobnosti; Používá se hlavně pro binární klasifikaci. KNN je jedním z nejjednodušších algoritmů strojového učení45. Při podávání nových vstupních dat najde data K blízko existující sady a poté je klasifikuje do třídy s nejvyšší frekvencí. Nastavili jsme 3 pro počet sousedů zvažovaného (k). SVM je algoritmus, který maximalizuje vzdálenost mezi dvěma třídami pomocí funkce jádra k rozšíření lineárního prostoru do nelineárního prostoru zvaného Fields46. Pro tento model používáme zkreslení = 1, sílu = 1 a gama = 1 jako hyperparametry pro polynomiální jádro. DT byl aplikován v různých oborech jako algoritmus pro rozdělení celého souboru dat do několika podskupin reprezentací rozhodovacích pravidel ve stromové struktuře47. Model je nakonfigurován s minimálním počtem záznamů na uzel 2 a používá index Gini jako měřítko kvality. RF je metoda souboru, která kombinuje více DT pro zlepšení výkonu pomocí metody agregace bootstrap, která generuje slabý klasifikátor pro každý vzorek náhodně nakreslením vzorků stejné velikosti několikrát z původního datového souboru48. Jako kritéria separace uzlů jsme použili 100 stromů, 10 hloubek stromů, 1 minimální velikost uzlu a index příměsi Gini. Klasifikace nových údajů je určena většinovým hlasováním. XGBOost je algoritmus, který kombinuje techniky posilování pomocí metody, která jako tréninkové údaje bere chybu mezi skutečnými a předpokládanými hodnotami předchozího modelu a rozšiřuje chybu pomocí gradients49. Jedná se o široce používaný algoritmus díky svému dobrému výkonu a efektivitě zdrojů, jakož i vysokou spolehlivost jako korekční funkce nadměrná. Model je vybaven 400 podpůrnými koly. MLP je neuronová síť, ve které jeden nebo více vnímání vytváří více vrstev s jednou nebo více skrytými vrstvami mezi vstupní a výstupní vrstvy38. Pomocí tohoto můžete provést nelineární klasifikaci, kde při přidání vstupní vrstvy a získáte hodnotu výsledku, předpokládaná hodnota výsledku je porovnána se skutečnou hodnotou výsledku a chyba se šíří zpět. V každé vrstvě jsme vytvořili skrytou vrstvu s 20 skrytými neurony. Každý model, který jsme vyvinuli, byl aplikován na interní a externí sady pro testování klasifikačního výkonu výpočtem citlivosti, specificity, PPV, NPV a Auroc. Citlivost je definována jako poměr vzorku odhadovaného na 18 let nebo starší ke vzorku odhadovanému na 18 let nebo starší. Specifičnost je podíl vzorků mladších 18 let a u těch, o nichž se odhaduje, že jsou mladší 18 let.
Zubní fáze hodnocené v tréninkové sadě byly přeměněny na numerické fáze pro statistickou analýzu. Byla provedena multivariační lineární a logistická regrese za účelem vývoje prediktivních modelů pro každý pohlaví a odvození regresních vzorců, které lze použít k odhadu věku. Tyto vzorce jsme použili k odhadu věku zubů pro vnitřní i externí testovací sady. Tabulka 4 ukazuje modely regrese a klasifikace použité v této studii.
Spolehlivost intra- a interobserveru byla vypočtena pomocí Cohenovy statistiky Kappa. Pro testování přesnosti DM a tradičních regresních modelů jsme vypočítali MAE a RMSE pomocí odhadovaného a skutečného věku vnitřních a externích testovacích sad. Tyto chyby se běžně používají k vyhodnocení přesnosti předpovědí modelu. Čím menší je chyba, tím vyšší je přesnost předpovědi24. Porovnejte MAE a RMSE interních a externích testovacích sad vypočtených pomocí DM a tradiční regrese. Klasifikační výkon osmnáctiletého mezní hodnoty tradičních statistik byl hodnocen pomocí kontingenční tabulky 2 × 2. Vypočítaná citlivost, specificita, PPV, NPV a Auroc testovací sady byly porovnány s naměřenými hodnotami klasifikačního modelu DM. Data jsou vyjádřena jako průměr ± standardní odchylka nebo číslo (%) v závislosti na datových charakteristikách. Oboustranné hodnoty p <0,05 byly považovány za statisticky významné. Všechny rutinní statistické analýzy byly provedeny pomocí SAS verze 9.4 (SAS Institute, Cary, NC). Regresní model DM byl implementován v Pythonu pomocí Keras50 2.2.4 Backend a Tensorflow51 1.8.0 speciálně pro matematické operace. Klasifikační model DM byl implementován v prostředí analýzy znalostí Waikato a analytická platforma Konstanz Information Miner (KNIME) 4.6.152.
Autoři uznávají, že údaje podporující závěry studie lze nalézt v článku a doplňkovém materiálu. Datové sady generované a/nebo analyzované během studie jsou k dispozici od odpovídajícího autora na přiměřenou žádost.
Ritz-Timme, S. a kol. Hodnocení věku: Nejmodernější pro splnění specifických požadavků forenzní praxe. International. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. a Olze, A. Aktuální status posouzení forenzního věku živých subjektů pro účely trestního stíhání. Forenzní. lék. Patologie. 1, 239–246 (2005).
Pan, J. a kol. Modifikovaná metoda hodnocení zubního věku dětí ve věku 5 až 16 let ve východní Číně. klinický. Ústní průzkum. 25, 3463–3474 (2021).
Lee, SS atd. Chronologie vývoje druhých a třetích stoliček v Korejcích a jeho aplikace pro posouzení forenzního věku. International. J. Legal Medicine. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY a Lee, SS přesnost odhadu věku a odhadu 18letého prahu na základě zralosti druhého a třetího stoličení v Korejcích a japonštině. PLOS ONE 17, E0271247 (2022).
Kim, JY, et al. Analýza dat založená na strojovém učení může předpovídat výsledek léčby spánku u pacientů s OSA. věda. Zpráva 11, 14911 (2021).
Han, M. a kol. Přesný odhad věku z strojového učení s lidským zásahem nebo bez něj? International. J. Legal Medicine. 136, 821–831 (2022).
Khan, S. a Shaheen, M. Od těžby dat po těžbu dat. J.informace. věda. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. a Shaheen, M. Wisrule: První kognitivní algoritmus pro těžbu pravidel asociace. J.informace. věda. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. a Abdullah U. Karm: Tradiční těžba dat založená na pravidlech asociace založených na kontextu. vypočítat. Matt. pokračovat. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. a Habib M. Deet Detect Detection Detection Detection Detection Detection Detection pomocí textových dat. informovat. technologie. řízení. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. a Shahin, M. Systém pro rozpoznávání činnosti ve sportovních videích. multimédia. Nástroje aplikace https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge v dětském kostním věku. Radiologie 290, 498–503 (2019).
Li, Y. a kol. Odhad forenzního věku z rentgenových paprsků pánve pomocí hlubokého učení. EURO. záření. 29, 2322–2329 (2019).
Guo, YC, et al. Přesná klasifikace věku pomocí manuálních metod a hlubokých konvolučních neuronových sítí z ortografických projekčních obrazů. International. J. Legal Medicine. 135, 1589–1597 (2021).
Alabama Dalora et al. Odhad věku kostí pomocí různých metod strojového učení: Systematická přehled literatury a metaanalýza. PLOS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. a Yang, J. Populační věkový odhad afrických Američanů a čínských na základě objemu buničiny prvních stoliček pomocí počítačové tomografie kužele. International. J. Legal Medicine. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK a OH KS Určování věkových skupin žijících lidí pomocí obrazů založených na umělé inteligenci prvních stoliček. věda. Zpráva 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., a Urschler, M. Automatický odhad věku a většinovou klasifikaci z vícerozměrných dat MRI. IEEE J. Biomed. Upozornění na zdraví. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. a Li, G. Odhad věku založeného na segmentaci 3D buničiny komory prvních stoliček z počítačové tomografie z kuželového paprsku integrací hlubokého učení a sad úrovní. International. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT, et al. Dolování dat v klinických velkých datech: Společné databáze, kroky a metody. Svět. lék. zdroj. 8, 44 (2021).
Yang, J. a kol. Úvod do lékařských databází a technologií těžby dat v éře velkých dat. J. AVID. Základní medicína. 13, 57–69 (2020).
Shen, S. a kol. Metoda kamera pro odhad věku zubů pomocí strojového učení. BMC Oral Health 21, 641 (2021).
Galliburg A. a kol. Porovnání různých metod strojového učení pro predikci zubního věku pomocí metody Demirdjian Staging. International. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. a Tanner, JM nový systém pro hodnocení věku zubního lékaře. šňupat. biologie. 45, 211–227 (1973).
Landis, Jr a Koch, GG opatření dohody pozorovatelů o kategorických datech. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK a Choi HK. Texturní, morfologická a statistická analýza dvourozměrného zobrazování magnetické rezonance pomocí technik umělé inteligence pro diferenciaci primárních mozkových nádorů. Zdravotní informace. zdroj. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Čas příspěvku: leden-04-2024