Nedávný systematický přehled řady vědeckých rukopisů provedený výzkumníky z Univerzity v Cambridge zjistil, že modely strojového učení pro zjišťování nebo diagnostiku covid-19 zatím nejsou vhodné ve srovnání se standardním lékařským zobrazováním. Výzkum byl publikován v časopise Nature Machine Intelligence.
„V počátcích pandemie panoval hlad po informacích a některé publikace byly bezpochyby uspěchány,“ uvedl James Rudd, spoluautor studie. „Pokud však svůj model zakládáte na datech z jedné nemocnice, nemusí to fungovat na datech z nemocnice v sousedním městě: data musí být různorodá, v ideálním případě mezinárodní, jinak nastavujete svůj model strojového učení tak, aby selhal, když bude testován šířeji.“
V rámci přezkumu výzkumníci identifikovali více než 2000 studií publikovaných v období od ledna do října 2020, které uváděly schopnost diagnostikovat nebo stanovit prognózu covid-19 z rentgenových snímků hrudníku (CXR) a snímků počítačové tomografie (CT). I když mnohé prošly odbornou recenzí, neplatí to o všech. Z těchto studií výzkumníci po několika projekcích snížili počet na 62. Zjistili, že žádná ze studií neměla potenciál pro klinické použití kvůli zaujatosti, metodickým nedostatkům, nedostatečné reprodukovatelnosti a chybným souborům dat.
„Ať už používáte strojové učení k předpovídání počasí nebo toho, jak může nemoc postupovat, je důležité zajistit, aby různí specialisté pracovali společně a mluvili stejným jazykem, aby bylo možné se zaměřit na správné problémy,“ řekl spoluautor studie Michael Roberts.
V mnoha studiích autoři nespecifikovali, kde získali svá data, ani zda byla pro modely a testy použila stejná data, což znemožnilo reprodukovat počáteční výsledky. Výzkumníci však zdůrazňují, že tato oblast výzkumu vykazuje – s některými klíčovými úpravami – mnoho příslibů a může být potenciálně mocným nástrojem v boji proti pandemii. „Mezinárodní komunita strojového učení vyvinula obrovské úsilí při zvládání pandemie covid-19 pomocí strojového učení,“ řekl Rudd. „Tyto rané studie jsou slibné, ale trpí vysokou prevalencí nedostatků v metodice a podávání zpráv, přičemž žádná z literatury, kterou jsme přezkoumali, nedosáhla hranice rozsáhlosti a reprodukovatelnosti, která je nezbytná pro podporu použití v klinické praxi.“