Nový nástroj americké technologické společnosti založený na umělé inteligenci (AI) překonává lidské lékaře v diagnóze složitých případů, tvrdí firma. Systém AI Diagnostic Orchestrator správně identifikoval 85,5 procenta komplikovaných případů popsaných v časopise New England Journal of Medicine (NEJM), zatímco lidským lékařům se to bez konzultací s literaturou nebo kolegy podařilo jen zhruba ve 20 procentech.
Systém využívá pět takzvaných virtuálních agentů AI, kteří spolu debatují a navrhují diagnózy, přičemž každý má konkrétní roli, například vymýšlení hypotéz nebo výběr testů. Novou metodu nazval "řetězec debaty" (chain of debate). Řetězec debaty podle firmy umožňuje sledovat krok za krokem logiku, jejíž pomocí systém dospěl k závěrům.
Nejlepších výsledků dosáhl AI Diagnostic Orchestrator s modelem o3 společnosti OpenAI. testoval různé modely GPT od OpenAI, Llama od Meta Platforms, Claude od firmy Anthropic, Grok od xAI nebo čínský DeepSeek. Šéf divize AI a spoluzakladatel laboratoře DeepMind Mustafa Suleyman označil výsledky za zásadní krok směrem k "lékařské superinteligenci".
"Modely AI nejsou jen o něco lepší, ale dramaticky lepší - rychlejší, levnější a čtyřikrát přesnější," řekl Suleyman v rozhovoru v deníku Financial Times (FT). Systém podle firmy umožňuje snižovat náklady a výrazně redukoval počet testů nutných k určení diagnózy, což v některých případech vedlo k úspoře stovek tisíc dolarů.
Odborníci podle FT upozorňují, že technologie není připravena pro nasazení v klinické praxi a výsledky dosud neprošly recenzním řízením. Nástroj je součástí širší strategie na využití AI ve zdravotnictví a řešení problémů s nedostatkem personálu. Výzkumný tým si podle společnosti uvědomuje omezení současného výzkumu a zdůrazňuje nutnost dalšího testování v reálných podmínkách lékařské praxe.