Stárnutí duchů ve stroji? Pokročilé generativní inteligence trpí demencí  
Momentálně jsme svědky pozoruhodného vývoje v oblasti umělých inteligencí. Od posměšků „vždyť je to jenom počítačový program“ nebo „ne, vážně nejsou jako lidé, ani v nejmenším,“se dostáváme k praktickým dotazům „kde seženu psychiatra pro svou generativní inteligenci?“ Kdo by tohle čekal?
Duch ve stroji. Kredit: DALL-E/OpenAI via Psychology Today.
Duch ve stroji. Kredit: DALL-E/OpenAI via Psychology Today.

Výzkum a vývoj velkých jazykových modelů, tedy generativních inteligencí, s nimiž si teď mnozí z nás rádi povídají, nabírá až nečekané grády. Podle zajímavé studie, kterou přineslo vánoční číslo British Medical Journal (BMJ), vykazují prakticky všechny významné velké jazykové modely (LLM) známky mírné kognitivní poruchy v testech široce používaných u lidských pacientů pro odhalení časných známek demence. Výsledky experimentů rovněž ukazují, že starší verze generativních inteligencí, pozoruhodně podobě jako starší lidští pacienti, jsou v testech demence horší.

 

Gal Koplewitz. Kredit: Harvard College.
Gal Koplewitz. Kredit: Harvard College.

Gal Koplewitz (zřejmě) z britského Quantum Black Analytics a Tel Aviv University se svými spolupracovníky vyšel z toho, že velké jazykové modely v dnešní době představují slibné kandidáty na rozsáhlé využití v medicíně, včetně psychiatrie, ale přitom ještě nikdo neprozkoumal, zda nejsou náchylné k lidským potížím, jako je slábnutí kognitivních funkcí a rozvoj demence. Přitom se to nabízí. Co je člověku podobné, mohlo by mít i člověku podobné problémy. Pokud jde o vedoucího týmu Koplewitze, je překvapivě obtížné o něm něco najít. U (bývalého?) vojenského zpravodajského analytika IDF ovšem není divu.

 

MoCA test, úkol s hodinami. Kredit: Mattson M, Wikimedia Commons, CC BY-SA 4.0CC BY-SA 4.0.
MoCA test, úkol s hodinami. Kredit: Mattson M, Wikimedia Commons, CC BY-SA 4.0CC BY-SA 4.0.

Badatelé otestovali na demenci přední, veřejně dostupné a hojně využívané inteligence, včetně ChatGPT 4 a 4o (OpenAI), Claude 3.5 „Sonnet“ (Anthropic) a Gemini 1 a 1.5 (Alphabet). Využili k tomu test Montreal Cognitive Assessment (MoCA), který se široce uplatňuje při detekci kognitivních poruch a časných příznaků demence u starších pacientů. Zahrnuje řadu otázek a krátkých úkolů, přičemž hodnotí schopnosti jako pozornost, paměť, řeč, vizuálně prostorové dovednosti nebo exekutivní funkce (kognitivní procesy podporující cílevědomé chování). Nejvyšší možné skóre testu MoCA je 30, za normální stav je považováno 26 a více bodů.

 

Zmíněné inteligence obstály slušně ve většině úkolů. Problémem pro ně byly vizuálně prostorové dovednosti a exekutivní funkce, například interpretace toho, co inteligence „vidí“ nebo slavný Stroopův test, případně známé kreslení ciferníku hodin ukazujících určený čas. Nakonec jen jedna z inteligencí dosáhla 26 bodů, zbytek neuspěl.

Posmívat se inteligencím, že trpí demencí, je samozřejmě škodolibá antropomorfní nadsázka. Na druhou stranu, výzkum Koplewitze a spol. pozoruhodně odhaluje, v čem se momentálně liší „mozky“ velkých jazykových modelů od toho našeho. Zdá se, že selhávají především v úkolech vyžadujících vizuální abstrakci. Pro Koplewitze a jeho kolegy je to úleva, protože to prý znamená, že neurologové nebudou jen tak nahrazeni inteligencemi. Naopak, jak věří autoři studie, lidští neurologové možná brzy najdou nové, virtuální pacienty. Své umělé inteligence budeme vodit k psychiatrovi.

 

Video: Montreal Cognitive Assessment (MoCA): Administration and Scoring

 

Literatura

Medical Xpress 18. 12. 2024.

BMJ 387: e081948.

Datum: 21.12.2024
Tisk článku



Diskuze:

Dementní či jen slabomyslné?

Tomáš Petrásek,2024-12-21 20:09:31

Pokud jsem v článku i v původní studii něco podstatného nepřehlédl, tak autoři nijak nedoložili, že by testované UI skutečně s věkem dementněly, protože je testovali jen jednou, nezjišťovali změny v čase. Demence (zblbělost), ale i její předstupeň mírná kognitivní porucha, jak to titulují v původní studii, předpokládá, že studovaná mentální schopnost se zhoršila oproti předchozí normě. Jinak to také může být obyčejná mentální retardace čili oligofrenie.
Ačkoli jsem v oboru UI naprostý laik, soudím, že starší UI měly horší výkonnost prostě proto, že jsou to méně pokročilé modely a hůř fungovaly hned od "narození", nikoli že by s věkem dementněly.
Nechápu, proč to autoři studie podali právě tímhle zavádějícím způsobem (skutečně to nevzniklo až v překladu a převyprávění). Umělá mentální retardace (UMR) by přitom zněla tak hezky!

Odpovědět


Re: Dementní či jen slabomyslné?

Pavel Kaňkovský,2024-12-21 23:04:13

Asi máte pravdu. Oni pozorovali, že dřívější verze určitého modelu vykazuje horší výsledky než novější, ale přehlédli, že jednou hotová verze se už v čase nemění a tedy fakticky nestárne. A pokud bychom to chtěli porovnávat podle toho, která verze prošla delším vývojem a tedy jakoby starší, tak by to byla paradoxně ta novější.

Nicméně i tak je zajímavé, že ty modely při provedených testech vykazovaly některé symptomy typické pro skutečnou demenci.

Odpovědět




Pro přispívání do diskuze musíte být přihlášeni



Zásady ochrany osobních údajů webu osel.cz