Tým vědců na MIT s kolegy z Kataru vyvinul neuronovou síť (formu umělé inteligence AI), která dokáže z dlouhých vědeckých elaborátů vybrat to podstatné a zhustit to do několika vět. Podle tvůrců programu by jejich vynález mohl být k užitku nejen redaktorům, ale i vědcům. Ti si také skenují velké množství článků a mnohdy nemají čas je všechny ani přečíst a získat tím alespoň hrubou představu, o co v nich jde. Tištěné i netištěné zdroje chrlí tolik novinek, že není v lidských silách obsáhnout vše a hrozí, že něco podstatného unikne. Program, který nyní američtí vědci představili, by se kromě zde zmíněného zpracování psaného textu měl uplatnit ve vylepšení strojových překladů. A rovněž i jiných, zatím netušených oblastech lidské činnosti.
Představená jazyková vychytávka vznikla poněkud paradoxně, jako vedlejší produkt projektu, který si kladl za cíl řešit problémy fyzikálních výpočtů, jakým je chování světla v opticky složitých materiálech. Měla k tomu být použita umělá inteligence a neuronové sítě. Ty jsou pokusem o napodobení způsobu lidského učení se novým věcem. Počítač prověřuje mnoho příkladů a z těch si pak odvozuje klíčové vzorce. Tento přístup se již nyní používá například při identifikaci osob ze snímků pořízených kamerami, celníkům zase pomáhá typovat zásilky se zbraněmi, či jiným kontrabandem.
O neuronových sítích je známo, že mají potíže s korelacemi u dlouhých řetězců dat. Vědci se to snaží vylepšovat různými triky, včetně technik známých jako prodloužení krátkodobé paměti (LSTM) a uzavřených rekurentních jednotek (GRU). Nic z toho ale nedosahuje toho, co je potřeba pro zpracování chování světla, a nebo přirozeného jazyka.Tým z Massachusetts přišel na alternativní řešení. Místo toho, aby pracovali s pomnožováním matic, jako to dělá většina konvenčních neuronových sítí, převedli vše na vektory rotující v multidimenzionálním prostoru.
Základem jejich konceptu je něco, co nazývají rotační paměťovou jednotkou (rotational unit of memory, zkráceně RUM). Pracuje tak, že systém z každého slova v textu „udělá“ vektor (úsečku) v multidimenzionálním prostoru. Každé následující slovo tomuto vektoru poopravuje jeho směr. Na konci procesu tak výsledný vektor, nebo sadu vektorů, převede algoritmus zpět do odpovídajícího řetězce slov. Podle vědců jejich nápad s rotational unit of memory umožňuje neuronovým sítím dělat dvě věci. Pomáhá jim lépe si pamatovat a umožňuje jim přesněji vyvolat informace. Dokládají to na příkladu.
Tradičním přístupem založeném na systému LSTM se jim podařilo získat z odborného textu toto: "Baylisascariasis," zabíjí myši, ohrožuje lesní strom a způsobil onemocnění jako slepota nebo závažné následky. Tato infekce, označovaná jako "baylisascariasis", zabíjí myši, ohrožuje lesní strom a způsobuje onemocnění jako slepota nebo závažné následky. Tato infekce, označovaná jako "baylisascariasis", zabíjí myši, ohrožuje lesní strom.“
Ze stejné publikace vytvořil jejich systém založený na rotational unit of memory toto: "Městští mývalové mohou infikovat lidi více, než se dříve předpokládalo. 7% dotazovaných jedinců bylo pozitivních na protilátky proti mrožovicovým škrkavkám. Více než 90 procent raccoons v Santa Barbara hrát hostitele tohoto parazita."
V současné době už byl systém rotational unit of memory rozšířen a zvládá „číst“ nejen souhrny, nebo jednu výzkumnou zprávu, ale ze stejného oboru i více zpráv najednou a z těch pak nabídnou výtah. Aby si výzkumníci ověřili, co jejich výtvor umí, otestovali ho i na své vlastní výzkumné publikaci. Té, o níž se snaží referovat i tento populární článek.
Zde je shrnutí, které z něj vytvořila neuronová síť: "Výzkumníci vyvinuli nový proces reprezentace na rotační jednotce RUM, opakující se paměti, kterou lze použít k řešení širokého spektra neurální revoluce při zpracování přirozeného jazyka."
Jak je vidět, tak abstrakty tvořené AI jsou poněkud neučesané, podstatnou informaci ale podávají a relativně srozumitelně. Je až s podivem, že v době, kdy je téměř vše podřízeno diktátu peněz, autoři to dávají k dispozici jako open-source a vše je přístupné na Githubu. Ke zdrojovým kódům se tak dostane celá řada pracovišť a budou mít možnost si na svých úkolech vše prověřit. A to je nadějná cesta dalšího vylepšování a brzkého uplatnění v široké praxi.
Závěr
Američané si osobují právo na objev způsobu, jak porozumět dlouhým a nudným vědeckým elaborátům. Klíčovým prvkem má být rotační paměťová jednotka. Tu ale v našich končinách známe už dlouho, jen nás EU donutila říkat jí tuzemák.
Literatura
Rumen Dangovski et al, Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications, Transactions of the Association for Computational Linguistics (2019).dx.doi.org/10.1162/tacl_a_00258