Neuronová síť si přečte vědecké práce a vyrobí z nich souhrn

Práce popularizátorů vědeckých poznatků mnohdy spočívá v přečtení haldy odborných statí, než se jim podaří porozumět odborné hantýrce a významu cizích termínů, aby z toho pak dokázali vyprodukovat text, z čehož si odnesou něco i ti, kteří jsou v dané vědecké oblasti laici. Teď se zdá, že je brzo nahradí AI.

Umělá inteligence zvládá číst vědecké texty a požizovat z nich výtah. Kredit: Chelsea Turner

Umělá inteligence zvládá číst vědecké texty a pořizovat z nich výtah. Kredit: Chelsea Turner

Tým vědců na MIT s kolegy z Kataru vyvinul neuronovou síť (formu umělé inteligence AI), která dokáže z dlouhých vědeckých elaborátů vybrat to podstatné a zhustit to do několika vět. Podle tvůrců programu by jejich vynález mohl být k užitku nejen redaktorům, ale i vědcům. Ti si také skenují velké množství článků a mnohdy nemají čas je všechny ani přečíst a získat tím alespoň hrubou představu, o co v nich jde. Tištěné i netištěné zdroje chrlí tolik novinek, že není v lidských silách obsáhnout vše a hrozí, že něco podstatného unikne. Program, který nyní američtí vědci představili, by se kromě zde zmíněného zpracování psaného textu měl uplatnit ve vylepšení strojových překladů. A rovněž i jiných, zatím netušených oblastech lidské činnosti.

Představená jazyková vychytávka vznikla poněkud paradoxně, jako vedlejší produkt projektu, který si kladl za cíl řešit problémy fyzikálních výpočtů, jakým je chování světla v opticky složitých materiálech. Měla k tomu být použita umělá inteligence a neuronové sítě. Ty jsou pokusem o napodobení způsobu lidského učení se novým věcem. Počítač prověřuje mnoho příkladů a z těch si pak odvozuje klíčové vzorce. Tento přístup se již nyní používá například při identifikaci osob ze snímků pořízených kamerami, celníkům zase pomáhá typovat zásilky se zbraněmi, či jiným kontrabandem.

O neuronových sítích je známo, že mají potíže s korelacemi u dlouhých řetězců dat. Vědci se to snaží vylepšovat různými triky, včetně technik známých jako prodloužení krátkodobé paměti (LSTM) a uzavřených rekurentních jednotek (GRU). Nic z toho ale nedosahuje toho, co je potřeba pro zpracování chování světla, a nebo přirozeného jazyka.Tým z Massachusetts přišel na alternativní řešení. Místo toho, aby pracovali s pomnožováním matic, jako to dělá většina konvenčních neuronových sítí, převedli vše na vektory rotující v multidimenzionálním prostoru.

Základem jejich konceptu je něco, co nazývají rotační paměťovou jednotkou (rotational unit of memory, zkráceně RUM). Pracuje tak, že systém z každého slova v textu „udělá“ vektor (úsečku) v multidimenzionálním prostoru. Každé následující slovo tomuto vektoru poopravuje jeho směr. Na konci procesu tak výsledný vektor, nebo sadu vektorů, převede algoritmus zpět do odpovídajícího řetězce slov. Podle vědců jejich nápad s rotational unit of memory umožňuje neuronovým sítím dělat dvě věci. Pomáhá jim lépe si pamatovat a umožňuje jim přesněji vyvolat informace. Dokládají to na příkladu.

Tradičním přístupem založeném na systému LSTM se jim podařilo získat z odborného textu toto: "Baylisascariasis," zabíjí myši, ohrožuje lesní strom a způsobil onemocnění jako slepota nebo závažné následky. Tato infekce, označovaná jako "baylisascariasis", zabíjí myši, ohrožuje lesní strom a způsobuje onemocnění jako slepota nebo závažné následky. Tato infekce, označovaná jako "baylisascariasis", zabíjí myši, ohrožuje lesní strom.“

Ze stejné publikace vytvořil jejich systém založený na rotational unit of memory toto: "Městští mývalové mohou infikovat lidi více, než se dříve předpokládalo. 7% dotazovaných jedinců bylo pozitivních na protilátky proti mrožovicovým škrkavkám. Více než 90 procent raccoons v Santa Barbara hrát hostitele tohoto parazita."

V současné době už byl systém rotational unit of memory rozšířen a zvládá „číst“ nejen souhrny, nebo jednu výzkumnou zprávu, ale ze stejného oboru i více zpráv najednou a z těch pak nabídnou výtah. Aby si výzkumníci ověřili, co jejich výtvor umí, otestovali ho i na své vlastní výzkumné publikaci. Té, o níž se snaží referovat i tento populární článek.

Zde je shrnutí, které z něj vytvořila neuronová síť: "Výzkumníci vyvinuli nový proces reprezentace na rotační jednotce RUM, opakující se paměti, kterou lze použít k řešení širokého spektra neurální revoluce při zpracování přirozeného jazyka."

Jak je vidět, tak abstrakty tvořené AI jsou poněkud neučesané, podstatnou informaci ale podávají a relativně srozumitelně. Je až s podivem, že v době, kdy je téměř vše podřízeno diktátu peněz, autoři to dávají k dispozici jako open-source a vše je přístupné na Githubu. Ke zdrojovým kódům se tak dostane celá řada pracovišť a budou mít možnost si na svých úkolech vše prověřit. A to je nadějná cesta dalšího vylepšování a brzkého uplatnění v široké praxi.

Závěr

Američané si osobují právo na objev způsobu, jak porozumět dlouhým a nudným vědeckým elaborátům. Klíčovým prvkem má být rotační paměťová jednotka. Tu ale v našich končinách známe už dlouho, jen nás EU donutila říkat jí tuzemák.

Literatura

Rumen Dangovski et al, Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications, Transactions of the Association for Computational Linguistics (2019).dx.doi.org/10.1162/tacl_a_00258

Autor: Josef Pazdera

Datum: 20.04.2019

Tisk článku

Související články:

Neurony se chovají jako sbor volitelů při volbě prezidenta Autor: Josef Pazdera (16.09.2009)
Co je to vlastně ta Umělá inteligence? Autor: Lukáš Fireš (30.01.2019)
Pokud nebudeme k umělým inteligencím milí, mohly by nám to vrátit Autor: Stanislav Mihulka (17.03.2019)

Diskuze:

Žádný příspěvek nebyl zadán

Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce

Myšlenka a video dne

„Nikdy nepodceňujte sílu hloupých lidí ve velkých skupinách.“ (George Dennis Carlin)

Reklama

Sponzoři a partneři