Herní průmysl se otřásá v základech. Nové pukliny se šíří od úterka, kdy vědci Google a Tel Aviv University vypustili na světlo novou inteligenci GameNGen. Jde o první herní engine, který je poháněný neurálním modelem, umožňujícím interakci s komplexním prostředím v reálném čase a ve vysoké kvalitě. Není to první inteligence tohoto druhu, ale podle ohlasů se jejím tvůrcům povedl slušný zásah.
Tvůrci vyzkoušeli inteligenci GameNGen na klasice všech klasik, videohře Doom z roku 1993 od id Software, která položila základy žánru First-person shooter (FPS), tedy střílečky z pohledu první osoby, a stala se jednou z nejvýznamnějších a nejlepších videoher všech dob. GameNGen interaktivně simuluje Doom v reálném čase a využívá ke generování grafiky technologii vypůjčenou od inteligence Stable Diffusion.
Podle vývojáře Nicka Dobose je potenciál podobných inteligencí až absurdně obrovský. Namísto vykreslování grafiky tradičními postupy bude možné využívat engine založený na umělé inteligenci k halucinování grafiky v reálném čase. Jak s nostalgií říká Dobos, proč by měl někdo ručně vytvářet složitou grafiku, když umělá inteligence může vysnít každý pixel? Tohle zní jako rozsudek smrti pro soudobý přístup k vývoji her a aplikací, i když to nemusí být okamžitě.
GameNGen generuje přes dvacet snímků (frames) za sekundu pomocí jediného procesoru TPU (tensor processing unit), zařízení podobného GPU, které je optimalizované pro umělé inteligence. V experimentu dokázalo deset lidských hodnotitelů rozlišit krátké videosekvence z tradičního Doomu od výstupu inteligence GameNGen jen asi v 60 procentech případů.
Jak to funguje? Inteligence se řídí vstupy hráče. Neurální model současně předpovídá další stav hry na základě předchozích, k čemuž využívá zkušenosti z intenzivního tréninku sledování videosekvencí hraní hry Doom.
Tvůrci inteligence GameNGen nezastírají, že je to teprve začátek. Generování videohry s pomocí technologie Stable Diffusion není bez chyb, které mohou vést k rychlému poklesu kvality generovaného světa. Další věc je, že modely založené na inteligenci Stable Diffusion jsou dobré v napodobování, nikoliv v tvorbě nových, originálních věcí.
GameNGen vidí jen 3 sekundy z děje, takže při případných návratech do míst, která hráč viděl před tím, by musel odhadovat předchozí stavy hry, tedy vlastně halucinovat data, jako to dělají i jiné generativní inteligence.
Doom je sice klasika, ale z roku 1993, takže je to v zásadě prostá hra s jednoduchou grafikou. Schopnosti umělých inteligencí rostou každý den. Zřejmě v dohledné době dočkáme sofistikovaných neurálních herních enginů, které vystavějí v reálném čase velké a konzistentní interaktivní světy.
##seznam_reklama##
Dani Valevski z Google Research a jeho kolegové to shrnuli stručně, jasně a nekompromisně. Dneska programují videohry lidé. GameNGen ohlašuje nové paradigma, v němž jsou hry výstupem neurálního modelu, nikoliv řádků počítačového kódu. Není vůbec vyloučeno, že nové hry budou vznikat tak, že autoři popovídají s inteligencí, buď textově anebo ji předvedou nějaké obrázky a inteligence udělá hru. Čekají nás zajímavé časy.
Video: GameNGen
Literatura