Inteligence GameNGen sní o legendární videohře Doom z roku 1993  
Nová umělá inteligence GameNGen je herní engine s neurálním modelem, který umožňuje interakci se složitým prostředím v reálném čase. Lidé u krátkých videosekvencí poznají hraní na umělé inteligenci jen asi v 60 procentech případů. Jak se zdá, herní svět se blíží k tektonickému zlomu.
Snímky z hraní hry Doom na inteligenci GameNGen lidským hráčem. Kredit: Valevski et al. (2024), arXiv.
Snímky z hraní hry Doom na inteligenci GameNGen lidským hráčem. Kredit: Valevski et al. (2024), arXiv.

Herní průmysl se otřásá v základech. Nové pukliny se šíří od úterka, kdy vědci Google a Tel Aviv University vypustili na světlo novou inteligenci GameNGen. Jde o první herní engine, který je poháněný neurálním modelem, umožňujícím interakci s komplexním prostředím v reálném čase a ve vysoké kvalitě. Není to první inteligence tohoto druhu, ale podle ohlasů se jejím tvůrcům povedl slušný zásah.

 

Tvůrci vyzkoušeli inteligenci GameNGen na klasice všech klasik, videohře Doom z roku 1993 od id Software, která položila základy žánru First-person shooter (FPS), tedy střílečky z pohledu první osoby, a stala se jednou z nejvýznamnějších a nejlepších videoher všech dob. GameNGen interaktivně simuluje Doom v reálném čase a využívá ke generování grafiky technologii vypůjčenou od inteligence Stable Diffusion.

 

Dani Valevski. Kredit: Google Research.
Dani Valevski. Kredit: Google Research.

Podle vývojáře Nicka Dobose je potenciál podobných inteligencí až absurdně obrovský. Namísto vykreslování grafiky tradičními postupy bude možné využívat engine založený na umělé inteligenci k halucinování grafiky v reálném čase. Jak s nostalgií říká Dobos, proč by měl někdo ručně vytvářet složitou grafiku, když umělá inteligence může vysnít každý pixel? Tohle zní jako rozsudek smrti pro soudobý přístup k vývoji her a aplikací, i když to nemusí být okamžitě.

 

GameNGen generuje přes dvacet snímků (frames) za sekundu pomocí jediného procesoru TPU (tensor processing unit), zařízení podobného GPU, které je optimalizované pro umělé inteligence. V experimentu dokázalo deset lidských hodnotitelů rozlišit krátké videosekvence z tradičního Doomu od výstupu inteligence GameNGen jen asi v 60 procentech případů.

 

Architektura inteligence GameNGen. Kredit: Google Research.
Architektura inteligence GameNGen. Kredit: Google Research.

Jak to funguje? Inteligence se řídí vstupy hráče. Neurální model současně předpovídá další stav hry na základě předchozích, k čemuž využívá zkušenosti z intenzivního tréninku sledování videosekvencí hraní hry Doom.

 

Tvůrci inteligence GameNGen nezastírají, že je to teprve začátek. Generování videohry s pomocí technologie Stable Diffusion není bez chyb, které mohou vést k rychlému poklesu kvality generovaného světa. Další věc je, že modely založené na inteligenci Stable Diffusion jsou dobré v napodobování, nikoliv v tvorbě nových, originálních věcí.

 

GameNGen vidí jen 3 sekundy z děje, takže při případných návratech do míst, která hráč viděl před tím, by musel odhadovat předchozí stavy hry, tedy vlastně halucinovat data, jako to dělají i jiné generativní inteligence.

 

Doom je sice klasika, ale z roku 1993, takže je to v zásadě prostá hra s jednoduchou grafikou. Schopnosti umělých inteligencí rostou každý den. Zřejmě v dohledné době dočkáme sofistikovaných neurálních herních enginů, které vystavějí v reálném čase velké a konzistentní interaktivní světy.

 

Dani Valevski z Google Research a jeho kolegové to shrnuli stručně, jasně a nekompromisně. Dneska programují videohry lidé. GameNGen ohlašuje nové paradigma, v němž jsou hry výstupem neurálního modelu, nikoliv řádků počítačového kódu. Není vůbec vyloučeno, že nové hry budou vznikat tak, že autoři popovídají s inteligencí, buď textově anebo ji předvedou nějaké obrázky a inteligence udělá hru. Čekají nás zajímavé časy.

 

Video: GameNGen

 

Literatura

ARS Technica 28. 8. 2024.

GameNGen.github.

arXiv:2408.14837.

Datum: 30.08.2024
Tisk článku



Diskuze:

Moore and more

Mintaka Earthian,2024-08-31 08:36:37

Potenciál to má. Například ve známé knize Enderova hra z roku 1985, taková byla.

Na druhou stranu, výpočetní náročnost, v porovnání s tím původním Doomem z roku 1993 bude někde hoodně jinde.

Ale co už, dle Mooreova "zákona" je rozdíl na úrovni množství tranzistorů aktuálních procesorů(+GPU) 100 000 krát vyšší než těch z roku 1993.

Odpovědět


Re: Moore and more

Lukáš Langšádl,2024-09-01 21:47:54

Ntno podotknout že doom je zvolen pouze z hlediska stylizace, tedy hra s vizuální podobou roku 1993 i roku 2025 má stejnou náročnost .. která je samozřejmě z hlediska i dnešních her naprosto směšně vysoká ale dovoluje teoreticky libovolnou stylizaci za stejnou cenu tj čistě teoreticky konci celá pipeline v optimalizaci medelu shaderů kódu a optimalizuje se již jen samotný ai model tedy vlastně ai herní engine.. prostě nová úroveň abstrakce v počítači.. už nevím co sem tím chtěl říci

Odpovědět


Re: Re: Moore and more

F M,2024-09-02 00:20:19

Nevím, ale opravdu, ale i tak se mi to nezdá. Přece jenom už jen ta práce v rozlišení Doom tuším něco jako 640x480 a dnešní rozumné minimum 1980x1024. V Doomu z dnešního pohledu opravdu minimum možných druhů věcí k zobrazení, vše v úhlech drtivá většina pravé, omezení pohybu, prakticky žádné efekty, odrazy atd.
Koukněte se do originálu na obrázky jak se jim to po chvilce rozsypalo, pokud to netrénovali na šumu (nebo co to tam řeší). Dnes má každá textura víc detailů než celý obraz.
Ještě dodám, že i takhle píší 20fps. A pokud člověk tu hru zná tak tam těch chyb, i v tom již jistě vybraném obraze, je spousta, jen bych nevěděl proč vznikají.

Odpovědět

Z prvej

Macko Pu1,2024-08-30 20:59:35

by som povedal, ze halucinovana hra nemoze byt kvalitna, ked ale kazdy 1/400 europan sype kokain a eu manazuju takyto ludia, hra uz nebude problem.

Odpovědět


Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce








Zásady ochrany osobních údajů webu osel.cz