Hravá umělá inteligence: Chinook, AlphaGo, Liberatus  
Jaký je rozdíl mezi dámou, šachami, go a pokerem z hlediska počítačových programů a co k tomu může říct umělá inteligence? Strojové učení a neuronové sítě se dostávají do módy, triumfují nad člověkem stále častěji. A navíc ještě o hře kámen-nůžky-papír.

Marvin Minsk. Vědec zabývající se umělou inteligencí. Byl spoluzakladatelem laboratoře umělé inteligence na MIT a autorem několika filosofických textů. Roku 1969 obdržel Turingovu cenu, nejprestižnější ocenění v oblasti informatiky. (Kredit: Sethwoodworth, Wikipedia, CC BY 3.0
Marvin Minsk. Vědec zabývající se umělou inteligencí. Byl spoluzakladatelem laboratoře umělé inteligence na MIT a autorem několika filosofických textů. Roku 1969 obdržel Turingovu cenu, nejprestižnější ocenění v oblasti informatiky. (Kredit: Sethwoodworth, Wikipedia, CC BY 3.0

Zatímco na počátku loňského roku počítač AlphaGo zvítězil nad nejlepším lidským hráčem v Go, nyní podle všeho definitivně končí éra lidské převahy v pokeru. Tento obor je dnes v kurzu – natolik, že jím přímo přetékají marketingová oznámení, analýzy a prognózy (10 spotřebitelských trendů pro rok 2017: AI a virtuální realita - Ericsson , Top 10 technologických trendů pro rok 2017 - Gartner).

 

AlphaGo: všechno co uděláte, je špatně…
AlphaGo: všechno co uděláte, je špatně…

Stejně tak se do módy dostalo vše zmiňovat i související strojové učení a neuronové sítě. Přitom tyto technologie existují už hrozně dlouho. Takový loni zemřelý Marvin Minsky, považovaný za jednoho z otců umělé inteligence vůbec, první neuronovou síť zkonstruoval již v roce 1951 a v roce 1969 podle svých odpůrců výzkum kolem neuronových sítí zase málem pohřbil, když z toho, že jednovrstvá neuronová síť se neumí vypořádat s funkcí XOR, vyvozoval mnohem obecnější fakta o (ne)schopnosti těchto systémů. Pak skoro 20 let trvalo, než jako odpověď na Minského argumenty byla objevena metoda backpropagation, obor znovu přišel do módy, ale v rámci akademické vědy. Ze vzpomínek dalšího pamětníka, tentokrát mě osobně: Ve 2. polovině 90. let byly v počítačové publicistice neuronové sítě příkladem tématu tak zoufale nepřitažlivého a bez praktického dopadu, že se příslušné nabízené články málem rovnou vyhazovaly a autorům doporučovalo, ať si všímají nějakých sexy témat zajímavých i pro čtenáře, třeba Internetu. Časy se prostě mění, jinak by ostatně technologie ani nebyly zajímavé.

 

 

Lee Se-dol, jihokorejský profesionální hráč Go výkonostní třídy 9. dan. (Kredit Cyberoro ORO, Wikipedia, CC BY 3.0)
Lee Se-dol, jihokorejský profesionální hráč Go výkonostní třídy 9. dan. (Kredit Cyberoro ORO, Wikipedia, CC BY 3.0)

 

V následujícím textu se přidržíme her, zcela pomineme minimálně jednu velmi zajímavou oblast současné AI, a to sice zpracování přirozeného jazyka (chatboty/digitální asistenti, počítačové překladače), na což snad dojde někdy jindy. I tak se už text bude rozbíhat mnoha směry a odbočkami, řada věcí jsou spíše poznámky a i samotný pojem umělá inteligence se v dalším textu používá poněkud vágně.

 

Kapitola 1: dáma

Někteří příznivci dámy tvrdí, že tato hra je inteligentnější než šachy, čistí, s jednoduššími pravidly a tudíž víc závislá na lidské inteligenci a porozumění. Naopak v šachách je ve hře tolik možností, že jde spíše o to v chaosu zrovna něco nepřehlédnout, důležitější je pozornost než porozumění. Takže by pro počítačové programy, které pochopitelně takto „nepřehlížejí“, měla být dáma obtížnější? Jak se však ukázalo, je zase příliš omezená.

V případě dámy se programu prostě podařilo obsáhnout celý stavový prostor hry (samozřejmě si to bylo stejně nutné nějak chytře zjednodušovat, kontrolovat proti databázi pozic s již známým výsledkem, brát v úvahu symetrie...). Ukázalo se, že dáma skončí vždy remízou. V roce 2007 se tak program Chinook stal prokazatelně neporazitelným. Ne že bych se orientovat v různých verzích dámy, ale předpokládám, že to bude cca stejné, jak co do počítačové zvládnutelnosti, tak i výsledku.

Chinook bychom do umělé inteligence zařadili stěží. Ne že by tím ale přitažlivost dámy pro tuto disciplínu nutně vyčerpávala. Vezměte si takovou pitomou hru kámen-nůžky-papír. Stačí generátor náhodných čísel a neprohrajete, jistě, co ale když chcete (statisticky) vyhrát proti člověku (který podvědomě alespoň částečně sleduje určitý systém, nehraje náhodně)? Musíte nějak projít soupeřovu strategii a adaptovat se na ni, takové programy existují a jsou proti lidem úspěšně (a samozřejmě – protože samy nehrají náhodně, jsou už zase porazitelné). Některé z nich by se možná do kategorie umělé inteligence zařadit daly.

 

Jak to souvisí s dámou? Program znalý stavového prostoru hry neudělá chybu a dokáže chyb soupeře plně využít, dokáže ho k chybám ale i přimět? Úspěšnější proti omylným lidem by tak mohl být program, který by hrál různě proti různým lidem na základě jejich předešlých partií, snažil se jim maximálně klást léčky apod.

 

Kapitola 2: šachy

Zde hrubá síla stačila rovněž, a to i když se celý stavový prostor hry obsáhnout nepodařilo. Někteří soudí, že k tomu může dojít tak po roce 2060, podle jiných nikdy.

(Zato máme k dispozici různé databáze koncovek, jejichž prostor zmapován je. Hrát si s těmito databázemi je mimochodem fascinující, i když samozřejmě jen pro šachisty. Takže 2 střelci proti jezdci vyhrávají, věž a střelec proti věži není zase zrovna tak jednoduchá remíza, dvě lehké figurky lze různě stavět tak, aby remizovaly proti dámě, dáma a spojení pěšci na 2 krajních sloupcích proti dámě bývá kupodivu remis. Opravdová lahůdka je pak podle mě věž a jezdec proti dvěma jezdcům, kdy některé pozice jsou vyhrané, jiné velmi podobné ne, ale zdali se v tom dá dobrat nějakého obecnějšího poučení...)

V počátcích vývoje šachových programů existovaly vedle sebe dva přístupy, jeden snažící se napodobovat lidské uvažování o šachách, druhý v podobě hrubé síly. Tento přístup dosahoval podstatně lepších výsledků, a to i když tyto šachové programy narazí ve strašlivě se větvícím prostoru variant samozřejmě na své limity (dané především množstvím času, po který je necháme počítat).

Na nejlepší lidské hráče stačí hrubá výpočetní síla i bez toho, že by takový program byl neomylný; stačí výkonný hardware, kvalitní prořezávání větví stromu možností a především pak neustále zdokonalovaný systém, který dokáže vyhodnotit pozice v dosažitelné hloubce propočtu, pak je seřadit dle výhodnosti a podle toho zvolit pokračování. Takové šachové programy opět nejsou nijak inteligentní – v tom smyslu, že jsou strašně jednoúčelové, nedají se (asi) použít pro nic jiného než zase jen pro šachy. V některých ohledech nám dokonce přijdou hloupé a existují speciální typy pozic, s nimiž si dnešní programy neporadí, nicméně toto množství stále klesá. Už asi 12 let nejsou zápasy mezi nejlepšími lidskými hráči a programy zajímavé, nicméně člověk zde ještě úplně zbytečný není. Takový mistr světa s určitým programem hraje stále lépe než tento program sám o sobě.

A mimochodem, protože šachové programy neobsáhly celý prostor hry, tak pochopitelně nevíme ani to, zda šachy bez chyby jsou remiz jako v případě dámy. Předpokládáme, že ano, výhoda bílých figur není k výhře dostačující, ale to je opravdu jen taková nejistá extrapolace.

 

 

Kapitola 3: Go

Dostáváme se ke Go. I zde zastánci hry podobně jako u dámy tvrdí, že je „inteligentnější“ než šachy, protože v ní jde ne tolik o počítání, ale o rozpoznávání vzorů (obecných struktur). Podobný přístup jako u šachů zde nepřinášel zvláštní výsledky, i když to může být dáno i jinými faktory než samotnou hrou – třeba programátoři prostě věnovali více svého času šachům.

Počátkem loňského program AlphaGo vyvinutý v Googlu konečně vyhrál nad mistrem světa Lee Se-dol (Sciencemag.cz), čímž je podle všeho vymalováno i zde. Nezdá se pravděpodobné, že by se lidé dokázali stylu motorů přizpůsobit a prvenství jim opět uzmout (v šachách se objevily úvahy o hráčích specializovaných na počítače, ale to by mělo stejně smysl jen v situacích, kdo by člověk dostával dopředu nějakou výhodu).

Vlastně vše, co k úspěchu programu lze dodat, bylo již řečeno výše. Go se podobá šachům velikostí stavového prostoru (dnes neobsáhnutelný), dámě zase důrazem na geometrické vzory bez zahlcení hromadou dalších subpravidel, prostě jakousi minimalistickou elegancí. Programy tedy zřejmě dokáží vnímat i eleganci. (Nakolik můžeme říct, že zatímco šachový program prostě počítá, AlphaGo chápe Go podobně jako lidský hráč? To by se chtělo podívat, jakou podobu mají abstraktnější struktury používané v rámci programu.)

Zajímavé je, zda teď, když už víme, že to jde v Go, by podobný přístup nešlo oživit i v šachách. V roce 2015 se objevil program Giraffe, což měl být experimentální pokus o zavedení metod umělé inteligence i do šachů, kdy software např. různé varianty počítal do různé hloubky, rozpoznával obecné vzory podobě jako lidští šachisté („izolovaný pěšec“, „sedmá řada“, „špatný střelec“), nehrál ovšem na nijak vrcholné úrovni a pak už o něm nikdo neslyšel, respektive autor práce přerušil, i když pro případné zájemce je kód k dispozici. A pokud AI porazí lidské šachisty, stále zde bude zbývat prostor pro střet programů AI s těmi, které využívají hrubou sílu?

(Samozřejmě stavět do protikladu přístupy pomocí výpočetní síly a inteligence úplně neodpovídá realitě. Faktem je, že i pokrok v oblasti neuronových sítí/strojového učení je do značné míry výsledkem ne toho, že bychom vymýšleli chytřejší algoritmy, ale že nám toho víc umožňuje hardware, viz třeba Matlab R2016a, kdy se vícevrstvé neuronové sítě staly už loni součástí zcela standardního, masově používané produktu, Matlabu http://sciencemag.cz/matlab-nabizi-strojove-uceni-pomoci-vicevrstvych-neuronovych-siti/).

 

Kapitola 4: Poker

Aktuálně přichází zprávy, že program Libratus drtí nejlepší lidské hráče v pokeru (Sciencemag.cz). Jde o variantu Heads-Up, No-Limit Texas Hold’em, prý počítačově obzvlášť obtížně zvládnutelnou.

Pokeru nerozumím vůbec, hrál jsem naposledy před 18 lety, takže následující spekulace by jistě mohl doplnit někdo povolanější. Jak se liší třeba přístup umělé inteligence k pokeru a go? Předpokládám, že AlphaGo hraje stále „nejlepší tahy“, tj. nijak neanalyzuje, kdo zrovna stojí proti ní, nevymýšlí nějaké záměrné léčky („co by asi tak člověk mohl přehlédnout“). Libratus má naproti tomu nejen počítat, ale i blufovat a navíc analyzuje vlastní partie a zlepšuje se (určitě se dá dohledat, zda to dělá AlphaGo; u brute force šachových programů parametry přirozeně ladí programátoři ručně). Ve stejné situaci volí slušnější lidský i umělý hráč pokeru různé možnosti, protože zde je samozřejmě klíčové být nepředvídatelný. Nelze uplatňovat žádnou ve hře jiného typu racionální strategii typu „mám-li horší než průměrné karty, nebudu zvyšovat sázky“. Když už, pak optimalizace zní „mám-li o tolik a tolik horší než průměrné karty, nebudu zvyšovat sázky s pravděpodobností x“. Tah se pak vybere podle generátoru náhodných čísel. Tento analytický přístup sám o sobě by ovšem sotva stačil. Jak vidno, dostáváme k umělé inteligenci nejvyšší úrovně i prvky onoho stupidního kámen-nůžky-papír. Výsledkem je pak program velmi obecný, prý použitelný všude tam, kde se hraje s neúplnými informacemi, ať už jde o data (karty) nebo další algoritmy (strategie protihráčů). Libratus by pak po úpravě byl ideálním vojevůdcem do bitvy i pro obchodní vyjednávání.

Související diskuse viz též odkaz výše.

Autor: Pavel Houser
Datum: 30.01.2017
Tisk článku

Související články:

Hawking rozvířil obavy o umělou inteligenci     Autor: Stanislav Mihulka (06.12.2014)
Jsou dominantní životní formou vesmíru umělé superinteligence?     Autor: Stanislav Mihulka (04.01.2015)
Vyřeší nejpalčivější problémy světa davová superinteligence?     Autor: Stanislav Mihulka (02.01.2016)
Umělá inteligence autonomního automobilu se stala řidičem     Autor: Stanislav Mihulka (16.02.2016)
Porazí umělé inteligence rakovinu?     Autor: Stanislav Mihulka (21.02.2016)
Dokáže herní společnost zkrotit chování online hráčů?     Autor: Stanislav Mihulka (31.03.2016)
Umělá inteligence Deep Mind odezírá ze rtů lépe než profesionálové     Autor: Stanislav Mihulka (29.11.2016)



Diskuze:

Léčky a znalost stavového prostoru

Jan Turoň,2017-02-01 00:35:07

Známe-li stavový prostor, můžeme popsat léčku jako tah, který není dle vyhodnocovacího algoritmu nejsilnější, ale poskytuje soupeři větší pravděpodobnost chyby. Např. v piškvorkách 3x3 je nejsilnější první tah doprostřed, ale remízu zajistí odpověď do libovolného rohu. Léčka je tah do rohu, kde remízu zajistí pouze odpověď do středu, vše ostatní končí výhrou začínajícího!

Jinými slovy léčku dokážeme objevit pouze tehdy, známe-li dostatečně velký počet stavů. Léčka tedy není kvalitativně nový pojem, je matematicky popsatelná.

Zatímco výkonný stroj vyhodnotí až miliony šachových pozic za sekundu, člověk jich za stejnou dobu zvládne možná deset. Člověk ale dělá i jiné úvahy, např. "byl soupeřův tah ofenzivní nebo defenzivní?". Stroje by mohly vyhodnocovat i toto a být ještě silnější proti lidským hráčům, ale hrubá síla prostě stačí.

Při šachu má člověk největší šanci ve střední hře: zahajování má nastudováno člověk i počítač, ale v koncovkách dokáže počítač vyhodnocovat hodně do hloubky, i desítky tahů - zde má největší váhu právě ta hrubá síla a ostatní úvahy ztrácejí na významu. Tedy dobrou strategií počítače proti člověku je včasná výměna materiálu (přemýšlení více do hloubky je pro člověka více vyčerpávající, a roste tedy šance, že udělá chybu), zatímco proti jinému počítači (podle Umění války od Sun-Tzu) je výhodnější defenzíva.

Zakomponování těchto pravidel do algoritmu z něj ale ještě nedělá inteligenci. Dnes je slovo "inteligence" natolik vágně definovaný a marketingově zprofanovaný pojem, že je spíše matoucí. Snad by bylo lepší se mu ve vědeckém výzkumu vyhnout a nahradit ho několika jinými pojmy, které marketingově nejsou tak sexy.

Odpovědět


Re: Léčky a znalost stavového prostoru

pavel houser,2017-02-01 20:56:30

je pravda, ze lecka znamena pokus soupere splest, a to s piskvorkami je hezky priklad (i kdyz da se mluvit tady o tom, ze tah doprostred je nejsilnejsi?). ovsem lecka asi neznamena jen, ze za soupere nejvice moznych tahu prohrava (eventualne prohravajicich tahu ku vsem moznym apod.), ale i ze tyto prohravajici tahy jsou "na pohled" (cloveka) dobre. (pohrozit matem, ktery jde kryt jen jednim zpusobem, neni zrovna lecka, ne?)

Odpovědět


Re: Re: Léčky a znalost stavového prostoru

Jan Turoň,2017-02-02 08:48:59

Tah doprostřed znamená 4 nekryté pozice k výhře a soupeři zbývají 4 pozice, kde může vyhrát. Tah do rohu nabízí jen 3 pozice k výhře a dává soupeři 5 pozic. Přesto tahem do rohu budeme statisticky vyhrávat častěji (navíc i když soupeř odpoví do středu, můžeme táhnout do protějšího rohu, čímž soupeři dáváme ještě jednu šanci prohrát tahem do některého ze dvou zbývajících rohů).

Přesto hrubá síla stačí. Na dni otevřených dveří na průmyslovce jsem jako atrakci udělal "AI" běžných piškvorek, kde se vyhodnocovala jen aktuální pozice a jen 2 návštěvníci za celý den byli schopni statisticky vyhrávat. Na přechytračení člověka (obzvlášť bez zkušeností) stačí pár řádků kódu.

Při tvorbě léček bych vzal v úvahu styl, jakým kdo hraje, kde má silné a slabé stránky. K tomu stačí datamining historie odehraných her. Taky jde automaticky uplatnit psychologii. Třeba úmyslně nějakou dobu čekat s tahem, když je soupeř v poziční nevýhodě. Hezká ukázka je tady: https://youtu.be/aojiH2ofR98?t=15s - všimněte si cíleného otálení s prvním tahem a překvapivým druhým tahem. Myslím, že je to výborné zahájení pro silnějšího hráče, když má protihráč detailně nastudovaná zahájení - už od začátku se tak oba dostávají do neprostudovaných pozic. Nic, co by nezvládl prostý automat bez jakéhokoliv zkušenostního nastavování vah, kterému říkáme inteligence. Carlsen (aktuálně nejlepší hráč) je dle mého labilnější než většina grandmasterů. Úšklebek či povzdech ve správné chvíli může být pro něj více zdrcující než dokonale promyšlená strategie. Rozhodnuto může být i mimo šachovnici, viz třeba zde: https://www.youtube.com/watch?v=ePIeNvLSc-w

Odpovědět

zaujímavá téma

Martin Makúch,2017-01-31 19:42:35

Téma zaujímavá, i keď spracovaná trocha povrchne. Upresním že Lee Se-dol nie je majstrom sveta, myslím že taký titul v Go nie je. Je ale považovaný za jedného z dvoch najsilnejších hráčov súčasnosti.

Dôvody prečo hrubá sila alfa-beta orezávaním nefunguje v Go sú dva:
1. Omnoho širšie vetvenie (cca 300 možností na ťah oproti cca 40 v šachu) neumožňuje prepočet do dostatočnej hĺbky.
2. Ohodnotenie kľudovej pozície je komplikované a nepresné. V šachu dobre funguje už obyčajné spočítanie materiálu, pridáme pár pozičných kritérií a výsledok veľmi dobre korešponduje so šancou na výhru. V Go je extrémne zložité ohodnotiť kto stojí lepšie a o koľko (azda okrem koncovky).

AlphaGo má na riešenie práve týchto dvoch problémov dve separátne neurónové siete. Jedna určuje kandidátne ťahy, druhá zasa ohodnocuje pozície. K prielomu v počítačovom Go došlo keď sa tam začali implementovať Monte-carlo algoritmy. Dovtedy AI hrala na úrovni začiatočníka (cca do 16.kyu), potom rázne poskočila až niekam na úroveň 1.danu (amatérskeho). AlphaGo tiež používa túto techniku, akurát ťahy navrhuje a pozície ohodnocuje príslušná neurónová sieť.

Zaujímavý prírastok ku hrám potenciálne komplikovaným pre AI je aj vznik kvantového šachu zhruba pred rokom (Quantum chess). Modifikované pravidlá umožňujú figúrky naraz na rôznych políčkach v superpozícii, aj kvantové previazanie stavov, a keď je to potrebné tak príde na kolaps kvantovej funkcie do konkrétneho stavu (pozície). Vetvenie je ešte viac košaté ako v Go (stovky potenciálnych ťahov) a aktuálna pozícia môže zodpovedať tisícom i viac rôznych pozícií s rôznymi pravdepodnosťami.

Odpovědět


Re: zaujímavá téma

pavel houser,2017-02-01 20:50:20

a ty kvantove sachy mohou hrat i normalni lide? ted jsem hledal a tam mi to rikalo, ze pravidla ve vyvoji, nebo uz jsou kodifikovana? (jinak si myslim, ze to nikdo hrat nebude, krome zajemcu o AI/programovani; sachy jsou zajimave hlavne historii, pristupem k partiim starych mistru, vyvoji teorie apod., zadna modifikace pravidel se uz prakticky nechytla, fischerovy sachy napr.)

Odpovědět


Re: Re: zaujímavá téma

Martin Makúch,2017-02-02 09:47:16

Bez problémov hrateľné človekom. Idea (asi trocha idealistická) je, že by sa nadané deti hraním kvantového šachu nenásilnou formou naučili porozumieť princípom kvantovej fyziky. Pravidlá vyzerajú viac menej finalizované, i keď drobné zmeny sa asi vylúčiť nedajú. Niečo viac sa dá dozvedieť hľadaním "Quantum chess" napr. na nasledovných stránkach:

kickstarter - pôvodná kampaň obsahuje dosť informácií i nejakú diskusiu
steam - k dispozícii je zatiaľ Early access verzia, AI je žiaľ len do počtu (hrá zúfalo)
chess24.com - "Quantum Chess with Anna Rudolf" video dvoch ukážkových partií silnej hráčky šachu s tvorcom kvantového šachu
youtube - "qmc sample game 01" ukážka trocha schopnejšieho AI, ktoré som ako hobby urobil pred necelým rokom

"zadna modifikace pravidel se uz prakticky nechytla" to nie je úplne pravda, varianta Shogi je veľmi populárna v Ázii. Akurát ju zatieňuje tam ešte populárnejšie Go. Ale áno, tiež nemyslím že by nejaká nová forma nahradila šach, a asi to ani nie je cieľom kvantového šachu.

Odpovědět


Re: Re: Re: zaujímavá téma

pavel houser,2017-02-02 20:16:52

dekuji za ty odkazy. s tim, proc sachy nemodifikovat: protoze je to chaoticka, "neergonomicka" hra. skutecne go, dama, sudoku, rubikova kostka... jsou mnohem elegantnejsi, s minimem pravidel. bez te historie za tim nemam myslim cenu se hrou typu sachy zabyvat.

Odpovědět


Re: Re: Re: zaujímavá téma

Jan Turoň,2017-02-03 08:20:19

Na lichess.org je krom tradičních šachů možné vyzkoušet si tyto varianty:

Crazyhouse - vyhozená soupeřova figurka může být místo tahu umístěna na šachovnici jako vlastní (inspirace ze shogi)
Chess960 - pozice figur v zadní řadě je náhodná (symetrická na obou stranách)
King of the Hill - vyhrává hráč, který dopraví krále na některé ze čtyř políček ve středu šachovnice
Three-check - vyhrává hráč, který dá potřetí šach
Antichess - žravé šachy (inspirace žravou dámou)
Atomic - (šachy islámských teroristů) při vyhození figurka exploduje a odstraní ze šachovnice všechny figurky okolo (vč. případného chudáka krále = vítězství)
Horde - bílý má pět řad pěšců, černý vyhraje, když je všechny vyhodí
Racing kings - vyhraje hráč, který dopraví svého krále na opačnou stranu šachovnice. Je zakázáno dát šach.

Odpovědět

turing

pavel houser,2017-01-31 10:30:15

"Šachový program je tak jednoduchý, že prvý program bol napísaný v 40. rokoch, keď ešte žiadny počítač neexistoval a riadok po riadku sa vyhodnocoval ručne." - toto mi prijde jako opravdu fascinujici moment, Turing takto sehral partii a neuveritelne je, ze tento "tuzkovy program" hraje tak, ze jeho tahy davaji ramcove smysl. klobouk dolu.

Odpovědět

Go, Poker

Richard Malaschitz,2017-01-31 09:03:09

GO.

"třeba programátoři prostě věnovali více svého času šachům"
To tak nie je. Šachový program je tak jednoduchý, že prvý program bol napísaný v 40. rokoch, keď ešte žiadny počítač neexistoval a riadok po riadku sa vyhodnocoval ručne. V 1997 keď Kasparov prehral svoj zápas proti počítaču, tak sa hrala partia, kde profesionálna hráčka dala počítaču handicap 25 kameňov a vyhrala. Aj najsilnejší program bol vtedy slabší ako hráč, ktorý hral go týždeň.

AlphaGo nepoužíva iba neurónovú sieť, ale aj prepočet podľa algoritmu MTCS (Monte Carlo tree search). Neurónová sieť mu pomáha optimalizovať toto hľadanie a vyberať iba najlepšie ťahy. Je možné, že špičkoví hráči by sa naučili hrať proti AlphaGo, pretože v samotnom zápase Lee Sedol vyhral jednu partiu (to by v šachu nebolo možné ani proti iPhonu) v ktorej ukázal akou taktikou sa dá AlphaGo oklamať.

Poker.

Silné pokerové boty hrajú už celé roky online. Vzhľadom na to, že sa jedná o hru o peniaze, tak tých informácií je málo.

Odpovědět

AIXI

Bluke .,2017-01-30 12:07:21

Cosi podobneho na temu AI a hry ,uz bolo spomenute s nazvom "AIXI" na tomto portaly v starsich clankoch. vid. >>> http://www.osel.cz/7331-univerzalni-umela-inteligence-aixi.html

Odpovědět


Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce








Zásady ochrany osobních údajů webu osel.cz