Analýza velkých souborů dat spočívá ve vyhledávání skrytých vztahů a souvislostí. To už naše juvenilní umělé inteligence se svými algoritmy a automatizovanými výpočty v některých případech zvládají. Ale samotný výběr toho, co je zajímavé, co se vlastně bude hledat, to obvykle vyžaduje vhled člověka, lidskou intuici. Vývojáři z MIT se teď snaží i tento zbývající lidský element z analýz velkých souborů dat odstranit. Pracují na systému, přezdívanému „Data Science Machine“, který by měl zvládnout nejen těžit dat, ale také navrhovat, co by se mělo hledat.
Student Max Kanter a jeho školitel Kalyan Veeramachaneni už mají k dispozici první prototyp systému se strojovou intuicí a prověřili ho ve třech soutěžích. V nich se systém Data Science Machine utkal s celkem 906 lidskými týmy v analýze souboru neznámých dat. 615 týmů, tedy více než dvě třetiny, porazil. V jednotlivých soutěžích Data Science Machine dosáhl 96, 94 a 87 procentní úspěšnosti ve srovnání s vítěznými lidskými týmy v té které soutěži. K tomu se ale jistě hodí poznamenat, že lidské týmy na svých analýzách souborů dat obvykle pracovaly celé měsíce, zatímco Data Science Machine na jednu analýzu potřeboval 2 až 12 hodin.
Kanter s Veeramachanenim nestaví Skynet, alespoň zatím ne. Svého mazlíka Data Science Machine vnímají jako podporu tolik vytížených lidských mozků. Podle Kantera žijeme obklopeni horami dat, která jen tak bez užitku čekají na to, až z nich někdo vytěží nějaké ty cenné a zajímavé informace.
Jsme ve věku „big data“, česky roztomile „veledat“, pro lidi běžnými postupy nestravitelně velkých souborů dat. Systémy jako je Data Science Machine by nám s tím mohly významně pomoct. Kanter by teď měl předvést prototyp systému se strojovou intuicí na konferenci 2015 IEEE International Conference on Data Science & Advanced Analytics, která se uskuteční 19.-21. října v Paříži.
Ačkoliv se Kanter a Veeramachaneni jistě poctivě snaží, jejich systém (zatím) nemyslí a plnohodnotně nenahrazuje lidskou intuici. Ve skutečnosti si pečlivě všímá analyzovaných dat a z nich pak odvozuje své další kroky. Cenné informace získává ze struktury použitých databází, sleduje i uspořádání dat v proměnných a další věci. Tak si vytvoří skupinu slibných kandidátů na dotazy k prohledávání dotyčného souboru dat, vyřadí ty, jejichž výstup by byl korelovaný s jinými, a prohledávání může začít.
Video: The Biggest Bottleneck in Data Science
Literatura
MIT News 16. 10. 2015, Wikipedia (Big data).
Umělá inteligence Watson očekávaným vítězem v Riskuj!
Autor: Stanislav Mihulka (18.02.2011)
Umělá inteligence se učí chápat jazyk hraním slavné hry
Autor: Stanislav Mihulka (19.07.2011)
Strojová inteligence hodnotí psychedelické zážitky
Autor: Stanislav Mihulka (20.07.2012)
Univerzální umělá inteligence AIXI
Autor: Stanislav Mihulka (09.12.2013)
Počítačový program prošel Turingovým testem. Máme slavit?
Autor: Stanislav Mihulka (12.06.2014)
Jsou dominantní životní formou vesmíru umělé superinteligence?
Autor: Stanislav Mihulka (04.01.2015)
Příchod „hloupé“ umělé inteligence
Autor: Jan Špaček (06.02.2015)
Diskuze: