Když začínal vývoj autonomních vozidel či letounů nebo třeba inteligentních bezpečnostních systémů, bylo jasné, že budou potřebovat výkonné systémy strojového vidění (machine vision). Zdálo se to být vcelku jednoduché. Vezme se vhodná kamera, připojí se k procesoru, přihodí se k tomu pár šikovných algoritmů a bude hotovo.
Koneckonců náš druh, stejně jako jiné biologické druhy, které využívají zrak, to zvládá bez větší námahy. Ani nevíme, jak to vlastně děláme. Prostě máme biokamery, které jsou připojené na wetware, který nám sedí v hlavě. Co by na tom mělo být těžkého?
Bohužel, záhy vyšlo najevo, že vývoj schopného počítačového vidění je extrémně těžký úkol. Lidské oko je sice relativně jednoduchá kamera, navíc, jak správně tvrdí každá lepší učebnice, kamera velmi provizorní a nepříliš chytré konstrukce, ale zpracování vizuálních signálů v mozku je neuvěřitelně komplexní a prozatím hodně neprůhledné. Věrné napodobení těchto procesů se ukázalo jako takřka nemožné. Každopádně to vyžaduje velmi schopné senzory a razantní výpočetní sílu, což komplikuje praktičnost výsledných zařízení.
Čínský výzkumný tým, který vedli odborníci Tsinghua University v Pekingu, vyvinul převratný systém strojového vidění, který má dramaticky nižší výpočetní nároky a ještě ke všemu využívá jediný pixel. Systém využívá nový postup pro sledování pohybujících se objektů ve 3D. Vylepšení je hlavně v tom, že nesleduje celý objekt, ale zapojuje jen jediný pixel, který detekuje intenzitu světelného záření.
Jak uvádí vedoucí týmu Zihan Geng, získání 3D souřadnic sledovaného objektu vyžaduje pouhých 6 bitů paměti a 2,4 mikrosekund výpočetního času. Díky tomu je sledování objektů novým systémem velice efektní a razantně klesají finanční náklady na potřebné vybavení. Takové strojové vidění je pak mnohem dostupnější pro aplikace i uživatele.
Chce to sice složitou matematiku, to ale pro počítače není problém. Experimenty ukazují, že jediný detektor vybavený tímto počítačovým viděním sleduje objekty asi 200krát rychleji než tradiční srovnatelné metody, aniž by měl předem k dispozici informace objektu a jen s minimální výpočetní silou. Prozatím to funguje pro sledování jediného objektu, tým už ale pracuje na rozšíření s více objekty. Rozmanité praktické i výzkumné aplikace se už nemohou dočkat vylepšení strojového vidění.
Video: What Is Machine Vision In 60 Seconds
Literatura
Kvantové zobrazování a duch Schrödingerovy kočky
Autor: Stanislav Mihulka (29.08.2014)
MicroBRAIN: DARPA sází ve vývoji umělých inteligencí na hmyzí mozek
Autor: Stanislav Mihulka (24.01.2019)
Mozky vážek by mohly vylepšit protiraketovou obranu
Autor: Stanislav Mihulka (27.07.2019)
Inteligence Switft poráží světové šampiony v rychlostních závodech dronů
Autor: Stanislav Mihulka (06.09.2023)
Diskuze: