O.S.E.L. - Radikálně rychlé a levné strojové vidění využívá jediný pixel
 Radikálně rychlé a levné strojové vidění využívá jediný pixel
Strojové vidění v dnešní době vyžaduje složité senzory a velkou výpočetní sílu. Nový čínský systém sice využívá komplikovanou matematiku, ale vystačí si s jediným pixelem a je mnohem méně výpočetně náročný. Vypadá to na průlom v celé řadě moderních technologií, pokud se vývoj nového systému povede dotáhnout do konce.

Testování nového systému strojového vidění. Kredit: Zihan Geng, Tsinghua University.
Testování nového systému strojového vidění. Kredit: Zihan Geng, Tsinghua University.

Když začínal vývoj autonomních vozidel či letounů nebo třeba inteligentních bezpečnostních systémů, bylo jasné, že budou potřebovat výkonné systémy strojového vidění (machine vision). Zdálo se to být vcelku jednoduché. Vezme se vhodná kamera, připojí se k procesoru, přihodí se k tomu pár šikovných algoritmů a bude hotovo.

 


Zihan Geng. Kredit: Tsinghua University.
Zihan Geng. Kredit: Tsinghua University.

Koneckonců náš druh, stejně jako jiné biologické druhy, které využívají zrak, to zvládá bez větší námahy. Ani nevíme, jak to vlastně děláme. Prostě máme biokamery, které jsou připojené na wetware, který nám sedí v hlavě. Co by na tom mělo být těžkého?

 

Bohužel, záhy vyšlo najevo, že vývoj schopného počítačového vidění je extrémně těžký úkol. Lidské oko je sice relativně jednoduchá kamera, navíc, jak správně tvrdí každá lepší učebnice, kamera velmi provizorní a nepříliš chytré konstrukce, ale zpracování vizuálních signálů v mozku je neuvěřitelně komplexní a prozatím hodně neprůhledné. Věrné napodobení těchto procesů se ukázalo jako takřka nemožné. Každopádně to vyžaduje velmi schopné senzory a razantní výpočetní sílu, což komplikuje praktičnost výsledných zařízení.

 

Logo. Kredit: Tsinghua University.
Logo. Kredit: Tsinghua University.

Čínský výzkumný tým, který vedli odborníci Tsinghua University v Pekingu, vyvinul převratný systém strojového vidění, který má dramaticky nižší výpočetní nároky a ještě ke všemu využívá jediný pixel. Systém využívá nový postup pro sledování pohybujících se objektů ve 3D. Vylepšení je hlavně v tom, že nesleduje celý objekt, ale zapojuje jen jediný pixel, který detekuje intenzitu světelného záření.

 

Jak uvádí vedoucí týmu Zihan Geng, získání 3D souřadnic sledovaného objektu vyžaduje pouhých 6 bitů paměti a 2,4 mikrosekund výpočetního času. Díky tomu je sledování objektů novým systémem velice efektní a razantně klesají finanční náklady na potřebné vybavení. Takové strojové vidění je pak mnohem dostupnější pro aplikace i uživatele.

##seznam_reklama##

 

Chce to sice složitou matematiku, to ale pro počítače není problém. Experimenty ukazují, že jediný detektor vybavený tímto počítačovým viděním sleduje objekty asi 200krát rychleji než tradiční srovnatelné metody, aniž by měl předem k dispozici informace objektu a jen s minimální výpočetní silou. Prozatím to funguje pro sledování jediného objektu, tým už ale pracuje na rozšíření s více objekty. Rozmanité praktické i výzkumné aplikace se už nemohou dočkat vylepšení strojového vidění.

 

Video: What Is Machine Vision In 60 Seconds

 

Literatura

New Atlas 24. 6. 2024.

Optic Letters 49: 3628–3631.


Autor: Stanislav Mihulka
Datum:25.06.2024