O.S.E.L. - Biologická AI simulovala 500 milionů let evoluce a stvořila nový protein
 Biologická AI simulovala 500 milionů let evoluce a stvořila nový protein
Tvůrci evolučních inteligencí EvolutionaryScale zabodovali s generativní inteligencí ESM3, zaměřenou na proteiny. Nakrmili ji daty o 3,15 miliardách sekvencí, 236 milionech struktur a 539 milionech popisů proteinů a ESM3 teď umí podle zadání „udělej zeleně fluoreskující protein“ vyrobit fungující protein, jaký svět ještě neviděl.

Přehlídka různých fluorescentních proteinů. Kredit: 	Erin Rod, Wikimedia Commons, CC BY-SA 4.0.
Přehlídka různých fluorescentních proteinů. Kredit: Erin Rod, Wikimedia Commons, CC BY-SA 4.0.

Odborníci na umělé inteligence, biologové a experti na evoluci z americké společnosti EvolutionaryScale a institutu Arc Institute spojili síly, aby vyvinuli generativní „biologickou“ inteligenci, která je schopná podle zadání vytvářet DNA pro syntetizování zcela nových, umělých funkčních proteinů. Tak vznikla pozoruhodná přírodovědná inteligence ESM3, která následně navrhla doposud neznámý jasně fluoreskující protein.

 

Thomad Hayes. Kredit: T. Hayes.
Thomad Hayes. Kredit: T. Hayes.

Thomad Hayes z EvolutionaryScale a jeho spolupracovníci vzali navrženou sekvenci a protein podle ní úspěšně syntetizovali. Takže tady máme inteligenci, která se v podstatě stává nezávislým hráčem v evoluci proteinů. ESM3 reaguje na pokyny uživatele a využívá znalosti o sekvenci, struktuře a funkci značného množství proteinů.

 

Syntetizování proteinů a jeho výzkum může poskytnout velmi zajímavý vhled do struktury a fungování proteinů. Jsou to složité molekuly plné komplikovaných interakcí a pro naši mysl je těžké proniknout do jejich struktury. Do dnešní doby jsme v naprosté většině případů syntetizovali proteiny, které jsou zcela přesné nebo velmi podobné kopie přírodních proteinů, které si ukuchtila evoluce.

 

Logo. Kredit: EvolutionaryScale.
Logo. Kredit: EvolutionaryScale.

Hayes a spol. přiměli zmíněnou inteligenci ESM3, aby generovala fluorescentní proteiny. Stvořila jich hned několik. Jedním z nich byl jasně fluoreskující protein, který se značně liší od známých fluorescentních proteinů. Má s nimi shodnou sekvenci na pouhých 58 procent, což je doopravdy málo. Podle autorů inteligence takový rozdíl odpovídá simulování 500 milionů let nezávislé evoluce.

 

ESM3 je multimodální generativní jazykový model. To znamená, že stejně jako jeho předchůdci, dnes již legendární jazykové modely, které se staly našimi společníky v každodenním životě, trénuje na ohromném objemu dat. Inteligence ESM3 se učila na datech vytvořených ze 3,15 miliard sekvencí proteinů, 236 milionů proteinových struktur a 539 milionů anotací, tedy popisů vlastností proteinů.

##seznam_reklama##

Dotyčným proteinem, který inteligence vymyslela, je esmGFP, nový zeleně fluoreskující protein, který září pod UV světlem. Jak se zdá, inteligence teď mohou sypat z rukávu nové typy proteinů, které bude možné využívat v medicíně a mnoha dalších aplikacích. Také bude dobré mít na paměti, že uživatelé podobných nástrojů mohou mít různou motivaci. Ostatně, zkuste si sami na webu EvolutionaryScale.

 

Video: Alexander Rives - Evolutionary Scale Language Models

 

Video: Simulating 500 million years of evolution with an LLM | ESM3 is Insane | Powered by NVIDIA

 

Literatura

Phys.org 21. 1. 2025.

Science online 16. 1. 2025.


Autor: Stanislav Mihulka
Datum:24.01.2025