David Baker se svým týmem v roce 2003 navrhl úplně nový protein, jaký biochemie dosud neznala. Jeho výzkumná skupina pak představila množství dalších uměle vytvořených bílkovin. Mohou najít praktické uplatnění jako léky, vakcíny, nanomateriály nebo mikroskopické senzory.
Demis Hassabis a John M. Jumper zase v roce 2020 stvořili revoluční umělou inteligenci AlphaFold 2. S její pomocí dokázali s vysokou přesností předpovědět prostorovou strukturu prakticky všech z více než 200 milionů bílkovin, které vědci zatím objevili. Model momentálně používají zhruba dva miliony badatelů ze 190 zemí. Jeho aplikací je nepočítaně.
Dá se použít třeba k výzkumu odolnosti bakterií vůči antibiotikům, návrhu nových léků, pochopení mechanizmů na pozadí dědičných chorob, nebo při návrhu reakcí šetrných k přírodě v chemickém průmyslu. Letos na jaře vyšla nejmodernější verze modelu AlphaFold 3.
Základní molekuly života
Bílkoviny dělají v buňkách naprostou většinu práce. Slouží jako stavební materiál. Keratin tvoří základ vlasů a nehtů, kolagen najdeme v kůži a šlachách, aktin a myozin zase fungují jako fundament svalových vláken. Další proteiny zastávají funkce enzymů. Katalyzují nejrůznější biochemické reakce. Příklad je trávení potravy, kopírování a péče o DNA nebo produkce energie. Jiné bílkoviny mají na starosti přenos signálů, imunitu nebo transport různých molekul z místa na místo.
Všechny proteiny přitom vznikají podobně. Tvoří je zhruba dvacítka základních stavebních molekul – aminokyselin. Ty se spojují do dlouhých řetězců pomocí tzv. peptidové vazby. Systém je velice podobný Legu. Pořadí jednotlivých aminokyselin je zapsáno v DNA nebo RNA příslušné formy života.
Řetězec proteinu se už během své syntézy v buňce skládá do složitého trojrozměrného tvaru. Ten souvisí s jeho funkcí. Například enzymy mají takzvané aktivní místo. Molekula, kterou zpracovávají, do něj přesně zapadá.
Tvar proteinu vyplývá z pořadí aminokyselin v jeho řetězci. Určuje ho množství sil. Jsou mezi nimi dodatečné vazby mezi jednotlivými aminokyselinami, přitažlivé nebo odpudivé síly mezi nimi, vodíkové můstky, nebo působení molekul vody v okolí. Biochemici věděli, že to tak je, velmi dlouho.
Anfinsenovo dogma
V roce 1962 ocenila nobelovská komise Angličana Johna Kendrewa a jeho kolegu naturalizovaného Brita rakouského původu Maxe Perutze za výzkum trojrozměrného tvaru proteinových molekul pomocí rentgenového záření. O deset let později dostal cenu americký chemik Christian B. Anfinsen (společně se svými krajany Stanfordem Mooreem a Williamem H. Steinem). Svými experimenty prokázal, že tvar proteinu určuje pořadí aminokyselin, ze kterých je složený.
Téhle hypotéze se říká také Anfinsenovo dogma. Předpovědět, do jaké trojrozměrné struktury se daný protein složí, ale bylo dlouho mimo lidské možnosti. Sil ovlivňujících tvar bílkovin bylo příliš mnoho.
V roce 1994 vznikl projekt CASP (Critical Assessment of Structure Prediction, Kritické posouzení predikce struktury). Umožňoval vědcům objektivně testovat metody předpovídání tvarů proteinů, na kterých právě pracovali.
Program se brzo zvrhl v soutěž. Konala se každé dva roky. V roce 1998 byl mezi účastníky i tým David Bakera. Baker se původně zajímal o filosofii a sociální vědy. Během studií na vysoké škole ho ale zaujala proteinová záhada.
Rosetta@home
Na začátku devadesátých let vyvinul předpovědní algoritmus Rosetta. Ten se později stal základem sítě Rosetta@home. Po internetu se do ní mohli hlásit dobrovolníci, kteří poskytovali výpočetní výkon svých počítačů k řešení problému skládání proteinů. V soutěži CASP si Rosetta vedla dobře. Bakera ale napadlo, jestli by nebylo lepší místo hádání struktury už známých proteinů vytvořit vlastní.
Bakerovi předchůdci ve stejné disciplíně obvykle začínali úpravami nějakého proteinu, jehož tvar i pořadí aminokyselin už byly známé. Baker se však rozhodl vytvořit bílkovinu úplně nově.
„Když chcete postavit letadlo,“ prohlásil, „nezačínáte úpravou ptáka. Nastudujete si principy aerodynamiky a postavíte létající stroj.“
Na základě popsaného přístupu navrhl v roce 2003 s pomocí Rosetty protein jménem Top7. Měl téměř přesně strukturu, kterou software předpovídal. Zdrojový kód programu pak Baker zveřejnil. Do návrhu proteinů se tak mohl pustit kdekdo další.
Od šachů přes Go k proteinům
Demis Hassabis začal svou cestu ke slávě v pouhých čtyřech letech jako dětský šachový génius. Když mu bylo třináct, dosáhl Elo ratingu 2300. Patřil tak do méně než půl procenta nejlepších šachistů světa. Dělal kapitána britské juniorské šachové reprezentace. V hraní pokračoval i na univerzitě. Jeho zájem se postupně přesunul k počítačům a umělé inteligenci. Zabýval se i návrhem videoher.
V roce 2010 založil společnost DeepMind, vyvíjející stejnojmennou AI. Soustředila se na deskové hry. V roce 2014 koupil firmu Google. O dva roky později ohromila svět. DeepMind dokázala porazit velmistra v nejsložitější a nejtěžší hře světa, Go.
Demis Hassabis se následně rozhodl zkusit uplatnit DeepMind v problému skládání proteinů. V roce 2018 ji přihlásil do soutěže CASP. Vznikla první verze modelu AlphaFold.
Vedla si dobře. Ostatní soutěžní týmy dokázaly předpovídat strukturu proteinů s úspěšností okolo čtyřiceti procent. AlphaFold 1 zvládla šedesát. Pořád to ale nebylo ono.
John M. Jumper a transformer
K zásadnímu zpřesnění předpovědí přispěl až John M. Jumper. Původně studoval matematiku a fyziku. Stejně jako ostatní letošní chemické nobelisty ho však okouzlil problém skládání bílkovin. Než se přidal k týmu DeepMind, zabýval se vymýšlením metod, které šetřily při předpovědích proteinové struktury výpočetní čas.
Po svém příchodu do DeepMind stál Jumper společně s Hassabisem u zrodu druhé verze softwaru, AlphaFold 2. Při jejím vývoji se uplatnil nový typ neuronové sítě, označovaný jako transformer.
Neuronová síť je počítačová nápodoba struktury lidského mozku. Tvoří ji závorky s čísly, které simulují chování nervových buněk. Mohou se učit způsobem, jenž vzdáleně připomíná lidské osvojování znalostí. Transformer se dokáže učit efektivněji než jiné architektury.
V roce 2020 se AlphaFold 2 zúčastnila soutěže CASP. Dokázala předpovídat tvar proteinů s přesností okolo 90 procent. Snadno zvítězila. Problém, který nedal biochemikům spát desítky let, byl vyřešený. Soutěž skončila.


















