Přednáška: Z velkých dat lze v genetice i vypočítat diagnózu

  12:00aktualizováno  17:55
Síla Internetu věcí, desítek milionů vzájemně komunikujících zařízení, čidel a senzorů, spočívá především v možnosti analýzy posbíraných dat. Proč je to jeden z největších problémů, vysvětluje doktor Jan Kalina.

V nejrůznějších oblastech lidské činnosti se v posledních letech čím dál častěji setkáváme s obrovskými daty. Mezi příklady, které nás každodenně obklopují, patří sociální sítě, které o nás sbírají veškerá dostupná data, nebo věrnostní karty v samoobsluze, které vypovídají o složení nákupního košíků jednotlivých stálých zákazníků. Množství dat neustále přibývá, a to rychlejším tempem, než jsme schopni vůbec taková data analyzovat. Prezentace nejprve pojedná o příkladech oblastí, v nichž se setkáváme s velkými daty, avšak náš zájem se primárně týká statistického zpracování dat v oblasti molekulární genetiky.

RNDr. Jan Kalina, Ph.D.

Jan Kalina je vedoucím Oddělení medicínské informatiky a biostatistiky na Ústavu informatiky AV ČR. Mezi jeho odborné zájmy patří robustní statistické metody, které jsou spolehlivé i při kontaminaci dat výrazně odlehlými hodnotami, a redukce komplexity v mnohorozměrných datech.

V současné době řeší prestižní matematický projekt Neuron Impuls od Nadačního fondu Neuron na podporu vědy. Vede i několik diplomových prácí na MFF UK. Je členem České statistické společnosti, Mezinárodní společnosti pro klinickou biostatistiku a České lékařské společnosti Jana Evangelisty Purkyně.

Při molekulárně genetických studiích je obvyklé, že se měří genová aktivita (exprese) řádově desítek tisíc genů na pouhých desítkách pacientů. Cílem analýzy pak je například určit diagnózu nového jedince na základě porovnání jeho genových aktivit s naměřenými hodnotami u různých skupin pacientů.

Standardní statistické metody však trpí tzv. prokletím dimenzionality, to znamená, že je buď nelze rychle spočítat pro tak velké počty genů, anebo je nelze spočítat vůbec.

Rozcestník

Kde sledovat další přednášky?

Výrazně si zjednodušíme celou analýzu, pokud dokážeme nejprve najít malou sadu těch genů, které nejvíc přispívají k odlišení jednotlivých skupin pacientů. Pak stačí hledat pravidlo pro určení diagnózy právě jen na základě této malé skupiny genů. V prezentaci popíšeme naši nově navrženou statistickou metodu pro hledání malé sady významných genů, která je navíc dostatečně spolehlivá i v situaci, kdy jsou naměřené hodnoty zatížené výraznou chybou měření.

Autor:
 

Nejčtenější

Unikla hesla rekordních 773 milionů uživatelů. Najdete tam to svoje?

Není heslo jako heslo. Či spíše heslo jako heslo vlastně ani není heslo.

Více než miliarda unikátních kombinací e-mailu a hesla unikla na web v zatím rekordní databázi přístupových údajů....

Nájemný vrah doplatil na svůj koníček, udaly jej chytré sportovní hodinky

Mark Fellows na snímku z desetikilometrového závodu v Manchesteru v roce 2015

Britský běžec a cyklista Mark Fellows byl odsouzen k doživotnímu trestu za dvojnásobnou vraždu. K jeho odhalení a...

Čeští vývojáři vylepšili vláček pro koleje z IKEA. Uhání až 90 cm/s

Intelino tým

Vypadá jako obyčejný vláček, ale můžete ho ovládat přes aplikaci v mobilu nebo jen pokládáním barevných terčíků na...

SpaceX začíná zkoušky „superrakety“. Bude se lesknout jako zrcadlo

Stavba pokusné rakety konceptu Starship na raketodromu SpaceX v jižním Texasu.

Fanouškům kosmonautiky přichystal šéf společnosti SpaceX Elon Musk na přelomu roku nečekaný dárek: nové plány na stavbu...

Tito lidé neexistují. Počítač si je vymyslel, napodobí rasu i vlasy

Fotografie neexistujících celebrit generované neuronovou sítí Nvidia na základě...

Podívejte se na fotky lidí, které jste nikdy nepotkali a nepotkáte. Počítač si je totiž vymyslel. Generativní...

Další z rubriky

Nové poznatky o událostech po pádu planetky, která vyhubila dinosaury

První prokazatelnou obětí následků dopadu planetky Chicxulub byly nebohé...

Lokalita zvaná „Tanis“ se nachází se na území Severní Dakoty ve Spojených státech amerických. Tato fosilní lokalita ze...

Největší známý slon byl těžký asi jako Tyrannosaurus rex

Porovnání velikosti dospělého člověka s velikostí průměrně velkého samce a...

Jak si vede největší živočich, který v současnosti chodí po zemi, ve srovnání s pravěkými obyvateli naší planety?

Ochutnali jsme hamburger z umělého masa. Ani masožrout se neušklíbne

… i po kousnutí.

Před stánkem „Impossible burger“ na lasvegaském výstavišti byla k vidění nevídaná věc. Vegetariáni i „masožrouti“ jedli...

Najdete na iDNES.cz