Data mining se využívá v oblastech od lékařské diagnostiky přes zpracování satelitních snímků až například k analýze sociálních sítí. Metody dobývání informací z dat jsou velmi různorodé, zahrnují přístupy založené na statistice, výpočetní matematice, teorii informace, a také biologicky inspirované modely jako jsou umělé neuronové sítě nebo evoluční algoritmy. Typicky jde o metody, které mají řadu parametrů a úspěch jejich použití je závislý na zkušenostech a znalostech experimentátorů. Nejúspěšnější praktické aplikace dnes pracují s kombinacemi několika desítek až stovek jednotlivých metod, které týmy odborníků vyvíjejí dlouhou dobu na míru pro řešený problém.
Mgr. Roman Neruda, CSc. V Ústavu informatiky pracuje v Oddělení optimalizace a systémů, zabývá se mimo jiné zpracováním a analýzou velkých dat. Vyučuje na Matematicko-fyzikální fakultě Univerzity karlovy. Je jedním ze zakladatelů punkové kapely Sdružení rodičů a přátel RoPy. |
Velkou výzvou strojového učení je dnes otázka, zda lze lidské zkušenosti při sestavování a aplikaci těchto komplikovaných modelů alespoň částečně nahradit metodami umělé inteligence. Snažíme se vyvinout algoritmy, které na základě databází předchozích výsledků doporučí pro daný problém nejvhodnější metodu, případně vhodnou kombinaci metod společně s jejich parametry. Takové algoritmy musí být adaptivní, schopné učit se z předchozích zkušeností a vytvářet si vnitřní modely porozumění datům do jisté míry odpovídající znalostem lidského experta. Většinou jde o časově náročné přístupy, které zkušenosti získávají řadou pokusů a prohledávání vhodných alternativ.
RozcestníkKde sledovat další přednášky? |
V přednášce si demonstrujeme základní principy dobývání znalostí z dat pomocí metod umělé inteligence, strojového učení a špetky detektivní práce.