Zajímavé je, že chatbot poháněný open-source modelem DeepSeek-V3 byl údajně vyvinut na hardwaru za méně než šest milionů dolarů. To je výrazně méně, než kolik stál vývoj podobných modelů ve Spojených státech.
I to ukazuje, proč DeepSeek zanechal v centru vývoje technologií v USA v Silicon Valley tak hluboký dojem. Zároveň to nabourává široce rozšířené názory na prvenství USA v oblasti AI a vyvolává otázky ohledně účinnosti vývozních omezení Washingtonu zaměřených na pokročilé čipy a schopnosti AI, uvedla agentura Reuters.
Podle výzkumné společnosti Sensor Tower aplikace AI poháněná modelem DeepSeek-V3 se od spuštění 10. ledna stala velmi populární. Tvůrci modelu tvrdí, že DeepSeek-V3 je nejvýš hodnoceným modelem s otevřeným kódem a že se dokáže vyrovnat nejpokročilejším uzavřeným modelům na světě, tedy těm, jejichž kód a trénovací data nejsou veřejně dostupné.
Marc Andreessen ze Silicon Valley, který se zabývá rizikovým kapitálem a je poradce Donalda Trumpa, označil DeepSeek-R1 za AI’s Sputnik moment“ v odkazu na první umělou družici Země, která byla vypuštěna Sovětským svazem v roce 1957.
Stačil i méně výkonný hardware
Modely AI, od ChatGPT po DeepSeek, potřebují k tréninku pokročilé čipy. Americká vláda předchozího prezidenta Joea Bidena od roku 2021 rozšířila rozsah zákazů, které mají zabránit vývozu těchto čipů do Číny a jejich používání k trénování modelů AI čínskými firmami.
Výzkumníci z DeepSeek v prosinci v článku napsali, že DeepSeek-V3 používal k tréninku čipy firmy Nvidia H800 a že firma za ně utratila méně než šest milionů USD (143 milionů Kč). Čip H800 je upravená verze čipu Nvidia H100, který byl speciálně vytvořen pro čínský trh, aby splňoval americká exportní omezení na pokročilé čipy do Číny, a má omezenou šířku pásma paměti. H100 je jedním z nejvýkonnějších grafických procesorů na trhu, ale je také velmi drahý – může stát až desítky tisíc dolarů.
Google nechá AI mluvit česky a dá miliardu dolarů do projektu konkurence![]() |
Ačkoli informace od DeepSeek byly následně zpochybněny, tvrzení, že použité čipy byly méně výkonné než nejpokročilejší produkty Nvidia, které se Washington snaží udržet mimo Čínu, a také relativně nízké náklady na trénování vedlo americké manažery z technologického sektoru k otázkám ohledně účinnosti omezení vývozu technologií.
Pokud by se ale tvrzení potvrdilo a byly vyvinuty velké jazykové modely (LLM), které vyžadují mnohem menší výpočetní výkon než dřív, tak by to znamenalo, že také mohou stát mnohem méně, a výrazně by to narušilo současný pohled na tento průmysl.
Singapurský technologický poradce Vey-Sern Ling řekl BBC, že by to mohlo „potenciálně vykolejit investiční příležitosti pro celý dodavatelský řetězec AI“.
O firmě DeepSeek se však toho ví jen málo. Startup se sídlem v Chang-čou byl založen v roce 2023, kdy vyhledávací gigant Baidu vydal v Číně první velký jazykový model AI. Od té doby představily desítky čínských technologických firem své vlastní velké a malé modely AI. DeepSeek je však první firmou, kterou americký technologický průmysl chválí za to, že se vyrovná špičkovým americkým modelům, nebo je dokonce předčí.