Pokud si dnes otevřete libovolnou sociální síť, nevyhnete se jedné věci, čínskému modelu DeepSeek. A zejména jeho verzi R1, která umí přemýšlet. A podobně jako u jakéhokoliv jiného tématu obíhá internetovým éterem spousta polopravd. Nejen o nich Jakub Danielka z Počítačové školy GOPAS:



Co víme relativně bezpečně



Jedná se o velmi schopný model, i když záleží na konkrétním use case, který na tento model uživatel naloží. DeepSeek umí přemýšlet podobně jako modely o1 a o3 od OpenAI. A je sdílnější, co se popisu přemýšlení týče. Nedá se mu totiž upřít míra detailů a skoro až "roztomilost" dialogu či spíše samomluvy.

Je minimálně zčásti otevřený, na čemž vzniklo spousta vtipů na téma otevřenost OpenAI. a namísto smíchu směrem o k OpenAI je možná na místě zvážit smích směrem k Číně, protože ani u jednoho jmenovaného to opravdu není nikterak horké téma. Existuje v několika verzích, které se liší jednak velikostí a jednak také podkladovým modelem - tzv. distilled modely postavené nad modely Llama od Mety a Qwen od Alibaby.

DeepSeek je velmi levný, ve webovém rozhraní dokonce zdarma, k tématu ceny se nicméně dostaneme dále. Soukromí rozhodně není jeho silnou stránkou, respektive je to něco na způsob přímé linky mezi uživatelem a ústředím Komunistické strany Číny.

Co prosakuje a je někde mezi pravdou a spekulací



DeepSeek sám je možná distilled verzí GPT. Cena jeho vytvoření (v jednotkách milionů USD) možná nepokrývá celý proces, ale pouze jeho finální část. A pokud se vydáme za hranice všedních dní, můžeme to asi klidně označit za psyops, ale to už možná utíkáme moc daleko.

Co je v mnoha textech zcela nebo částečně špatně



Tvrzení 1: jedná se o tzv. ChatGPT killer. Pokud ho budeme brát jako zhruba tisící položku na seznamu těchto killerů, tak nepochybně ano. Funkčně? Spíš ne. Z bezpečnostního hlediska, resp. pro uživatele, pro které je určitá míra ochrany informací důležitá? Určitě ne.

Tvrzení 2: bezpečnost se dá zaručit tím, že si model spustíte lokálně na svém počítači. Ano, tím se soukromí víceméně zaručí, nicméně pokud doma nemáte sestavu grafických karet s celkovou VRAM kolem 500 GB (anebo počítač s podobně velkou RAM - pak ale budete na jednu odpověď čekat opravdu velice dlouho), tak musíte provozovat "zmenšenou" verzi s nižší počtem parametrů ("nervových synapsí"), některou z quantized verzí a nebo nějakou z distilled verzí. V obou případech dostanete "hloupější" model. Obejít se to samozřejmě dá i hrubou výpočetní silou, kdy si pronajmete GPU v cloudu od některého z mnoha poskytovatelů, využijete jej v prostředí Azure, anebo jej vyzkoušíte v Poe či Perplexity.

Co je na tom celém velmi překvapivé



Jeden model z Číny dokáže vymazat 20 % hodnoty a mnoha dalších společností. Vzhledem k tomu, že za DeepSeekem je reálně společnost zabývající se tradingem, otevírá to takřka nekonečný prostor konspiračním teoriím. Zároveň to ukazuje bohužel asi i neznalost na straně investorů. Celý DeepSeek byl vytrénován na kartách, používá karty, a i kdyby se objevil princip, který výrazně zjednoduší a tím i zlevní provoz AI na těchto grafických kartách, bude karet potřeba možná i více.

Aplikace DeepSeek dokázala zválcoval App Store, kde se stala nejstahovanější aplikací. Jen se potvrzuje, že uživatele očividně absolutně nezajímá ani bezpečnost, ani soukromí, ani původ aplikace. Hlavně, že je zdarma. Na školeních vždy opakuji: nenaskakujte na každou novou cool AI aplikaci a už vůbec ne, pokud je zdarma. A budu to dělat dál, protože "žádný oběd není zdarma". A to nejpřekvapivější asi je, že jsem překvapený tím, jak je uživatelům úplně jedno, co je to za aplikaci, když tu máme už několik let víceméně epidemii TikToku, který by se mohl (a měl) dostat na seznam návykových látek a činností, zhruba na úroveň alkoholu a hazardu.

Co je na tom naopak nepřekvapivé



Čína udělala to, co Čína dělá. Pokud se potvrdí teorie o distilled verzi GPT modelu, tak si zkrátka trošku přiohla pravidla ve svůj prospěch. Nicméně jsme trochu v rovině "zloděj křičí chyťte zloděje", protože jen bůh a OpenAI ví, kde se vzala původní tréninková data pro GPT modely. A i zbytek může být tak trochu v čínském duchu: vládní subvence pro snížení ceny, podobně jako u BEV a obecně čínská schopnost vyrábět některé zboží na skorozápadní až západní úrovni levněji - ať už je zatím levná pracovní síla, nucená práce Ujgurů a nebo ty zmíněné subvence kombinované s flexibilním výkladem autorských a jiných práv, i když tady budeme asi primárně u těch subvencí.

Jak se k tomu postavit?



Pokud si chcete vyzkoušet, jak by vám odpovídalo ChatGPT, ovlivněné tak trochu jinou cenzurou či jiným pohledem na uspořádání světa, vyzkoušejte ho. A ano, i ChatGPT a další nástroje/modely vám neřeknou všechno. Pokud potřebujete materiál pro příspěvek na LinkedIn, abyste byli in a drželi prst na tepu doby, vyzkoušejte ho. Pokud budete mít nutkání do jeho originální verze na čínských serverech nahrát nějaké firemní soubory, NEZKOUŠEJTE ho. Pokud jste majitel či ředitel firmy, která dbá na elementární bezpečnost dat, zakažte ho. Své kolegy a zaměstnance tím o žádnou revoluci nepřipravíte.

Pokud potřebujete snížit náklady na AI, počkejte. Jedna věc bude na DeepSeek asi nakonec přece jen pozitivní. Konkurence, a to i čínská, umí vyburcovat ty ostatní, očekávám tedy pokles cen. Anebo nové, krásné, skvělé a naleštěné funkce. OpenAI tak v posledních dnech zařadilo vyšší rychlosti stupeň, a i díky DeepSeeku teď máme v ChatGPT k dispozici první vlaštovky z rodiny modelů o3 a k tomu Deep research funkci, která sice existovala už dříve u jiných poskytovatelů AI, ale její implementace v ChatGPT je jednoduše skvělá. Pokud tedy máte Pro předplatné za 200 USD/měsíc. Ale je na cestě i do levnějších variant.

Co říct závěrem?



Snad popřát si, aby se, zejména pokud jste využili buy the dip, cena akcií zase vyšvihla nahoru. Jinak můžeme už jen parafrázovat slavné britské Keep calm and carry on (with ChatGPT, Claude, Gemini...).

Jakub Danielka z Počítačové školy GOPAS