Kitajska umetna inteligenca DeepSeek

Novi kitajski model umetne inteligence predstavlja cenovno dostopno, a zelo zmogljivo alternativo ameriškim vodilnim modelom.

Jan 28, 2025

Zadnje dni preizkušam novi kitajski model umetne inteligence DeepSeek-R1, ki me je navdušil s svojo zmogljivostjo tudi pri uporabi v slovenščini. 😊

Kitajski AI start-up DeepSeek je v izjemno kratkem času dosegel pomemben preboj z lansiranjem modela, ki se lahko kosa z najzmogljivejšimi ameriškimi različicami, kot je ChatGPT. Model DeepSeek-R1 izstopa zaradi treh ključnih lastnosti: relativne odprtosti in dostopnosti kode, bistveno nižjih stroškov razvoja v primerjavi z ameriškimi tekmeci ter napredne zmožnosti razumskega sklepanja, ki je primerljiva z vrhunskimi modeli, kot je OpenAI-jev o1.

Kitajska industrija umetne inteligence hitro dohiteva ameriške tekmece, kljub omejitvam v obliki sankcij na dobavo najbolj naprednih čipov in regulativnih ovir na domačem trgu. Podjetja, kot sta Alibaba in DeepSeek, so razvila cenovno dostopne in tehnološko napredne modele, ki se lahko po zmogljivosti kosajo z izdelki vodilnih ameriških podjetij.

Transparentnost, odprtokodni pristop in osredotočenost na učinkovito treniranje nevronskih mrež so ključni dejavniki, ki Kitajski omogočajo hiter vzpon v globalni tekmi za prevlado na področju umetne inteligence. Ena izmed ključnih lastnosti modela DeepSeek-R1 je njegova relativna odprtost, saj sta končna koda in tehnična dokumentacija prosto dostopni za ogled, prenos in prilagajanje.

Tudi stroški razvoja DeepSeek modela so bili občutno nižji, približno 6 milijonov dolarjev, v primerjavi z ameriškimi tekmeci, kjer stroški pogosto dosegajo milijardo dolarjev. Poleg tega se kitajski modeli odlikujejo s prilagodljivostjo za manj razširjene jezike, kar jim omogoča širšo uporabnost na globalni ravni ter olajša vključevanje v različne kulturne in jezikovne kontekste. Vseeno pa se je treba zavedati, da ima model DeepSeek-R1 vgrajeno cenzuro glede občutljivih kitajskih političnih tem, kot je denimo protest na Trgu nebeškega miru, kar omejuje njegovo uporabnost v določenih kontekstih.

Zanimivo pri modelu DeepSeek-R1 je, da lahko spremljaš proces njegovega razmišljanja, preden ti ponudi odgovor. Primer je iz pogovora z zelo skrčeno verzijo modela, ki jo zaganjam na prenosniku.

Najboljši ameriški modeli trenutno sicer še vedno ohranjajo vodilni položaj, vendar se je ta prednost v zadnjem času bistveno zmanjšala, kar je povzročilo padec vrednosti delnic nekaterih tehnoloških podjetij. Cena uporabe DeepSeek-R1 je kar 95 % nižja od OpenAI-jevega modela, kar ga dela izjemno privlačnega za širši krog uporabnikov.

ANATOMIJA VEDNOSTI / Sašo Dolenc

Discussion about this post