
A DeepSeek különlegessége, hogy a jelek szerint sokkal olcsóbb. Míg az iparágvezető OpenAI a hírek szerint több mint 100 millió dollárt költött a GPT-4 fejlesztésére, addig a DeepSeek 6 millió dollárból fejlesztette ki modelljét. Ezt a költségelőnyt a csúcskategóriás Nvidia A100-as chipek és más, viszonylag olcsóbb processzorok kombinációjával érték el.
Szakértők szerint ez a szám félrevezető, mert nem veszi figyelembe a szélesebb körű kutatás-fejlesztési költségeket, az adatszerzést, a személyi kiadásokat, az infrastrukturális költségeket és a hardveres beruházásokat.
Teljesítmény és jellemzők
A ChatGPT-hez hasonlóan a DeepSeek is úgy működik, hogy kérdésekre ad választ, és matematikailag és kódolásban az OpenAI o1 modelljéhez hasonlítható. Ez egy „érvelő” modell, amely úgy gondolkodik és válaszol, mint az emberek, így különösen hasznos üzleti és ügyfélszolgálati célokra.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
A rendszer különösen jól tudja bemutatni a probléma megoldása során végzett érvelési folyamatát azáltal, hogy érvelési folyamatát lépésekre bontja. Képes arra is, hogy – akárcsak egy ember, aki rejtvényt old meg – visszavezesse a logikáját, és szükség esetén korrigálja a korábbi lépéseket.
Ez az átlátható megközelítés lehetővé teszi a felhasználók számára, hogy megismerjék, hogyan jutott a rendszer az ajánlásaihoz.
A DeepSeek etikai aggályokat vet fel
A DeepSeek felemelkedése a mesterséges intelligencia területén fontos kérdéseket vet fel technológiájának következményeivel kapcsolatban, különösen annak fényében, hogy a képzést drága hardvereken végezték, amelyeket valószínűleg az amerikai exportellenőrzéskijátszására fejlesztettek ki. Bár az R1 modelljének teljesítménye, amely képes az OpenAI o1 funkcionalitását megismételni, de töredék áron, lenyűgöző, ugyanakkor a világ többi részén az AI-fejlesztés során alkalmazott, nem ellenőrzött vagy etikátlan gyakorlatok lehetőségét is feltárja.
Az, hogy a vállalat képes volt sikeresen beépíteni az Nvidia A100-as chipeket, amelyeket korábban az amerikai előírások korlátoztak, vörös zászlót vet a vállalat hitelességére és arra, hogy az ilyen technológiák hogyan használhatók fel a nemzetközi rend felforgatására.
a DeepSeek érzékeny történelmi eseményekre adott válaszai megfelelnek a kínai kormányzati cenzúrának, mivel ez azt mutatja, hogy a modell felhasználható az államilag irányított narratívák támogatására, ami globálisan korlátozhatja a modell hasznosságát és hitelességét. Így, ahogy a piacok reagálnak az amerikai technológiai fölényt fenyegető vélt fenyegetésre, a DeepSeek stratégiájának – innovatív, de erkölcsileg megalapozott – szélesebb körű következményeit alaposan elemezni kell.
aggasztó, hogy