DeepSeek: A túlbefektetés határvonalán vagy a Jevons-paradoxon küszöbén? - Concorde blog A DeepSeek jelensége a modern befektetési stratégiák világában egy új, ámde izgalmas kihívást hozott magával. De vajon valóban a túlbefektetés szélén egyensúlyozunk,


2025. január 27-e sötét napként vonul be az Nvidia történetébe, amikor is a vállalat piaci értéke egy nap leforgása alatt drámai módon, 589 milliárd dollárral csökkent. A DeepSeek megjelenése alapjaiban rengeti meg a mesterséges intelligenciával kapcsolatos fejlesztésekbe befektetett hatalmas összegek értelmét és jövedelmezőségét.

A DeepSeek, amely eredetileg a High-Flyer hedge fund egyik ágazataként indult, modelljének finomhangolása mindössze 5,6 millió dollárt igényelt, miközben H800 GPU-kat alkalmaztak. Ez a chip a H100 továbbfejlesztett változata, amelyet az exportkorlátozások miatt kifejezetten a kínai piac számára terveztek. A módosítás kulcsa abban rejlik, hogy a kínai verzió alacsonyabb adatátviteli sebességgel bír, ami gyengébb teljesítményt eredményez az eredetihez képest.

A modellfejlesztők különböző innovatív megoldásokkal igyekeztek mérsékelni a felmerülő hátrányokat. Például a számítások során 8 tizedesjegy alkalmazásával dolgozták fel az adatokat, a hagyományos 16 vagy 32 helyett, ami jelentős mértékben növelte a hatékonyságot. Mindazonáltal vannak olyanok, akik kétségbe vonják, hogy a DeepSeek valóban rendelkezett volna H100 GPU-val, amit Elon Musk és Alexandr Wang, a Scale AI vezérigazgatója is hangsúlyozott, utalva arra, hogy a kínai chipkészlet körülbelül 50 000 darabra tehető.

Jelenleg azt nem lehet 100 százalékos pontossággal eldönteni, hogy kinek lehet igaza, de ha elhisszük a kínaiak verzióját, akkor nekik sikerült egy olyan modellt létrehozniuk, amely a teljesítményével felülmúlja a Szilícium-völgy technológiai óriásainak fejlesztéseit. Mindezt úgy, hogy a hiperskálázó cégek már egyértelműen az Nvidia újabb, korszerűbb H100 vagy akár H200 GPU-it használják - mint például az OpenAI, a ChatGPT fejlesztője.

Joggal merül fel a kérdés: ha egy régebbi, olcsóbb GPU-val ilyen eredmények érhetők el, akkor miért fektetnek a hiperskálázók hatalmas összegeket a mesterséges intelligencia infrastruktúrájába, amikor ennek legnagyobb része a chipvásárlásra megy el?

Jelenleg a mesterséges intelligencia iparágában négy domináló hiperskálázó szereplő uralja a piacot: az Amazon (AWS), a Microsoft (Azure), az Alphabet (Google Cloud) és a Meta. A várakozások szerint 2024-re ezek a cégek összesen 213 milliárd dollárt fektetnek be AI-hoz kapcsolódó projektekbe. Hogy jobban érzékelhessük ennek a hatalmas összegnek a jelentőségét: ez az érték messze meghaladja Magyarország 2023-as GDP-jét, ha dollárban és folyó áron számolunk.

Elképesztő pénzösszegek keringenek tehát az AI világában, amit Sundar Pichai, az Alphabet vezérigazgatója 2024 júliusában így indokolt:

Az alulbefektetés kockázata az AI területén számukra lényegesen magasabb, mint a túlbefektetésből adódó veszélyek.

Ez a megállapítás tökéletesen reflektál az elmúlt pár negyedév hangulatára, de felmerül a kérdés: miként alakítja át a DeepSeek megjelenése a jelenlegi helyzetet? Valóban meg fogja változtatni, vagy inkább a hiperskálázók továbbra is a kevesebb befektetés irányába tartanak? A jövőbeli lehetőségek még mindig ködösek, hiszen nem zárható ki, hogy éppen a Jevons-paradoxon első fázisában járunk. Ezt Satya Nadella, a Microsoft vezérigazgatója is megemlítette a hétfői Twitter posztjában:

A Jevons-paradoxon újra megmutatja magát! Ahogy a mesterséges intelligencia folyamatosan fejlődik és egyre könnyebben elérhetővé válik, úgy egyre inkább tapasztalhatjuk, hogy a használatának mértéke az egekbe szökik. Az AI olyan termékké válik, amelyből sosem elég, és hamarosan elengedhetetlenné válik a mindennapjainkban.

Jelen blogbejegyzés a szerző magánvéleményét tükrözi, amely nem feltétlenül egyezik a Concorde Csoport hivatalos álláspontjával.

Related posts