Tech

Hoe de Chinese AI-startup DeepSeek concurreert met OpenAI en Google

De dag na Kerstmis onthulde een kleine Chinese start-up genaamd DeepSeek een nieuw AI-systeem dat de mogelijkheden van geavanceerde chatbots van bedrijven als OpenAI en Google zou kunnen evenaren.

Dat alleen al zou een mijlpaal zijn geweest. Maar het team achter het systeem, DeepSeek-V3 genaamd, beschreef een nog grotere stap. In een onderzoekspapier Toen ze uitlegden hoe ze de technologie bouwden, zeiden de ingenieurs van DeepSeek dat ze slechts een fractie van de zeer gespecialiseerde computerchips gebruikten waar toonaangevende AI-bedrijven op vertrouwden om hun systemen te trainen.

Deze chips vormen het middelpunt van een gespannen technologische concurrentie tussen de Verenigde Staten en China. Terwijl de Amerikaanse regering eraan werkt om de leidende positie van het land in de mondiale AI-race te behouden, probeert zij het aantal krachtige chips, zoals die van het Silicon Valley-bedrijf Nvidia, dat aan China en andere rivalen kan worden verkocht, te beperken.

Maar de prestaties van het DeepSeek-model roepen vragen op over de onbedoelde gevolgen van de handelsbeperkingen van de Amerikaanse overheid. De controles hebben onderzoekers in China gedwongen creatief aan de slag te gaan met een breed scala aan tools die gratis beschikbaar zijn op internet.

De DeepSeek-chatbot beantwoordde vragen, loste logische problemen op en schreef zijn eigen computerprogramma’s, net zo capabel als alles wat al op de markt was, volgens de benchmarktests die Amerikaanse AI-bedrijven hebben gebruikt.

En het werd goedkoop gemaakt, waarmee het heersende idee werd uitgedaagd dat alleen de grootste bedrijven in de technologiesector – allemaal gevestigd in de Verenigde Staten – het zich konden veroorloven om de meest geavanceerde AI-systemen te maken. De Chinese ingenieurs zeiden dat ze slechts ongeveer 6 miljoen dollar aan ruwe rekenkracht nodig hadden om hun nieuwe systeem te bouwen. Dat is ongeveer tien keer minder dan de technologiegigant Meta heeft uitgegeven aan het bouwen van zijn nieuwste AI-technologie.

“Het aantal bedrijven dat 6 miljoen dollar te besteden heeft, is veel groter dan het aantal bedrijven dat 100 miljoen of 1 miljard dollar te besteden heeft”, zegt Chris V. Nicholson, een investeerder bij durfkapitaalbedrijf Page One Ventures, die zich richt op AI-technologieën.

Sinds OpenAI in 2022 de AI-boom veroorzaakte de release van ChatGPTVeel experts en investeerders waren tot de conclusie gekomen dat geen enkel bedrijf zonder uitgaven met de marktleiders kon concurreren honderden miljoenen dollars aan gespecialiseerde chips.

De toonaangevende AI-bedrijven ter wereld trainen hun chatbots met behulp van supercomputers die maar liefst 16.000 chips gebruiken, zo niet meer. De ingenieurs van DeepSeek zeiden daarentegen dat ze slechts ongeveer 2.000 gespecialiseerde computerchips van Nvidia nodig hadden.

De beperkingen op chips in China dwongen de DeepSeek-ingenieurs om ‘het efficiënter te trainen, zodat het nog steeds concurrerend kon zijn’, zegt Jeffrey Ding, een assistent-professor aan de George Washington University die gespecialiseerd is in opkomende technologie en internationale betrekkingen.

Eerder deze maand heeft de regering-Biden nieuwe regels uitgevaardigd die tot doel hebben te voorkomen dat China via andere landen geavanceerde AI-chips verkrijgt. De regels bouwen voort op meerdere rondes van eerdere beperkingen die Chinese bedrijven ervan weerhouden geavanceerde computerchips te kopen of te maken. President Trump heeft nog niet aangegeven of hij zich aan de regels zal houden of deze zal intrekken.

De Amerikaanse regering heeft geprobeerd geavanceerde chips uit de handen van Chinese bedrijven te houden, omdat ze bang waren dat ze voor militaire doeleinden zouden kunnen worden gebruikt. Als reactie daarop hebben sommige bedrijven in China duizenden chips opgeslagen, terwijl andere deze uit een Chinese fabriek haalden bloeiende ondergrondse marktplaats van smokkelaars.

DeepSeek wordt gerund door een kwantitatief aandelenhandelsbedrijf genaamd High Flyer. In 2021 had het zijn winst gekanaliseerd in de aanschaf van duizenden Nvidia-chips, die het gebruikte om zijn eerdere modellen te trainen. Het bedrijf, dat niet reageerde op verzoeken om commentaar, is in China bekend geworden omdat het vers talent van topuniversiteiten heeft binnengehaald met de belofte van hoge salarissen en het vermogen om de onderzoeksvragen te volgen die hun interesse het meest wekken.

Zihan Wang, een computeringenieur die aan een eerder DeepSeek-model werkte, zei dat het bedrijf ook mensen inhuurt zonder enige computerwetenschappelijke achtergrond om de technologie te helpen poëzie en goede vragen over het notoir moeilijke Chinese toelatingsexamen voor de universiteit te begrijpen en te genereren.

DeepSeek maakt geen producten voor consumenten, waardoor de ingenieurs zich volledig op onderzoek kunnen concentreren. Dat betekent dat de technologie ervan niet wordt beperkt door het strengste aspect van de Chinese regelgeving inzake AI, die vereist dat op de consument gerichte technologie voldoet aan de controles van de overheid op informatie.

De toonaangevende Amerikaanse bedrijven blijven de stand van de techniek op het gebied van AI bevorderen. In december onthulde OpenAI een nieuw ‘redeneersysteem’ genaamd o3 die de prestaties van bestaande technologieën overtreft, hoewel deze buiten het bedrijf nog niet algemeen beschikbaar is. Maar DeepSeek blijft laten zien dat het niet ver achterloopt. Deze maand heeft het een indrukwekkend eigen redeneermodel uitgebracht.

(De New York Times heeft dat gedaan aangeklaagd OpenAI en zijn partner Microsoft beschuldigen hen van inbreuk op het auteursrecht op nieuwsinhoud met betrekking tot AI-systemen. OpenAI en Microsoft hebben deze claims ontkend.)

Een cruciaal onderdeel van deze snel veranderende mondiale markt is een oud idee: open source software. Net als veel andere bedrijvenDeepSeek heeft zijn nieuwste AI-systeem open source gemaakt, wat betekent dat het de onderliggende code heeft gedeeld met andere bedrijven en onderzoekers. Hierdoor kunnen anderen hun eigen producten bouwen en distribueren met behulp van dezelfde technologieën.

Terwijl werknemers bij grote Chinese technologiebedrijven beperkt zijn tot samenwerking met collega’s, “werk je als je aan open source werkt met talent over de hele wereld”, zegt Yineng Zhang, hoofdsoftware-ingenieur bij Baseten in San Francisco, die werkt aan de open source SGLang. project. Hij helpt andere mensen en bedrijven producten te bouwen met behulp van het systeem van DeepSeek.

Het open source-ecosysteem voor AI kwam in 2023 op stoom Meta deelde vrijelijk een AI-systeem genaamd LLama. Velen gingen ervan uit dat deze gemeenschap alleen zou floreren als bedrijven als Meta – technologiegiganten met enorme datacenters gevuld met gespecialiseerde chips – hun technologieën zouden blijven opensourcen. Maar DeepSeek en anderen hebben laten zien dat ook zij de kracht van open source-technologieën kunnen uitbreiden.”

Veel leidinggevenden en experts hebben betoogd dat de grote Amerikaanse bedrijven hun technologieën niet open source moeten maken ze kunnen worden gebruikt om desinformatie te verspreiden of andere ernstige schade aan te richten. Sommige Amerikaanse wetgevers hebben de mogelijkheid onderzocht om deze praktijk te voorkomen of te beperken.

Maar anderen beweren dat als toezichthouders de vooruitgang van open source-technologie in de Verenigde Staten onderdrukken, China een aanzienlijke voorsprong zal verwerven. Als de beste open source-technologieën uit China komen, zo betogen zij, zullen Amerikaanse ontwikkelaars hun systemen bovenop die technologieën bouwen. Op de lange termijn zou dit China in het hart van AI-onderzoek en -ontwikkeling kunnen plaatsen.

“Het zwaartepunt van de open source-gemeenschap is verschoven naar China”, zegt Ion Stoica, hoogleraar computerwetenschappen aan de University of California, Berkeley. “Dit zou een enorm gevaar kunnen zijn voor de VS”, omdat het China in staat stelt de ontwikkeling van nieuwe technologieën te versnellen.

Uren na zijn inauguratie trok president Trump een uitvoerend bevel van de regering-Biden in dat dreigde open source-technologieën aan banden te leggen.

Dr. Stoica en zijn studenten hebben onlangs een AI-systeem gebouwd met de naam Sky-T1 dat op bepaalde benchmarktests kan wedijveren met de prestaties van het nieuwste OpenAI-systeem, OpenAI o1 genaamd. Ze hadden slechts $ 450 aan rekenkracht nodig.

Ze deden dit door voort te bouwen op twee open source-technologieën van de Chinese technologiegigant Alibaba.

Hun systeem van $ 450 is niet zo krachtig als de technologie van OpenAI of het nieuwe systeem van DeepSeek. En het is onwaarschijnlijk dat de technieken die zij gebruikten systemen zullen opleveren die de prestaties van de leidende technologieën overtreffen. Maar het project toonde aan dat zelfs operaties met minuscule middelen concurrerende systemen kunnen bouwen.

Reuven Cohen, een technologieconsultant in Toronto, gebruikt DeepSeek-V3 sinds eind december. Hij zegt dat het vergelijkbaar is met de nieuwste systemen van OpenAI, Google en de San Francisco start-up Anthropic – en veel goedkoper in gebruik.

“DeepSeek is voor mij een manier om geld te besparen”, zei hij. “Dit is het soort technologie dat iemand als ik wil gebruiken.”

Related Articles

Back to top button