Wat is Deepseek? En hoe gaat het naar AI?
Techvoorraden in de war. Gigantische bedrijven zoals Meta en Nvidia werden geconfronteerd met een spervuur van vragen over hun toekomst. Tech -leidinggevenden gingen naar sociale media om hun angsten te verkondigen.
En het was allemaal vanwege een weinig bekende Chinese kunstmatige intelligentie-start-up genaamd Diepeek.
Deepseek veroorzaakte maandag golven over de hele wereld als een van zijn prestaties – dat het een zeer krachtig AI -model had gecreëerd met veel minder geld dan veel AI -experts die voor mogelijk waren gehouden – riep een groot aantal vragen op, waaronder of Amerikaanse bedrijven zelfs concurrerend waren in AI meer.
Deepseek is ‘Ai’s Sputnik Moment’, Marc Andreessen, een tech -venture -kapitalist, gepost op sociale media op zondag.
Hoe kon een bedrijf waarover maar weinig mensen hadden gehoord zo’n effect hebben?
Wat is Deepseek?
Deepseek is een start-up opgericht en eigendom van het Chinese aandelenhandelsbedrijf High Flyer. Het doel is om AI -technologieën te bouwen in de trant van de chatgpt chatbot van Openai of Google’s Gemini. Tegen 2021 had Deepseek duizenden computerchips overgenomen van de Amerikaanse chipmaker Nvidia, die een fundamenteel onderdeel zijn van elke poging om krachtige AI -systemen te creëren.
In China staat de start-up bekend om het pakken van jonge en getalenteerde AI-onderzoekers van topuniversiteiten, beloofde hoge salarissen en een kans om te werken aan geavanceerde onderzoeksprojecten. Zowel hoogvlieger als Deepseek worden gerund door Liang Wenfeng, een Chinese ondernemer.
In de afgelopen jaren heeft Deepseek verschillende grote taalmodellen uitgebracht, wat het soort technologie is dat chatbots zoals Chatgpt en Gemini ondersteunt. Op 10 januari bracht het zijn eerste gratis chatbot-app uit, die was gebaseerd op een nieuw model genaamd Deepseek-V3.
Waarom reageerde de aandelenmarkt er nu op?
Toen Deepseek de Day After Kerstmis zijn Deepseek-V3-model introduceerde, kwam het overeen met de mogelijkheden van de beste chatbots van Amerikaanse bedrijven zoals Openai en Google. Dat alleen zou indrukwekkend zijn geweest.
Maar het team achter het nieuwe systeem onthulde ook een grotere stap vooruit. In een onderzoekspaper waarin werd uitgelegd hoe het de technologie bouwde, zei Deepseek dat het slechts een fractie van de computerchips gebruikte waarop toonaangevende AI -bedrijven vertrouwden om hun systemen te trainen.
De topbedrijven ter wereld trainen meestal hun chatbots met supercomputers die maar liefst 16.000 chips of meer gebruiken. De ingenieurs van Deepseek zeiden dat ze slechts ongeveer 2.000 nvidia -chips nodig hadden.
Waarom is dat belangrijk?
Sinds eind 2022, toen Openai de AI -boem vertrok, was het heersende idee dat de krachtigste AI -systemen niet konden worden gebouwd zonder miljarden dollars te investeren in gespecialiseerde AI -chips. Dat zou betekenen dat alleen de grootste technologiebedrijven – zoals Microsoft, Google en Meta, die allemaal in de Verenigde Staten zijn gevestigd – het zich kunnen veroorloven om de toonaangevende technologieën te bouwen.
(The New York Times heeft aangeklaagd OpenAI en haar partner, Microsoft, claimt inbreuk op het auteursrecht van nieuwsinhoud met betrekking tot AI -systemen. De twee technologiebedrijven hebben de claims van het pak ontkend.)
Maar de ingenieurs van Deepseek zeiden dat ze slechts ongeveer $ 6 miljoen nodig hadden om hun nieuwe systeem te trainen. Dat was ongeveer 10 keer minder dan wat Meta besteedde aan het bouwen van zijn nieuwste AI -technologie.
Hoe heeft Deepseek zijn technologie gemaakt met minder AI -chips?
Top AI -ingenieurs in de Verenigde Staten zeggen dat het onderzoekspaper van Deepseek slimme en indrukwekkende manieren heeft uiteengezet om AI -technologie met minder chips op te bouwen.
Kortom, de ingenieurs van de startup demonstreerden een efficiëntere manier om gegevens te analyseren met behulp van de chips. Toonaangevende AI -systemen leren hun vaardigheden door patronen in enorme hoeveelheden gegevens te lokaliseren, waaronder tekst, afbeeldingen en geluiden. Deepseek beschreef een manier om deze gegevensanalyse te verspreiden over verschillende gespecialiseerde AI -modellen – wat onderzoekers een “mix van experts” -methode noemen – terwijl de tijd wordt verloren door gegevens van plaats naar plaats te verplaatsen.
Anderen hebben eerder vergelijkbare methoden gebruikt, maar het verplaatsen van informatie tussen de modellen had de neiging om de efficiëntie te verminderen. Deepseek deed dit op een manier die het mogelijk maakte om minder rekenkracht te gebruiken.
“Het is heel duidelijk geworden dat andere bedrijven, niet alleen iemand als Openai, dit soort systemen kunnen bouwen,” zei Tim Dettmers, een onderzoeker bij het Allen Institute for Artificial Intelligence in Seattle en een professor in informatica aan de Carnegie Mellon University die Gespecialiseerd in het bouwen van efficiënte AI -systemen. “Deepseek gebruikte methoden die iedereen kan dupliceren.”
Het onderzoekspaper van DeepSeek riep vragen op of grote Amerikaanse bedrijven een belangrijke voorsprong kunnen behouden in AI, veel experts zijn van mening dat AI -technologie een handelswaar zal worden, waarbij veel bedrijven veel hetzelfde product verkopen.
Is Deepseek’s technologie zo goed als systemen van Openai en Google?
Deepseek-V3 kan vragen beantwoorden, logische problemen oplossen en zijn eigen computerprogramma’s zo effectief schrijven als alles wat al op de markt is, volgens standaard benchmarktests.
Vlak voordat Deepseek zijn technologie uitbracht, had Openai een nieuw systeem onthuld, Openai O3 genoemddie krachtiger leek dan Deepseek-V3. Maar Openai heeft dit systeem niet vrijgegeven aan het bredere publiek.
Openai O3 is ontworpen om te ‘redeneren’ door problemen met wiskunde, wetenschap en computerprogrammering. Veel experts wezen erop dat Deepseek geen redeneermodel had opgebouwd in deze lijnen, wat wordt gezien als de toekomst van AI
Toen op 20 januari bracht Deepseek zijn eigen redeneermodel uit genaamd Deepseek R1, en het maakte ook indruk op de experts. Dat bracht ons uiteindelijk beleggers en anderen eind vorige week en in het weekend in paniek toen ze zich het belang van Deepseek’s nieuwe technologie realiseerden.
Amerikaanse tech -reuzen bouwen datacenters met gespecialiseerde AI -chips. Maakt dit nog steeds uit, gezien wat Deepseek heeft gedaan?
Ja, het doet er nog steeds toe.
Grote aantallen AI -chips kunnen bedrijven op veel manieren nog steeds helpen. Met meer chips kunnen ze meer experimenten uitvoeren terwijl ze nieuwe manieren verkennen om AI te bouwen met andere woorden, meer chips kunnen bedrijven nog steeds een technisch en concurrentievoordeel geven.
Meer chips zullen ook nodig zijn om het nieuwe ras van “redeneren” AI -modellen te bedienen, zeiden experts. Deze vereisen meer rekenkracht wanneer mensen en bedrijven ze gebruiken.
Hebben de Verenigde Staten niet het aantal NVIDIA -chips beperkt dat aan China wordt verkocht?
Ja. Om de Amerikaanse voorsprong in de wereldwijde AI -race te handhaven, had de Biden -administratie regels ingevoerd die het aantal krachtige chips beperken dat aan China en andere rivalen kon worden verkocht.
Maar de indrukwekkende prestaties van het DeepSeek -model riep vragen op over de onbedoelde gevolgen van de handelsbeperkingen van de Amerikaanse regering. De bedieningselementen hebben onderzoekers in China gedwongen om creatief te worden met een breed scala aan tools die vrij beschikbaar zijn op internet.
Sommige experts blijven pleiten voor Amerikaanse handelsbeperkingen en zeggen dat ze pas recent zijn opgezet en dat ze een groter effect zullen hebben op de capaciteiten van China om AI te creëren naarmate de jaren verstrijken.
Betekent de technologie van Deepseek dat China nu de Verenigde Staten voor is in AI?
Nee. De wereld heeft het O3 -model van Openai nog niet gezien en de prestaties op standaardbenchmarktests waren indrukwekkender dan iets anders op de markt. Maar experts zijn bezorgd dat China vooruit springt op open-source AI-systemen.
Wat is open-source AI precies?
Zoals veel andere bedrijvenDeepseek heeft zijn nieuwste AI -systeem “open”, wat betekent dat het de onderliggende computercode heeft gedeeld met andere bedrijven en onderzoekers. Hierdoor kunnen anderen hun eigen producten bouwen en distribueren met dezelfde technologieën.
Dit is een deel van de reden dat Deepseek en anderen in China in staat zijn geweest om competitieve AI -systemen zo snel en goedkoop te bouwen.
In de AI -wereld verzamelde open source voor het eerst stoom in 2023 toen Meta deelde vrijelijk een AI -systeem genaamd LLAMA. Destijds gingen velen ervan uit dat het open-source ecosysteem alleen zou floreren als bedrijven als meta-gigantische bedrijven met enorme datacenters vol met gespecialiseerde chips-hun technologieën zouden blijven openen.
Maar Deepseek en anderen hebben aangetoond dat dit ecosysteem kan gedijen op manieren die verder gaan dan de Amerikaanse technische reuzen.
Waarom is dat belangrijk?
Veel experts hebben betoogd dat de grote Amerikaanse bedrijven hun technologieën niet moeten openen omdat Ze kunnen worden gebruikt om desinformatie te verspreiden of andere ernstige schade aan te richten. Sommige Amerikaanse wetgevers hebben de mogelijkheid onderzocht om de praktijk te voorkomen of te smoren.
Maar andere experts hebben betoogd dat als toezichthouders de voortgang van open-source technologie in de Verenigde Staten verstikken, China een aanzienlijk voordeel zal krijgen. Als de beste open-source technologieën uit China komen, stellen deze experts dat Amerikaanse onderzoekers en bedrijven hun systemen bovenop die technologieën zullen bouwen.
Op de lange termijn zou dat China centraal kunnen stellen in AI -onderzoek en ontwikkeling, die zijn inspanningen verder zou kunnen versnellen om een breed scala aan AI -technologieën op te bouwen, waaronder autonome wapens en andere militaire systemen.