Hoe AI -chatbots zoals Chatgpt en Deepseek Reden zoals
In september onthulde Openai een nieuwe versie van Chatgpt ontworpen om te redeneren door taken met wiskunde, wetenschap en computerprogrammering. In tegenstelling tot eerdere versies van de chatbot, zou deze nieuwe technologie tijd kunnen besteden aan ‘denken’ door complexe problemen voordat hij zich vestigt op een antwoord.
Al snel zei het bedrijf dat zijn nieuwe redeneringstechnologie had gedaan overtrof de toonaangevende systemen van de industrie op een reeks van Tests die de voortgang van kunstmatige intelligentie volgen.
Nu andere bedrijven, zoals Google,, Antropisch en die van China Diepeekbieden vergelijkbare technologieën.
Maar kan AI eigenlijk als een mens redeneren? Wat betekent het voor een computer om te denken? Naderen deze systemen echt echte intelligentie?
Hier is een gids.
Wat betekent het als een AI -systeem redeneert?
Redeneren betekent gewoon dat de chatbot wat extra tijd besteedt aan het werken aan een probleem.
“Redenering is wanneer het systeem extra werk doet nadat de vraag is gesteld,” zei Dan Klein, een professor informatica aan de Universiteit van Californië, Berkeley en Chief Technology Officer van Scaled Cognition, een AI-start-up.
Het kan een probleem in individuele stappen breken of proberen het door vallen en opstaan op te lossen.
De originele chatgpt beantwoordde onmiddellijk vragen. De nieuwe redeneringssystemen kunnen enkele seconden – of zelfs minuten – een probleem doorlopen voordat ze beantwoordden.
Kun je specifieker zijn?
In sommige gevallen zal een redeneringssysteem zijn benadering van een vraag verfijnen en herhaaldelijk proberen de methode die het heeft gekozen te verbeteren. Andere keren kan het verschillende manieren proberen om een probleem te benaderen voordat het zich op een van hen vestigt. Of het kan teruggaan en wat werk controleren, het deed een paar seconden eerder, alleen om te zien of het correct was.
Kortom, het systeem probeert alles wat het kan om uw vraag te beantwoorden.
Dit is een soort van een leerschoolstudent die moeite heeft om een manier te vinden om een wiskundeprobleem op te lossen en verschillende opties op een vel papier te krabbelt.
Wat voor soort vragen vereisen een AI -systeem om te redeneren?
Het kan mogelijk overal redeneren. Maar redeneren is het meest effectief wanneer u vragen stelt met betrekking tot wiskunde, wetenschap en computerprogrammering.
Hoe verschilt een redeneerchatbot van eerdere chatbots?
Je zou eerder chatbots kunnen vragen om je te laten zien hoe ze een bepaald antwoord hadden bereikt of om hun eigen werk te controleren. Omdat het originele chatgpt van tekst op internet had geleerd, waar mensen lieten zien hoe ze een antwoord hadden gekregen of hun eigen werk hadden gecontroleerd, kon dit ook dit soort zelfreflectie doen.
Maar een redeneringssysteem gaat verder. Het kan dit soort dingen doen zonder gevraagd te worden. En het kan ze op uitgebreidere en complexe manieren doen.
Bedrijven noemen het een redeneringssysteem omdat het voelt alsof het meer werkt als een persoon die een moeilijk probleem nadenkt.
Waarom is AI redeneren nu belangrijk?
Bedrijven als Openai geloven dat dit de beste manier is om hun chatbots te verbeteren.
Jarenlang vertrouwden deze bedrijven op een eenvoudig concept: hoe meer internetgegevens ze in hun chatbots hebben gepompt, hoe beter die systemen presteerden.
Maar in 2024, zij opgebruikt bijna alle tekst op internet.
Dat betekende dat ze een nieuwe manier nodig hadden om hun chatbots te verbeteren. Dus begonnen ze redeneringssystemen te bouwen.
Hoe bouw je een redeneringssysteem?
Vorig jaar begonnen bedrijven als Openai zwaar te leunen op een techniek genaamd wapening leren.
Via dit proces – dat meer dan maanden kan verlengen – kan een AI -systeem gedrag leren door uitgebreide vallen en opstaan. Door duizenden wiskundige problemen te doorlopen, kan het bijvoorbeeld leren welke methoden leiden tot het juiste antwoord en welke niet.
Onderzoekers hebben complexe feedbackmechanismen ontworpen die het systeem laten zien wanneer het iets goed heeft gedaan en wanneer het iets verkeerd heeft gedaan.
“Het is een beetje als het trainen van een hond,” zei Jerry Tworek, een Openai -onderzoeker. “Als het systeem het goed doet, geef je het een cookie. Als het niet goed gaat, zeg je: ‘Bad Dog.'”
(The New York Times aangeklaagd OpenAI en zijn partner, Microsoft, in december voor inbreuk op het auteursrecht van nieuwsinhoud met betrekking tot AI -systemen.)
Werkt het leren van versterking?
Het werkt vrij goed op bepaalde gebieden, zoals wiskunde, wetenschap en computerprogrammering. Dit zijn gebieden waar bedrijven duidelijk het goede gedrag en het slechte kunnen definiëren. Wiskundeproblemen hebben definitieve antwoorden.
Versterkings leren werkt niet zo goed op gebieden als creatief schrijven, filosofie en ethiek, waar de onderscheid tussen goed en slecht is moeilijker vast te stellen. Onderzoekers zeggen dat dit proces in het algemeen de prestaties van een AI -systeem kan verbeteren, zelfs wanneer het vragen beantwoordt buiten wiskunde en wetenschap.
“Het leert geleidelijk welke redeneringspatronen het in de goede richting leiden en welke niet,” zei Jared Kaplan, Chief Science Officer bij Anthropic.
Zijn versterkingsonderwijs- en redeneersystemen hetzelfde?
Nee. Versterking leren is de methode die bedrijven gebruiken om redeneersystemen te bouwen. Het is de trainingsfase die chatbots uiteindelijk toestaat om te redeneren.
Maken deze redeneersystemen nog steeds fouten?
Absoluut. Alles wat een chatbot doet, is gebaseerd op waarschijnlijkheden. Het kiest een pad dat het meest lijkt op de gegevens die het heeft geleerd – of die gegevens van internet kwamen of werden gegenereerd door middel van versterking. Soms kiest het een optie die verkeerd is of niet logisch is.
Is dit een pad naar een machine die overeenkomt met menselijke intelligentie?
AI -experts zijn verdeeld over deze vraag. Deze methoden zijn nog relatief nieuw en onderzoekers proberen nog steeds hun grenzen te begrijpen. In het AI -veld vorderen nieuwe methoden in het begin vaak zeer snel, voordat ze vertraagden.