Economie

De nieuwe AI-tool van Google gebruikt beeldprompts in plaats van tekst



CNN

Met de nieuwste tool voor kunstmatige intelligentie van Google, ‘Whisk’, kunnen mensen foto’s uploaden om een ​​gecombineerd, door AI gegenereerd beeld terug te krijgen – zelfs zonder dat gebruikers tekst invoeren om uit te leggen wat ze willen.

Gebruikers kunnen afbeeldingen invoeren die onderwerpen, setting en stijl weergeven voordat Whisk alles in één afbeelding combineert.

Whisk is een ‘creatieve tool’ voor snelle inspiratie, zei Google in een blogpostin tegenstelling tot een ‘traditionele afbeeldingseditor’. In wezen is Whisk bedoeld als een leuke AI-functie, en niet als iets dat verfijnd professioneel werk zou moeten zijn.

Grote technologiebedrijven als Google en OpenAI haasten zich om consumentenproducten uit te brengen die toepassingen voor de hippe nieuwe technologie kunnen demonstreren, ook al waarschuwen nee-zeggers dat het gebrek aan vangrails rond de ontwikkeling van AI gevaren voor de mensheid met zich meebrengt.

Sinds OpenAI in 2021 voor het eerst zijn tool voor het maken van tekst naar afbeeldingen, Dall-E, lanceerde, is het concept van door AI gegenereerde kunstwerken overspoelde sociale media en een focus van consumentenproducten worden. Google’s Whisk is een afbeelding-naar-afbeelding-generator, die voortbouwt op het populaire concept van tekst-naar-afbeelding-generatoren.

Mensen die Whisk gebruiken, kunnen de uiteindelijke afbeelding ‘remixen’ door hun invoer te bewerken en de categorieën te mixen om verschillende afbeeldingen te produceren zoals een knuffel, emaille pin of sticker. Gebruikers kunnen tekst toevoegen als ze bepaalde details willen regisseren, maar het is niet vereist om een ​​beeld te creëren.

“Whisk is ontworpen om gebruikers in staat te stellen een onderwerp, scène en stijl op nieuwe en creatieve manieren te remixen, waardoor snelle visuele verkenning mogelijk wordt in plaats van pixel-perfecte bewerkingen”, zegt Thomas Iljic, directeur productmanagement bij Google Labs, in een verklaring.

Google’s Whisk is gebouwd op de generatieve AI ontwikkeld door DeepMind, het AI-lab dat Google in 2014 heeft overgenomen.

Een algemeen beeld van de Google DeepMind-kantoren na de aankondiging dat oprichter en CEO Demis Hassabis en senior onderzoekswetenschapper John M. Jumper op 9 oktober 2024 in Londen, Engeland, de Nobelprijs voor Scheikunde 2024 ontvingen. Twee Google DeepMind-medewerkers deelden de Nobelprijs voor Scheikunde 2024 met David Baker van de Universiteit van Washington, voor ontdekkingen met betrekking tot de structuur van eiwitten.

Whisk werkt door gebruik te maken van het belangrijkste AI-aanbod van Google, Gemini, dat in december 2023 debuteerde, en dit te koppelen aan Imagen 3, de nieuwste tekst-naar-afbeelding-generator die in december door DeepMind werd uitgebracht.

Wanneer gebruikers hun afbeeldingen uploaden, genereert Gemini een bijschrift dat in Imagen 3 wordt ingevoerd. Het proces legt de ‘essentie’ van het onderwerp vast, in tegenstelling tot een exacte replica, waardoor het uiteindelijke beeld opnieuw kan worden gemengd, maar ook betekent dat het eindproduct kan afwijken van de afbeelding. de aanwijzing.

De gegenereerde afbeelding kan bijvoorbeeld een andere hoogte, kapsel of huidskleur hebben dan de promptafbeeldingen, aldus Google in een blogpost.

Wanneer Google eerst uitgerold Gemini’s tekst-naar-afbeelding-maker in februari kreeg het bedrijf te maken met aanvankelijke tegenslag omdat de tool historisch onnauwkeurige afbeeldingen produceerde.

Whisk is voor het eerst beschikbaar als website op Google Labs voor gebruikers in de VS en bevindt zich in de beginfase van ontwikkeling, aldus het bedrijf.

OpenAI sinds kort ook uitgegeven een tekst-naar-videogenerator genaamd Sora, die de concurrentie om consumentenproducten benadrukt.

Dan Ives, algemeen directeur en senior aandelenanalist bij Wedbush Securities, vertelde CNN dat Whisk weer een ‘flex the spiermoment’ is voor Google in de AI- en technologierace.

“DeepMind is een belangrijke troef voor Google”, zei Ives, waarbij hij opmerkte dat AI-producten deel uitmaken van Google’s “schatkist” aan nieuwe producten voor 2025, waaronder ook een nieuw Android-besturingssysteem dat is gebouwd in samenwerking met Samsung en Qualcomm.

Related Articles

Back to top button