Google werkt aan een nieuw AI-product dat bestaande chatbots moet overtreffen: ‘Gemini’.
Bij het beschikbaar komen van de verschillende chatbots zoals ChatGPT en Bing, bleef Google aanvankelijk opvallend afwezig. Intern kondigde een van de grootste internetbedrijven ‘code rood’ af: alles moest aangewend worden om mee te kunnen doen met de “AI-wedloop”. Een aantal maanden later werd ook Google’s Bard wereldwijd beschikbaar. Daarmee verdienden ze bij Google echter geen rustpauze: er wordt naarstig gewerkt aan het volgende AI-product, dat de naam ‘Gemini’ zal krijgen.
Gemini zou deze herfst beschikbaar moeten komen. Google’s huidige chatbot, Bard, wordt over het algemeen bekeken als iets minder krachtig dan zijn concurrenten ChatGPT en Bing. Met Gemini wil Google echter meteen op een ander, hoger plan gaan spelen. De bedoeling is niet meer om te concurreren met de bots van OpenAI en Microsoft, maar om ze regelrecht te overtreffen.
Daarvoor haalt Google heel wat talent binnen. Verschillende leden van Google Brain en DeepMind zouden momenteel samenwerken aan Gemini. Onder hen zijn grote namen als Paul Barham, onderzoeker bij Google, en Tom Hennigan, onderzoeker bij DeepMind. Ook de co-oprichter van Google, Sergey Brin, komt sinds 2022 opnieuw met regelmaat naar de Google-kantoren. Hij zou een belangrijke rol spelen in het trainen en evalueren van de taalmodellen achter Gemini.
Tekst én beeld
Hoe Google de concurrentie precies wilt overtreffen? Op basis van een anonieme bron, die aan The Information enige details over het project verklapte, weten we dat het achterliggende taalmodel erg groot moeten worden. Meer nog: Gemini zou zich niet enkel focussen op taal, maar zou meteen beeldverwerking in zich integreren.
Gemini zou daardoor niet alleen ChatGPT-gewijst tekst kunnen genereren, maar zou ook meteen met afbeeldingen aan de slag kunnen. Je zou, met andere woorden, aan de chatbot kunnen vragen om een tekening te maken of afbeelding te genereren. Google zou echter meer functies willen toevoegen: heb je een grafiek of een diagram om te interpreteren? Ook dat zou Gemini voor elkaar moeten krijgen.
Gemini zou, volgens de anonieme bron, getraind worden met YouTube-video’s en bijbehorende transcripten. Daarbij houdt een team van advocaten nauwgezet in de gaten welke data er voor die training gebruikt worden. Op die manier wil Google ervoor zorgen dat het auteursrecht steeds gerespecteerd wordt.
De vraag is natuurlijk of zo’n uitgebreid model biedt waar gebruikers naar zoeken – en of het niet beter is om specifieke chatbots te gebruiken, afhankelijk van wat je precies nodig hebt.