Nyheter24
Annons

Nya verktyget skapar en podd av vad som helst

Publicerad: 20 okt. 2024, kl. 11:00
Notebook LM kan utifrån uppladdade texter skapa en ljudfil som består av två podcastvärdar som pratar om innehållet. Foto: Anders Humlebo

En ny AI-tjänst skapar en dialog mellan två röster – som ett poddavsnitt – utifrån i princip vilket dokument som helst. Det har fått ett anonymt anteckningsverktyg att bli en snackis. Vi tyckte själva att det var coolt, säger produktchefen Raiza Martin.

Teknikjätten Google ligger bakom mängder med olika verktyg, varav många inte når en särskilt bred publik. Så var det med Notebook LM, en tjänst för att hålla ordning på anteckningar och dokument, som låter användaren ställa frågor om innehållet via en chattbot.

— Det är ett verktyg som låter dig förstå dina källor, säger Raiza Martin vid Google Labs.

Bildtext: Notebook LM, Googles tjänst för att hantera anteckningar. Pressbild.
Bildtext: Notebook LM, Googles tjänst för att hantera anteckningar. Pressbild.

"Blir ödmjuk"

Men när Google för några veckor sedan släppte en ljudfunktion blev tjänsten viral. Notebook LM kan nämligen utifrån i princip vilket dokument som helst generera en ljudfil, bestående av två podcastvärdar som pratar om innehållet i materialet. Användare har testat att skapa poddavsnitt av allt från sina räkningar till komplexa rapporter. Vad som än stoppas in försöker verktyget skapa ett intresseväckande samtal. Raiza Martin säger att hon är överraskad av genomslaget, även om man också internt tycker att funktionen är häftig.

Annons

— Men man blir ödmjuk när man inser att många andra också tycker att det är väldigt coolt, säger hon.

'Vi har de här väldigt kraftfulla modellerna, men det är en mänsklig uppgift att fundera på vad man använder dem till', säger produktchefen Raiza Martin. Pressbild.
"Vi har de här väldigt kraftfulla modellerna, men det är en mänsklig uppgift att fundera på vad man använder dem till", säger produktchefen Raiza Martin. Pressbild.

Podd-värdarna stannar upp, ändrar tonläge och kommenterar innehållet på en människolikt sätt. Exakt hur det går till är hemligt.

— Men mycket tankeverksamhet har lagts på vilken typ av ljud som vi tycker är det mest intressanta. Och det var så vi bestämde oss för den här samtalsstilen, med två värdar som ger en överblick av ditt innehåll och försöker att göra det så intressant som möjligt, säger hon.

Med tanke på det verklighetstrogna resultatet är det ett oväntat litet team som jobbar med Notebook LM. Arbetet inleddes av Martin och ett par andra i slutet av 2022. I maj förra året var man tre ingenjörer, och gruppen växte till åtta innan ljudfunktionen släpptes.

Fortsatt utveckling

Nu har gruppen vuxit och det pågår arbete med fler språk. Det ska också vara möjligt att styra podden mer, och inom några månader ska användaren i realtid kunna flika in med egna frågor. Google uppger att materialet som laddas upp inte används för att träna AI-modellen och att filerna är skyddade.

Men finns det risk att tjänsten slår ut riktiga poddare? Raiza Martin säger att utvecklingen följs noga. Hittills rör det sig mest om användare som laddar upp sitt cv – eller skapar poddar om sin hemsida.

— Det rör sig om folk som skapar ljud av saker som det annars inte hade blivit ljud av ändå, säger hon.

Fakta: Notebook LM

Notebook LM är en tjänst där användaren kan ladda upp uppemot 50 filer. Därutöver kan användaren få sammanfattningar och ställa frågor om dokumenten, med hjälp av Googles AI-modell Gemini 1.5.

Hittills stöds ljudfiler, Youtubelänkar, pdf, textfiler, docs och slides.

Tjänsten är gratis, och Google uppger att man inte tränar AI-modellen på det material som laddas upp.

Notebook LM har en Discordkanal med 60 000 användare, där alla i utvecklingsgruppen också deltar.

Kommentarer

Du måste vara inloggad för att kunna kommentera eller svara på andra kommentarer.

Annons
Annons
Annons