Tech

Pocket FM si associa a ElevenLabs per convertire rapidamente gli script in contenuti audio

La piattaforma audio Pocket FM, sostenuta da Lightspeed Ventures, ha appena annunciato di essersi associata alla società di clonazione vocale ElevenLabs per convertire rapidamente i contenuti di testo, come script, in serie audio utilizzando l'Intelligenza Artificiale.

Pocket FM, che ha raccolto $103 milioni in finanziamenti di Serie D a marzo, ha dichiarato a TechCrunch che stava già sperimentando la capacità di convertire i contenuti di testo in audio utilizzando la tecnologia di ElevenLabs. Ora, l'azienda con sede in India ha ampliato la partnership per rendere lo strumento di conversione disponibile a tutti i creatori nelle prossime settimane.

Nella fase di test, Pocket FM ha già prodotto 30.000 ore di serie audio utilizzando la tecnologia AI di ElevenLab. Con il nuovo lancio, la startup prevede di triplicare la sua biblioteca di contenuti di oltre 100.000 ore di contenuti audio quest'anno. Pocket FM ha anche dichiarato che durante la fase sperimentale, gli strumenti alimentati dall'IA hanno aiutato a ridurre del 90% il costo della produzione audio.

Crediti immagine: Pocket FM

Il co-fondatore e CTO di Pocket FM, Prateek Dixit, ha dichiarato a TechCrunch in una chiamata che con questa partnership, l'azienda vuole rendere più facile ai writer convertire le loro scritture in serie audio.

'Abbiamo oltre 250.000 writer (tra cui quelli sulla piattaforma di scrittura di Pocket Novel dell'azienda) e questa partnership diminuisce il costo di allestire e registrare audio per loro,' ha detto.

'Anche con un buon set di strumenti e attrezzature di registrazione, i writer possono produrre circa 30 minuti di contenuto audio di alta qualità al giorno. Con gli strumenti di intelligenza artificiale, questa produttività può essere 10 volte maggiore,' ha aggiunto.

Pocket FM ha creato uno strumento che integra la tecnologia di ElevenLabs, attraverso il quale offre 50 voci per i writer che vogliono convertire i loro contenuti. Il co-fondatore di ElevenLabs, Mati Staniszewski, ha detto che lo strumento della sua azienda comprende il contesto della scrittura e inferisce automaticamente le emozioni tramite la voce.

'Lavorando con Pocket FM, stiamo implementando i nostri nuovi modelli che comprendono meglio il genere della scrittura e sono più emotivi,' ha detto Staniszewski.

Dixit ha osservato che basandosi sui dati riguardanti l'interazione degli utenti con questo tipo di contenuto, la piattaforma prevede anche di suggerire voci che funzionano bene per i writer in un particolare genere.

Pocket FM non è l'unica piattaforma di serie audio che sta sperimentando con strumenti alimentati dall'IA. Kuku FM, sostenuta da Google, sta utilizzando GPT-4, Claude, BandLab e persino ElevenLabs per aiutare i suoi writer in diverse fasi della creazione, tra cui la revisione dello script, la generazione delle miniature, l'aggiunta di effetti sonori e la conversione del testo in audio.

Kuku FM ha dichiarato a TechCrunch che sta anche sperimentando l'uso di strumenti di generazione visiva come MidJourney e Runway per creare annunci relativi al contenuto.

Qualità dei contenuti e impatto sugli artisti

La promessa degli strumenti alimentati dall'IA è quella di generare più contenuti più velocemente, ma ciò non significa che i contenuti siano di buona qualità. La risposta di Pocket FM per facilitare la scoperta e mettere in evidenza contenuti di qualità è rendere il suo algoritmo di scoperta sofisticato e sperimentare l'interazione degli utenti.

'Se un writer pubblica una serie audio, mettiamo in evidenza quel contenuto a un numero selezionato di utenti e osserviamo le metriche di interazione. Se queste metriche sono positive, lo promuoviamo ulteriormente,' ha detto Dixit.

L'utilizzo dell'IA potrebbe portare a risultati più rapidi e a una biblioteca di contenuti più ampia per queste piattaforme, ma ridurrà anche il ruolo degli voice over artist che lavorano con loro. L'Associazione degli Artisti Voiceover dell'India (AVA) ha espresso preoccupazioni sull'IA che prende il sopravvento.

'Se l'IA prende il sopravvento, siamo finiti. Come artisti voice, dobbiamo ottenere una regolamentazione in modo che il nostro sostentamento sia protetto,' ha detto Amarinder Singh Sodhi, segretario generale dell'associazione, a Scroll.

Sodi ha anche raccontato a Scroll di casi in cui gli artisti voiceover venivano chiamati in studio per registrare campioni per addestrare l'IA senza ottenere il loro consenso o informarli.

'A livello emotivo, mi spaventa. Utilizzando l'IA, si sta essenzialmente diluendo l'esperienza umana della narrazione. Si perde un legame emotivo,' ha detto Aditya Mattoo, voice-over artist di Delhi, a TechCrunch.

Ha aggiunto che concedere l'accesso a voci premium a persone che non hanno sviluppato il gusto e la competenza per produrre contenuti di qualità porterà al mercato ad essere inondato da contenuti scadenti.

Quando abbiamo chiesto l'effetto della generazione vocale alimentata dall'IA su Pocket FM, l'azienda non ha risposto direttamente alla domanda. Tuttavia, Dixit ha osservato che l'interazione con i contenuti generati dall'IA nei loro esperimenti è 'buona come la produzione umana di voice-over.' Notevolmente, l'azienda sta anche lavorando su una tecnologia per incorporare voci multiple in un unico output audio.

Sia Pocket FM che Kuku FM attualmente non etichettano i loro contenuti per indicare se è stato utilizzata l'IA nel processo di creazione.

Related Articles

Back to top button Back to top button