Tech

OpenAI ritarda il nuovo Voice Mode di ChatGPT

Mars nordic Saturday, July 13 2024

A Maggio, quando OpenAI ha presentato per la prima volta una modalità vocale avanzata, quasi in tempo reale e inquietantemente realistica, per la piattaforma di chatbot alimentata da intelligenza artificiale ChatGPT, l'azienda ha dichiarato che la funzionalità sarebbe stata rilasciata agli utenti paganti di ChatGPT entro poche settimane.

Mesi dopo, OpenAI dichiara di aver bisogno di più tempo.

In un post sul server Discord ufficiale di OpenAI, l'azienda afferma che aveva previsto di iniziare a distribuire la modalità vocale avanzata in versione alpha a un piccolo gruppo di utenti ChatGPT Plus alla fine di Giugno, ma problemi persistenti hanno costretto a posticipare il lancio a Luglio.

“Ad esempio, stiamo migliorando la capacità del modello di rilevare e rifiutare determinati contenuti,” scrive OpenAI. “Stiamo anche lavorando al miglioramento dell'esperienza utente e alla preparazione della nostra infrastruttura per scalare a milioni di utenti mantenendo risposte in tempo reale. Come parte della nostra strategia di distribuzione iterativa, inizieremo la alpha con un piccolo gruppo di utenti per raccogliere feedback ed espanderemo in base a ciò che apprendiamo.”

La modalità vocale avanzata potrebbe non essere lanciata per tutti i clienti ChatGPT Plus fino all'autunno, dice OpenAI, a seconda che superi determinati controlli interni di sicurezza e affidabilità. Il ritardo non influirà tuttavia sul lancio delle nuove funzionalità di condivisione video e schermo dimostrate separatamente durante l'evento stampa della primavera di OpenAI.

Queste funzionalità includono la risoluzione di problemi matematici dati un'immagine del problema, e spiegare vari menu delle impostazioni su un dispositivo. Sono progettate per funzionare su ChatGPT su smartphone così come su client desktop, come l'app per macOS, resa disponibile a tutti gli utenti di ChatGPT in data odierna.

“La modalità vocale avanzata di ChatGPT può comprendere e rispondere con emozioni e segnali non verbali, portandoci più vicini a conversazioni in tempo reale e naturali con l'IA,” scrive OpenAI. “La nostra missione è portare queste nuove esperienze a voi in modo ponderato.”

Sul palco all'evento di lancio, i dipendenti di OpenAI hanno mostrato ChatGPT che risponde quasi istantaneamente a richieste come risolvere un problema matematico su un foglio di carta posto di fronte alla fotocamera dello smartphone di un ricercatore.

La modalità vocale avanzata di OpenAI ha generato molta controversia per la somiglianza della voce predefinita "Sky" con l'attrice Scarlett Johansson. Johansson ha successivamente rilasciato una dichiarazione dicendo che ha assunto consulenti legali per informarsi sulla voce e ottenere dettagli precisi su come è stata sviluppata – e che ha rifiutato ripetute sollecitazioni da parte di OpenAI per concedere in licenza la sua voce per ChatGPT.

OpenAI, pur negando di aver usato la voce di Johansson senza autorizzazione o un sosia, ha successivamente rimosso la voce incriminata.

Mars nordic