OpenAI está lanzando por fin su asistente de voz a los suscriptores de ChatGPT Plus, pero le faltan algunas de las funciones que la empresa mostró en su demostración original.
El Modo Avanzado de Voz (AVM) se demostró por primera vez en mayo, pero las preocupaciones sobre alineación de seguridad y la capacidad de AVM para reproducir contenidos protegidos por derechos de autor paralizaron su lanzamiento. La polémica sobre una de las voces llamada "Sky" sonando mucho como Scarlett Johansson probablemente tampoco ayudó.
OpenAI aludió con humor a la frustrante espera de AVM en su anuncio de la puesta en marcha.
Advanced Voice se está implantando para todos los usuarios Plus y Team en el ChatGPT a lo largo de la semana.
Mientras esperabas pacientemente, hemos añadido instrucciones personalizadas, memoria, cinco voces nuevas y acentos mejorados.
También puede decir "Siento llegar tarde" en más de 50 idiomas. pic.twitter.com/APOqqhXtDg
- OpenAI (@OpenAI) 24 de septiembre de 2024
AVM viene con cinco nuevas voces, incluida una con acento australiano, pero los fans de la película "Her" se sentirán decepcionados al descubrir que se ha eliminado la voz de Sky. Las nuevas voces son Arbor, Maple, Sol, Spruce y Vale, con lo que el total asciende a nueve.
Conozca a las cinco nuevas voces. pic.twitter.com/F9BOUaJqG1
- OpenAI (@OpenAI) 24 de septiembre de 2024
Otra función que los usuarios aún no tendrán es la capacidad de visión de AVM. Cuando OpenAI hizo la demostración original del asistente de voz, éste podía acceder a la cámara del teléfono y responder a datos visuales. Por ahora, AVM sólo dispone de la modalidad de voz.
No se sabe cuándo, o si, AVM obtendrá el don de la vista. Podría tratarse simplemente de un movimiento estratégico para reducir las exigencias informáticas de los servidores de OpenAI mientras los usuarios se apresuran a probar AVM.
Sin embargo, AVM incorpora algunas funciones nuevas. AVM almacenará las "instrucciones personalizadas" del usuario sobre cómo quiere que hable el modelo. Puede especificar una cadencia concreta o cómo quiere que se dirija a usted. También permite al usuario proporcionar antecedentes personales para que la AVM pueda ofrecer respuestas más relevantes en función del contexto.
La función de "memoria" permite a ChatGPT recordar conversaciones para consultarlas en interacciones posteriores.
Los usuarios ya están compartiendo vídeos de formas creativas de utilizar AVM.
Voz avanzada en ChatGPT afina mi guitarra. pic.twitter.com/1H6mYZTCq7
- Pietro Schirano (@skirano) 24 de septiembre de 2024
Si se encuentra en el Reino Unido, la UE o Suiza, es posible que tenga que esperar un tiempo antes de que AVM se active en su dispositivo. OpenAI no ha indicado cuándo se desplegará la función en todo el mundo.