Click acá para ir directamente al contenido

ChatGPT: actualización le permitirá "ver, oír y hablar"

Hasta ahora solo se podía interactuar con las distintas versiones de ChatGPT por escrito, pero los usuarios de pago en "dos semanas" podrán tener una conversación en voz alta y escuchar las respuestas de la máquina.

24horas.cl

ChatGPT. Celular.

Martes 26 de septiembre de 2023

OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció este lunes una nueva versión de su popular herramienta que es capaz de "ver, oír y hablar" en voz alta con los usuarios.

LEE TAMBIÉN 

Hasta ahora solo se podía interactuar con las distintas versiones de ChatGPT por escrito, pero los usuarios de pago en "dos semanas" podrán tener una conversación en voz alta y escuchar las respuestas de la máquina, así como mandar fotos, imágenes, capturas de pantalla y documentos al chat para obtener respuestas específicas.

ChatGPT. Celular.

Por su parte, los que usan la versión gratuita de esta herramienta podrán sacarle partido a estas nuevas actualizaciones "poco después", según OpenAI.

ChatGPT: ¿para quiénes estará disponible la nueva versión?

Por ahora, este asistente de voz -que es similar a Alexa, de Amazon, y a Siri, de Apple,- estará disponible para iOS y Android, pero no en PC.

Se podrán elegir entre cinco voces distintas, aunque la voz de ChatGPT que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.

ChatGPT. inteligencia artificial. Chat.

ChatGPT: la IA ahora también puede hablar 

Mediante Whisper -herramienta de OpenAI que usa la IA para trascribir audio- se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina en ChatGPT.

"Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude", advierte la empresa.

OpenAI, además, anunció hoy que la plataforma de música Spotify está utilizando el "poder de esta tecnología para traducir algunos de sus pódcast a "idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados".