OpenAI se adelanta a Google y Apple: el nuevo modo de voz de ChatGPT me dejó sin palabras

OpenAI se adelanta a Google y Apple: el nuevo modo de voz de ChatGPT me dejó sin palabras

  • El nuevo modo avanzado de audio llega a ChatGPT Plus

  • La conversación es tan buena que a veces parece que hablas con un humano

1 comentario Facebook Twitter Flipboard E-mail
Chatgpt Portada

Lo esperaba con ganas y al fin llegó a mi ChatGPT: el modo avanzado de audio logra que conversar con la IA resulte muy humano y sin apenas tiempo de carga entre respuestas; con un sistema de voz realmente natural. Eso sí, de momento sólo en ChatGPT Plus.

La primera vez que hablé con la IA de ChatGPT ya tuve la sensación de sumergirme en la película Her. Pese a que existía cierta barrera entre mi conversación y la respuesta de la máquina, el resultado general siempre me pareció muy convincente. Pero claro, Open AI no podía quedarse en ese punto, sobre todo cuando empresas como Google (Gemini Live) y Apple (Intelligence) avivan la competencia. Con la evolución del modo conversacional de audio Open AI me ha dejado claro que va muy por delante.

El modelo avanzado de voz llega a ChatGPT Plus «para todos»

Chatgpt Audio Avanzado

Tal y como avanzó Open AI, el nuevo modo de audio se ha expandido a todos los usuarios que pagan ChatGPT. Eso sí, con limitaciones, ya que los ciudadanos europeos nos quedamos fuera de la IA evolucionada de voz. Nada que no solucione un VPN.

Para activar la novedad en ChatGPT Plus sólo necesité conectarme a Estados Unidos en mis móviles (es válido tanto para iPhone como para Android) y abrir/cerrar la aplicación hasta que me apareció el aviso de que el modo avanzado de audio estaba disponible. El lenguaje de la app lo tengo en inglés, pero toda la interacción con la IA es en español.

ChatGPT habilita su nuevo sistema de audio con todos los modelos disponibles: desde GPT-4 a o1-preview. Bajo mis pruebas, los mejores resultados se consiguen en GPT-4o, tanto por la naturalidad y calidad de la conversación como por los tiempos de espera entre respuestas. Dado que o1-preview se caracteriza por «razonar» antes de responder, la conversación con él no termina de ser fluida.

Igual que en el modo de audio anterior, toda la conversación con ChatGPT queda transcrita. Eso es útil no sólo para copiar toda la información que suelte, también para retomar en cualquier momento el chat: la IA mantendrá el hilo de la conversación al completo. Y ésta puede circular por cualquier derrotero, doy fe.

Deja sin palabras, aunque aún no es el que Open AI prometió

Chatgpt Audio Avanzado

He estado probando el nuevo modo hablando con la IA de temas banales, le he preguntado sobre dudas concretas de ámbito general, simulé con ella un juego en el que creamos una historia de espías sobre la marcha y hasta puse a ChatGPT a conversar consigo mismo de forma simultánea utilizando dos móviles. Los resultados fueron impresionantes.

Tenía las expectativas altas, no en vano Open AI se encargó de levantarlas con todos los avances que fue mostrando en vídeo. Y, en mi opinión, están más que cumplidas: el nuevo modo de audio diluye la frontera con la máquina hasta que casi desaparece. No lo hace del todo, en especial por los requerimientos para probarlo: el VPN ralentiza la experiencia.

La necesidad de hacer uso de un VPN aumenta la latencia de la conversación, aunque no de forma exagerada

Son dos los aspectos que más me gustan del nuevo modo de audio de ChatGPT:

  • Las inflexiones de la voz. Ríe cuando un humano lo haría, cambia el tono dependiendo de la conversación, guía el hilo de manera proactiva y todo con un tono sorprendentemente natural. Sigue teniendo el defecto de la pronunciación, ChatGPT no habla español a nivel nativo, pero Open AI ha mejorado mucho este punto.
  • El lapso mínimo entre respuestas. Ya he comentado que el VPN ralentiza la experiencia. Pero, aun así, es sorprendentemente rápida: apenas hay latencia entre que hablas con ChatGPT y te responde. La conversación es muy humana.

El salto dado en el modo de voz es enorme, sobre todo por la naturalidad del modelo y por lo bien que se desenvuelve la IA. Además, Open AI añadió cinco nuevas voces, por lo que hay multitud de opciones donde elegir. Cada una con su propio carácter, otro rasgo más de humanidad.

Chatgpt Audio Avanzado Transcripción de conversaciones con ChatGPT

Pese a todo el avance que supone la novedad, siguen faltando opciones que se anunciaron y que, de momento, no se encuentran disponibles. Por ejemplo, el modo de cámara: Open AI mostró cómo el modo avanzado de audio podía describir todo cuanto le rodea (de momento sólo admite interacciones con vez). Aun así, la evolución es notoria: Open AI se lo ha puesto muy difícil a la competencia.

Imagen de portada | Iván Linares

En Xataka Móvil | Qué hacer si te sale publicidad y anuncios en tu teléfono móvil

En Xataka Móvil | 192.168.1.1 o 192.168.0.1: cómo entrar en el router y configurar la conexión

Inicio