
VER RESUMEN
Herramienta desarrollada por BioBioChile
OpenAI lanzó ChatGPT-4o, su nueva versión mejorada y gratuita del popular chatbot, que destaca por sus capacidades en texto, visión y audio, con una respuesta rápida similar a la humana. Mira Murati, jefa tecnológica de la empresa, destacó en una sesión online que esta versión es un gran avance en facilidad de uso. Según la compañía, GPT-4o acepta combinaciones de texto, audio e imagen y genera salidas en segundos. Sam Altman, máximo ejecutivo de OpenAI, lo describió como el mejor modelo hasta la fecha, multimodal y disponible para todos, incluidos usuarios gratuitos, funcionando también como traductor en tiempo real. La nueva función de voz y video ha sorprendido por su nivel de realismo y expresividad, acercándose al nivel humano.
La empresa de Inteligencia Artificial (IA) OpenAI presentó este lunes ChatGPT-4o (con la “o” significando “omni”), la nueva versión gratuita, más rápida y con capacidades mejoradas de su popular ‘chatbot’.
La jefa tecnológica Mira Murati, en una sesión abierta y retransmitida por internet, dijo que esta versión “mejora sus capacidades en texto, visión y audio”, y que supone un “gran paso adelante” en su facilidad de uso.
Según asegura la compañía, GPT-4o “acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen. Puede responder a entradas de audio en tan solo 232 milisegundos, con una media de 320 milisegundos, lo que es similar al tiempo de respuesta humano en una conversación”.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
El máximo ejecutivo de OpenAI, Sam Altman, destacó en Twitter/X que ChatGPT-4o es “el mejor modelo hasta la fecha”, “multimodal” y disponible para todos los usuarios, incluidos los del plan gratuito.
También funcionaría como un traductor en tiempo real, demostraron mediante un video en la red social.
audience request to act as a translator pic.twitter.com/E2qbfhyVmX
— Sam Altman (@sama) May 13, 2024
“El nuevo modo de voz (y vídeo) es la mejor interfaz de cálculo que he usado nunca. Parece una IA de las películas; y todavía me sorprende un poco que sea real. Llegar a tiempos de respuesta y expresividad de nivel humano resulta ser un gran cambio”, aseguró Altman mediante su blog personal.