OpenAI ha revelado su nuevo modelo de inteligencia artificial, GPT-4o, que destaca por sus capacidades para tener conversaciones en tiempo real de la misma forma que lo haría un humano.

Publicado por: La nota central

Ciencia y Tecnologia

13 mayo, 2024

CHAT_GPT_OPENAI

#CienciayTecnología Durante una actualización de primavera, OpenAI mostró qué es capaz de realizar este nuevo modelo de IA, resolver ecuaciones en tiempo real, analizar código, pero también contar historias en tiempo real (cambiando de entonación a gusto del usuario), servir como traductor instantáneo, y hasta siendo capaz de analizar el rostro de una persona.

Explicando el modelo
De acuerdo con OpenAI, GPT-4o es un nuevo modelo multimodal capaz de utilizar de forma nativa diferentes entradas de contenido, audio, visión, y texto en tiempo real, lo que vuelve la interacción «mucho más natural», siendo también más rápido en sus respuestas.

Esto se debe a una nueva forma de entrenamiento, de extremo a extremo, donde la IA procesa en la misma red neuronal todas las entradas y salidas de texto, visión y audio.

De forma simple, este cambio altera la manera en que analizaba el contenido. Hasta ahora, la IA debía realizar tres pasos: transcribir una entrada de audio a texto, generar el texto de la respuesta y convertirla en audio nuevamente para compartirla con el usuario.

Este proceso hacía que ChatGPT perdiera información al no poder analizar detalles como tonos, o si había múltiples participantes, pero también limitándose en su capacidad para emitir risas, cantar o expresar emociones.

Justamente esa es una de las áreas que mejoran con GPT-4o, pues ahora la IA, además de poder mantener las conversaciones en tiempo real, también puede agregar tonos y transmitir distintas emociones en su voz, e interactuar en tiempo real con contenido, gracias a una función de cámara en vivo dentro de su app para smartphones.

Según la compañía, GPT-4o tiene un rendimiento de nivel GPT-4 Turbo en texto, pero también en los apartados de razonamiento e inteligencia de codificación, aunque utiliza menos tokens para poder procesar el contenido, haciéndolo «más económico», algo especialmente útil para los desarrolladores que utilizan su API.

Las demostraciones de GPT-4o
En la presentación se mostraron algunos de estos detalles, pues al solicitarle contar una historia, distintos usuarios podían pedir cambios en la manera de contarla, pronunciarla de forma «más emotiva» o hasta cambiar la narración por una voz robótica.

Demostracion Historia Gpt 4o
La demostración de GPT-4o contando una historia
El nuevo modelo también se probó en otros entornos, ayudando a los presentadores a resolver una ecuación lineal, paso a paso en tiempo real mientras apuntaban la cámara de su smartphone al problema, y para hacer traducciones entre dos personas, de italiano a inglés, de forma prácticamente instantánea.

Al igual que los otros modelos, GPT-4o es capaz de analizar también código paso a paso, y dar retroalimentación al usuario sobre cómo funciona, pero también con explicaciones de información que se encuentre en formato de gráfica, por ejemplo.

Disponibilidad de GPT-4o
Uno de los elementos más destacados de este nuevo modelo es que estará disponible prácticamente para todos los usuarios, es decir, llegará tanto de forma gratuita, aunque con limitaciones, como para aquellos que estén suscritos en algunos de sus planes.

Según OpenAI, desde el miércoles 13 de mayo se estarán implementando en ChatGPT las capacidades de texto e imagen del modelo de forma gratuita, y para los usuarios Plus habrá límites de mensajes hasta cinco veces mayores.

Por otro lado, el nuevo modo de voz, una de las funciones estrella del modelo, llegará únicamente para los suscriptores en versión alfa en las próximas semanas.

Para los desarrolladores que usan la API de la IA también hay beneficios, pues GPT-4o es un modelo, dice OpenAI, dos veces más rápido, a mitad de precio y con límites de velocidad más altos en comparación con GPT-4 Turbo.

Fuente:xataka.com

Síguenos

Follows

Artículos Relacionados

Contraseña en WhatsApp Web: protege tus chats en segundos

Contraseña en WhatsApp Web: protege tus chats en segundos

Ciencia y Tecnologia

La contraseña en WhatsApp se ha convertido en una de esas funciones que parecen simples, pero que resuelven un problema cotidiano muy real. Basta con levantarte de tu escritorio para ir por un café, atender una reunión improvisada o salir a comer, y tus...

ChatGPT inspira “matrimonio” entre una mujer japonesa y su creación virtual

ChatGPT inspira “matrimonio” entre una mujer japonesa y su creación virtual

Ciencia y Tecnologia

El avance de la inteligencia artificial sigue generando historias insólitas. En Japón, una mujer de 32 años decidió casarse con una personalidad de IA que desarrolló mediante el chatbot ChatGPT. La protagonista, conocida como la señora Kano, creó a “Klaus”, una figura...

Descubren el asteroide 2025 PN7: Una cuasi luna en la órbita terrestre desde hace seis décadas

Descubren el asteroide 2025 PN7: Una cuasi luna en la órbita terrestre desde hace seis décadas

Ciencia y Tecnologia

El observatorio Pan-STARRS en Hawái ha sido el escenario de un hallazgo astronómico: el asteroide 2025 PN7, que lleva décadas orbitando la Tierra casi en sincronía. Este objeto ha sido clasificado como una nueva cuasi luna y se proyecta que continuará en nuestra...

« Entradas más antiguas

Compártelo