Home » GPT-4o de OpenAI: ¿Qué trae de nuevo el modelo de IA generativa y cómo funciona?

GPT-4o de OpenAI: ¿Qué trae de nuevo el modelo de IA generativa y cómo funciona?

Down has rose feel find man. Learning day desirous informed expenses material returned six the. She enabled invited exposed him another

En el vertiginoso mundo de la inteligencia artificial generativa, OpenAI ha elevado la apuesta con la introducción de su nuevo modelo, el GPT-4o. Este lanzamiento no solo busca atraer a más usuarios a su plataforma, sino también mantener a raya a los competidores que intentan ganar terreno.

¿Qué es GPT-4o?

GPT-4o es una actualización del modelo de lenguaje de gran escala que impulsa ChatGPT. Aunque se rumoreó su lanzamiento como un motor de búsqueda para competir con Google, OpenAI retrasó su presentación. Sin embargo, Sam Altman, CEO de OpenAI, afirmó en X que la compañía ha estado trabajando arduamente en novedades que seguramente encantarán a los usuarios.

El “o” en GPT-4o significa “omni”, indicando que este modelo está diseñado para ser omnipresente en nuestras vidas, capaz de razonar en tiempo real a través de audio, visión y texto. En resumen, es el modelo de IA más rápido de OpenAI hasta la fecha, ofreciendo una interacción humano-computadora mucho más natural.

Generative AI, Open AI, and AI services.

¿Qué hace a GPT-4o tan rápido?

OpenAI asegura que GPT-4o puede responder a entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, tiempos comparables a los de una conversación humana. Esto se traduce en una menor necesidad de tokens, las unidades básicas en IA que calculan la longitud del texto, lo cual varía según el idioma.

Por ejemplo, GPT-4o utiliza menos tokens en idiomas como el árabe (de 53 a 26), el gujarati (de 145 a 33), el hindi (de 90 a 31), el coreano (de 45 a 27) y el chino (de 34 a 24). Esto se compara con un estudio de 1968 de Robert Miller que determinó que un tiempo de respuesta de 100 milisegundos es percibido como instantáneo, y menos de un segundo permite a los usuarios sentir que interactúan libremente con la información.

¿Cómo funciona GPT-4o?

OpenAI ha simplificado significativamente el proceso de conversión de entrada a salida. Anteriormente, los modelos de IA utilizaban múltiples modelos para transcribir audio a texto, procesar texto y convertirlo de nuevo a audio. Esto resultaba en una pérdida de información, ya que GPT-4 no podía observar directamente el tono, múltiples interlocutores o ruidos de fondo.

Con GPT-4o, todas estas funciones se han integrado en un solo modelo, capaz de procesar texto, visión y audio de manera simultánea. Esta integración permite una reducción considerable del tiempo y la información procesada. “Todos los insumos y salidas son procesados por la misma red neuronal”, señaló OpenAI. A pesar de esto, OpenAI admite que todavía están explorando todas las capacidades y limitaciones de GPT-4o.

¿Cuáles son las limitaciones de GPT-4o?

A pesar de sus avances, GPT-4o presenta varias limitaciones, incluyendo inconsistencias en las respuestas. OpenAI continúa refinando el comportamiento del modelo a través de post-entrenamiento para abordar preocupaciones de seguridad, un tema crucial en la IA moderna. Se han implementado nuevos sistemas de seguridad y se ha probado el modelo con más de 70 expertos en psicología social, sesgo, equidad y desinformación.

¿Cuánto cuesta GPT-4o?

La buena noticia es que GPT-4o es gratuito para todos los usuarios, aunque los usuarios de pago disfrutan de una capacidad hasta cinco veces mayor que los usuarios gratuitos.

Si no eres un usuario de pago, el costo es de $5 por un millón de tokens de entrada y $15 por un millón de tokens de salida. Esta estrategia complementa otros servicios pagos de OpenAI, como el plan mensual ChatGPT Enterprise y el plan Plus de $20 al mes.

Competencia en el mercado de IA generativa

La introducción de GPT-4o refleja la intensa competencia en el mercado de IA generativa. Google, con su modelo Gemini, y Anthropic, con Claude 3, son algunos de los principales competidores. Google ofrece su plan Google One AI Premium por $19.99 al mes, mientras que Anthropic tiene tres niveles de servicio: Haiku, Sonnet y Opus, con precios que varían según las capacidades.

Microsoft también es un competidor destacado, ofreciendo su servicio Copilot por $20 al mes. Además, xAI, de Elon Musk, y entidades regionales como el Instituto de Innovación Tecnológica de Abu Dhabi con Falcon 2, están entrando en el campo.

En resumen, GPT-4o de OpenAI promete una interacción más rápida y natural entre humanos y computadoras, con un modelo integrado que procesa múltiples modalidades de entrada y salida. Sin embargo, sus limitaciones y la feroz competencia en el mercado subrayan la necesidad de una mejora continua y refinamiento en el campo de la IA generativa. Para los usuarios, esto significa una experiencia más fluida y accesible, aunque deberán estar atentos a las actualizaciones y mejoras que OpenAI y otros competidores seguirán implementando.

La Revolución de la Escritura en Imágenes con ChatGPT-4O

La Revolución de la Interacción entre AIs con ChatGPT-4o

La Revolución en la Preparación para Entrevistas de Trabajo con ChatGPT-4o

De la Digitalización a la Inteligencia Artificial: Actividad Administrativa, Algoritmos y Derechos