La competencia entre OpenAI y otras compañías en el ámbito de la inteligencia artificial (IA) es una guerra sin cuartel. El lanzamiento de ChatGPT en noviembre de 2022 supuso un punto inflexión en esta industria, que se ha vuelto mucho más competitiva. Desde ese entonces, Google ha estado tratando de recuperar su liderazgo, pero la firma liderada por Sam Altman no le ha dado respiro.
En los últimos años hemos visto cómo el gigante del buscador y la “startup” respaldada por Microsoft han medido sus fuerzas lanzamiento tras lanzamiento. Google presentó esta semana el “Modo de pensamiento de Gemini 2.0 Flash”, una apuesta que, por fin, parecía estar a la altura del modelo o1 de OpenAI. Pues bien, acaban de aparecer en escena los nuevos modelos o3 y o3 mini de OpenAI.
OpenAI presenta sus nuevos modelos de razonamiento
Lo último de los creadores de ChatGPT es capaz de ofrecer un nivel de razonamiento más avanzado que la versión inicial. Al igual que el modelo o1 que conocimos en septiembre de este año, el nuevo modelo pasará algo de tiempo “pensando” la respuesta. No será tan rápido como las versiones GPT, pero su ventaja es que será capaz de resolver problemas más complejos en varios pasos.
Ciertamente, los modelos de razonamiento son ideales para todo. De hecho, el ámbito de la IA está creciendo tanto que hay alternativas orientadas a casos de uso. Por ejemplo, si buscamos un modelo de respuestas rápidas para impulsar un chatbot de atención al cliente, no elegiríamos o3, sino algo como GPT-4o mini. Si lo que buscamos en precisión en física y matemática, puede que o3 sea la elección correcta.
Una forma interesante de analizar el alcance y las posibilidades de un modelo es contemplarlo a la luz de los benchmarks. Durante la presentación, OpenAI ha presentó dos puntos de referencia de programación. Como podemos ver en las imágenes, o3 mejora a o1 en 22,8 puntos porcentuales en SWE-Bench Verified. En este punto de referencia alcanza 71.7 puntos en frente a los 84.9 del modelo anterior.
En Codeforces, o1 alcanza una puntuación de 1891 y o3 de 2727. Como decimos, estos modelos son útiles para muchas tareas complejas. Si nos enfocamos en puntos de referencia de matemáticas, en el American Invitational Mathematics Exam 2024, o1 registra una puntuación del 83.3%. o3, por su parte, presume de un 96.7%, fallando a una única pregunta.
Cabe señalar que la decisión de llamar al modelo o3 en lugar de o2 parece no tener que ver con un salto en sus capacidades (o de un movimiento motivado por el marketing). En realidad, según The Information, se debe a evitar problemas de marcas registradas. OpenAI habría decidido saltarse un número porque o2 es una marca registrada de un proveedor de telecomunicaciones británico.
Tendremos que esperar para acceder al nuevo modelo de razonamiento insignia de OpenAI, o3, como a su modelo más pequeño y rápido, o3 mini. De momento, los investigadores de seguridad pueden apuntarse en una lista de esperar para probar el modelo. La firma espera lanzarlos al público más adelante, pero no está claro cuándo acabarán llegando (y si bajo qué suscripciones).
Imágenes | Xataka con DALL·E 3
En Xataka | Apple no puede ofrecer ChatGPT en China. Más que un problema, eso es una bendición
No hay reseñas todavía. Sé el primero en escribir una.