anuncia o3 y o3 mini tras del lanzamiento del modo de pensamiento de Gemini

La competencia entre OpenAI y otras compañías en el ámbito de la inteligencia artificial (IA) es una guerra sin cuartel. El lanzamiento de ChatGPT en noviembre de 2022 supuso un punto inflexión en esta industria, que se ha vuelto mucho más competitiva. Desde ese entonces, Google ha estado tratando de recuperar su liderazgo, pero la firma liderada por Sam Altman no le ha dado respiro.

En los últimos años hemos visto cómo el gigante del buscador y la “startup” respaldada por Microsoft han medido sus fuerzas lanzamiento tras lanzamiento. Google presentó esta semana el “Modo de pensamiento de Gemini 2.0 Flash”, una apuesta que, por fin, parecía estar a la altura del modelo o1 de OpenAI. Pues bien, acaban de aparecer en escena los nuevos modelos o3 y o3 mini de OpenAI.

OpenAI presenta sus nuevos modelos de razonamiento

Lo último de los creadores de ChatGPT es capaz de ofrecer un nivel de razonamiento más avanzado que la versión inicial. Al igual que el modelo o1 que conocimos en septiembre de este año, el nuevo modelo pasará algo de tiempo “pensando” la respuesta. No será tan rápido como las versiones GPT, pero su ventaja es que será capaz de resolver problemas más complejos en varios pasos.

Ciertamente, los modelos de razonamiento son ideales para todo. De hecho, el ámbito de la IA está creciendo tanto que hay alternativas orientadas a casos de uso. Por ejemplo, si buscamos un modelo de respuestas rápidas para impulsar un chatbot de atención al cliente, no elegiríamos o3, sino algo como GPT-4o mini. Si lo que buscamos en precisión en física y matemática, puede que o3 sea la elección correcta.

Una forma interesante de analizar el alcance y las posibilidades de un modelo es contemplarlo a la luz de los benchmarks. Durante la presentación, OpenAI ha presentó dos puntos de referencia de programación. Como podemos ver en las imágenes, o3 mejora a o1 en 22,8 puntos porcentuales en SWE-Bench Verified. En este punto de referencia alcanza 71.7 puntos en frente a los 84.9 del modelo anterior.

En Codeforces, o1 alcanza una puntuación de 1891 y o3 de 2727. Como decimos, estos modelos son útiles para muchas tareas complejas. Si nos enfocamos en puntos de referencia de matemáticas, en el American Invitational Mathematics Exam 2024, o1 registra una puntuación del 83.3%. o3, por su parte, presume de un 96.7%, fallando a una única pregunta.

Cabe señalar que la decisión de llamar al modelo o3 en lugar de o2 parece no tener que ver con un salto en sus capacidades (o de un movimiento motivado por el marketing). En realidad, según The Information, se debe a evitar problemas de marcas registradas. OpenAI habría decidido saltarse un número porque o2 es una marca registrada de un proveedor de telecomunicaciones británico.

OpenAI tiene un problema muy serio con Sora: Google le acaba de adelantar por la derecha con su IA de vídeo

Tendremos que esperar para acceder al nuevo modelo de razonamiento insignia de OpenAI, o3, como a su modelo más pequeño y rápido, o3 mini. De momento, los investigadores de seguridad pueden apuntarse en una lista de esperar para probar el modelo. La firma espera lanzarlos al público más adelante, pero no está claro cuándo acabarán llegando (y si bajo qué suscripciones).

Imágenes | Xataka con DALL·E 3

En Xataka | Apple no puede ofrecer ChatGPT en China. Más que un problema, eso es una bendición

Ver Fuente:

0,0

0,0 de 5 estrellas (basado en 0 reseñas)

Excelente0%

Muy buena0%

Media0%

Mala0%

Muy mala0%

No hay reseñas todavía. Sé el primero en escribir una.

anuncia o3 y o3 mini tras del lanzamiento del modo de pensamiento de Gemini

Tesla había apostado buena parte de su año a un Tesla Model Y por debajo de 40.000 euros. Ahora mismo es una ilusión

El futuro de Intel está ligado al éxito de un solo nodo de fabricación de chips: la tecnología 18A

la mejor forma de jugar a PS5 sin encender la consola

Tesla había apostado buena parte de su año a un Tesla Model Y por debajo de 40.000 euros. Ahora mismo es una ilusión

Llega a los cines un «drama devastador» dirigido por las «nuevas maestras del cine mexicano» – Noticias de cine

«Me ha arruinado la semana, el mes y el año»: los fans de ‘The Last of Us’ están desolados, pero el capítulo 2 es «uno de los mejores de la historia» – Noticias de series

El futuro de Intel está ligado al éxito de un solo nodo de fabricación de chips: la tecnología 18A

Regresa una de las mejores sagas zombies de la historia del cine: «como director tienes la responsabilidad de ir tan lejos como puedas» – Noticias de cine

Centro Cultural Tijuana

la mejor forma de jugar a PS5 sin encender la consola

Todo el mundo se pregunta qué va a pasar ahora con ‘The Last of Us’: Esto es lo que ocurre en el videojuego tras el momento más trágico de la temporada 2 – Noticias de series

El rover Curiosity ha encontrado su mejor pista hasta ahora de que Marte fue un planeta habitable

La serie española que superó en audiencia a partidos de Champions: un hito de la televisión que siempre se nos olvida que existe – Noticias de series

Menú

Entradas recientes

OpenAI presenta sus nuevos modelos de razonamiento

Publicaciones relacionadas

Menú

Entradas recientes