Hace más de una década llegó a los cines ‘Her‘, una película que nos sumergía en un futuro donde los asistentes de inteligencia artificial (IA) no solo interactuaban con los usuarios por voz, sino que también podían “ver” el entorno a través de la cámara. Por aquel entonces, Siri llevaba apenas dos años en funcionamiento, y lo que planteaba la película se percibía como un futuro aún muy distante. OpenAI está acortando el camino hacia esa realidad.
ChatGPT finalmente puede ver lo que sucede a nuestro alrededor. Esto significa que será posible brindarle acceso a nuestra cámara cuando usemos el modo de voz avanzado. De esta forma, el famoso chatbot podrá procesar las imágenes en tiempo real gracias al modelo multimodal GPT-4o. También estará disponible la opción de compartir nuestra pantalla para que obtenga datos en tiempo real de las aplicaciones que estemos utilizando.
ChatGPT ahora puede procesar vídeo en tiempo real
Una vez que esté disponible en nuestro dispositivo, comenzar a utilizar esta nueva capacidad será muy sencillo. Simplemente tendremos que abrir la aplicación de ChatGPT y pulsar el botón de la esquina superior derecha para iniciar el modo de voz avanzado. El paso siguiente será pulsar sobre el botón de la cámara. En la interfaz nos encontraremos con un botón que nos permitirá elegir la cámara delantera o trasera en caso que usemos un teléfono.
El chatbot de IA de OpenAI ahora puede ser mucho más útil. Por ejemplo, podríamos pedirle que nos ayude a realizar determinadas tareas. Un miembro del equipo hizo una demostración este jueves. Le pidió a ChatGPT que le indicara paso a paso cómo prepara café con un filtro. El modelo fue capaz de reconocer cada uno de los objetos sobre la mesa en tiempo real y guiar a la persona durante todo el proceso. La latencia parecía insignificante.
Cuando la compañía anunció esta funcionalidad en mayo de este año presentó muchos otros escenarios de uso. Entre ellos encontramos un padre resolviendo problemas de matemática junto a su hijo, gente jugando a piedra, papel o tijera e incluso vimos a un emocionado ChatGPT conociendo un perro. Una de los ejemplos más interesantes llegó de la mano de las opciones de accesibilidad, que permitía describir en lenguaje sencillo el entorno.
Si quisiéramos compartir nuestra pantalla con el chatbot simplemente tendríamos que pulsar el menú de los tres puntos y después seleccionar Compartir pantalla. Toca esperar para saber si las capacidades de visión del chatbot cumplirán con las expectativas, pero debemos mencionar que como todo modelo de IA puede cometer errores. En cualquier caso, OpenAI demuestra que se mantiene a la vanguardia en la carrera de la inteligencia artificial.
OpenAI dice que el nuevo modo de vídeo estará disponible en los próximos días “en la mayoría de los países” para los usuarios de ChatGPT Plus (20 dólares al mes) y ChatGPT Pro (200 dólares al mes). Si estás leyendo esto desde España, la compañía ha señalado que espera ofrecer “pronto” esta novedad en la Unión Europea. Así que no tenemos una fecha de llegada a los países del bloque comunitario, aparentemente por temas regulatorios.
Altman dijo esta semana en un mensaje en X que algunos de sus productos posiblemente lleguen más tarde a Europa. Además añadió que es probable que no puedan ofrecer algunos de sus productos. “Queremos ofrecer nuestros productos en Europa y creemos que una Europa fuerte es importante para el mundo. También tenemos que cumplir con la regulación”, dijo el empresario en el mismo mensaje.
Imágenes | OpenAI | Captura de pantalla
En Xataka | OpenAI acaba de acercarnos más que nunca a ‘Her’: su nuevo modelo de voz nos acompañará (y quizás enamorará)
No hay reseñas todavía. Sé el primero en escribir una.