OpenAI confirma que los agentes de IA llegarán el año que viene

OpenAI se dispone a mejorar la inteligencia artificial con el lanzamiento de sus «agentes» avanzados el año que viene. Estos modelos de IA están diseñados para ejecutar una amplia gama de tareas de forma autónoma, integrándose potencialmente en plataformas como ChatGPT en breve.

En el OpenAI DevDay inaugural celebrado en San Francisco, Sam Altman, Consejero Delegado de la empresa, dio a conocer las futuras capacidades de estos agentes, mostrando un asistente de voz que realizaba de forma autónoma una llamada telefónica para pedir fresas. Esta demostración puso de relieve las capacidades de los agentes y supuso un paso importante hacia la consecución de la Inteligencia Artificial General (AGI).

Altman esbozó un modelo de cinco etapas de desarrollo de la AGI, con la tecnología actual en la segunda etapa, en la que la IA puede razonar antes de responder. La introducción de agentes representa la tercera etapa, que permite a la IA realizar tareas de forma independiente como parte de su proceso de razonamiento y respuesta. Este avance significa que la IA podría encargarse de tareas complejas como escribir y autopublicar un libro, reduciendo significativamente el tiempo y el esfuerzo requeridos a los humanos.

Durante el DevDay, Altman destacó el papel fundamental de la familia de modelos o1 de OpenAI en el desarrollo de estos modelos de grado agente, que se espera que aparezcan pronto. Sin embargo, también señaló los retos que plantea garantizar que estos agentes se adhieran a los valores humanos y no realicen acciones perjudiciales. Esta preocupación subraya la importancia de la alineación en el desarrollo de la IA.

El rendimiento de la API OpenAI Real time durante la demostración reveló una latencia de respuesta de aproximadamente 2 segundos, más lenta que el estándar de vanguardia de menos de 400 milisegundos. Además, aunque la tecnología de voz utilizada era eficaz, carecía de la profundidad emocional de los modos más avanzados, lo que indica que hay áreas que mejorar.

El potencial de estos agentes de IA se extiende a diversos campos. Por ejemplo, se podría encargar a un agente que escribiera un libro y se encargara de forma autónoma del proceso de autopublicación en plataformas como Amazon Kindle Direct. Este nivel de autonomía en la IA podría transformar tareas que requieren mucho tiempo, reduciéndolas de meses a meras horas.

«En 2025 es cuando los agentes trabajarán», declaró Altman, sugiriendo que el despliegue de agentes de IA tendrá un impacto significativo en las tareas cotidianas. Imaginó un escenario en el que los individuos podrían emplear múltiples agentes para diferentes tareas, ampliándose para manejar varios aspectos de sus responsabilidades diarias.

La seguridad sigue siendo una preocupación primordial, y cada nuevo modelo de IA se somete a rigurosas pruebas para cumplir los criterios de seguridad antes de su lanzamiento. El establecimiento de «barandillas» es crucial para evitar acciones no deseadas de la IA, aunque ha habido casos en los que estas salvaguardas han fallado. Por ejemplo, el modelo GPT-4o tiene capacidades como la generación de imágenes, la producción de música y la imitación de voz que están restringidas para evitar usos indebidos.

Una preocupación concreta es que los agentes puedan acceder a información sensible, como cuentas bancarias, o realizar actividades en línea no autorizadas. Para mitigar estos riesgos, se propone exigir a los agentes de IA que se identifiquen siempre como tales durante las interacciones.

En declaraciones al Financial Times, el director de producto de OpenAI, Kevin Weil, expresó la ambición de la empresa de facilitar interacciones similares a las humanas con la IA. «Queremos que sea posible interactuar con la IA de la misma forma que se interactúa con otro ser humano», declaró Weil, destacando el potencial transformador de los sistemas agénticos que se incorporarán a la corriente dominante el año que viene.

Altman también compartió su entusiasmo personal por la llegada de los agentes, sobre todo por su potencial para agilizar los procesos de codificación y gestionar tareas mundanas como la clasificación del correo electrónico. Con un guiño humorístico a los escenarios ficticios de la IA, bromeó: «Si Skynet es el precio que tengo que pagar para llegar a la bandeja de entrada cero, que vengan los Terminators».