OpenAI anunció este miércoles el desarrollo y la fabricación de su primer chip propio de inteligencia artificial (IA), bautizado como Jalapeño, diseñado específicamente para optimizar y acelerar el rendimiento de los grandes modelos de lenguaje (LLM).
El procesador, catalogado por la compañía creadora de ChatGPT como un "procesador de inteligencia" o "acelerador de IA", ha sido desarrollado desde cero por OpenAI y llevado a la fase de producción en colaboración con el fabricante de semiconductores Broadcom. La entrega física de las primeras muestras fue realizada este miércoles a los máximos directivos de OpenAI, Sam Altman y Brockman.
"Al diseñar nosotros mismos una mayor parte de la infraestructura tecnológica, podemos ofrecer más inteligencia con mayor eficiencia y continuar impulsando la IA avanzada hacia un acceso más amplio", afirma Greg Brockman, presidente de OpenAI, este miércoles en el comunicado.
OpenAI ha señalado que todavía está evaluando el rendimiento definitivo, pero ha afirmado que las primeras pruebas indican que Jalapeño ofrecerá un rendimiento por vatio "sustancialmente mejor que el de la tecnología más avanzada actual".
Según detalló la firma, este silicio está concebido para apoyar las cargas de trabajo de ChatGPT, el sistema de programación Codex, su interfaz de programación de aplicaciones (API) y futuros productos basados en agentes automatizados.
OpenAI y Broadcom mantienen desde hace tiempo acuerdos sobre el codesarrollo y el suministro de los aceleradores de IA. Ambas empresas han firmado un acuerdo preliminar para desplegar bastidores que incorporan los aceleradores de IA y las soluciones de red de Broadcom.
Para Broadcom, esta colaboración refuerza la importancia de los aceleradores personalizados y la elección de Ethernet como tecnología para la red scale-up y scale-out en los centros de datos de IA.
Tras el anuncio de la alianza, las acciones de Broadcom subieron cerca de un 2% en Wall Street, aunque después moderaron el avance hasta alrededor del 1%.
Desde sus inicios, OpenAI ha dependido de forma masiva de las costosas unidades de procesamiento gráfico (GPU) de Nvidia para entrenar y operar sus modelos. No obstante, la tecnológica estadounidense ha buscado diversificar su cadena de suministro mediante acuerdos con firmas como Advanced Micro Devices (AMD), Cerebras y Amazon Web Services (AWS) para el uso de sus chips Trainium.