OpenAI está lanzando una plataforma de desarrollo conocida como Foundry para permitir a los clientes ejecutar grandes cargas de trabajo de inteligencia artificial basadas en sus modelos.
"[Foundry permite] la inferencia a escala con control total sobre la configuración del modelo y el perfil de rendimiento", afirman los documentos publicados en Twitter.
Su objetivo es ofrecer una "asignación estática" de capacidad de cómputo que esté "diseñada para clientes de vanguardia que ejecutan cargas de trabajo más grandes".
Los clientes podrán monitorear sus instancias usando las mismas herramientas y tableros que usa OpenAI para su propio trabajo, incluidos ChatGPT, Dall E y GPR3.
"Próximamente, OpenAI ofrecerá opciones de ajuste más sólidas para nuestros últimos modelos", dice el documento. "Foundry será la plataforma para servir esos modelos".
El servicio ofrece acuerdos de nivel de servicio (SLA) para un tiempo de actividad del 99,5 % y soporte técnico de guardia.
Ejecutar una versión liviana de GPT-3.5 costará 26.000 dólares al mes por un compromiso de tres meses o 264.000 por un compromiso de un año.
La instancia de modelo DV (contenido máximo de 8K) costará 78.000 dólares por mes durante tres meses, o 792.000 dólares por todo el año.
Si bien el documento no revela dónde se alojará esa computación, es probable que se encuentre en Microsoft Azure.
Microsoft ha invertido más de 10 mil millones de dólares en la empresa y es su principal proveedor de nube. También ha construido sistemas especializados a medida para OpenAI.