OpenAI ha contratado a Todd Underwood para dirigir un nuevo equipo de ingeniería de confiabilidad del sitio centrado en cargas de trabajo de investigación y capacitación.

La compañía de Inteligencia Artificial generativa ya cuenta con un equipo SRE para el lado aplicado que trabaja en inferencia y productos API.

Como sugiere su nombre, los SRE tienen la tarea de crear y mantener sistemas de software altamente confiables y escalables. El concepto se originó en Google, pero desde entonces se ha extendido por toda la industria de TI.

"En Google creé la organización Machine Learning Site Reliability Engineering (ML SRE)", dijo Underwood en LinkedIn. "Lo fundamos en 2016 (ya había un equipo de Cloud ML SRE; creamos uno para servicios internos y luego los combinamos).

"Después de que una reorganización dividió esos equipos, me fui a trabajar en Capital Engineering... Recientemente, tenía muchas ganas de volver a trabajar más en SRE, pero también acercarme a la infraestructura de ML, especialmente a la infraestructura de capacitación. ¡De ahí OpenAI! "

Underwood pasó 14 años y nueve meses en Google y es coautor del libro de O'Reilly Reliable Machine Learning.

En su publicación, Underwood agregó: "Ahora estoy en condiciones de construir un nuevo equipo de infraestructura de capacitación en ML a una escala interesante (incluso interesante para la gente que viene de Google, me atrevo a decir).

"Este es un equipo que deberá involucrarse en la infraestructura desde cero hasta el modelo, con oportunidades para trabajar en el estado del hardware de los aceleradores, la orquestación y ejecución del trabajo, la dinámica del modelo y, por supuesto, un enfoque especial en métricas y mediciones."

Underwood se unió a la compañía ChatGPT la semana pasada en medio del caos por el despido del CEO Sam Altman, y estuvo entre los que firmaron una carta amenazando con renunciar y unirse a Microsoft si no lo volvían a contratar. Altman regresó a OpenAI después de cinco días.

"Diré que esta fue una incorporación un poco más interesante que la que he tenido en cualquier otro trabajo", dijo Underwood. "La historia completa puede requerir una bebida y un ambiente relajado".

Esa semana, OpenAI también contrató al antiguo líder del chip TPU AI de Google para encabezar una nueva división de hardware.