Cerebras, una compañía que surgió sigilosamente esta semana, ha anunciado el procesador de computadora más grande del mundo.

El chip de inteligencia artificial es una oblea de silicio tan grande como un iPad, y contiene 1,2 billones de transistores, aproximadamente 40 veces más que los procesadores más densos actualmente en producción, como el EPYC Rome de AMD, que tiene 32 mil millones. El chip Cerebras también tiene 400.000 núcleos y 18 gigabytes de memoria integrada. Los procesadores recientes de Intel tienen hasta 18 núcleos.

Cerebras resolvió problemas fundamentales que obstaculizaron los intentos anteriores de producir silicio a escala de oblea, dijo en la conferencia Hot Chips en la Universidad de Stanford esta semana. Esas fueron las tasas de error durante la fabricación (rendimiento) y las comunicaciones en chip.

Más allá de estos problemas, Cerebras ha dicho a los periodistas que también tiene soluciones a los problemas más prácticos que surgen cuando se piensa en implementar chips monstruosos en los sistemas: empaque, enfriamiento y expansión térmica. A pesar de esto, los chips están muy lejos de la producción en volumen y la disponibilidad en los sistemas de trabajo.

400.000 núcleos

Cerebras ha diseñado el chip, llamado Wafer Scale Engine, para vencer a las GPU en la computación con inteligencia artificial. Replicó la arquitectura paralela utilizada por las GPU, pero la llevó al extremo: empaquetando una gran cantidad de núcleos, cada uno de los cuales tiene memoria dedicada. Sus 400.000 núcleos están dispuestos en grupos de 4.800, y los grupos están dispuestos en una matriz de 7x12 mosaicos. La oblea resultante es 56 veces más grande que la GPU Nvidia actual más grande y consta de una matriz de 7x12 de mosaicos idénticos, cada uno de los cuales contiene 4.800 núcleos, cada uno de los cuales tiene 48 kilobytes de SRAM.

Cerebras, con sede en California, fabricó el chip a partir de transistores a una escala de 16 billonésimas de metro (nanómetros). Los chips más avanzados en uso hoy en día tienen componentes escalados a la mitad de ese tamaño. Cerebras no ha dicho a qué velocidad de reloj funciona, pero se supone que es relativamente bajo, menos de dos o tres GHz.

Cerebras desarrolló el WSE con 112 millones de dólares que obtuvo de fondos de riesgo, incluido Benchmark. La mayoría de su personal clave, incluido el CEO Andrew Feldman y el arquitecto de hardware Sean Lie, estaban anteriormente en SeaMicro, una firma avanzada de silicio comprada por AMD.

cs-wafer-comparison-gpu-black cerebras.jpg

Los fabricantes de productos electrónicos hicieron intentos similares de integración a escala de obleas en la década de 1980, pero fracasaron debido a que su rendimiento era demasiado bajo. Las obleas siempre contienen fallas, causadas por imperfecciones en el silicio y la fina resolución del proceso de producción de litografía fotográfica. Los fabricantes lanzan muchos chips en una sola oblea de silicio y descartan aquellos que se encuentran defectuosos cuando los ha roto. La mayoría de ellos serán perfectos y utilizables. Pero si se usa toda la oblea para un procesador, es casi seguro que contenga núcleos de falla.

Cerebras resolvió el problema al permitir que el procesador ignore los núcleos defectuosos cuando está funcionando. Desarrolló protocolos de comunicación para resolver otro problema, que consistía en ejecutar flujos de datos entre los muchos mosaicos del procesador.

Los creadores de sistemas deben resolver otros problemas para incorporar el WSE en las computadoras que funcionan. El chip consume 15kW de potencia, que es más que la potencia consumida por dos racks enteros de dos metros . La única forma de eliminar el calor es montar el chip verticalmente y enfriarlo con una placa de metal, con líquido que fluye hacia arriba, dijo Feldman en una entrevista.