"La historia de Arm en el centro de datos no es nueva, no es un detalle importante. La verdadera historia es que hemos llegado a un punto de inflexión en el que la nube requiere algo nuevo debido a la forma en que funciona, y debe ser eficiente. Nadie que esté haciendo x86 está construyendo eso. Da la casualidad de que estamos basados en Arm, pero lo estamos construyendo".
Durante una amplia discusión en Londres, el director de productos de Ampere Computing, Jeff Wittich, le dio a DCD un repaso detallado de la hoja de ruta tecnológica de la compañía y por qué cree que la empresa de cinco años puede dominar el mercado de CPU en la nube.
Los múltiples intentos de Arm de ingresar al centro de datos pueden no ser nuevos, pero revisar rápidamente la historia proporciona un contexto valioso.
Tenías las primeras fallas que simplemente no estaban listas", recuerda Wittich. "Los chips Calxeda, las cosas de Applied Micro, pero el modelo estaba equivocado, la gente pensó que podías tomar pequeños chips de teléfonos celulares y si los ampliabas lo suficiente, tendrían suficiente rendimiento"
Pero sentaron las bases y pusieron en marcha un ecosistema de software.
Luego vino la fase intermedia, en la que "un grupo de personas que tenían el enfoque equivocado o se retiraron demasiado pronto, cuando se puso difícil, porque era una apuesta paralela como parte de un negocio diferenciado".
Un ejemplo de ello es la línea de procesadores de servidor Arm de Qualcomm. Su chip Centriq 2400 fue bien recibido y puede haber tenido éxito a largo plazo. Pero luego, la compañía se enfrentó a una pelea legal con su principal cliente, Apple, y pasó la mayor parte de 2018 luchando contra un intento de adquisición hostil por parte de Broadcom.
Magullado y con la necesidad de tranquilizar a los inversores con la reducción de costos, despidió a cientos de personas de su división de centros de datos y eliminó el proyecto. Ampere y Microsoft contrataron a muchos de los que se fueron.
Pero ahora, después de años de fracasos, las estrellas finalmente parecen estar alineadas. Amazon Web Services lanzó su serie de chips Graviton, mientras que la supercomputadora más rápida de 2021 utiliza el procesador Arm A64FX de Fujitsu.
"El ecosistema de software está ahí, por lo que las cosas están a la par o, en algunos casos, incluso un poco por delante de donde están las cosas x86", dice Wittich. "El momento es ahora."
Por supuesto, una vez que haya llegado a la conclusión de que Arm es inevitable debido a su eficiencia energética y flexibilidad sobre x86.
Con AWS varias generaciones en su propia familia de procesadores, se sabe que Microsoft está trabajando en sus propios chips Arm y Google probablemente esté cocinando algo, ¿qué espacio hay para Ampere?
"Son grandes empresas", admite Wittich. "Pero nuestros clientes son una combinación de todas esas empresas, por lo que podemos llegar a una escala masiva. También es útil desde la perspectiva del efecto de red.
“Pero es un nivel de complejidad que no necesita existir cuando podemos ingresar y ejecutar el mismo procesador en Microsoft, en Google o en una caja de HPE”.
Aún así, si un procesador hecho con un hyperscaler fuera significativamente mejor, la falta de esfuerzo de la red no disuadiría a los usuarios. Para que Ampere tenga éxito, debe mostrar una clara ventaja, admite Wittich.
Ahí es donde entra su gran apuesta por los núcleos.
Arm, con sede en el Reino Unido, otorga licencias de su arquitectura de conjunto de instrucciones del mismo nombre a los diseñadores de chips. También otorga licencias de tecnologías de núcleo de procesador, siendo la última Neoverse.
En eso confía AWS para Graviton. Y es en lo que Ampere solía confiar.
"En Altra y Altra Max, decidimos que no podíamos quedarnos sentados durante cinco años construyendo un núcleo", dice. "Dijimos 'saquemos algo porque de lo contrario no tendremos clientes, no tendremos comentarios'. , y no tendremos un ecosistema.
“En el futuro, con lo que estamos haciendo con nuestros núcleos, se ve muy diferente. Y comienza a ofrecer realmente una gran eficiencia energética de tasa de densidad, al mismo tiempo que ofrece el tipo de rendimiento que la nube quiere.
"Simplemente no sé si veremos eso de Arm [núcleos]".
La opinión de Ampere es que los propios núcleos de Arm nunca pondrán el centro de datos en primer lugar. "Arm desarrolla los núcleos para el producto del cliente primero y luego los adapta a los núcleos de infraestructura unos meses más tarde. Pero en el fondo, todavía se desarrollaron para un mercado diferente".
Eso significa que muchos otros enfoques para las CPU de servidores Arm son defectuosos, argumenta Wittich. "Es uno de los problemas fundamentales con un montón de modelos de CPU en la actualidad, tienen características que tienen mucho sentido para un procesador de cliente pero no tienen sentido en la nube".
Sus núcleos, argumenta, están dirigidos directamente a la nube. Incluso la informática tradicional de alto rendimiento es un mercado demasiado tangencial. "No estoy enfocado en eso, harías un tipo diferente de núcleo".
Sin embargo, hay otro mercado al que Ampere se dirige más allá de la nube y la nube local: el Edge de gama alta.
"La compañía de autos sin conductor Cruise nos usa en sus vehículos", revela Wittich. "No somos nosotros quienes ingresamos al espacio automotriz, sino que necesitaban un servidor Edge de muy alto rendimiento que se colocara en el automóvil. No podían". En realidad, no encuentro ninguna otra CPU que, dentro de los 100 vatios, brinde un rendimiento razonable, y nuestro chip de 64 núcleos consume 70 vatios".
Pero la compañía espera que descifrar el espacio automotriz se vincule a la nube. "Hay un montón de otros dispositivos Arm más pequeños ubicados en todas partes del vehículo, pero muchos de los desarrolladores solo están haciendo esas cosas en máquinas x86 en la nube y luego las mueven al automóvil. Estás constantemente portando de un lado a otro y es un desperdicio”.
Construir sus propios núcleos también reduce las tarifas de licencia para Arm y lo aísla de los altibajos del diseñador de chips. A fines de 2020, Nvidia anunció que adquiriría Arm por 40 mil millones de dólares pero, después de dos años de investigaciones regulatorias que distrajeron, el acuerdo fracasó.
Arm pronto nombró a un nuevo director ejecutivo, quien anunció despidos y planes para una oferta pública inicial. "No tuve que preocuparme tanto durante todas estas cosas en los últimos dos años", dice Wittich. "Tenemos una licencia de arquitectura y podemos construir lo que queremos construir".
Pero Ampere no está solo en eso, ya que otros desarrollan sus propios núcleos.
Del lado del consumidor, Apple adoptó el enfoque para sus chips M1 Arm, lanzados por primera vez en 2020. En el lado del centro de datos, las cosas se vuelven un poco más complejas.
En 2018, tres veteranos de Apple lanzaron Nuvia para construir su propia CPU de servidor Arm con sus propios núcleos. Solo un año después, Apple demandó a uno de los fundadores alegando que solo trabajaba en Nuvia mientras aún era empleado de Apple.
En 2021, parecía que Nuvia había dejado atrás la controversia, vendiéndola a Qualcomm por unos respetables 1.400 millones de dólares. Curiosamente, parecía que también puso el chip del servidor detrás, y Qualcomm anunció que usaría la tecnología en productos móviles, IoT y de redes, integrándolo en Snapdragon.
Un año más tarde, dio un giro hacia atrás, comprando un producto de servidor. Durante el verano, Bloomberg informó que Amazon accedió a revisar el chip.
Sin embargo, pronto hubo más confusión. En septiembre, Arm demandó a Qualcomm, uno de sus socios más grandes, alegando que no estaba de acuerdo con el uso de las licencias de Nuvia por parte de Qualcomm y rescindió las licencias en febrero.
Si gana el caso, podría deshacer una adquisición importante para Qualcomm y arruinar sus planes de chips para servidores y computadoras de escritorio. Incluso si el caso finalmente se resuelve, retrasará y distraerá a Nuvia, y es difícil tener fe en la administración de Qualcomm para mantener el enfoque.
Wittich es diplomático en sus puntos de vista sobre Nuvia. "Tenemos nuestros propios núcleos, y eso nos da una ventaja de cinco años sobre cualquiera que decida que podría ser el momento de comenzar a diseñar sus propios núcleos. Ahora, eso es un gran diferenciador".
Otro factor que espera le dará una ventaja sobre los procesadores Arm y no Arm es su propia interconexión de chip a chip, que le permitirá adoptar un enfoque de chiplet, donde se utilizan troqueles diminutos en lugar de un troquel monolítico.
“Nuestros primeros dos productos se volvieron monolíticos, porque es fundamental que nuestro desempeño sea muy, muy consistente”, dijo. “No queremos ninguna variabilidad en el chip, donde si se coloca en un núcleo frente a otro núcleo, el rendimiento se ve muy diferente.
"Queríamos evitar cuellos de botella. Muchos de los enfoques de chiplet hasta la fecha tienen grandes cuellos de botella, porque hay demasiados saltos y la latencia sigue siendo demasiado grande de un chip a otro.
“Nuestros chiplets se interconectan de tal manera que eliminamos muchos de los cuellos de botella comunes que ocurren en un enfoque basado en chiplets”, afirma.
La empresa pudo obtener 128 núcleos en un solo troquel; planea varios cientos a medida que avanza chiplet. “Queremos asegurarnos de que, a medida que ponga más y más núcleos en línea, el rendimiento por núcleo no disminuya. Y ese no es realmente el caso con muchas CPU x86 heredadas”.
Es por eso que esta no es una historia sobre Arm, argumenta. “Estos no son los viejos tiempos de los chips Arm que vienen y simplemente rebajan el precio de todos, no somos el precio más bajo. Pero lo que somos es el procesador de mayor rendimiento, y somos el procesador con mayor eficiencia energética”.
Con x86, "el problema es que estás entrando en un espacio donde ese rendimiento adicional se vuelve realmente ineficiente desde el punto de vista energético", dice Wittich. “Así que estás agregando un 20 por ciento más de potencia para obtener un 10 por ciento más de rendimiento”.
A nivel de rack y centro de datos, eso no tiene sentido, dice. “Parece que cada chip ofrece un mayor rendimiento, pero en general acaba de reducir su capacidad general. Sin razón."
Aún así, mientras ve esas cargas de trabajo x86 como terreno por conquistar, Wittich señala que es consciente de dónde están los límites de los chips Ampere.
“Tratar de hacer que todo sea de una sola talla para todos es un desastre. Lo hacemos de maravilla en la inferencia en una CPU, pero si tiene trabajos de inferencia por lotes que va a realizar durante las próximas 12 horas, tal vez mueva esas cosas a un acelerador de inferencia”.
"No creo que regresemos a un mercado en el que tienes una CPU implementada en el 99 por ciento de los servidores, no vamos a regresar", dice Wittich, quien fue atraído a la compañía después de 15 años en Intel viendo caer la cuota de mercado. “El mundo ha cambiado ahora”.