“Quando começamos, o primeiro slide em nosso discurso para a aceleradora de startups Y Combinator foi 'O que é uma GPU?'”, lembra o fundador da Paperspace, Dillon Erb.

Não é uma pergunta que provavelmente será feita por alguém em 2024, mas quando a Paperspace foi fundada há uma década, o mercado de nuvem ainda estava em sua infância. Embora todos os hiperescalas tenham sido lançados, apenas a AWS da Amazon tinha GPUs em oferta - o Microsoft Azure levaria até 2016 para lançar GPUs em sua nuvem e o Google até 2017.

“A Amazon tinha uma instância, mas acho que fomos a primeira nuvem totalmente GPU”, diz Erb. “É óbvio agora, mas pensamos que as GPUs seriam uma grande parte da computação em nuvem”.

Como fornecedora de uma nuvem de GPU dedicada, a Paperspace entrou em cena desde o início. Mas com a inteligência artificial agora na moda, a empresa enfrenta a necessidade de provar que não era muito cedo e que pode acompanhar os recém-chegados como CoreWeave e Lambda.

Para isso, tornou-se parte da fornecedora de nuvem intermediário DigitalOcean (DO) em um acordo de 111 milhões de dólares (610 milhões de reais) em 2023. “Eles realmente foram pioneiros em ter um foco no desenvolvedor, indo atrás de desenvolvedores e startups no mercado intermediário inferior”, diz Erb. “Uma vez que você fica realmente grande, então há nuvens maiores para ir”.

Essa estratégia provou ser um pouco bem-sucedida para a DO, com um valor de mercado de 3 bilhões de dólares (16,5 bilhões de reais) no momento da redação deste artigo – mas também limitou o crescimento. Ao se concentrar nos negócios e empresas menores, serviu como um trampolim para os hiperescalas.

Apesar de lançar seus negócios em 2011, a DO falhou em aproveitar a onda de migração para a nuvem corporativa que impulsionou as receitas dos hiperescalas. Depois de ser listada na Bolsa de Valores de Nova York em 2021 com uma avaliação de 4,48 bilhões de dólares (24,6 bilhões de reais) e um ano inicial de apoio ao investidor, ela tem lutado para convencer o mercado de que pode crescer.

“O negócio que eles desenvolveram tem sido muito bem-sucedido em atingir essa escala de clientes”, rebate Erb. “Temos ambições maiores agora porque a revolução da GPU e IA significa que empresas menores podem fazer muito mais. Estamos nos esforçando para poder crescer com os clientes à medida que eles crescem”.

Ele acrescentou: “Há uma enorme oportunidade de crescimento aqui. A pergunta que todos estão fazendo internamente é 'como transformamos isso de uma empresa que vale três ou quatro bilhões para valer 10× aquilo?' E, é claro, há preocupações de que teremos uma incompatibilidade entre oferta e demanda eventualmente, à medida que todos desenvolvem a computação”.

“Mas minha forte percepção sobre isso, apenas tendo observado este espaço, é que a demanda por computação é quase infinita. Inventamos esses softwares de IA muito legais que podem simplesmente consumir tudo”.

Esse comentário otimista está alinhado com grande parte do otimismo selvagem da indústria de tecnologia para o futuro da IA, que preocupa outros com a possibilidade de a realidade acabar.

“Estou na bolha”, diz Erb com uma risada. “Mas a demanda por computação continuará a superar a oferta nos próximos anos. Há uma quantidade insana de impulso em torno disso e sentimos que somos o centro deste universo que muitas pessoas ainda não percebem que existe”.

Com a empolgação em torno da IA em alta, é difícil avaliar verdadeiramente como a Paperspace e a DO se comparam. “No momento, a realidade é que a demanda por computação é tão alta que, se você puder empilhar e empilhar essas caixas de pizza, as pessoas virão e as usarão”, diz Erb. “Isso vai durar um pouco”.

A escassez de GPU está começando a diminuir, embora a indústria de Data Centers ainda não possa construir e alimentar Data Centers com rapidez suficiente para acompanhar a demanda, fazendo com que os clientes se comprometam com quem fazem negócios.

Quando isso começar a melhorar e as empresas puderem ser mais criteriosas com a escolha do fornecedor, Erb espera que a experiência do desenvolvedor venha à tona.

“É nisso que a DO é melhor, temos centenas de milhares de clientes. A coisa toda sempre foi sobre simplicidade, em face de hiperescalas maciçamente complexos”.

Da mesma forma, ele acredita que outras nuvens de IA terão dificuldades para alcançar a pilha de software em nuvem da DO, mesmo que avancem com mais implantações de GPU. “O que uma CoreWeave e uma Lambda precisam fazer no futuro para se tornar uma empresa de computação em nuvem?”.

“Na verdade, isso não é fácil de fazer – você precisa ser distribuído globalmente, precisa de firewalls, precisa de balanceadores de carga, etc. Eu acho que a DO é uma espécie de dorminhoco aqui. Acho que estamos bem posicionados para nos tornarmos um dos melhores, se não os melhores neste mercado”.

A Paperspace opera em três Data Centers, somando-se à forte presença de 15 Data Centers da DO. Ainda não está claro quantos dos sites adicionarão pegadas significativas de GPU – “não estamos tentando adaptar Data Centers antigos para se tornarem novos” – mas Erb espera se apoiar no alcance global da empresa para se diferenciar de outras nuvens de IA. “Todo mundo está tentando fazer IA, não apenas os EUA”.

Como o resto da indústria, a rapidez com que ela se expandirá depende um pouco da rapidez com que ela pode colocar as mãos nas GPUs mais recentes e em quantas pode colocar as mãos. Mas com tantos de seus clientes sendo menores, ainda há oportunidades a serem encontradas em equipamentos mais antigos.

“Para nossa base de clientes, há muitas pessoas que dizem 'Na verdade, não preciso do mais novo B100 ou B200'”, diz Erb. “Eles não precisam treinar os modelos em quatro dias, eles estão bem em fazê-lo em duas semanas por um quarto do custo. Na verdade, ainda temos GPUs da geração Maxwell [lançadas pela primeira vez em 2014] que estão sendo executadas em produção. Dito isso, estamos investindo pesadamente na próxima geração”.

Ecoando a luta de muitos no setor de IA, Erb acredita que diferentes gerações de GPUs Nvidia representaram a extensão da fragmentação da computação de IA. “Tenho esperança de que haja mais opções [além da Nvidia]”, diz ele.

T4-GPU-web.width-358
– Nvidia

A Paperspace foi o primeiro lugar onde as pessoas puderam experimentar o IPU da Graphcore, mas a empresa está à beira da falência há algum tempo depois de não conseguir competir com a Nvidia e na semana passada foi comprada pelo SoftBank.

“Nossa premissa desde o início era que seríamos mais agnósticos e estaríamos trabalhando em estreita colaboração com a Cerebras, a SambaNova e a Groq”, diz Erb. “Eu vi um monte de hardware específico para transformadores sendo lançados. Mas não tenho certeza se apostaria contra a máquina [Nvidia]”.

Para treinamento, “é a Nvidia 99% do tempo porque você não pode convencer as pessoas a aprender uma nova pilha”, diz Erb, mas o fundador da Paperspace vê uma oportunidade para novas arquiteturas “à medida que avançamos para a inferência, se você puder trocar a Groq nos bastidores e seu preço por desempenho for melhor, acho que você verá alguma pressão para baixo”.

Operando com uma presença global e uma ampla pilha de computação, Erb espera que a DO seja capaz de exercer sua própria pressão descendente sobre o setor de nuvem. “A DigitalOcean simplesmente não está presente neste ecossistema”, diz ele. “E assim, se pudermos nos mover rapidamente e trazer o melhor do que fizemos e do que eles estão fazendo, acho que é super atraente”.