Rob Lee Pure Storage
– Rob Lee

A Pure Storage, empresa especializada em tecnologia e serviços de armazenamento de dados, anunciou novas arquiteturas de referência validadas para suportar casos de uso de IA generativa, incluindo uma específica para a NVIDIA OVX.

A empresa de armazenamento, em parceria com a NVIDIA, agora oferece aos clientes uma estrutura para gerenciar dados de alto desempenho e os requisitos de computação necessários para implementações bem-sucedidas de IA. Os novos projetos e provas de conceito incluem:

  • Pipeline RAG para inferência de IA: Para melhorar a precisão, a vigência e a relevância dos recursos de inferência para grandes modelos de linguagem (LLMs), a Pure Storage criou um pipeline RAG – sigla em inglês para geração aumentada de recuperação - aproveitando os microsserviços NeMo Retriever e GPUs da NVIDIA e o armazenamento corporativo totalmente em flash da Pure Storage. Como resultado, a Pure Storage acelera o tempo de obtenção de insights para empresas que usam seus próprios dados internos para treinamento de Inteligência Artificial, garantindo o uso de seus dados mais recentes e eliminando a necessidade de retreinamento constante de LLMs.
  • Arquitetura certificada de referência de armazenamento de servidor NVIDIA OVX: A Pure Storage obteve a validação do OVX Server Storage, fornecendo aos clientes corporativos e parceiros de canal arquiteturas de referência de armazenamento flexíveis, validadas em relação aos principais benchmarks para fornecer uma base sólida de infraestrutura para soluções de hardware e software de IA com otimização de custo e desempenho. Essa validação oferece opções adicionais para clientes de IA e complementa a certificação da Pure Storage para o NVIDIA DGX BasePOD, lançada no ano passado.
  • Desenvolvimento do RAG vertical: Para acelerar a adoção da IA nos setores verticais de forma bem-sucedida, a Pure Storage está criando RAGs específicos para cada setor em colaboração com a NVIDIA. Primeiro, a Pure Storage criou uma solução RAG de serviços financeiros para resumir e consultar conjuntos de dados massivos com maior precisão do que os LLMs prontos para uso. As instituições de serviços financeiros agora podem obter insights mais rápidos usando IA para criar resumos e análises de vários documentos financeiros e outras fontes. Outros RAGs para o setor público e de saúde serão lançados.
  • Investimento ampliado no ecossistema de parceiros de IA: A Pure Storage está investindo ainda mais em seu ecossistema de parceiros de IA com a NVIDIA, envolvendo-se em novas parcerias com ISVs como Run.AI e Weights & Biases. Enquanto a Run.AI otimiza a utilização da GPU por meio de orquestração e programação avançadas, a plataforma de desenvolvimento de IA Weights & Biases permite que as equipes de machine learning (ML) criem, avaliem e controlem o ciclo de vida de desenvolvimento do modelo. Além disso, a Pure Storage está trabalhando em estreita colaboração com revendedores e parceiros de serviços focados em IA, incluindo ePlus, Insight, WWT e outros, para operacionalizar ainda mais as implementações conjuntas de IA dos clientes.

"A Pure Storage reconheceu a crescente demanda por IA desde o início, fornecendo uma plataforma eficiente, confiável e de alto desempenho para as implementações de IA mais avançadas. Com nossa colaboração de longa data com a NVIDIA, as mais recentes arquiteturas de referência de IA validadas e provas de conceito de IA generativa emergem como componentes essenciais para empresas no mundo inteiro desvendarem as complexidades do quebra-cabeça da IA”, diz Rob Lee, diretor de Tecnologia da Pure Storage.

Atualmente, muitas implementações de IA estão dispersas em diversos ambientes de dados, desde soluções legadas de armazenamento até a nuvem. No entanto, esses ambientes fragmentados não oferecem suporte adequado para os requisitos de desempenho e conectividade necessários para impulsionar os processos de IA e explorar todo o potencial dos dados corporativos.

À medida que as empresas aumentam o uso da IA para impulsionar a inovação, simplificar operações e obter vantagem competitiva, a demanda por uma infraestrutura robusta, de alto desempenho e eficiente em IA torna-se mais urgente do que nunca.