No momento, há uma grande empolgação com a IA Generativa (Inteligência Artificial), especialmente os Large Language Models (LLMs). O hype inicial em torno do ChatGPT está indiscutivelmente diminuindo, mas está claro que há tecnologia e pesquisa acadêmica suficientes para a atenção séria do desenvolvedor.

Apesar do potencial da abordagem, os LLMs vêm com uma série de desafios. Isso inclui a conhecida questão das alucinações (inventar falsidades persuasivas), mas também o falso raciocínio lógico (se duas camisas levam duas horas para secar no varal, quanto tempo demoram cinco camisas?) e dar a resposta errada quando uma pergunta é invertida.

Além disso, há altos custos associados ao treinamento de um LLM de uso empresarial. É complexo atualizá-los e mantê-los, e é difícil realizar auditorias e fornecer explicações. Felizmente, essas questões podem ser remediadas e mitigadas.

Gráficos de conhecimento ao resgate

As desvantagens dos LLMs podem ser significativamente resolvidas apoiando-os com gráficos de conhecimento construídos sobre mecanismos modernos de banco de dados de gráficos. Analistas técnicos fortes como a Redmonk concordam: “As empresas estão justificadamente preocupadas com os perigos de informações incorretas e 'alucinações' entrarem em suas redes de fornecimento de informações e estão procurando soluções técnicas para o problema. Os bancos de dados gráficos são uma tecnologia bem estabelecida que pode ter um papel a desempenhar aqui”.

Vejamos como. Um gráfico de conhecimento é uma estrutura rica em informações que fornece uma visão das entidades e como elas se inter-relacionam. Eles são um ajuste natural para bancos de dados gráficos que são adequados para aplicações que envolvem dados complexos e interconectados com muitos relacionamentos.

Podemos expressar essas entidades e relações como uma rede de fatos confiáveis, que é um “gráfico” do que sabemos. Tendo construído tal estrutura, podemos consultá-la em busca de padrões, mas também podemos computar sobre o gráfico usando algoritmos de gráficos e ciência de dados de gráficos. Isso pode descobrir fatos que antes estavam obscuros e levar a insights valiosos.

Você pode até mesmo gerar incorporações a partir desse gráfico (seus dados e sua estrutura) que podem ser usadas em pipelines de aprendizado de máquina.

Ao combinar um gráfico de conhecimento com um LLM, surgem quatro abordagens principais:

  • Primeiro, os recursos de processamento de linguagem natural dos LLMs podem processar um enorme corpus de dados de texto. Em seguida, pedimos ao próprio LLM que produza um gráfico de conhecimento. O gráfico de conhecimento pode ser inspecionado, QA-ed e curado. É importante ressaltar que o gráfico de conhecimento é explícito e determinista sobre suas respostas de uma maneira que os LLMs não são.
  • Na segunda abordagem, em vez de treinar LLMs em um grande corpus geral, as empresas podem treiná-los exclusivamente em um gráfico de conhecimento existente. Isso significa que eles podem criar chatbots em linguagem natural que parecem muito bem informados sobre os produtos e serviços de uma empresa e podem responder aos usuários sem risco de alucinações enganosas.
  • Em uma terceira abordagem, as mensagens que vão e saem do LLM podem ser interceptadas e enriquecidas com dados do gráfico de conhecimento. No caminho para o LLM, podemos enriquecer prompts com dados do gráfico de conhecimento, enquanto no caminho de volta do LLM, podemos fazer incorporações e resolvê-las em relação ao gráfico de conhecimento para fornecer maior profundidade e contexto para a resposta.
  • Em uma quarta abordagem, que é ativa na esfera da pesquisa, melhores IAs podem ser construídas com gráficos de conhecimento. Aqui, um LLM é enriquecido por uma IA secundária menor, conhecida como “crítica”. O crítico procura erros de raciocínio no LLM. Ao fazer isso, ele cria um gráfico de conhecimento para consumo a jusante por outro modelo “aluno". Em última análise, o aluno é menor e mais preciso do que o LLM original, uma vez que nunca aprende imprecisões factuais e respostas inconsistentes a perguntas, e as ficções são amplamente omitidas.

Gráficos de conhecimento com o ChatGPT no Microsoft Azure

Vale lembrar por que estamos fazendo todo esse trabalho com ferramentas do tipo ChatGPT. O uso da IA generativa pode ajudar os profissionais do conhecimento a executar consultas que desejam que sejam respondidas sem precisar entender e interpretar uma linguagem de consulta ou criar APIs de várias camadas. Isso tem o potencial de aumentar a eficiência e permitir que os funcionários concentrem seu tempo e energia em tarefas de maior valor agregado.

Neo4j_Knowledge_Graphs_1.width-358
– Neo4j

Uma multinacional global de energia já está usando gráficos de conhecimento com o ChatGPT no Microsoft Azure em várias implementações para seu hub de conhecimento corporativo, por exemplo, integrando dados em mais de 250 subdivisões para melhor análise preditiva, cargas de trabalho de aprendizado de máquina e automação de processos. Ainda esse ano, a empresa fornecerá serviços cognitivos adicionais baseados em GenAI para milhares de usuários de funcionários em domínios verticais e personas, incluindo Jurídico, Engenharia e outros departamentos-chave.

A prova de conceito inicial da empresa, acredita-se, deve desbloquear pelo menos 25 milhões de dólares (130 milhões de reais) em valor dentro de três meses com gráficos e LLMs. Claramente, LLMs e gráficos de conhecimento são uma combinação poderosa – especialmente se o gráfico for para tornar os dados, não as aplicações, mais inteligentes.

Também é uma combinação que pode capacitar a GenAI a enfrentar desafios substanciais com precisão e de maneiras que os usuários corporativos possam confiar.

O autor é coautor de Graph Databases (1ª e 2ª edições, O'Reilly) e Graph Databases for Dummies (Wiley). Mais detalhes sobre essa discussão podem ser encontrados em Building Knowledge Graphs (O'Reilly, publicado em agosto de 2024)