Por Jim Webber, científico jefe de Neo4j
En este momento, hay un gran entusiasmo acerca de la IA generativa (Inteligencia Artificial), especialmente los modelos grandes de lenguaje (LLM). Podría decirse que el entusiasmo inicial en torno a ChatGPT está disminuyendo, pero está claro que hay suficiente tecnología e investigación académica para que los desarrolladores presten una atención seria.
A pesar del potencial del enfoque, los LLM plantean una serie de desafíos. Entre ellos se incluyen el conocido problema de las alucinaciones (inventar falsedades persuasivas), pero también los falsos razonamientos lógicos (si dos camisas tardan dos horas en secarse en el tendedero, ¿cuánto tardan cinco camisas?) y dar una respuesta equivocada a ciertas preguntas.
Además, existen altos costos asociados con la capacitación de un LLM de uso empresarial. Es complejo actualizarlos y mantenerlos, y es difícil realizar auditorías y dar explicaciones. Afortunadamente, estos problemas pueden remediarse o paliarse.
Gráficos de conocimiento al rescate
Los inconvenientes de los LLM se pueden abordar significativamente respaldándolos con gráficos de conocimiento creados sobre motores de bases de datos de gráficos modernos. Fuertes analistas técnicos como Redmonk están de acuerdo: “Las empresas están justificadamente preocupadas por los peligros de que información incorrecta o 'alucinaciones' entren en sus cadenas de suministro de información, y están buscando soluciones técnicas al problema. Las bases de datos de gráficos son una tecnología bien establecida que puede tener un papel que desempeñar aquí”.
Veamos cómo. Un gráfico de conocimiento es una estructura rica en información que proporciona una vista de las entidades y cómo se interrelacionan. Son una opción natural para las bases de datos de gráficos que son adecuadas para aplicaciones que involucran datos complejos e interconectados con muchas relaciones.
Podemos expresar estas entidades y relaciones como una red de hechos afirmables, es decir, un "gráfico" de lo que sabemos. Una vez construida una estructura de este tipo, podemos consultarla en busca de patrones, pero también podemos calcular sobre el gráfico utilizando algoritmos de gráficos y ciencia de datos de gráficos. Hacerlo puede revelar hechos que antes estaban ocultos y generar conocimientos valiosos.
Incluso puede generar incrustaciones a partir de este gráfico (tanto sus datos como su estructura) que pueden usarse en procesos de aprendizaje automático.
Al combinar un gráfico de conocimiento con un LLM, surgen cuatro enfoques principales:
- En primer lugar, las funciones de procesamiento del lenguaje natural de los LLM pueden procesar una enorme cantidad de datos de texto. Luego le pedimos al propio LLM que produzca un gráfico de conocimiento. El gráfico de conocimiento se puede inspeccionar, realizar controles de calidad y seleccionar. Es importante destacar que el gráfico de conocimiento es explícito y determinista acerca de sus respuestas de una manera que los LLM no lo son.
- En el segundo enfoque, en lugar de capacitar a los LLM en un gran corpus general, las empresas pueden capacitarlos exclusivamente en un gráfico de conocimiento existente. Eso significa que pueden crear chatbots en lenguaje natural que parecen tener mucho conocimiento sobre los productos y servicios de una empresa y pueden responder a los usuarios sin riesgo de sufrir alucinaciones engañosas.
- En un tercer enfoque, los mensajes que van hacia y desde el LLM pueden interceptarse y enriquecerse con datos del gráfico de conocimiento. En el camino hacia el LLM podemos enriquecer las indicaciones con datos del gráfico de conocimiento, mientras que en el camino de regreso desde el LLM, podemos tomar incrustaciones y resolverlas en comparación con el gráfico de conocimiento para proporcionar mayor profundidad y contexto para la respuesta.
- En un cuarto enfoque, que está activo en el ámbito de la investigación, se pueden construir mejores IA con gráficos de conocimiento. Aquí, un LLM se enriquece con una IA secundaria más pequeña, conocida como "crítica". El crítico busca errores de razonamiento en el LLM. Al hacerlo, crea un gráfico de conocimiento para el consumo posterior de otro modelo de "estudiante". En última instancia, el estudiante es más pequeño y más preciso que el LLM original, ya que nunca aprende inexactitudes objetivas o respuestas inconsistentes a las preguntas, y las ficciones se omiten en gran medida.
Gráficos de conocimiento con ChatGPT en Microsoft Azure
Vale la pena recordarnos por qué estamos haciendo todo este trabajo con herramientas similares a ChatGPT. El uso de IA generativa puede ayudar a los trabajadores del conocimiento a ejecutar las consultas que desean que se respondan sin tener que comprender e interpretar un lenguaje de consulta o crear API de varias capas. Esto tiene el potencial de aumentar la eficiencia y permitir que los empleados concentren su tiempo y energía en tareas de mayor valor agregado.
Una multinacional energética global ya está utilizando gráficos de conocimiento con ChatGPT en Microsoft Azure en múltiples implementaciones para su centro de conocimiento empresarial, por ejemplo, integrando datos en más de 250 subdivisiones para mejores análisis predictivos, cargas de trabajo de aprendizaje automático y automatización de procesos. A finales de este año, la empresa ofrecerá servicios cognitivos adicionales basados en GenAI a miles de usuarios empleados en dominios y personas verticales, incluidos los departamentos jurídico, de ingeniería y otros departamentos clave.
Se cree que la prueba de concepto inicial de la compañía desbloqueará al menos 25 millones de dólares en valor en tres meses con gráficos y LLM. Claramente, los LLM y los gráficos de conocimiento son una combinación poderosa, especialmente si el gráfico es para hacer que los datos, no las aplicaciones, sean más inteligentes.
También es una combinación que puede permitir que GenAI aborde desafíos sustanciales con precisión y de manera que los usuarios empresariales puedan confiar.
El autor es coautor de Graph Databases (1.ª y 2.ª ediciones, O'Reilly) y Graph Databases for Dummies (Wiley). Puede encontrar más detalles sobre esta discusión en Building Knowledge Graphs (O'Reilly, publicado en agosto de 2024).