Por Victor Botev, CTO y cofundador de Iris.ai
Las capacidades de ChatGPT han cautivado a organizaciones de todas las industrias, y muchas buscan aprovecharlas en sus operaciones. La rápida serie de anuncios de Microsoft y OpenAI solo ha avivado las llamas, lo que provocó especulaciones sobre cómo ChatGPT podría interrumpir la superioridad de búsqueda de Google.
Las organizaciones seguirán este ejemplo y buscarán integrar modelos de lenguaje extenso (LLM) en los motores de búsqueda. Los LLM que sustentan las aplicaciones de IA, como GPT-3 para ChatGPT, tienen un enorme potencial para interpretar e imitar la escritura humana de forma natural.
Con base en miles de millones de parámetros de datos, los LLM pueden captar los matices de los lenguajes humanos e interpretar coloquialismos, subtextos y preguntas matizadas. Como tal, su producción puede ser igualmente rica y convincente, una gran progresión del texto generado por IA de años pasados.
Sin embargo, hay una diferencia entre ser capaz de escribir de manera convincente y escribir con precisión. El mismo tamaño que permite a los LLM crear una salida que suena humana también dificulta su factualidad, lo que lleva a alucinaciones y respuestas falsas. En las industrias donde la precisión de los hechos es una prioridad, esto es una preocupación, y eso también se aplica a las consultas en los buscadores.
El tamaño de los LLM
Los LLM de proveedores conocidos como OpenAI y Google están capacitados en grandes cantidades de texto extraído de Internet. El alcance y la variedad de estos datos de capacitación pretenden cubrir casi todos los temas imaginables, lo que permite a los LLM desarrollar una idea de cómo hablan los laicos.
Los problemas surgen una vez que estos LLM se trasladan a campos especializados. Industrias como la ciencia de los materiales, la ingeniería o la fabricación tienen una terminología específica que tiene un significado individual para cada campo. Esto variará drásticamente de cómo se usa en la conversación diaria. Esto no solo incluye definiciones: una disciplina puede tener relaciones muy diferentes entre conceptos y términos en comparación con las mismas palabras en otra disciplina.
En consecuencia, los LLM que reciben solicitudes en campos especializados a menudo terminan recopilando información irrelevante de un área no relacionada. Terminarán usando definiciones incorrectas cuando obtengan información, o simplemente malinterpretando la pregunta que se les hace.
Estos problemas se amplifican cuando se trata de una búsqueda. En términos generales, cuando un usuario realiza una consulta en un motor de búsqueda de Internet, no es un experto en el área en la que busca obtener una comprensión. Como tal, las respuestas potencialmente inexactas generadas por el LLM podrían ser tomadas como un hecho por los usuarios. Esto es especialmente cierto si una respuesta no va acompañada de citas para fundamentar la respuesta.
Modelos más inteligentes
Los LLM no han sido diseñados para permitir consultas dentro de los motores de búsqueda. Pero existe una alternativa: modelos de lenguaje inteligente. Estos son modelos que están entrenados en conjuntos de datos seleccionados de alta calidad.
Los modelos de lenguaje inteligente están diseñados desde cero para la precisión de los hechos. Diseñados para servir a un campo particular de experiencia, el enfoque de sus datos de entrenamiento permite que estos modelos comprendan el lenguaje y los conceptos específicos del dominio. También pueden citar las fuentes de información de estas respuestas, lo que ayuda a explicarlas. El enfoque de los modelos de lenguaje inteligente es particularmente útil en el contexto de la búsqueda, ya que estos modelos pueden procesar mejor los enlaces, clasificaciones y anuncios intrínsecos a la búsqueda.
Los modelos de lenguaje inteligente brindan un fuerte contraste con muchos de los problemas actuales que se encuentran con los LLM en la búsqueda, donde no hay garantía de precisión fáctica y no se citan las fuentes.
Los LLM y los modelos de lenguaje inteligente tienen propiedades únicas que podrían ser la base para el futuro de las búsquedas, lo que permite capacidades de búsqueda personalizadas, similares a las humanas e interactivas. Sin embargo, la tecnología tendrá que evolucionar hasta que la plausibilidad y la factualidad alcancen el mismo nivel.
Hoy en día, los modelos de lenguaje inteligente son más adecuados para las aplicaciones empresariales que los LLM porque se centran en la factualidad, pero la plausibilidad de los LLM será importante en el futuro para hacer que los resultados fácticos sean más fáciles de entender y digerir por parte de los usuarios.