Cómo organizar tu repositorio de conocimiento para que la IA encuentre todo: tutorial paso a paso

Cómo organizar tu repositorio de conocimiento para que la IA... — A scientist in a lab coat operates a high-tech robotic arm in a laboratory setti

canonical_url: «https://margapress.com/repositorio-conocimiento-negocio-consultable-claude/»


La promesa del repositorio de conocimiento para IA es atractiva: documenta cómo funciona tu negocio, súbelo al modelo, y ya no tienes que explicar lo mismo cada vez. En la práctica, la mayoría de los intentos producen documentos que el modelo consulta pero no interpreta bien, o que están desactualizados antes de que el sistema esté en marcha.

En el laboratorio llevamos tiempo probando distintos enfoques de diseño de repositorios. Este artículo recoge lo que aprendimos sobre estructura, granularidad y mantenimiento.

El problema central: los repositorios que fallan no son los que tienen poca información

La primera sorpresa del experimento: los repositorios que producían peores resultados no eran los más incompletos, sino los más desorganizados. Un repositorio con 20 documentos bien estructurados superó consistentemente a uno con 80 documentos sin jerarquía clara.

El modelo no «busca» en el repositorio como lo hace un motor de búsqueda. Lee el contexto disponible y extrae lo que cree relevante. Si la información está organizada de forma que el modelo puede inferir qué es relevante para cada tipo de pregunta, el rendimiento es bueno. Si la organización mezcla conceptos sin estructura, el modelo puede recuperar información correcta pero de forma no contextualizada.

Los tres niveles de información que necesita un repositorio bien diseñado

En nuestras pruebas, los repositorios más efectivos tenían información organizada en tres niveles jerárquicos:

Nivel 1 — Contexto de negocio: quién eres, qué haces, para quién, cómo. Una o dos páginas como máximo. Este nivel se incluye siempre al inicio de la sesión.

Nivel 2 — Procesos y procedimientos: cómo se hacen las cosas específicas. Incorporación de clientes, proceso de venta, flujo de aprobaciones, protocolo de soporte. Cada proceso en un documento separado, con nombre de proceso claro en el título.

Nivel 3 — Datos de referencia: información estática o poco cambiante que el modelo puede necesitar. Catálogo de productos, glosario de términos técnicos, políticas internas. Documentos tabulares o estructurados, no narrativos.

La separación entre niveles importa porque el modelo los usa de forma distinta. El nivel 1 siempre está en contexto. Los niveles 2 y 3 se consultan según la tarea.

El experimento de granularidad: ¿qué nivel de detalle funciona mejor?

Para una misma base de conocimiento de procesos empresariales, creamos tres versiones de granularidad distinta:

Alta granularidad: cada paso de cada proceso en su propio documento, con detalle de condiciones, excepciones y responsables. 47 documentos para cubrir los mismos procesos.

Granularidad media: cada proceso en un documento, con pasos listados y excepciones principales mencionadas. 12 documentos.

Baja granularidad: todos los procesos en un único documento tipo wiki, organizados por sección. 1 documento.

Probamos los tres con 60 consultas de trabajo real. La granularidad media produjo los mejores resultados (82% de consultas con respuesta correcta y completa). La alta granularidad produjo el 74% (el modelo tenía dificultad para saber qué documento era relevante cuando había 47 opciones). La baja granularidad produjo el 61% (el documento único mezclaba contextos que el modelo no siempre separaba bien).

Las contradicciones son el mayor riesgo

El fallo más frecuente en repositorios reales no es la falta de información: son las contradicciones entre documentos. El proceso de onboarding dice una cosa, el documento de políticas dice otra ligeramente distinta, y el email de instrucciones que se subió hace seis meses dice una tercera versión.

En nuestras pruebas, cuando el repositorio tenía contradicciones entre documentos sobre el mismo tema, el modelo elegía arbitrariamente cuál seguir en el 78% de los casos (sin señalar la contradicción). Solo en el 22% de los casos señaló que había información inconsistente.

La solución: cada tema debe tener un documento de referencia designado. Si hay documentos más antiguos que pudieran contradecirlo, o se eliminan del repositorio o se etiquetan explícitamente como «histórico, no vigente».

El protocolo de mantenimiento mínimo que funciona

El repositorio más común que falla no es el que nunca se actualiza, sino el que se actualiza de forma parcial: se añaden documentos nuevos pero no se revisan o retiran los que quedan obsoletos.

El protocolo mínimo que nuestras pruebas identificaron como efectivo:

1. Cada nuevo documento de proceso tiene fecha de última revisión en el encabezado.

2. Revisión trimestral de todos los documentos: no reescribir, sino verificar que siguen siendo correctos y actualizar la fecha si lo son.

3. Cuando un proceso cambia: actualizar el documento ese mismo día, no «cuando haya tiempo». La desactualización acumulada es el mayor enemigo del repositorio.

4. Cuando hay duda sobre si un documento es vigente: marcarlo como «en revisión» hasta confirmar. Es mejor que el modelo sepa que hay incertidumbre que que confíe en información posiblemente desactualizada.

El repositorio mínimo viable para empezar

Si estás construyendo un repositorio desde cero, el MVP más efectivo es: contexto de negocio (nivel 1, un documento de una página), los tres o cuatro procesos que el modelo necesita ejecutar más frecuentemente (nivel 2, un documento por proceso), y el glosario de términos específicos de tu negocio que el modelo podría interpretar de forma diferente a como los usas (nivel 3).

Con eso ya tienes un repositorio funcional. El crecimiento posterior debería venir de los casos donde el modelo falla por falta de información específica, no de intentar documentar todo lo posible de antemano.


El sistema completo de repositorio de conocimiento para trabajo con IA está en El Empleado Digital.

Descarga el libro en Amazon | Lee el artículo original en MargaPress

Esto es solo una muestra. El libro completo te enseña a convertir la IA en tu empleado más productivo.


Portada del libro El Empleado Digital

📖 El Empleado Digital
Claude y la IA como tu mejor colaborador

👉 Comprar en Amazon

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *