Cómo iterar con Claude: tutorial de feedback para mejorar resultados sin pedir ‘otra versión

Cómo iterar con Claude: tutorial de feedback para mejorar re... — A group of young professionals brainstorming ideas in a startup office setting.

canonical_url: «https://margapress.com/feedback-iterar-claude-junior-brillante/»


Existe un patrón de uso muy común y muy costoso en tiempo: pedir algo a la IA, no estar satisfecho con el resultado, pedir «otra versión» sin especificar qué cambiar, y repetir el ciclo hasta que algo encaje o hasta que uno se rinde. Es el equivalente de decirle a un redactor «no me gusta, hazlo diferente» y esperar que adivine en qué dirección diferente.

El tiempo real que se pierde en este ciclo no está en las respuestas del modelo. Está en las iteraciones innecesarias que podrían haberse evitado con un feedback más estructurado desde el inicio.

En el laboratorio medimos exactamente esto: qué tipos de feedback producen outputs mejores en menos iteraciones. Los resultados tienen implicaciones directas para cualquiera que use IA en trabajo diario.

El diseño del experimento

150 sesiones de iteración con una tarea fija: producir el primer borrador de un documento profesional (un email, una propuesta corta, un informe de una página). La tarea era idéntica, pero el feedback entre iteraciones variaba según el protocolo asignado.

Cinco protocolos de feedback distintos:

Protocolo A — Feedback vago: «no está bien», «más profesional», «otra versión».

Protocolo B — Feedback de dimensión: especificar en qué dimensión falla (tono, estructura, longitud, contenido).

Protocolo C — Feedback de causa: explicar por qué no funciona («suena excesivamente formal para el tipo de relación que tenemos con este cliente»).

Protocolo D — Feedback de ejemplo: mostrar un fragmento de cómo debería quedar («el párrafo de cierre debería sonar más como esto: [ejemplo]»).

Protocolo E — Feedback de diagnóstico conjunto: pedir primero al modelo que identifique qué aspectos del output cree que no cumplen el objetivo, luego añadir la corrección.

Medimos: número de iteraciones hasta output usable, tasa de mejora por iteración y tasa de regresión (iteraciones donde el output empeora respecto al anterior).

Resultado 1 — Número de iteraciones hasta output usable

| Protocolo | Media de iteraciones |

|—|—|

| A — Vago | 4.8 |

| B — Dimensión | 2.9 |

| C — Causa | 2.3 |

| D — Ejemplo | 1.9 |

| E — Diagnóstico conjunto | 2.1 |

El protocolo con ejemplo (D) produce el menor número de iteraciones medias. El diagnóstico conjunto (E) es ligeramente menos eficiente pero produce los outputs más consistentes en las sesiones posteriores dentro de la misma conversación.

El feedback vago (A) produce casi el doble de iteraciones que el feedback con ejemplo (D). Y lo que es más relevante en términos de tiempo real: en el 31% de las sesiones con protocolo A, el output nunca llegó a ser usable en las 7 iteraciones que establecimos como límite. En el protocolo D ese porcentaje fue del 8%.

Resultado 2 — Tasa de regresión

Uno de los hallazgos más útiles del experimento: la tasa de regresión (iteraciones donde el output empeora) varía significativamente según el protocolo.

  • Protocolo A: 23% de regresión
  • Protocolo B: 14%
  • Protocolo C: 11%
  • Protocolo D: 7%
  • Protocolo E: 4%

Las regresiones son especialmente costosas porque no solo no avanzan, sino que hay que detectarlas (lo que requiere comparación activa con versiones anteriores) y corregirlas (un paso adicional de iteración). El protocolo de diagnóstico conjunto (E) tiene la menor tasa de regresión porque al incluir al modelo en el diagnóstico, se crea un momento de alineación antes de la corrección.

Resultado 3 — Cuándo vale la pena empezar de cero

El experimento incluyó también un análisis de cuándo la iteración continua es peor opción que empezar una conversación nueva.

El criterio que emergió de los datos: si en tres iteraciones consecutivas el output no mejora en la dimensión principal que estás intentando corregir, empezar de cero con un primer mensaje mejorado es casi siempre más eficiente.

La razón técnica: cuando una conversación acumula varios mensajes de feedback negativo sin resolución, el modelo empieza a optimizar para «lo que quiere el usuario» en un sentido demasiado amplio, incorporando señales contradictorias de distintas iteraciones. El resultado es un output que intenta satisfacer todos los feedbacks a la vez y que termina siendo una solución de compromiso sin coherencia.

El nuevo primer mensaje más eficiente en estos casos no es «hazlo diferente». Es un primer mensaje que incorpora las instrucciones originales más la causa del fallo que has identificado en las iteraciones anteriores.

El protocolo mínimo recomendado

Si tuvieras que adoptar un solo cambio en tu forma de iterar con IA, es este: antes de escribir el feedback, identifica en qué dimensión específica el output no cumple tu objetivo. No «no me gusta» sino «el tono no es correcto», «falta la información X», «la estructura no facilita la lectura del destinatario».

Con esa dimensión identificada, el feedback más eficiente es: [dimensión que falla] + [por qué no cumple el objetivo] + [si tienes un ejemplo, mejor].

Este protocolo simplificado (B+C+D) produjo en nuestras pruebas resultados comparables al protocolo E con menor tiempo de preparación.

Lo que el experimento no resolvió: el problema de los objetivos implícitos

Hay una limitación importante que el experimento reveló pero no resolvió: la iteración es más difícil cuando el usuario no sabe exactamente qué está buscando. Esto es más común de lo que parece: en muchos casos de uso real, el feedback vago («no está bien») no es pereza ni falta de habilidad. Es que el usuario genuinamente no sabe articular qué le falta al output.

En esos casos, el protocolo E (diagnóstico conjunto) tiene una ventaja que el resto no tienen: al pedir al modelo que identifique sus propias debilidades, a veces ayuda al usuario a articular lo que estaba buscando sin saberlo.

«Creo que el punto débil de este texto es que el tono es demasiado formal para una comunicación inicial» es una frase que el modelo puede generar y que puede hacer que el usuario responda «sí, exacto, eso es lo que buscaba». No como validación de lo que el modelo ya sabía, sino como ayuda para que el usuario articule su propio criterio.


El marco completo de iteración eficiente con IA está desarrollado con casos prácticos en El Empleado Digital.

Descarga el libro en Amazon | Lee el artículo original en MargaPress

Esto es solo una muestra. El libro completo te enseña a convertir la IA en tu empleado más productivo.


Portada del libro El Empleado Digital

📖 El Empleado Digital
Claude y la IA como tu mejor colaborador

👉 Comprar en Amazon

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *