Le pides a Claude Code un refactor rápido y se frena a mitad de camino: límite alcanzado, en pausa hasta que se reinicie la ventana. Una hora después vuelve a correr, pero ahora las respuestas se sienten más flojas que ayer, así que empiezas a reescribir tus prompts convencido de que el modelo "se volvió más tonto". Aquí está la trampa en la que nuestro equipo cae una y otra vez: son dos problemas distintos con el mismo disfraz. Uno es un límite de uso que el proveedor aplica. El otro es un bajón de calidad que muchas veces viene de un bug temporal de su lado. Si los tratas igual, pierdes la tarde arreglando lo que no era.
Qué es realmente este problema
Hay dos confusiones distintas escondidas bajo "mi agente de IA está fallando". La primera es un límite de uso: el proveedor limita cuánto puedes correr en un periodo, y al cruzar ese tope tu sesión queda en pausa hasta que la ventana se reinicia. Es algo determinista y esperable. La segunda es una caída de calidad percibida: el modelo sigue respondiendo, pero las respuestas se sienten peores, así que asumes que lo degradaron en silencio. Esa segunda sensación es real con suficiente frecuencia como para tomarla en serio, pero la causa suele ser un bug temporal y reparable, no una degradación deliberada. Lo más útil es saber cuál de los dos enfrentas antes de tocar un solo prompt.
A quién le importa esto
- Ideal para: solopreneurs, creadores y product managers que se apoyan en Claude Code, el OpenAI Codex CLI o Cursor a diario y pierden horas cuando una sesión se traba o la calidad baja.
- También útil para: equipos pequeños que comparten un plan y a quienes les llega el clásico "¿solo a mí me pasa?" en el chat cada vez que la salida se siente rara.
- No es problema para: quienes usan muy poco y corren un par de prompts por semana — casi nunca rozarás un límite de uso, y una mala respuesta aislada no es un patrón que valga la pena diagnosticar.
Qué necesitas
| Herramienta | Qué hace aquí | Enlace oficial |
|---|---|---|
Claude Code /usage | Muestra tu uso del plan contra la ventana móvil y el límite semanal, para confirmar si de verdad estás limitado | Docs de costos y uso de Claude Code (en inglés) |
| Estado / blog de ingeniería del proveedor | Te dice si hay un incidente actual que está degradando la calidad para todos, no solo para ti | Blog de ingeniería de Anthropic (en inglés) |
| Un asistente de respaldo | Una segunda herramienta configurada (por ejemplo Cursor u otro modelo) para que un límite o incidente no te bloquee todo el día | Docs de OpenAI Codex (en inglés) |
| Tu página de uso de la cuenta | La vista web de los mismos límites, útil cuando no estás en la terminal | Seguimiento de uso de Claude Code (en inglés) |
La solución de un vistazo
| Síntoma | Causa más probable | Solución más rápida |
|---|---|---|
| "Límite alcanzado, en pausa hasta reiniciar" | Cruzaste la ventana móvil de ~5 horas o la semanal | Corre /usage, mira la hora de reinicio, cambia a tu herramienta de respaldo o espera |
| Salida de pronto peor para todos los que conoces | Probablemente un incidente temporal conocido | Revisa la página de estado / blog de ingeniería; espera o reporta, no reescribas prompts todavía |
| Salida peor solo para ti, de forma gradual | Deriva del prompt o contexto inflado | Empieza una sesión nueva, ajusta el prompt, limita los archivos |
| Chocas con los límites todo el tiempo | Trabajos pesados amontonados juntos | Reparte los trabajos grandes a lo largo de la ventana de uso |
Paso a paso
- Revisa
/usageprimero. En Claude Code, corre/usagepara ver dónde estás frente a la ventana móvil y el límite semanal. Si estás en pausa, el problema es un límite de uso — no la calidad — y ningún cambio de prompt ayuda hasta que la ventana se reinicie. - Lee el reinicio, no pelees con él. Si llegaste al tope, anota la hora de reinicio. Darle a "reintentar" sin parar solo quema tiempo. Mueve el trabajo pesado a tu respaldo o prográmalo después del reinicio.
- Si es un problema de calidad, revisa el estado oficial y el blog de ingeniería. Un bajón de calidad repentino y amplio que varias personas notan a la vez es la firma de un incidente del lado del proveedor, no de tus prompts.
- Identifica el patrón. Amplio y repentino entre usuarios → probablemente un incidente conocido: espera o reporta. Gradual y solo para ti → probablemente deriva del prompt o contexto inflado: arregla eso.
- No reescribas en pánico. Reescribir prompts buenos durante un incidente deja cambios que tendrás que deshacer cuando arreglen el bug. Mantén la calma primero.
- Ten un asistente de respaldo configurado. Una segunda herramienta lista significa que un límite o incidente es una molestia, no un día perdido.
- Reparte los trabajos pesados. Divide los trabajos enormes en partes más pequeñas a lo largo de la ventana móvil para dejar de estrellarte contra el tope.
Comandos para copiar y pegar
Esta es la lista de triage que de verdad corremos. El primer bloque es un comando real de Claude Code; el resto es una rutina escrita más algunos stubs ilustrativos que adaptas a tu setup.
# 1. Revisa tu estado de uso real (córrelo dentro de Claude Code)
/usage
# Presiona d / w para alternar entre las últimas 24 horas y los últimos 7 días.
# Si ves que estás en pausa, la hora de reinicio te dice cuándo vuelve el acceso.
# 2. Rutina de triage (cópiala en tus notas — no es un script para correr a ciegas)
# a. ¿Estoy limitado? -> /usage dice en pausa -> es un LIMITE DE USO, espera/cambia
# b. ¿La calidad esta mal para todos? -> revisa estado + blog de ingenieria
# Ingenieria de Anthropic: https://www.anthropic.com/engineering
# c. ¿Bajon amplio + repentino? -> probable incidente conocido: ESPERA o REPORTA, no reescribas
# d. ¿Solo a mi + gradual? -> sesion nueva, ajusta el prompt, limita archivos
# 3. Setup del respaldo (ilustrativo — revisa las docs oficiales de cada herramienta)
# - Manten un segundo agente instalado y autenticado, por ejemplo OpenAI Codex CLI
# docs: https://developers.openai.com/codex/
# - Verifica que arranca ANTES de necesitarlo en una emergencia:
codex --version # ilustrativo: confirma que tu CLI de respaldo esta lista
Marca todo este bloque como rutina, no como magia: el único comando garantizado real aquí es /usage dentro de Claude Code. A junio de 2026, los flags de las herramientas cambian entre versiones — verifica la página oficial.
Ejemplo: lo que vas a ver
Llevas unas horas en tu día de desarrollo y una petición simplemente se detiene. El agente reporta algo como que se alcanzó un límite y la sesión queda en pausa hasta el reinicio. Correr /usage lo confirma: tu barra semanal está casi llena y la ventana móvil está agotada. Nada está roto — simplemente usaste la asignación de esta ventana. Aquí no importa cuánto ajustes el prompt; las únicas variables son el tiempo y tu herramienta de respaldo.
> /usage
Uso del plan (ultimos 7 dias): ████████████░░ cerca del limite
Ventana actual de 5 horas: ██████████████ agotada
Se reinicia en: un par de horas (pantalla ilustrativa)
Ejemplo: después de la solución
En lugar de reescribir prompts, lees la hora de reinicio, cambias a tu asistente de respaldo ya configurado y sigues avanzando con la siguiente tarea. Cuando la ventana se reinicia, tu agente principal vuelve a su comportamiento normal — sin cirugía de prompts, porque tus prompts nunca tuvieron nada malo. La sensación de "más tonto", si la hubo, resulta coincidir con un incidente de la página de estado que el proveedor resuelve durante el día, y tu calidad de salida regresa sola. Todo el episodio te cuesta minutos, no una tarde.
Notas probadas
- Tipo de entrada: una sesión de código trabada más una queja vaga de "el modelo se siente peor hoy" — el par exacto que confunde a la gente.
- Herramienta usada: Claude Code (para
/usagey la revisión de la ventana móvil), con el OpenAI Codex CLI como asistente de respaldo. - Mejor resultado: correr
/usageprimero separó al instante el "estoy limitado" del "bajó la calidad", y eso decidió cada paso siguiente. - Lo que falló: reescribir prompts durante lo que resultó ser un incidente del lado del proveedor — las ediciones no hicieron nada y hubo que revertirlas cuando arreglaron el bug.
- Ediciones manuales aún necesarias: aún tienes que leer la hora de reinicio, decidir esperar o cambiar, y juzgar si un bajón de calidad es amplio-y-repentino o gradual-y-solo-tuyo.
Trampas en las que de verdad caímos
La grande: asumir que un bajón de calidad significa que degradaron el modelo en secreto, y luego "arreglarlo" destrozando prompts que estaban bien. En nuestras pruebas, los peores días fueron aquellos en que ya había un incidente real rastreado públicamente — solo que no habíamos mirado. También perdimos tiempo tratando una pausa dura de uso como si reintentar con más fuerza ayudara; no ayuda, la ventana es la ventana. Y nos pasamos de la raya repartiendo los trabajos tan finos que tareas simples se alargaron. La solución no es paranoia, es una revisión de 30 segundos antes de reaccionar. A junio de 2026, verifica las docs de uso y las páginas de estado oficiales — el comportamiento cambia entre versiones.
Errores comunes
- Confundir un límite de uso con un problema de calidad, e intentar arreglos de prompt cuando simplemente estás en pausa.
- Reescribir en pánico prompts buenos durante un incidente del proveedor, y luego tener que deshacer los cambios.
- No configurar nunca un asistente de respaldo, así que un límite o caída te bloquea todo el día.
- Amontonar todos tus trabajos pesados juntos y estrellarte temprano contra la ventana móvil.
- Creerte la historia (ya revertida) de las horas pico y planear alrededor de una restricción que ya no aplica.
Alternativas de herramientas
| Herramienta | Cómo maneja los límites de uso | El ángulo de "se volvió más tonto" |
|---|---|---|
| Claude Code | Ventana móvil de ~5 horas más un límite semanal de 7 días; revisa con /usage o la página de la cuenta (a junio de 2026, verifica las docs oficiales) | Anthropic ha publicado postmortems de ingeniería de bugs temporales de calidad y afirma que no degrada la calidad de forma intencional |
| ChatGPT / OpenAI Codex | El uso está limitado por plan; revisa la propia vista de uso del proveedor y las docs oficiales para los límites actuales | El liderazgo de OpenAI (Sam Altman) reconoció públicamente problemas de routing alrededor de GPT-5 que podían enviar algunas consultas a respuestas más débiles (atribuido; con cautela — revisa el estado actual) |
| Cursor | Tiene sus propios controles de uso y de modelo; consulta las docs de Cursor para los límites actuales en vez de asumir etiquetas | La percepción de calidad depende del modelo subyacente y de cualquier incidente que lo afecte; trátalo igual — revisa el estado antes de reescribir |
FAQ
¿Cómo sé si llegué a un límite de uso de Claude o si el modelo solo empeoró?
Corre /usage en Claude Code primero. Si te muestra en pausa frente a la ventana móvil de aproximadamente 5 horas o al límite semanal, es un límite de uso y ningún cambio de prompt ayuda hasta el reinicio. Si /usage se ve bien pero las respuestas se sienten raras, trátalo como un posible problema de calidad y revisa la página de estado o el blog de ingeniería del proveedor. A junio de 2026 los límites y ventanas cambian entre versiones, así que confírmalo con las docs de uso oficiales y no de memoria.
¿Claude de verdad se está volviendo más tonto con el tiempo?
Por lo general no — los bajones que se reportan suelen ser bugs reales pero temporales de infraestructura o producto, no una degradación deliberada. Anthropic ha publicado postmortems de ingeniería que describen esas regresiones y cómo las corrigieron, y ha declarado que no degrada la calidad del modelo de forma intencional. Así que un bajón amplio y repentino es más probablemente un incidente conocido que un recorte oculto. A junio de 2026, revisa el blog de ingeniería por si hay un reporte actual antes de concluir que el modelo cambió de forma permanente.
¿Debo reescribir mis prompts cuando la salida baja de pronto?
No primero. Si el bajón es repentino y amplio — varias personas notan lo mismo a la vez — apunta a un incidente del lado del proveedor, y reescribir prompts buenos solo crea cambios que después deshaces. Revisa la página de estado y el blog de ingeniería antes de tocar nada. Si en cambio la caída es gradual y solo tú la ves, ahí sí la deriva del prompt o un contexto inflado son los culpables probables y una sesión nueva y más ajustada ayuda. Diagnostica el patrón antes de editar.
¿Y la restricción de horas pico de la que leí?
Existió una restricción extra de horas pico, pero fue revertida en 2026, así que no planees tu día alrededor de un throttling en hora pico como si estuviera activo ahora. Los límites que siguen aplicando son la ventana móvil de aproximadamente 5 horas y el límite semanal de 7 días. A junio de 2026, este es justo el tipo de detalle que cambia entre versiones, así que verifica las reglas actuales en las docs de uso oficiales en vez de confiar en guías viejas o posts de foros.
¿Cómo dejo de chocar con los límites tan seguido?
Reparte los trabajos pesados a lo largo de la ventana de uso en lugar de amontonarlos, y ten un asistente de respaldo configurado para que una pausa no sea un freno total. Échale un ojo a /usage durante las sesiones largas para que un límite no te sorprenda a mitad de tarea. Además, limita cada petición a los archivos que necesita en vez de volcar un contexto enorme, que agota tu asignación más rápido. A junio de 2026, verifica las docs de uso oficiales — las ventanas y lo que cuenta pueden cambiar entre versiones.
Recomendación final
Construye un reflejo de triage de 30 segundos: /usage primero para separar un límite de uso de un problema de calidad, y luego la página de estado y el blog de ingeniería antes de tocar un prompt. Si es un límite, espera o cambia a una herramienta de respaldo; si la calidad bajó de forma amplia y repentina, probablemente sea un incidente conocido y temporal — repórtalo y mantén la calma en vez de reescribir en pánico. Ten un segundo asistente listo y reparte los trabajos pesados a lo largo de la ventana. Esa rutina tranquila le gana a la cirugía de prompts casi siempre.
👉 Guarda esta rutina de triage y combínala con nuestras guías para correr agentes de IA de código de forma confiable — empieza por el hub de guías de Automatización con IA para que el próximo freno te cueste minutos, no una tarde.
Guías relacionadas
- Cómo reducir los costos de tokens en tu código con IA — los límites y las facturas son primos; menos contexto significa menos sorpresas.
- Los 5 problemas de correr agentes de IA de código (y una rutina de mantenimiento) — dónde encaja este playbook de límites en el panorama completo.
- ChatGPT vs Claude vs Gemini en español — en qué se diferencian las herramientas cuando eliges o mantienes un respaldo.
- Hub de la categoría Automatización con IA — el resto de nuestros playbooks de operación de agentes.

Lingye