Cómo se componen los tokens de input y output — y qué confunde en el camino.
Cuando el equipo de IEB+ usa Claude para armar reportes de mercado, rebalancear carteras o responder consultas, no paga "la pregunta". Paga por cada cosa que el modelo lee antes de responder (input) y cada cosa que genera (output). Acá lo vemos desglosado en los 3 productos: Chat, Cowork y Code.
Input vs output en 30 segundos
Dos lados del mismo intercambio. Los dos cuentan, pero se cobran distinto.
Todo lo que Claude lee antes de responder
El system prompt, las skills, la memoria del usuario, el historial de la conversación, los archivos que adjuntaste, los resultados de las herramientas que usó en turnos previos y tu mensaje actual. Todo junto entra a la ventana de contexto.
Sonnet 4.5: USD 3 / 1M tokensTodo lo que Claude genera
El texto que ves como respuesta, el thinking interno (si usa extended thinking), las llamadas a tools (JSON), y el contenido de los artifacts. No cuenta el archivo físico exportado — cuenta el texto que Claude escribió para armarlo.
Sonnet 4.5: USD 15 / 1M tokens · 5× más caroAmbigüedades que cambian la factura a fin de mes
La diferencia entre "esto cuenta" y "esto no cuenta" es donde la mayoría se pierde. Los casos más frecuentes:
scripts/ocr.py no suma tokensSKILL.md que lo describe síClaude Chat — claude.ai
El chat web. Input heterogéneo porque incluye todo lo que armaste en tu cuenta (projects, skills, memoria) más lo que pegás en el chat.
Chat
Sesión en claude.ai con proyecto y skills activos
Claude Cowork
El entorno colaborativo donde trabajás con Claude sobre documentos compartidos. El input crece con el workspace — no con cada mensaje individual.
Cowork
Workspace compartido, documentos vivos, contexto sostenido
Claude Code — CLI
El agente de código. Input explota porque Claude lee archivos, corre comandos y los resultados se acumulan. Output también explota porque piensa mucho.
Code
Agente en terminal con acceso a archivos, bash y MCP
Grep, Read sobre 6 archivos del skill market-report/, corre los tests con Bash, razona entre medio, y edita 2 archivos. Los resultados de cada tool se apilan en el contexto. ~35.000t input + ~6.500t output ≈ USD 0,20 esa sesión. Por eso Claude Code es el más caro: el acumulado de tool results pega duro.
El output es 5× más caro, pero el input es el que crece sin que lo notes.
Una respuesta larga duele en el bolsillo, pero lo que más escala el costo en Chat y Cowork es el historial + archivos adjuntos + vector store. En Code, los outputs de tools que se acumulan en el contexto. La regla que funciona: empezá chats nuevos cuando cambia el tema, cacheá lo que repetís (system prompts largos, docs que no cambian), y diseñá skills con progressive disclosure para no pagar lo que no usás.