workspace-v1/orchestration/directivas/simco/SIMCO-CONTROL-TOKENS.md
rckrdmrd ff3038f183 feat(orchestration): Add subagent token management system
Sistema completo de gestión de tokens para subagentes NEXUS v4.0:

Nuevas directivas SIMCO:
- SIMCO-SUBAGENTE.md: Protocolo para agentes en modo subagente
- SIMCO-CCA-SUBAGENTE.md: CCA ligero para subagentes (~1,500 tokens)
- SIMCO-CONTROL-TOKENS.md: Gestión de límites de tokens
- SIMCO-DELEGACION-PARALELA.md: Delegación paralela

Perfiles compact (~250 tokens cada uno):
- PERFIL-BACKEND-COMPACT.md
- PERFIL-FRONTEND-COMPACT.md
- PERFIL-DATABASE-COMPACT.md
- PERFIL-DEVOPS-COMPACT.md
- PERFIL-ML-COMPACT.md
- PERFIL-GENERIC-SUBAGENT.md

Templates de delegación escalonados:
- TEMPLATE-DELEGACION-MINIMA.md (~250 tokens)
- TEMPLATE-DELEGACION-ESTANDAR.md (~600 tokens)
- TEMPLATE-DELEGACION-COMPLETA.md (~1,800 tokens)

Nuevos perfiles especializados:
- PERFIL-MCP-ARCHITECT.md
- PERFIL-MCP-DEVELOPER.md
- PERFIL-RAG-ENGINEER.md
- PERFIL-CICD-SPECIALIST.md
- PERFIL-PRODUCTION-MANAGER.md
- PERFIL-MONITORING-AGENT.md
- PERFIL-SECRETS-MANAGER.md
- PERFIL-PROPAGATION-TRACKER.md

Checklists y documentación:
- CHECKLIST-PRE-DELEGACION.md
- Análisis y planes de implementación

Métricas de mejora:
- ~59% reducción de tokens por delegación
- Perfiles compact: 69% más ligeros
- CCA subagente: 85% más ligero

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-07 04:43:01 -06:00

6.7 KiB

SIMCO: CONTROL DE TOKENS

Versión: 1.0.0 Sistema: SIMCO - NEXUS v4.0 Propósito: Gestionar límites de tokens para evitar errores de overflow Fecha: 2026-01-04


LÍMITES ESTABLECIDOS

LIMITES_TOKENS:
  absoluto: 25000      # Máximo por solicitud (error si se supera)
  alerta: 20000        # Warning - considerar desglose
  seguro: 18000        # Recomendado para operación normal
  minimo_efectivo: 5000 # Mínimo para tareas simples

PRESUPUESTO POR NIVEL DE CONTEXTO

PRESUPUESTO_CONTEXTO:
  L0_sistema:
    tokens: 4500
    incluye:
      - 6 Principios fundamentales (~600 tokens c/u = 3600)
      - Perfil de agente (~500 tokens)
      - ALIASES.yml resueltos (~400 tokens)
    obligatorio: true

  L1_proyecto:
    tokens: 3000
    incluye:
      - CONTEXTO-PROYECTO.md (~1500 tokens)
      - PROXIMA-ACCION.md (~500 tokens)
      - Inventario relevante (~1000 tokens)
    obligatorio: true

  L2_operacion:
    tokens: 2500
    incluye:
      - SIMCO de operación (~800 tokens)
      - SIMCO de dominio (~800 tokens)
      - Referencias específicas (~900 tokens)
    obligatorio: true

  L3_tarea:
    tokens: variable (max 8000)
    incluye:
      - Especificación de tarea
      - Código de referencia (solo líneas relevantes)
      - DDL relacionado (si aplica)
    dinamico: true

  TOTAL_BASE: 10000   # L0 + L1 + L2
  DISPONIBLE_TAREA: 8000  # 18000 - 10000
  MARGEN_SEGURIDAD: 7000  # Para respuesta del agente

ESTRATEGIAS DE MITIGACIÓN

1. Desglose de Tareas

CRITERIO_DESGLOSE:
  si_tarea_requiere: ">3000 tokens de contexto específico"
  accion: "DESGLOSAR en subtareas"

  reglas:
    - max_archivos_por_subtarea: 2
    - max_lineas_codigo_inline: 50
    - preferir_referencias: "file:line-range"

EJEMPLO_DESGLOSE:
  # MAL - Tarea muy grande
  tarea: "Crear módulo completo de notificaciones"
  tokens_estimados: 15000

  # BIEN - Desglosado
  subtareas:
    - ST-001: "Crear tabla notifications" # ~3000 tokens
    - ST-002: "Crear NotificationEntity"  # ~2500 tokens
    - ST-003: "Crear NotificationService"  # ~2500 tokens
    - ST-004: "Crear NotificationController" # ~2500 tokens

2. Carga de Contexto Escalonada

CARGA_ESCALONADA:
  paso_1_obligatorio:
    - L0_sistema (siempre)
    - L1_proyecto (siempre)

  paso_2_segun_operacion:
    - L2_operacion (solo SIMCO relevante)

  paso_3_bajo_demanda:
    - L3_tarea (solo lo directamente relacionado)
    - NO cargar código completo de archivos
    - Usar referencias: "Ver {archivo}:{lineas}"

3. Compactación de Contexto

TECNICAS_COMPACTACION:
  aliases:
    usar: "@ALIAS en lugar de rutas completas"
    ejemplo: "@DDL/schemas/auth/" vs "apps/database/ddl/schemas/auth/"
    ahorro: "~30% de caracteres"

  referencias_linea:
    usar: "file:line-range"
    ejemplo: "user.entity.ts:45-60"
    ahorro: "Evita incluir archivo completo"

  resumenes:
    usar: "Descripción de 1-2 líneas en lugar de contenido"
    ejemplo: "Ver DDL de tabla users (20 columnas, 3 índices)"
    ahorro: "~90% vs incluir DDL completo"

  herencia_contexto:
    usar: "Variables pre-resueltas del CONTEXT-MAP"
    evitar: "Repetir definiciones en cada delegación"

DETECCIÓN Y ALERTAS

Señales de Riesgo

ALERTA_AMARILLA:
  condicion: "tokens_estimados > 15000"
  accion: "Considerar desglose"
  mensaje: "Tarea grande - evaluar si se puede dividir"

ALERTA_NARANJA:
  condicion: "tokens_estimados > 20000"
  accion: "Desglose RECOMENDADO"
  mensaje: "Riesgo de truncamiento - dividir tarea"

ALERTA_ROJA:
  condicion: "tokens_estimados > 23000"
  accion: "Desglose OBLIGATORIO"
  mensaje: "Error inminente - NO proceder sin dividir"

Estimación de Tokens

ESTIMACION_RAPIDA:
  # Aproximaciones para cálculo mental
  1_token: "~4 caracteres en inglés"
  1_linea_codigo: "~15-25 tokens"
  1_archivo_pequeño: "~200-500 tokens"
  1_archivo_mediano: "~500-1500 tokens"
  1_archivo_grande: "~1500-3000 tokens"

  SIMCO_tipico: "~800-1200 tokens"
  PERFIL_tipico: "~400-600 tokens"
  TEMPLATE_tipico: "~600-1000 tokens"

PROTOCOLO SI SE EXCEDE LÍMITE

SI_ERROR_TOKENS:
  paso_1_identificar:
    - Revisar qué archivos están cargados
    - Identificar contenido más pesado

  paso_2_reducir:
    - Eliminar código inline no esencial
    - Usar referencias en lugar de contenido
    - Resumir en lugar de copiar

  paso_3_desglosar:
    - Dividir tarea en subtareas más pequeñas
    - Cada subtarea: 1-2 archivos máximo
    - Ejecutar secuencialmente

  paso_4_documentar:
    - Registrar en SESSION-TRACKING si fue por delegación
    - Agregar nota en PROXIMA-ACCION.md si fue tarea principal

INTEGRACIÓN CON CONTEXT-MAP

El CONTEXT-MAP.yml de cada proyecto debe respetar estos límites:

# En CONTEXT-MAP.yml
contexto_por_nivel:
  L0_sistema:
    tokens_estimados: 4500  # Verificar no excede
  L1_proyecto:
    tokens_estimados: 3000  # Verificar no excede
  L2_operacion:
    tokens_estimados: 2500  # Verificar no excede
  L3_tarea:
    tokens_max: 8000        # Límite dinámico

validacion_tokens:
  total_estimado: 18000     # Debe ser <= limite_seguro
  margen_disponible: 7000   # Para respuesta

CHECKLIST PRE-DELEGACION

Antes de delegar a subagente, ejecutar OBLIGATORIAMENTE:

CHECKLIST_OBLIGATORIO:
  archivo: "orchestration/checklists/CHECKLIST-PRE-DELEGACION.md"

CHECKLIST_RAPIDO:
  - [ ] 1. Tarea delimitada (max 2 archivos)
  - [ ] 2. Template correcto seleccionado
  - [ ] 3. Contexto heredado incluido
  - [ ] 4. Tokens estimados < 2,500
  - [ ] 5. Perfil COMPACT especificado

INTEGRACION CON DELEGACION

Referencia Obligatoria

Antes de delegar, ejecutar:

  • orchestration/checklists/CHECKLIST-PRE-DELEGACION.md

Templates por Tokens

Tokens Disponibles Template Formato Herencia
>15,000 ESTANDAR o COMPLETA Completo
8,000-15,000 ESTANDAR o MINIMA Compactado
<8,000 MINIMA Ultra-compactado

Perfiles Compactos

Para subagentes, usar:

  • orchestration/agents/perfiles/compact/PERFIL-*-COMPACT.md
  • Ahorro: ~550 tokens por perfil

REFERENCIAS

Documento Proposito
PRINCIPIO-ECONOMIA-TOKENS.md Principio fundamental
SIMCO-DELEGACION.md Limites en delegacion
SIMCO-SUBAGENTE.md Protocolo para subagentes
SIMCO-CCA-SUBAGENTE.md CCA ligero para subagentes
CHECKLIST-PRE-DELEGACION.md Checklist obligatorio
CONTEXT-MAP.yml Presupuesto por proyecto
agents/perfiles/compact/ Perfiles compactos

Version: 1.1.0 | Sistema: SIMCO-NEXUS v4.0 | Tipo: Directiva de Control