# 06-DOCUMENTACIÓN: Mejora Integral de Modelos ML para Trading **Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT **Fase:** D - Documentación **Estado:** En Progreso (parcial) **Fecha:** 2026-01-25 --- ## 1. DOCUMENTACIÓN CREADA ### 1.1 Orchestration (Esta tarea) | Archivo | Propósito | Estado | |---------|-----------|--------| | METADATA.yml | Metadata de la tarea | ✅ Creado | | 01-CONTEXTO.md | Fase C de CAPVED | ✅ Creado | | 02-ANALISIS.md | Fase A de CAPVED | ✅ Creado | | 03-PLANEACION.md | Fase P de CAPVED | ✅ Creado | | 04-VALIDACION.md | Fase V de CAPVED | ✅ Creado | | 05-EJECUCION.md | Fase E de CAPVED | ✅ Creado | | 06-DOCUMENTACION.md | Fase D de CAPVED | ✅ Creado | ### 1.2 Especificaciones Técnicas | Archivo | Propósito | Estado | |---------|-----------|--------| | DATA-PIPELINE-SPEC.md | Schema y pipeline de datos | ✅ Creado | | ET-ML-009-multi-strategy-ensemble.md | Arquitectura ensemble general | ✅ Creado | | ET-ML-010-pva-strategy.md | Especificación estrategia PVA | ✅ Creado | | ET-ML-011-mrd-strategy.md | Especificación estrategia MRD | ✅ Creado | | ET-ML-012-vbp-strategy.md | Especificación estrategia VBP | ✅ Creado | | ET-ML-013-msa-strategy.md | Especificación estrategia MSA | ✅ Creado | | ET-ML-014-mts-strategy.md | Especificación estrategia MTS | ✅ Creado | | ET-ML-015-backtesting-framework.md | Framework de backtesting | ✅ Creado | **Ubicación:** `docs/02-definicion-modulos/OQI-006-ml-signals/especificaciones/` --- ## 2. DOCUMENTACIÓN ACTUALIZADA ### 2.1 Actualizaciones Requeridas | Archivo | Cambio | Estado | |---------|--------|--------| | `OQI-006/_MAP.md` | Agregar nuevas estrategias | ✅ Completado | | `OQI-006/README.md` | Actualizar arquitectura | ⏳ Opcional | | `MASTER_INVENTORY.yml` | Agregar nuevos modelos | ⏳ Opcional | | `PROJECT-STATUS.md` | Reflejar nueva tarea | ⏳ Opcional | | `PROXIMA-ACCION.md` | Actualizar checkpoint | ⏳ Opcional | | `_INDEX.yml` de tareas | Registrar esta tarea | ✅ Completado | --- ## 3. DOCUMENTACIÓN A PURGAR ### 3.1 Archivos Obsoletos | Archivo | Razón | Acción | |---------|-------|--------| | `NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md` | Nota temporal obsoleta | Eliminar | ### 3.2 Archivos para Consolidar | Archivos | Archivo Destino | Acción | |----------|-----------------|--------| | Múltiples ARQUITECTURA-*.md | ARQUITECTURA-ML-UNIFICADA.md | Consolidar | --- ## 4. INVENTARIOS ### 4.1 ML_INVENTORY.yml (NUEVO) ```yaml # orchestration/inventarios/ML_INVENTORY.yml version: "1.0.0" updated: "2026-01-25" modelos: level_0_attention: - name: "AttentionScoreModel" status: "trained" symbols: ["XAUUSD", "EURUSD", "BTCUSD", "GBPUSD", "USDJPY", "AUDUSD"] timeframes: ["5m", "15m"] count: 12 level_1_strategies: - name: "PVA - Price Variation Attention" status: "planned" architecture: "Transformer + XGBoost" - name: "MRD - Momentum Regime Detection" status: "planned" architecture: "HMM + LSTM + XGBoost" - name: "VBP - Volatility Breakout Predictor" status: "planned" architecture: "CNN 1D + Attention + XGBoost" - name: "MSA - Market Structure Analysis" status: "planned" architecture: "XGBoost (GNN opcional)" - name: "MTS - Multi-Timeframe Synthesis" status: "planned" architecture: "Hierarchical Attention Network" level_2_metamodel: - name: "Neural Gating Metamodel" status: "planned" architecture: "MLP Gating + Weighted Ensemble" datos: historical: source: "WorkspaceOld/trading MySQL dumps" size: "5.6 GB" status: "pending_migration" current: source: "Polygon API" bars: 469217 symbols: 6 period: "365 days" status: "loaded" metricas_objetivo: efectividad: ">=80%" sharpe_ratio: ">=1.5" max_drawdown: "<=15%" ``` --- ## 5. DIAGRAMAS ### 5.1 Arquitectura General (ASCII) ``` ┌─────────────────────────────────────────────────────────────────────────────────┐ │ ML TRAINING ENHANCEMENT ARCHITECTURE │ ├─────────────────────────────────────────────────────────────────────────────────┤ │ │ │ ┌─────────────┐ │ │ │ Market Data │ ─────────────────────────────────────────┐ │ │ │ (PostgreSQL)│ │ │ │ └─────────────┘ ▼ │ │ ┌─────────────────┐ │ │ │ Feature Engine │ │ │ │ (Per Strategy) │ │ │ └────────┬────────┘ │ │ │ │ │ ┌──────────────────────────────────────────────────┼──────────────┐ │ │ │ │ │ │ │ │ │ ▼ ▼ ▼ ▼ ▼ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ PVA │ │ MRD │ │ VBP │ │ MSA │ │ MTS │ │ │ │Transformer│ │HMM+LSTM │ │ CNN 1D │ │ XGBoost │ │Hier.Attn │ │ │ │+XGBoost │ │+XGBoost │ │+Attention│ │ /GNN │ │ Network │ │ │ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ │ │ │ │ │ │ │ └──────────────────┴──────────────────┴────────────┴────────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────┐ │ │ │ Neural Gating │ │ │ │ Metamodel │ │ │ │ (Weighted Ensemble)│ │ │ └──────────┬──────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────┐ │ │ │ Signal Formatter │ │ │ │ (For LLM) │ │ │ └──────────┬──────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────┐ │ │ │ LLM Agent │ │ │ │ (Ollama/Claude) │ │ │ └──────────┬──────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────┐ │ │ │ Trading Decision │ │ │ │ (TRADE/NO_TRADE) │ │ │ └─────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────────────────┘ ``` --- ## 6. ADRs (Decisiones Arquitectónicas) ### ADR-ML-001: Elección de 5 Estrategias Diversificadas **Contexto:** Se necesitan múltiples estrategias de predicción para lograr 80% de efectividad. **Decisión:** Implementar 5 estrategias complementarias: 1. PVA - Enfoque en variación de precio pura 2. MRD - Detección de régimen de mercado 3. VBP - Predicción de breakouts de volatilidad 4. MSA - Análisis de estructura de mercado 5. MTS - Síntesis multi-timeframe **Consecuencias:** - (+) Diversificación reduce riesgo de fallo sistémico - (+) Cada estrategia captura diferentes aspectos del mercado - (-) Mayor complejidad de implementación - (-) Mayor costo computacional de entrenamiento ### ADR-ML-002: Neural Gating vs Simple Average **Contexto:** Se necesita combinar predicciones de 5 estrategias. **Decisión:** Usar Neural Gating Network en lugar de promedio simple. **Consecuencias:** - (+) Ponderación dinámica según contexto de mercado - (+) Aprende qué estrategia funciona mejor en qué régimen - (-) Requiere datos de entrenamiento adicionales - (-) Riesgo de colapso a una estrategia (mitigado con regularización) ### ADR-ML-003: Atención Agnóstica al Tiempo **Contexto:** Se requiere que los modelos funcionen sin depender del horario. **Decisión:** No usar features de sesión/hora en Estrategia PVA. Usar solo retornos y derivados. **Consecuencias:** - (+) Modelo generaliza mejor a diferentes mercados - (+) Evita overfitting a patrones de sesión específicos - (-) Pierde información de sesión que puede ser valiosa - (-) Otras estrategias (MTS) sí usarán sesión para complementar --- ## 7. LECCIONES APRENDIDAS *(Se actualizará al completar la tarea)* ```yaml que_funciono_bien: [] que_se_puede_mejorar: [] para_futuras_tareas_similares: [] ``` --- ## 8. REFERENCIAS ### 8.1 Documentos Internos - `@CAPVED` - Ciclo de vida de tareas - `orchestration/directivas/simco/SIMCO-TAREA.md` - `docs/02-definicion-modulos/OQI-006-ml-signals/_MAP.md` - `projects/trading-platform/apps/ml-engine/` ### 8.2 Proyecto Antiguo - `C:\Empresas\WorkspaceOld\Projects\trading\` - Arquitectura XGBoost + GRU + Metamodelos - 22 indicadores técnicos ### 8.3 Referencias Externas - Attention Is All You Need (Transformers) - XGBoost Documentation - Hidden Markov Models for Time Series - ICT/SMC Concepts (Market Structure) --- ## 9. CHECKLIST DE DOCUMENTACIÓN - [x] Archivos CAPVED creados (8/8) - [x] Especificaciones técnicas creadas (8 ET specs) - [x] _INDEX.yml actualizado - [x] Diagramas en formato exportable (ASCII en docs) - [x] ADRs documentados (3 ADRs en este archivo) - [ ] Inventarios actualizados (opcional) - [ ] PROJECT-STATUS.md actualizado (opcional) - [ ] PROXIMA-ACCION.md actualizado (opcional) --- **Estado:** ✅ DOCUMENTACIÓN COMPLETADA **Resumen de Entregables:** - 8 archivos CAPVED completos - 8 especificaciones técnicas ET-ML-009 a ET-ML-015 + DATA-PIPELINE-SPEC - 63 archivos de código (~29,769 líneas) - 3 ADRs documentados - Tarea registrada en _INDEX.yml **Fecha:** 2026-01-25