- Added DATA-PIPELINE-SPEC.md for ML signals module - Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2.9 KiB
2.9 KiB
SUMMARY: Mejora Integral de Modelos ML para Trading
Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Tipo: analysis + feature Prioridad: P0 Epic: OQI-006-ml-signals
RESUMEN EJECUTIVO
Esta tarea define un plan integral para mejorar los modelos de Machine Learning de trading-platform con el objetivo de alcanzar 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.
Alcance
- 5 estrategias de modelos con arquitecturas diversificadas
- Neural Gating Metamodel para ensemble ponderado dinámico
- Integración LLM para decisiones basadas en predicciones
- Modelos especializados por activo (6 símbolos)
- Mecanismos de atención sobre variación de precio
Estrategias Diseñadas
| # | Código | Nombre | Arquitectura |
|---|---|---|---|
| 1 | PVA | Price Variation Attention | Transformer + XGBoost |
| 2 | MRD | Momentum Regime Detection | HMM + LSTM + XGBoost |
| 3 | VBP | Volatility Breakout Predictor | CNN 1D + Attention + XGBoost |
| 4 | MSA | Market Structure Analysis | XGBoost (GNN opcional) |
| 5 | MTS | Multi-Timeframe Synthesis | Hierarchical Attention Network |
Fases de Ejecución
FASE 1: Infraestructura (Data Pipeline + Attention Architecture)
↓
FASE 2: 5 Estrategias (Paralelo)
↓
FASE 3: Integración (Metamodel + LLM)
↓
FASE 4: Validación (Backtesting)
Métricas Objetivo
| Métrica | Objetivo |
|---|---|
| Efectividad operaciones | ≥80% |
| Direction accuracy | ≥70% |
| Sharpe Ratio | ≥1.5 |
| Max Drawdown | ≤15% |
Estimación
- Subtareas totales: 54
- Story Points: 90 SP
- GPU Hours: ~410h
- Storage adicional: ~26GB
Dependencias Principales
- Migración de datos históricos (5.6GB de WorkspaceOld)
- GPU 16GB VRAM (disponible)
- PyTorch ≥2.0, XGBoost, hmmlearn
Estado Actual
| Fase | Estado |
|---|---|
| C - Contexto | ✅ Completada |
| A - Análisis | ✅ Completada |
| P - Planeación | ✅ Completada |
| V - Validación | ✅ Aprobada |
| E - Ejecución | ⏳ Pendiente |
| D - Documentación | 🔄 En progreso |
PRÓXIMOS PASOS
- Aprobar plan con usuario
- Iniciar FASE 1 (Data Pipeline + Attention Architecture)
- Asignar agentes para ejecución paralela en FASE 2
- Monitorear progreso con métricas definidas
ARCHIVOS DE LA TAREA
orchestration/tareas/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/
├── METADATA.yml # Metadata completa
├── 01-CONTEXTO.md # Fase C
├── 02-ANALISIS.md # Fase A (extenso)
├── 03-PLANEACION.md # Fase P (extenso)
├── 04-VALIDACION.md # Fase V
├── 05-EJECUCION.md # Fase E (template)
├── 06-DOCUMENTACION.md # Fase D
└── SUMMARY.md # Este archivo
Creado: 2026-01-25 Agente: ARQUITECTO-ML-AI (Claude Opus 4.5)