trading-platform/orchestration/tareas/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/01-CONTEXTO.md

# 01-CONTEXTO: Mejora Integral de Modelos ML para Trading

**Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT
**Fase:** C - Contexto
**Estado:** Completada
**Fecha:** 2026-01-25

---

## 1. VINCULACIÓN

### Proyecto
- **Nombre:** trading-platform
- **Módulo:** ml-engine (OQI-006)
- **Epic:** OQI-006-ml-signals

### Origen
- **Tipo:** plan-original
- **Solicitante:** Usuario
- **Prioridad:** P0 (Crítica)

---

## 2. CLASIFICACIÓN

| Aspecto | Valor |
|---------|-------|
| **Tipo de Tarea** | analysis + feature |
| **Modo SIMCO** | @ANALYSIS (fases C+A+P) seguido de @FULL |
| **Alcance** | Multi-subtarea con jerarquía de N niveles |
| **Complejidad** | Alta (requiere diseño arquitectónico) |

---

## 3. FUENTES DE CONOCIMIENTO IDENTIFICADAS

### 3.1 Proyecto Antiguo (WorkspaceOld/trading)
```
C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/         # Frontend + Backend
├── trading_api/                   # API REST Python
├── trading_bot_meta_data/         # Datos + Indicadores (22)
├── trading_bot_meta_ws/           # XTB Broker WebSocket
├── trading_bot_meta_ws_2/         # Polygon.io CLI
├── trading_bot_meta_model_mt.zip  # Modelos entrenados (738 MB)
└── db*.sql                        # Datos históricos (5.6 GB total)
```

**Conocimiento Clave Extraído:**
- Arquitectura XGBoost + GRU + Metamodelos
- 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
- Predicción de high/close/low con horizontes 0,1,2,4
- Ventanas rodantes (15m, 60m, 120m)
- Sin mecanismos de atención explícitos

### 3.2 Proyecto Actual (trading-platform)
```
C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/               # Python ML Service
│   ├── src/models/               # 15 modelos implementados
│   ├── src/training/             # 8 módulos de entrenamiento
│   ├── src/pipelines/            # Walk-forward, hierarchical
│   └── models/attention/         # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/
```

**Estado Actual:**
- 15 modelos ML (AMD, Range, Signal, Attention, etc.)
- Arquitectura jerárquica Level 0/1/2
- 469,217 bars de datos (6 símbolos, 1 año)
- 12 modelos de atención entrenados
- PostgreSQL como base de datos
- 95% MVP completado

---

## 4. OBJETIVO DE LA TAREA

### 4.1 Objetivo Principal
Diseñar e implementar una arquitectura de ML avanzada que logre **80% de efectividad mínima** en las operaciones de trading ejecutadas por el LLM.

### 4.2 Objetivos Específicos

1. **Diseñar 3-5 estrategias diferentes** con features/targets especializados
2. **Implementar mecanismos de atención** enfocados en variación de precio
3. **Entrenar modelos especializados por activo** (6+ símbolos)
4. **Crear metamodelos** que sinteticen predicciones
5. **Integrar LLM** para decisiones basadas en ensemble de predicciones
6. **Implementar atención agnóstica** (sin importar horario o activo)

### 4.3 Criterios de Éxito

| Métrica | Objetivo | Actual |
|---------|----------|--------|
| Efectividad operaciones | ≥80% | ~65% |
| Precision predicción | ≥75% | ~70% |
| Win rate LLM | ≥75% | N/A |
| Sharpe ratio backtesting | ≥1.5 | N/A |
| MAE range prediction | ≤0.5% | 0.1-2% |

---

## 5. RESTRICCIONES Y CONSIDERACIONES

### 5.1 Sin Restricción de Cómputo
- GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
- Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
- Tiempo de entrenamiento no es limitante

### 5.2 Restricciones de Datos
- Datos actuales: 1 año (469K bars)
- Proyecto antiguo: 10+ años de datos (MySQL dumps)
- Migración de datos históricos requerida

### 5.3 Consideraciones de Arquitectura
- Mantener compatibilidad con API FastAPI existente
- Preservar integración LLM Agent actual
- Estructura de modelos jerárquica (Level 0/1/2/3)

---

## 6. DOCUMENTOS SIMCO CARGADOS

| Documento | Propósito |
|-----------|-----------|
| `@CAPVED` | Ciclo de vida obligatorio |
| `@SIMCO-TAREA` | Proceso detallado |
| `@EDICION-SEGURA` | Restricciones de edición |
| `DIRECTIVA-ML-SERVICES.md` | Estándares ML Python |
| `DIRECTIVA-ARQUITECTURA-HIBRIDA.md` | Separación TypeScript/Python |

---

## 7. DOCUMENTACIÓN A PURGAR

### 7.1 Identificadas para Eliminación
| Archivo | Razón |
|---------|-------|
| `docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md` | Nota temporal obsoleta |

### 7.2 Identificadas para Consolidación
| Archivos | Acción |
|----------|--------|
| Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ | Consolidar en documento principal |

### 7.3 Identificadas para Actualización
| Archivo | Actualización Requerida |
|---------|------------------------|
| `SRS-DOCUMENTO-REQUERIMIENTOS.md` | Agregar nuevos RF de ML |
| `OQI-006/_MAP.md` | Agregar nuevas estrategias |

---

## 8. PRÓXIMOS PASOS

1. ✅ **Contexto completado** → Pasar a Análisis
2. ⏳ **Análisis detallado** de mejoras por estrategia
3. ⏳ **Planeación** con subtareas en N niveles
4. ⏳ **Validación** del plan
5. ⏳ **Ejecución** delegada a subagentes
6. ⏳ **Documentación** final

---

**Siguiente Fase:** 02-ANALISIS.md