trading-platform/orchestration/tareas/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/01-CONTEXTO.md
Adrian Flores Cortes 7bfcbb978e docs: Add OQI-006 DATA-PIPELINE-SPEC.md and ML-TRAINING-ENHANCEMENT task docs
- Added DATA-PIPELINE-SPEC.md for ML signals module
- Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 14:32:37 -06:00

166 lines
5.1 KiB
Markdown

# 01-CONTEXTO: Mejora Integral de Modelos ML para Trading
**Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT
**Fase:** C - Contexto
**Estado:** Completada
**Fecha:** 2026-01-25
---
## 1. VINCULACIÓN
### Proyecto
- **Nombre:** trading-platform
- **Módulo:** ml-engine (OQI-006)
- **Epic:** OQI-006-ml-signals
### Origen
- **Tipo:** plan-original
- **Solicitante:** Usuario
- **Prioridad:** P0 (Crítica)
---
## 2. CLASIFICACIÓN
| Aspecto | Valor |
|---------|-------|
| **Tipo de Tarea** | analysis + feature |
| **Modo SIMCO** | @ANALYSIS (fases C+A+P) seguido de @FULL |
| **Alcance** | Multi-subtarea con jerarquía de N niveles |
| **Complejidad** | Alta (requiere diseño arquitectónico) |
---
## 3. FUENTES DE CONOCIMIENTO IDENTIFICADAS
### 3.1 Proyecto Antiguo (WorkspaceOld/trading)
```
C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/ # Frontend + Backend
├── trading_api/ # API REST Python
├── trading_bot_meta_data/ # Datos + Indicadores (22)
├── trading_bot_meta_ws/ # XTB Broker WebSocket
├── trading_bot_meta_ws_2/ # Polygon.io CLI
├── trading_bot_meta_model_mt.zip # Modelos entrenados (738 MB)
└── db*.sql # Datos históricos (5.6 GB total)
```
**Conocimiento Clave Extraído:**
- Arquitectura XGBoost + GRU + Metamodelos
- 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
- Predicción de high/close/low con horizontes 0,1,2,4
- Ventanas rodantes (15m, 60m, 120m)
- Sin mecanismos de atención explícitos
### 3.2 Proyecto Actual (trading-platform)
```
C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/ # Python ML Service
│ ├── src/models/ # 15 modelos implementados
│ ├── src/training/ # 8 módulos de entrenamiento
│ ├── src/pipelines/ # Walk-forward, hierarchical
│ └── models/attention/ # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/
```
**Estado Actual:**
- 15 modelos ML (AMD, Range, Signal, Attention, etc.)
- Arquitectura jerárquica Level 0/1/2
- 469,217 bars de datos (6 símbolos, 1 año)
- 12 modelos de atención entrenados
- PostgreSQL como base de datos
- 95% MVP completado
---
## 4. OBJETIVO DE LA TAREA
### 4.1 Objetivo Principal
Diseñar e implementar una arquitectura de ML avanzada que logre **80% de efectividad mínima** en las operaciones de trading ejecutadas por el LLM.
### 4.2 Objetivos Específicos
1. **Diseñar 3-5 estrategias diferentes** con features/targets especializados
2. **Implementar mecanismos de atención** enfocados en variación de precio
3. **Entrenar modelos especializados por activo** (6+ símbolos)
4. **Crear metamodelos** que sinteticen predicciones
5. **Integrar LLM** para decisiones basadas en ensemble de predicciones
6. **Implementar atención agnóstica** (sin importar horario o activo)
### 4.3 Criterios de Éxito
| Métrica | Objetivo | Actual |
|---------|----------|--------|
| Efectividad operaciones | ≥80% | ~65% |
| Precision predicción | ≥75% | ~70% |
| Win rate LLM | ≥75% | N/A |
| Sharpe ratio backtesting | ≥1.5 | N/A |
| MAE range prediction | ≤0.5% | 0.1-2% |
---
## 5. RESTRICCIONES Y CONSIDERACIONES
### 5.1 Sin Restricción de Cómputo
- GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
- Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
- Tiempo de entrenamiento no es limitante
### 5.2 Restricciones de Datos
- Datos actuales: 1 año (469K bars)
- Proyecto antiguo: 10+ años de datos (MySQL dumps)
- Migración de datos históricos requerida
### 5.3 Consideraciones de Arquitectura
- Mantener compatibilidad con API FastAPI existente
- Preservar integración LLM Agent actual
- Estructura de modelos jerárquica (Level 0/1/2/3)
---
## 6. DOCUMENTOS SIMCO CARGADOS
| Documento | Propósito |
|-----------|-----------|
| `@CAPVED` | Ciclo de vida obligatorio |
| `@SIMCO-TAREA` | Proceso detallado |
| `@EDICION-SEGURA` | Restricciones de edición |
| `DIRECTIVA-ML-SERVICES.md` | Estándares ML Python |
| `DIRECTIVA-ARQUITECTURA-HIBRIDA.md` | Separación TypeScript/Python |
---
## 7. DOCUMENTACIÓN A PURGAR
### 7.1 Identificadas para Eliminación
| Archivo | Razón |
|---------|-------|
| `docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md` | Nota temporal obsoleta |
### 7.2 Identificadas para Consolidación
| Archivos | Acción |
|----------|--------|
| Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ | Consolidar en documento principal |
### 7.3 Identificadas para Actualización
| Archivo | Actualización Requerida |
|---------|------------------------|
| `SRS-DOCUMENTO-REQUERIMIENTOS.md` | Agregar nuevos RF de ML |
| `OQI-006/_MAP.md` | Agregar nuevas estrategias |
---
## 8. PRÓXIMOS PASOS
1.**Contexto completado** → Pasar a Análisis
2.**Análisis detallado** de mejoras por estrategia
3.**Planeación** con subtareas en N niveles
4.**Validación** del plan
5.**Ejecución** delegada a subagentes
6.**Documentación** final
---
**Siguiente Fase:** 02-ANALISIS.md