- Added DATA-PIPELINE-SPEC.md for ML signals module - Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
166 lines
5.1 KiB
Markdown
166 lines
5.1 KiB
Markdown
# 01-CONTEXTO: Mejora Integral de Modelos ML para Trading
|
|
|
|
**Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT
|
|
**Fase:** C - Contexto
|
|
**Estado:** Completada
|
|
**Fecha:** 2026-01-25
|
|
|
|
---
|
|
|
|
## 1. VINCULACIÓN
|
|
|
|
### Proyecto
|
|
- **Nombre:** trading-platform
|
|
- **Módulo:** ml-engine (OQI-006)
|
|
- **Epic:** OQI-006-ml-signals
|
|
|
|
### Origen
|
|
- **Tipo:** plan-original
|
|
- **Solicitante:** Usuario
|
|
- **Prioridad:** P0 (Crítica)
|
|
|
|
---
|
|
|
|
## 2. CLASIFICACIÓN
|
|
|
|
| Aspecto | Valor |
|
|
|---------|-------|
|
|
| **Tipo de Tarea** | analysis + feature |
|
|
| **Modo SIMCO** | @ANALYSIS (fases C+A+P) seguido de @FULL |
|
|
| **Alcance** | Multi-subtarea con jerarquía de N niveles |
|
|
| **Complejidad** | Alta (requiere diseño arquitectónico) |
|
|
|
|
---
|
|
|
|
## 3. FUENTES DE CONOCIMIENTO IDENTIFICADAS
|
|
|
|
### 3.1 Proyecto Antiguo (WorkspaceOld/trading)
|
|
```
|
|
C:\Empresas\WorkspaceOld\Projects\trading\
|
|
├── ForexPredictorCharts/ # Frontend + Backend
|
|
├── trading_api/ # API REST Python
|
|
├── trading_bot_meta_data/ # Datos + Indicadores (22)
|
|
├── trading_bot_meta_ws/ # XTB Broker WebSocket
|
|
├── trading_bot_meta_ws_2/ # Polygon.io CLI
|
|
├── trading_bot_meta_model_mt.zip # Modelos entrenados (738 MB)
|
|
└── db*.sql # Datos históricos (5.6 GB total)
|
|
```
|
|
|
|
**Conocimiento Clave Extraído:**
|
|
- Arquitectura XGBoost + GRU + Metamodelos
|
|
- 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
|
|
- Predicción de high/close/low con horizontes 0,1,2,4
|
|
- Ventanas rodantes (15m, 60m, 120m)
|
|
- Sin mecanismos de atención explícitos
|
|
|
|
### 3.2 Proyecto Actual (trading-platform)
|
|
```
|
|
C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
|
|
├── apps/ml-engine/ # Python ML Service
|
|
│ ├── src/models/ # 15 modelos implementados
|
|
│ ├── src/training/ # 8 módulos de entrenamiento
|
|
│ ├── src/pipelines/ # Walk-forward, hierarchical
|
|
│ └── models/attention/ # 12 modelos Level 0 entrenados
|
|
└── docs/02-definicion-modulos/OQI-006-ml-signals/
|
|
```
|
|
|
|
**Estado Actual:**
|
|
- 15 modelos ML (AMD, Range, Signal, Attention, etc.)
|
|
- Arquitectura jerárquica Level 0/1/2
|
|
- 469,217 bars de datos (6 símbolos, 1 año)
|
|
- 12 modelos de atención entrenados
|
|
- PostgreSQL como base de datos
|
|
- 95% MVP completado
|
|
|
|
---
|
|
|
|
## 4. OBJETIVO DE LA TAREA
|
|
|
|
### 4.1 Objetivo Principal
|
|
Diseñar e implementar una arquitectura de ML avanzada que logre **80% de efectividad mínima** en las operaciones de trading ejecutadas por el LLM.
|
|
|
|
### 4.2 Objetivos Específicos
|
|
|
|
1. **Diseñar 3-5 estrategias diferentes** con features/targets especializados
|
|
2. **Implementar mecanismos de atención** enfocados en variación de precio
|
|
3. **Entrenar modelos especializados por activo** (6+ símbolos)
|
|
4. **Crear metamodelos** que sinteticen predicciones
|
|
5. **Integrar LLM** para decisiones basadas en ensemble de predicciones
|
|
6. **Implementar atención agnóstica** (sin importar horario o activo)
|
|
|
|
### 4.3 Criterios de Éxito
|
|
|
|
| Métrica | Objetivo | Actual |
|
|
|---------|----------|--------|
|
|
| Efectividad operaciones | ≥80% | ~65% |
|
|
| Precision predicción | ≥75% | ~70% |
|
|
| Win rate LLM | ≥75% | N/A |
|
|
| Sharpe ratio backtesting | ≥1.5 | N/A |
|
|
| MAE range prediction | ≤0.5% | 0.1-2% |
|
|
|
|
---
|
|
|
|
## 5. RESTRICCIONES Y CONSIDERACIONES
|
|
|
|
### 5.1 Sin Restricción de Cómputo
|
|
- GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
|
|
- Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
|
|
- Tiempo de entrenamiento no es limitante
|
|
|
|
### 5.2 Restricciones de Datos
|
|
- Datos actuales: 1 año (469K bars)
|
|
- Proyecto antiguo: 10+ años de datos (MySQL dumps)
|
|
- Migración de datos históricos requerida
|
|
|
|
### 5.3 Consideraciones de Arquitectura
|
|
- Mantener compatibilidad con API FastAPI existente
|
|
- Preservar integración LLM Agent actual
|
|
- Estructura de modelos jerárquica (Level 0/1/2/3)
|
|
|
|
---
|
|
|
|
## 6. DOCUMENTOS SIMCO CARGADOS
|
|
|
|
| Documento | Propósito |
|
|
|-----------|-----------|
|
|
| `@CAPVED` | Ciclo de vida obligatorio |
|
|
| `@SIMCO-TAREA` | Proceso detallado |
|
|
| `@EDICION-SEGURA` | Restricciones de edición |
|
|
| `DIRECTIVA-ML-SERVICES.md` | Estándares ML Python |
|
|
| `DIRECTIVA-ARQUITECTURA-HIBRIDA.md` | Separación TypeScript/Python |
|
|
|
|
---
|
|
|
|
## 7. DOCUMENTACIÓN A PURGAR
|
|
|
|
### 7.1 Identificadas para Eliminación
|
|
| Archivo | Razón |
|
|
|---------|-------|
|
|
| `docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md` | Nota temporal obsoleta |
|
|
|
|
### 7.2 Identificadas para Consolidación
|
|
| Archivos | Acción |
|
|
|----------|--------|
|
|
| Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ | Consolidar en documento principal |
|
|
|
|
### 7.3 Identificadas para Actualización
|
|
| Archivo | Actualización Requerida |
|
|
|---------|------------------------|
|
|
| `SRS-DOCUMENTO-REQUERIMIENTOS.md` | Agregar nuevos RF de ML |
|
|
| `OQI-006/_MAP.md` | Agregar nuevas estrategias |
|
|
|
|
---
|
|
|
|
## 8. PRÓXIMOS PASOS
|
|
|
|
1. ✅ **Contexto completado** → Pasar a Análisis
|
|
2. ⏳ **Análisis detallado** de mejoras por estrategia
|
|
3. ⏳ **Planeación** con subtareas en N niveles
|
|
4. ⏳ **Validación** del plan
|
|
5. ⏳ **Ejecución** delegada a subagentes
|
|
6. ⏳ **Documentación** final
|
|
|
|
---
|
|
|
|
**Siguiente Fase:** 02-ANALISIS.md
|