- Added DATA-PIPELINE-SPEC.md for ML signals module - Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
5.1 KiB
5.1 KiB
01-CONTEXTO: Mejora Integral de Modelos ML para Trading
Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Fase: C - Contexto Estado: Completada Fecha: 2026-01-25
1. VINCULACIÓN
Proyecto
- Nombre: trading-platform
- Módulo: ml-engine (OQI-006)
- Epic: OQI-006-ml-signals
Origen
- Tipo: plan-original
- Solicitante: Usuario
- Prioridad: P0 (Crítica)
2. CLASIFICACIÓN
| Aspecto | Valor |
|---|---|
| Tipo de Tarea | analysis + feature |
| Modo SIMCO | @ANALYSIS (fases C+A+P) seguido de @FULL |
| Alcance | Multi-subtarea con jerarquía de N niveles |
| Complejidad | Alta (requiere diseño arquitectónico) |
3. FUENTES DE CONOCIMIENTO IDENTIFICADAS
3.1 Proyecto Antiguo (WorkspaceOld/trading)
C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/ # Frontend + Backend
├── trading_api/ # API REST Python
├── trading_bot_meta_data/ # Datos + Indicadores (22)
├── trading_bot_meta_ws/ # XTB Broker WebSocket
├── trading_bot_meta_ws_2/ # Polygon.io CLI
├── trading_bot_meta_model_mt.zip # Modelos entrenados (738 MB)
└── db*.sql # Datos históricos (5.6 GB total)
Conocimiento Clave Extraído:
- Arquitectura XGBoost + GRU + Metamodelos
- 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
- Predicción de high/close/low con horizontes 0,1,2,4
- Ventanas rodantes (15m, 60m, 120m)
- Sin mecanismos de atención explícitos
3.2 Proyecto Actual (trading-platform)
C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/ # Python ML Service
│ ├── src/models/ # 15 modelos implementados
│ ├── src/training/ # 8 módulos de entrenamiento
│ ├── src/pipelines/ # Walk-forward, hierarchical
│ └── models/attention/ # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/
Estado Actual:
- 15 modelos ML (AMD, Range, Signal, Attention, etc.)
- Arquitectura jerárquica Level 0/1/2
- 469,217 bars de datos (6 símbolos, 1 año)
- 12 modelos de atención entrenados
- PostgreSQL como base de datos
- 95% MVP completado
4. OBJETIVO DE LA TAREA
4.1 Objetivo Principal
Diseñar e implementar una arquitectura de ML avanzada que logre 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.
4.2 Objetivos Específicos
- Diseñar 3-5 estrategias diferentes con features/targets especializados
- Implementar mecanismos de atención enfocados en variación de precio
- Entrenar modelos especializados por activo (6+ símbolos)
- Crear metamodelos que sinteticen predicciones
- Integrar LLM para decisiones basadas en ensemble de predicciones
- Implementar atención agnóstica (sin importar horario o activo)
4.3 Criterios de Éxito
| Métrica | Objetivo | Actual |
|---|---|---|
| Efectividad operaciones | ≥80% | ~65% |
| Precision predicción | ≥75% | ~70% |
| Win rate LLM | ≥75% | N/A |
| Sharpe ratio backtesting | ≥1.5 | N/A |
| MAE range prediction | ≤0.5% | 0.1-2% |
5. RESTRICCIONES Y CONSIDERACIONES
5.1 Sin Restricción de Cómputo
- GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
- Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
- Tiempo de entrenamiento no es limitante
5.2 Restricciones de Datos
- Datos actuales: 1 año (469K bars)
- Proyecto antiguo: 10+ años de datos (MySQL dumps)
- Migración de datos históricos requerida
5.3 Consideraciones de Arquitectura
- Mantener compatibilidad con API FastAPI existente
- Preservar integración LLM Agent actual
- Estructura de modelos jerárquica (Level 0/1/2/3)
6. DOCUMENTOS SIMCO CARGADOS
| Documento | Propósito |
|---|---|
@CAPVED |
Ciclo de vida obligatorio |
@SIMCO-TAREA |
Proceso detallado |
@EDICION-SEGURA |
Restricciones de edición |
DIRECTIVA-ML-SERVICES.md |
Estándares ML Python |
DIRECTIVA-ARQUITECTURA-HIBRIDA.md |
Separación TypeScript/Python |
7. DOCUMENTACIÓN A PURGAR
7.1 Identificadas para Eliminación
| Archivo | Razón |
|---|---|
docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md |
Nota temporal obsoleta |
7.2 Identificadas para Consolidación
| Archivos | Acción |
|---|---|
| Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ | Consolidar en documento principal |
7.3 Identificadas para Actualización
| Archivo | Actualización Requerida |
|---|---|
SRS-DOCUMENTO-REQUERIMIENTOS.md |
Agregar nuevos RF de ML |
OQI-006/_MAP.md |
Agregar nuevas estrategias |
8. PRÓXIMOS PASOS
- ✅ Contexto completado → Pasar a Análisis
- ⏳ Análisis detallado de mejoras por estrategia
- ⏳ Planeación con subtareas en N niveles
- ⏳ Validación del plan
- ⏳ Ejecución delegada a subagentes
- ⏳ Documentación final
Siguiente Fase: 02-ANALISIS.md