trading-platform/orchestration/tareas/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/01-CONTEXTO.md
Adrian Flores Cortes 7bfcbb978e docs: Add OQI-006 DATA-PIPELINE-SPEC.md and ML-TRAINING-ENHANCEMENT task docs
- Added DATA-PIPELINE-SPEC.md for ML signals module
- Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 14:32:37 -06:00

5.1 KiB

01-CONTEXTO: Mejora Integral de Modelos ML para Trading

Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Fase: C - Contexto Estado: Completada Fecha: 2026-01-25


1. VINCULACIÓN

Proyecto

  • Nombre: trading-platform
  • Módulo: ml-engine (OQI-006)
  • Epic: OQI-006-ml-signals

Origen

  • Tipo: plan-original
  • Solicitante: Usuario
  • Prioridad: P0 (Crítica)

2. CLASIFICACIÓN

Aspecto Valor
Tipo de Tarea analysis + feature
Modo SIMCO @ANALYSIS (fases C+A+P) seguido de @FULL
Alcance Multi-subtarea con jerarquía de N niveles
Complejidad Alta (requiere diseño arquitectónico)

3. FUENTES DE CONOCIMIENTO IDENTIFICADAS

3.1 Proyecto Antiguo (WorkspaceOld/trading)

C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/         # Frontend + Backend
├── trading_api/                   # API REST Python
├── trading_bot_meta_data/         # Datos + Indicadores (22)
├── trading_bot_meta_ws/           # XTB Broker WebSocket
├── trading_bot_meta_ws_2/         # Polygon.io CLI
├── trading_bot_meta_model_mt.zip  # Modelos entrenados (738 MB)
└── db*.sql                        # Datos históricos (5.6 GB total)

Conocimiento Clave Extraído:

  • Arquitectura XGBoost + GRU + Metamodelos
  • 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
  • Predicción de high/close/low con horizontes 0,1,2,4
  • Ventanas rodantes (15m, 60m, 120m)
  • Sin mecanismos de atención explícitos

3.2 Proyecto Actual (trading-platform)

C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/               # Python ML Service
│   ├── src/models/               # 15 modelos implementados
│   ├── src/training/             # 8 módulos de entrenamiento
│   ├── src/pipelines/            # Walk-forward, hierarchical
│   └── models/attention/         # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/

Estado Actual:

  • 15 modelos ML (AMD, Range, Signal, Attention, etc.)
  • Arquitectura jerárquica Level 0/1/2
  • 469,217 bars de datos (6 símbolos, 1 año)
  • 12 modelos de atención entrenados
  • PostgreSQL como base de datos
  • 95% MVP completado

4. OBJETIVO DE LA TAREA

4.1 Objetivo Principal

Diseñar e implementar una arquitectura de ML avanzada que logre 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.

4.2 Objetivos Específicos

  1. Diseñar 3-5 estrategias diferentes con features/targets especializados
  2. Implementar mecanismos de atención enfocados en variación de precio
  3. Entrenar modelos especializados por activo (6+ símbolos)
  4. Crear metamodelos que sinteticen predicciones
  5. Integrar LLM para decisiones basadas en ensemble de predicciones
  6. Implementar atención agnóstica (sin importar horario o activo)

4.3 Criterios de Éxito

Métrica Objetivo Actual
Efectividad operaciones ≥80% ~65%
Precision predicción ≥75% ~70%
Win rate LLM ≥75% N/A
Sharpe ratio backtesting ≥1.5 N/A
MAE range prediction ≤0.5% 0.1-2%

5. RESTRICCIONES Y CONSIDERACIONES

5.1 Sin Restricción de Cómputo

  • GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
  • Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
  • Tiempo de entrenamiento no es limitante

5.2 Restricciones de Datos

  • Datos actuales: 1 año (469K bars)
  • Proyecto antiguo: 10+ años de datos (MySQL dumps)
  • Migración de datos históricos requerida

5.3 Consideraciones de Arquitectura

  • Mantener compatibilidad con API FastAPI existente
  • Preservar integración LLM Agent actual
  • Estructura de modelos jerárquica (Level 0/1/2/3)

6. DOCUMENTOS SIMCO CARGADOS

Documento Propósito
@CAPVED Ciclo de vida obligatorio
@SIMCO-TAREA Proceso detallado
@EDICION-SEGURA Restricciones de edición
DIRECTIVA-ML-SERVICES.md Estándares ML Python
DIRECTIVA-ARQUITECTURA-HIBRIDA.md Separación TypeScript/Python

7. DOCUMENTACIÓN A PURGAR

7.1 Identificadas para Eliminación

Archivo Razón
docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md Nota temporal obsoleta

7.2 Identificadas para Consolidación

Archivos Acción
Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ Consolidar en documento principal

7.3 Identificadas para Actualización

Archivo Actualización Requerida
SRS-DOCUMENTO-REQUERIMIENTOS.md Agregar nuevos RF de ML
OQI-006/_MAP.md Agregar nuevas estrategias

8. PRÓXIMOS PASOS

  1. Contexto completado → Pasar a Análisis
  2. Análisis detallado de mejoras por estrategia
  3. Planeación con subtareas en N niveles
  4. Validación del plan
  5. Ejecución delegada a subagentes
  6. Documentación final

Siguiente Fase: 02-ANALISIS.md