Adrian Flores Cortes 7bfcbb978e docs: Add OQI-006 DATA-PIPELINE-SPEC.md and ML-TRAINING-ENHANCEMENT task docs

- Added DATA-PIPELINE-SPEC.md for ML signals module
- Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

2026-01-25 14:32:37 -06:00

5.1 KiB

Raw Blame History

01-CONTEXTO: Mejora Integral de Modelos ML para Trading

Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Fase: C - Contexto Estado: Completada Fecha: 2026-01-25

1. VINCULACIÓN

Proyecto

Nombre: trading-platform
Módulo: ml-engine (OQI-006)
Epic: OQI-006-ml-signals

Origen

Tipo: plan-original
Solicitante: Usuario
Prioridad: P0 (Crítica)

2. CLASIFICACIÓN

Aspecto	Valor
Tipo de Tarea	analysis + feature
Modo SIMCO	@ANALYSIS (fases C+A+P) seguido de @FULL
Alcance	Multi-subtarea con jerarquía de N niveles
Complejidad	Alta (requiere diseño arquitectónico)

3. FUENTES DE CONOCIMIENTO IDENTIFICADAS

3.1 Proyecto Antiguo (WorkspaceOld/trading)

C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/         # Frontend + Backend
├── trading_api/                   # API REST Python
├── trading_bot_meta_data/         # Datos + Indicadores (22)
├── trading_bot_meta_ws/           # XTB Broker WebSocket
├── trading_bot_meta_ws_2/         # Polygon.io CLI
├── trading_bot_meta_model_mt.zip  # Modelos entrenados (738 MB)
└── db*.sql                        # Datos históricos (5.6 GB total)

Conocimiento Clave Extraído:

Arquitectura XGBoost + GRU + Metamodelos
22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
Predicción de high/close/low con horizontes 0,1,2,4
Ventanas rodantes (15m, 60m, 120m)
Sin mecanismos de atención explícitos

3.2 Proyecto Actual (trading-platform)

C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/               # Python ML Service
│   ├── src/models/               # 15 modelos implementados
│   ├── src/training/             # 8 módulos de entrenamiento
│   ├── src/pipelines/            # Walk-forward, hierarchical
│   └── models/attention/         # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/

Estado Actual:

15 modelos ML (AMD, Range, Signal, Attention, etc.)
Arquitectura jerárquica Level 0/1/2
469,217 bars de datos (6 símbolos, 1 año)
12 modelos de atención entrenados
PostgreSQL como base de datos
95% MVP completado

4. OBJETIVO DE LA TAREA

4.1 Objetivo Principal

Diseñar e implementar una arquitectura de ML avanzada que logre 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.

4.2 Objetivos Específicos

Diseñar 3-5 estrategias diferentes con features/targets especializados
Implementar mecanismos de atención enfocados en variación de precio
Entrenar modelos especializados por activo (6+ símbolos)
Crear metamodelos que sinteticen predicciones
Integrar LLM para decisiones basadas en ensemble de predicciones
Implementar atención agnóstica (sin importar horario o activo)

4.3 Criterios de Éxito

Métrica	Objetivo	Actual
Efectividad operaciones	≥80%	~65%
Precision predicción	≥75%	~70%
Win rate LLM	≥75%	N/A
Sharpe ratio backtesting	≥1.5	N/A
MAE range prediction	≤0.5%	0.1-2%

5. RESTRICCIONES Y CONSIDERACIONES

5.1 Sin Restricción de Cómputo

GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
Tiempo de entrenamiento no es limitante

5.2 Restricciones de Datos

Datos actuales: 1 año (469K bars)
Proyecto antiguo: 10+ años de datos (MySQL dumps)
Migración de datos históricos requerida

5.3 Consideraciones de Arquitectura

Mantener compatibilidad con API FastAPI existente
Preservar integración LLM Agent actual
Estructura de modelos jerárquica (Level 0/1/2/3)

6. DOCUMENTOS SIMCO CARGADOS

Documento	Propósito
`@CAPVED`	Ciclo de vida obligatorio
`@SIMCO-TAREA`	Proceso detallado
`@EDICION-SEGURA`	Restricciones de edición
`DIRECTIVA-ML-SERVICES.md`	Estándares ML Python
`DIRECTIVA-ARQUITECTURA-HIBRIDA.md`	Separación TypeScript/Python

7. DOCUMENTACIÓN A PURGAR

7.1 Identificadas para Eliminación

Archivo	Razón
`docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md`	Nota temporal obsoleta

7.2 Identificadas para Consolidación

Archivos	Acción
Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/	Consolidar en documento principal

7.3 Identificadas para Actualización

Archivo	Actualización Requerida
`SRS-DOCUMENTO-REQUERIMIENTOS.md`	Agregar nuevos RF de ML
`OQI-006/_MAP.md`	Agregar nuevas estrategias

8. PRÓXIMOS PASOS

✅ Contexto completado → Pasar a Análisis
⏳ Análisis detallado de mejoras por estrategia
⏳ Planeación con subtareas en N niveles
⏳ Validación del plan
⏳ Ejecución delegada a subagentes
⏳ Documentación final

Siguiente Fase: 02-ANALISIS.md

5.1 KiB Raw Blame History