trading-platform/orchestration/tareas/_archive/2026-01/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/01-CONTEXTO.md
Adrian Flores Cortes df43dd90cb [F0-F2] feat: Coherence analysis baseline + entity types + frontend stores
FASE 0 - Preparación y Purga:
- Archived 21 completed tasks to _archive/2026-01/
- Marked 4 docs as DEPRECATED
- Created 3 baseline coherence reports

FASE 1 - DDL-Backend Coherence:
- audit.types.ts: +4 types (SystemEvent, TradingAudit, ApiRequestLog, DataAccessLog)
- investment.types.ts: +4 types (RiskQuestionnaire, WithdrawalRequest, DailyPerformance, DistributionHistory)
- entity.types.ts: +5 types (Symbol, TradingBot, TradingSignal, TradingMetrics, PaperBalance)

FASE 2 - Backend-Frontend Coherence:
- investmentStore.ts: New Zustand store with 20+ actions
- mlStore.ts: New Zustand store with signal caching
- alerts.service.ts: New service with 15 functions

FASE 3 - Documentation:
- OQI-009: Updated to 100% coverage, added ET-MKT-004-productos.md
- OQI-010: Created full structure (STATUS.md, ROADMAP-MT4.md, ET-MT4-001-gateway.md)

Coherence Baseline Established:
- DDL-Backend: 31% (target 95%)
- Backend-Frontend: 72% (target 85%)
- Global: 39.6% (target 90%)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-28 22:08:04 -06:00

5.1 KiB

01-CONTEXTO: Mejora Integral de Modelos ML para Trading

Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Fase: C - Contexto Estado: Completada Fecha: 2026-01-25


1. VINCULACIÓN

Proyecto

  • Nombre: trading-platform
  • Módulo: ml-engine (OQI-006)
  • Epic: OQI-006-ml-signals

Origen

  • Tipo: plan-original
  • Solicitante: Usuario
  • Prioridad: P0 (Crítica)

2. CLASIFICACIÓN

Aspecto Valor
Tipo de Tarea analysis + feature
Modo SIMCO @ANALYSIS (fases C+A+P) seguido de @FULL
Alcance Multi-subtarea con jerarquía de N niveles
Complejidad Alta (requiere diseño arquitectónico)

3. FUENTES DE CONOCIMIENTO IDENTIFICADAS

3.1 Proyecto Antiguo (WorkspaceOld/trading)

C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/         # Frontend + Backend
├── trading_api/                   # API REST Python
├── trading_bot_meta_data/         # Datos + Indicadores (22)
├── trading_bot_meta_ws/           # XTB Broker WebSocket
├── trading_bot_meta_ws_2/         # Polygon.io CLI
├── trading_bot_meta_model_mt.zip  # Modelos entrenados (738 MB)
└── db*.sql                        # Datos históricos (5.6 GB total)

Conocimiento Clave Extraído:

  • Arquitectura XGBoost + GRU + Metamodelos
  • 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
  • Predicción de high/close/low con horizontes 0,1,2,4
  • Ventanas rodantes (15m, 60m, 120m)
  • Sin mecanismos de atención explícitos

3.2 Proyecto Actual (trading-platform)

C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/               # Python ML Service
│   ├── src/models/               # 15 modelos implementados
│   ├── src/training/             # 8 módulos de entrenamiento
│   ├── src/pipelines/            # Walk-forward, hierarchical
│   └── models/attention/         # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/

Estado Actual:

  • 15 modelos ML (AMD, Range, Signal, Attention, etc.)
  • Arquitectura jerárquica Level 0/1/2
  • 469,217 bars de datos (6 símbolos, 1 año)
  • 12 modelos de atención entrenados
  • PostgreSQL como base de datos
  • 95% MVP completado

4. OBJETIVO DE LA TAREA

4.1 Objetivo Principal

Diseñar e implementar una arquitectura de ML avanzada que logre 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.

4.2 Objetivos Específicos

  1. Diseñar 3-5 estrategias diferentes con features/targets especializados
  2. Implementar mecanismos de atención enfocados en variación de precio
  3. Entrenar modelos especializados por activo (6+ símbolos)
  4. Crear metamodelos que sinteticen predicciones
  5. Integrar LLM para decisiones basadas en ensemble de predicciones
  6. Implementar atención agnóstica (sin importar horario o activo)

4.3 Criterios de Éxito

Métrica Objetivo Actual
Efectividad operaciones ≥80% ~65%
Precision predicción ≥75% ~70%
Win rate LLM ≥75% N/A
Sharpe ratio backtesting ≥1.5 N/A
MAE range prediction ≤0.5% 0.1-2%

5. RESTRICCIONES Y CONSIDERACIONES

5.1 Sin Restricción de Cómputo

  • GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
  • Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
  • Tiempo de entrenamiento no es limitante

5.2 Restricciones de Datos

  • Datos actuales: 1 año (469K bars)
  • Proyecto antiguo: 10+ años de datos (MySQL dumps)
  • Migración de datos históricos requerida

5.3 Consideraciones de Arquitectura

  • Mantener compatibilidad con API FastAPI existente
  • Preservar integración LLM Agent actual
  • Estructura de modelos jerárquica (Level 0/1/2/3)

6. DOCUMENTOS SIMCO CARGADOS

Documento Propósito
@CAPVED Ciclo de vida obligatorio
@SIMCO-TAREA Proceso detallado
@EDICION-SEGURA Restricciones de edición
DIRECTIVA-ML-SERVICES.md Estándares ML Python
DIRECTIVA-ARQUITECTURA-HIBRIDA.md Separación TypeScript/Python

7. DOCUMENTACIÓN A PURGAR

7.1 Identificadas para Eliminación

Archivo Razón
docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md Nota temporal obsoleta

7.2 Identificadas para Consolidación

Archivos Acción
Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ Consolidar en documento principal

7.3 Identificadas para Actualización

Archivo Actualización Requerida
SRS-DOCUMENTO-REQUERIMIENTOS.md Agregar nuevos RF de ML
OQI-006/_MAP.md Agregar nuevas estrategias

8. PRÓXIMOS PASOS

  1. Contexto completado → Pasar a Análisis
  2. Análisis detallado de mejoras por estrategia
  3. Planeación con subtareas en N niveles
  4. Validación del plan
  5. Ejecución delegada a subagentes
  6. Documentación final

Siguiente Fase: 02-ANALISIS.md