FASE 0 - Preparación y Purga: - Archived 21 completed tasks to _archive/2026-01/ - Marked 4 docs as DEPRECATED - Created 3 baseline coherence reports FASE 1 - DDL-Backend Coherence: - audit.types.ts: +4 types (SystemEvent, TradingAudit, ApiRequestLog, DataAccessLog) - investment.types.ts: +4 types (RiskQuestionnaire, WithdrawalRequest, DailyPerformance, DistributionHistory) - entity.types.ts: +5 types (Symbol, TradingBot, TradingSignal, TradingMetrics, PaperBalance) FASE 2 - Backend-Frontend Coherence: - investmentStore.ts: New Zustand store with 20+ actions - mlStore.ts: New Zustand store with signal caching - alerts.service.ts: New service with 15 functions FASE 3 - Documentation: - OQI-009: Updated to 100% coverage, added ET-MKT-004-productos.md - OQI-010: Created full structure (STATUS.md, ROADMAP-MT4.md, ET-MT4-001-gateway.md) Coherence Baseline Established: - DDL-Backend: 31% (target 95%) - Backend-Frontend: 72% (target 85%) - Global: 39.6% (target 90%) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
5.1 KiB
5.1 KiB
01-CONTEXTO: Mejora Integral de Modelos ML para Trading
Task ID: TASK-2026-01-25-ML-TRAINING-ENHANCEMENT Fase: C - Contexto Estado: Completada Fecha: 2026-01-25
1. VINCULACIÓN
Proyecto
- Nombre: trading-platform
- Módulo: ml-engine (OQI-006)
- Epic: OQI-006-ml-signals
Origen
- Tipo: plan-original
- Solicitante: Usuario
- Prioridad: P0 (Crítica)
2. CLASIFICACIÓN
| Aspecto | Valor |
|---|---|
| Tipo de Tarea | analysis + feature |
| Modo SIMCO | @ANALYSIS (fases C+A+P) seguido de @FULL |
| Alcance | Multi-subtarea con jerarquía de N niveles |
| Complejidad | Alta (requiere diseño arquitectónico) |
3. FUENTES DE CONOCIMIENTO IDENTIFICADAS
3.1 Proyecto Antiguo (WorkspaceOld/trading)
C:\Empresas\WorkspaceOld\Projects\trading\
├── ForexPredictorCharts/ # Frontend + Backend
├── trading_api/ # API REST Python
├── trading_bot_meta_data/ # Datos + Indicadores (22)
├── trading_bot_meta_ws/ # XTB Broker WebSocket
├── trading_bot_meta_ws_2/ # Polygon.io CLI
├── trading_bot_meta_model_mt.zip # Modelos entrenados (738 MB)
└── db*.sql # Datos históricos (5.6 GB total)
Conocimiento Clave Extraído:
- Arquitectura XGBoost + GRU + Metamodelos
- 22 indicadores técnicos (MACD, RSI, SAR, ATR, MFI, OBV, etc.)
- Predicción de high/close/low con horizontes 0,1,2,4
- Ventanas rodantes (15m, 60m, 120m)
- Sin mecanismos de atención explícitos
3.2 Proyecto Actual (trading-platform)
C:\Empresas\ISEM\workspace-v2\projects\trading-platform\
├── apps/ml-engine/ # Python ML Service
│ ├── src/models/ # 15 modelos implementados
│ ├── src/training/ # 8 módulos de entrenamiento
│ ├── src/pipelines/ # Walk-forward, hierarchical
│ └── models/attention/ # 12 modelos Level 0 entrenados
└── docs/02-definicion-modulos/OQI-006-ml-signals/
Estado Actual:
- 15 modelos ML (AMD, Range, Signal, Attention, etc.)
- Arquitectura jerárquica Level 0/1/2
- 469,217 bars de datos (6 símbolos, 1 año)
- 12 modelos de atención entrenados
- PostgreSQL como base de datos
- 95% MVP completado
4. OBJETIVO DE LA TAREA
4.1 Objetivo Principal
Diseñar e implementar una arquitectura de ML avanzada que logre 80% de efectividad mínima en las operaciones de trading ejecutadas por el LLM.
4.2 Objetivos Específicos
- Diseñar 3-5 estrategias diferentes con features/targets especializados
- Implementar mecanismos de atención enfocados en variación de precio
- Entrenar modelos especializados por activo (6+ símbolos)
- Crear metamodelos que sinteticen predicciones
- Integrar LLM para decisiones basadas en ensemble de predicciones
- Implementar atención agnóstica (sin importar horario o activo)
4.3 Criterios de Éxito
| Métrica | Objetivo | Actual |
|---|---|---|
| Efectividad operaciones | ≥80% | ~65% |
| Precision predicción | ≥75% | ~70% |
| Win rate LLM | ≥75% | N/A |
| Sharpe ratio backtesting | ≥1.5 | N/A |
| MAE range prediction | ≤0.5% | 0.1-2% |
5. RESTRICCIONES Y CONSIDERACIONES
5.1 Sin Restricción de Cómputo
- GPU disponible: NVIDIA RTX 5060 Ti (16GB VRAM)
- Se pueden usar arquitecturas intensivas (Transformers, Deep Learning)
- Tiempo de entrenamiento no es limitante
5.2 Restricciones de Datos
- Datos actuales: 1 año (469K bars)
- Proyecto antiguo: 10+ años de datos (MySQL dumps)
- Migración de datos históricos requerida
5.3 Consideraciones de Arquitectura
- Mantener compatibilidad con API FastAPI existente
- Preservar integración LLM Agent actual
- Estructura de modelos jerárquica (Level 0/1/2/3)
6. DOCUMENTOS SIMCO CARGADOS
| Documento | Propósito |
|---|---|
@CAPVED |
Ciclo de vida obligatorio |
@SIMCO-TAREA |
Proceso detallado |
@EDICION-SEGURA |
Restricciones de edición |
DIRECTIVA-ML-SERVICES.md |
Estándares ML Python |
DIRECTIVA-ARQUITECTURA-HIBRIDA.md |
Separación TypeScript/Python |
7. DOCUMENTACIÓN A PURGAR
7.1 Identificadas para Eliminación
| Archivo | Razón |
|---|---|
docs/00-notas/NOTA-DISCREPANCIA-PUERTOS-2025-12-08.md |
Nota temporal obsoleta |
7.2 Identificadas para Consolidación
| Archivos | Acción |
|---|---|
| Múltiples ARQUITECTURA-*.md en docs/01-arquitectura/ | Consolidar en documento principal |
7.3 Identificadas para Actualización
| Archivo | Actualización Requerida |
|---|---|
SRS-DOCUMENTO-REQUERIMIENTOS.md |
Agregar nuevos RF de ML |
OQI-006/_MAP.md |
Agregar nuevas estrategias |
8. PRÓXIMOS PASOS
- ✅ Contexto completado → Pasar a Análisis
- ⏳ Análisis detallado de mejoras por estrategia
- ⏳ Planeación con subtareas en N niveles
- ⏳ Validación del plan
- ⏳ Ejecución delegada a subagentes
- ⏳ Documentación final
Siguiente Fase: 02-ANALISIS.md