trading-platform/orchestration/tareas/TASK-2026-01-25-ML-TRAINING-ENHANCEMENT/04-VALIDACION.md
Adrian Flores Cortes 7bfcbb978e docs: Add OQI-006 DATA-PIPELINE-SPEC.md and ML-TRAINING-ENHANCEMENT task docs
- Added DATA-PIPELINE-SPEC.md for ML signals module
- Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 14:32:37 -06:00

152 lines
4.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 04-VALIDACIÓN: Mejora Integral de Modelos ML para Trading
**Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT
**Fase:** V - Validación
**Estado:** Pendiente
**Fecha:** 2026-01-25
---
## 1. CHECKLIST DE VALIDACIÓN
### 1.1 Cobertura Análisis → Plan
| Item de Análisis | ¿Tiene Subtarea en Plan? | Subtarea ID |
|------------------|--------------------------|-------------|
| Migración datos históricos | ✅ | 1.1.1 |
| Data loader para entrenamiento | ✅ | 1.1.2 |
| Validadores de calidad | ✅ | 1.1.3 |
| Arquitectura de atención | ✅ | 1.2.* |
| Estrategia 1 (PVA) | ✅ | 2.1.* |
| Estrategia 2 (MRD) | ✅ | 2.2.* |
| Estrategia 3 (VBP) | ✅ | 2.3.* |
| Estrategia 4 (MSA) | ✅ | 2.4.* |
| Estrategia 5 (MTS) | ✅ | 2.5.* |
| Neural Gating Metamodel | ✅ | 3.1.* |
| Integración LLM | ✅ | 3.2.* |
| Backtesting validation | ✅ | 4.1.* |
**Resultado:** ✅ 100% cobertura
### 1.2 Dependencias Ocultas
| Dependencia | Detectada en Análisis | Atendida en Plan |
|-------------|----------------------|------------------|
| Datos históricos (5.6GB) | ✅ | ✅ 1.1.1 |
| GPU 16GB VRAM | ✅ | ✅ Disponible |
| PyTorch ≥2.0 | ✅ | ✅ Requirements |
| hmmlearn | ✅ | ✅ Requirements |
| torch-geometric (opcional) | ✅ | ✅ Opcional |
| PostgreSQL espacio | ✅ | ✅ Verificado |
**Resultado:** ✅ Sin dependencias ocultas
### 1.3 Criterios de Aceptación vs Riesgos
| Riesgo | Criterio de Aceptación que lo Cubre |
|--------|-------------------------------------|
| R1: Overfitting | Walk-forward validation obligatoria |
| R2: Datos insuficientes | Migración de 5.6GB de datos históricos |
| R3: Latencia excesiva | Benchmark < 200ms |
| R4: Conflicto entre estrategias | Gating network aprende ponderación |
| R5: LLM decisiones incorrectas | Fine-tuning feedback loop |
| R6: Régimen no visto | Ensemble diversificado |
**Resultado:** Todos los riesgos cubiertos
---
## 2. VALIDACIÓN DE SCOPE
### 2.1 Scope Original vs Plan
| Requerimiento Original | En Plan | Status |
|------------------------|---------|--------|
| 3-5 estrategias diferentes | 5 estrategias | |
| Features/targets especializados | Por estrategia | |
| Mecanismos de atención | Price-Focused Attention | |
| Modelos por activo | 6 activos × 5 estrategias | |
| Metamodelos | Neural Gating | |
| Integración LLM | Signal Formatter | |
| 80% efectividad | Backtesting validation | |
| Atención agnóstica | Sin features temporales | |
**Resultado:** Scope completamente cubierto
### 2.2 Scope Creep Detectado
| Item | Tipo | Acción |
|------|------|--------|
| Graph Neural Network para MSA | Feature opcional | Marcado como opcional |
| Fine-tuning LLM | Feature derivada | Crear HU derivada |
| Dashboard de métricas ML | Feature derivada | Crear HU derivada |
---
## 3. HUs DERIVADAS IDENTIFICADAS
```yaml
HUs_Derivadas:
- id: "DERIVED-ML-001"
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
tipo: "feature"
descripcion: "Implementar fine-tuning del LLM con feedback de trades"
detectado_en_fase: "V"
prioridad_sugerida: "P2"
notas: "Requiere acumulación de datos de Signal Logger"
- id: "DERIVED-ML-002"
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
tipo: "feature"
descripcion: "Dashboard admin de métricas ML en tiempo real"
detectado_en_fase: "V"
prioridad_sugerida: "P2"
notas: "Visualización de attention scores, estrategias, ensemble"
- id: "DERIVED-ML-003"
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
tipo: "feature"
descripcion: "AutoML para hyperparameter tuning"
detectado_en_fase: "A"
prioridad_sugerida: "P3"
notas: "Optimización automática de hiperparámetros"
```
---
## 4. GATE DE VALIDACIÓN
### 4.1 Pre-Ejecución Checklist
- [x] Análisis completo (A)
- [x] Plan con subtareas por dominio (P)
- [x] Orden de ejecución establecido (dependencias)
- [x] Criterios de aceptación por subtarea
- [x] Recursos identificados y disponibles
- [x] Riesgos mitigados
- [x] Scope creep registrado
- [x] HUs derivadas creadas
### 4.2 Decisión
**ESTADO:** APROBADO PARA EJECUCIÓN
**Condiciones:**
1. Ejecutar FASE 1 (Infraestructura) antes de FASE 2
2. FASE 2 puede ejecutarse en paralelo (5 agentes)
3. FASE 3 requiere FASE 2 completa
4. FASE 4 es gate final
---
## 5. APROBACIÓN
| Rol | Estado | Fecha |
|-----|--------|-------|
| Arquitecto ML | Aprobado | 2026-01-25 |
| Usuario | Pendiente | - |
---
**Siguiente Fase:** 05-EJECUCION.md (tras aprobación)