- Added DATA-PIPELINE-SPEC.md for ML signals module - Added TASK-2026-01-25-ML-TRAINING-ENHANCEMENT documentation Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
152 lines
4.5 KiB
Markdown
152 lines
4.5 KiB
Markdown
# 04-VALIDACIÓN: Mejora Integral de Modelos ML para Trading
|
||
|
||
**Task ID:** TASK-2026-01-25-ML-TRAINING-ENHANCEMENT
|
||
**Fase:** V - Validación
|
||
**Estado:** Pendiente
|
||
**Fecha:** 2026-01-25
|
||
|
||
---
|
||
|
||
## 1. CHECKLIST DE VALIDACIÓN
|
||
|
||
### 1.1 Cobertura Análisis → Plan
|
||
|
||
| Item de Análisis | ¿Tiene Subtarea en Plan? | Subtarea ID |
|
||
|------------------|--------------------------|-------------|
|
||
| Migración datos históricos | ✅ | 1.1.1 |
|
||
| Data loader para entrenamiento | ✅ | 1.1.2 |
|
||
| Validadores de calidad | ✅ | 1.1.3 |
|
||
| Arquitectura de atención | ✅ | 1.2.* |
|
||
| Estrategia 1 (PVA) | ✅ | 2.1.* |
|
||
| Estrategia 2 (MRD) | ✅ | 2.2.* |
|
||
| Estrategia 3 (VBP) | ✅ | 2.3.* |
|
||
| Estrategia 4 (MSA) | ✅ | 2.4.* |
|
||
| Estrategia 5 (MTS) | ✅ | 2.5.* |
|
||
| Neural Gating Metamodel | ✅ | 3.1.* |
|
||
| Integración LLM | ✅ | 3.2.* |
|
||
| Backtesting validation | ✅ | 4.1.* |
|
||
|
||
**Resultado:** ✅ 100% cobertura
|
||
|
||
### 1.2 Dependencias Ocultas
|
||
|
||
| Dependencia | Detectada en Análisis | Atendida en Plan |
|
||
|-------------|----------------------|------------------|
|
||
| Datos históricos (5.6GB) | ✅ | ✅ 1.1.1 |
|
||
| GPU 16GB VRAM | ✅ | ✅ Disponible |
|
||
| PyTorch ≥2.0 | ✅ | ✅ Requirements |
|
||
| hmmlearn | ✅ | ✅ Requirements |
|
||
| torch-geometric (opcional) | ✅ | ✅ Opcional |
|
||
| PostgreSQL espacio | ✅ | ✅ Verificado |
|
||
|
||
**Resultado:** ✅ Sin dependencias ocultas
|
||
|
||
### 1.3 Criterios de Aceptación vs Riesgos
|
||
|
||
| Riesgo | Criterio de Aceptación que lo Cubre |
|
||
|--------|-------------------------------------|
|
||
| R1: Overfitting | Walk-forward validation obligatoria |
|
||
| R2: Datos insuficientes | Migración de 5.6GB de datos históricos |
|
||
| R3: Latencia excesiva | Benchmark < 200ms |
|
||
| R4: Conflicto entre estrategias | Gating network aprende ponderación |
|
||
| R5: LLM decisiones incorrectas | Fine-tuning feedback loop |
|
||
| R6: Régimen no visto | Ensemble diversificado |
|
||
|
||
**Resultado:** ✅ Todos los riesgos cubiertos
|
||
|
||
---
|
||
|
||
## 2. VALIDACIÓN DE SCOPE
|
||
|
||
### 2.1 Scope Original vs Plan
|
||
|
||
| Requerimiento Original | En Plan | Status |
|
||
|------------------------|---------|--------|
|
||
| 3-5 estrategias diferentes | 5 estrategias | ✅ |
|
||
| Features/targets especializados | Por estrategia | ✅ |
|
||
| Mecanismos de atención | Price-Focused Attention | ✅ |
|
||
| Modelos por activo | 6 activos × 5 estrategias | ✅ |
|
||
| Metamodelos | Neural Gating | ✅ |
|
||
| Integración LLM | Signal Formatter | ✅ |
|
||
| 80% efectividad | Backtesting validation | ✅ |
|
||
| Atención agnóstica | Sin features temporales | ✅ |
|
||
|
||
**Resultado:** ✅ Scope completamente cubierto
|
||
|
||
### 2.2 Scope Creep Detectado
|
||
|
||
| Item | Tipo | Acción |
|
||
|------|------|--------|
|
||
| Graph Neural Network para MSA | Feature opcional | Marcado como opcional |
|
||
| Fine-tuning LLM | Feature derivada | Crear HU derivada |
|
||
| Dashboard de métricas ML | Feature derivada | Crear HU derivada |
|
||
|
||
---
|
||
|
||
## 3. HUs DERIVADAS IDENTIFICADAS
|
||
|
||
```yaml
|
||
HUs_Derivadas:
|
||
- id: "DERIVED-ML-001"
|
||
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
|
||
tipo: "feature"
|
||
descripcion: "Implementar fine-tuning del LLM con feedback de trades"
|
||
detectado_en_fase: "V"
|
||
prioridad_sugerida: "P2"
|
||
notas: "Requiere acumulación de datos de Signal Logger"
|
||
|
||
- id: "DERIVED-ML-002"
|
||
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
|
||
tipo: "feature"
|
||
descripcion: "Dashboard admin de métricas ML en tiempo real"
|
||
detectado_en_fase: "V"
|
||
prioridad_sugerida: "P2"
|
||
notas: "Visualización de attention scores, estrategias, ensemble"
|
||
|
||
- id: "DERIVED-ML-003"
|
||
origen: "TASK-2026-01-25-ML-TRAINING-ENHANCEMENT"
|
||
tipo: "feature"
|
||
descripcion: "AutoML para hyperparameter tuning"
|
||
detectado_en_fase: "A"
|
||
prioridad_sugerida: "P3"
|
||
notas: "Optimización automática de hiperparámetros"
|
||
```
|
||
|
||
---
|
||
|
||
## 4. GATE DE VALIDACIÓN
|
||
|
||
### 4.1 Pre-Ejecución Checklist
|
||
|
||
- [x] Análisis completo (A)
|
||
- [x] Plan con subtareas por dominio (P)
|
||
- [x] Orden de ejecución establecido (dependencias)
|
||
- [x] Criterios de aceptación por subtarea
|
||
- [x] Recursos identificados y disponibles
|
||
- [x] Riesgos mitigados
|
||
- [x] Scope creep registrado
|
||
- [x] HUs derivadas creadas
|
||
|
||
### 4.2 Decisión
|
||
|
||
**ESTADO:** ✅ APROBADO PARA EJECUCIÓN
|
||
|
||
**Condiciones:**
|
||
1. Ejecutar FASE 1 (Infraestructura) antes de FASE 2
|
||
2. FASE 2 puede ejecutarse en paralelo (5 agentes)
|
||
3. FASE 3 requiere FASE 2 completa
|
||
4. FASE 4 es gate final
|
||
|
||
---
|
||
|
||
## 5. APROBACIÓN
|
||
|
||
| Rol | Estado | Fecha |
|
||
|-----|--------|-------|
|
||
| Arquitecto ML | Aprobado | 2026-01-25 |
|
||
| Usuario | Pendiente | - |
|
||
|
||
---
|
||
|
||
**Siguiente Fase:** 05-EJECUCION.md (tras aprobación)
|