trading-platform/orchestration/tareas/TASK-2026-01-25-ML-DATA-MIGRATION/03-PLANEACION.md
Adrian Flores Cortes c4d1524793 [TASK-2026-01-25-ML-DATA-MIGRATION] docs: Add CAPVED documentation for ML data migration task
- Created full CAPVED folder with METADATA, 01-06 phases, and SUMMARY
- Updated _INDEX.yml with new task entry
- Documents: Polygon data loading, MySQL→PostgreSQL migration, 12 attention models

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 06:17:40 -06:00

61 lines
1.6 KiB
Markdown

# 03-PLANEACION - ML Data Migration & Model Training
## Fecha: 2026-01-25
## Fase: PLANEACION (P)
## Estado: COMPLETADA
---
## 1. Plan de Ejecucion
### Fase 1: Preparacion Ambiente Python
1. Crear venv en WSL: `~/venvs/data-service/`
2. Instalar dependencias: aiohttp, asyncpg, pandas, numpy, python-dotenv
### Fase 2: Carga de Datos
1. Crear script `fetch_polygon_data.py`
2. Configurar API key de Polygon
3. Ejecutar carga para 6 tickers x 365 dias
4. Validar datos insertados
### Fase 3: Migracion ML Engine
1. Crear `apps/ml-engine/src/data/database.py`
2. Implementar PostgreSQLConnection con metodos:
- `get_ticker_data()`
- `execute_query()` con traduccion MySQL→PostgreSQL
3. Actualizar `config/database.yaml`
4. Crear `.env` con credenciales
### Fase 4: Entrenamiento Modelos
1. Instalar dependencias ML: xgboost, scikit-learn, joblib
2. Ejecutar `train_attention_models.py`
3. Validar metricas de modelos
4. Generar reporte de entrenamiento
### Fase 5: Documentacion
1. Actualizar DATABASE_INVENTORY.yml
2. Actualizar ML_INVENTORY.yml
3. Crear carpeta TASK con CAPVED
---
## 2. Estimacion de Entregables
| Entregable | Complejidad | Archivos |
|------------|-------------|----------|
| fetch_polygon_data.py | MEDIA | 1 |
| database.py | ALTA | 1 |
| Config files | BAJA | 3 |
| 12 modelos | ALTA | 36 |
| Documentacion | MEDIA | 4 |
---
## 3. Orden de Ejecucion
```
[1] Ambiente Python → [2] Datos → [3] Migration → [4] Training → [5] Docs
↓ ↓ ↓ ↓ ↓
venv OK 469K bars database.py 12 modelos TASK folder
```