# 03-PLANEACION - ML Data Migration & Model Training

## Fecha: 2026-01-25
## Fase: PLANEACION (P)
## Estado: COMPLETADA

---

## 1. Plan de Ejecucion

### Fase 1: Preparacion Ambiente Python
1. Crear venv en WSL: `~/venvs/data-service/`
2. Instalar dependencias: aiohttp, asyncpg, pandas, numpy, python-dotenv

### Fase 2: Carga de Datos
1. Crear script `fetch_polygon_data.py`
2. Configurar API key de Polygon
3. Ejecutar carga para 6 tickers x 365 dias
4. Validar datos insertados

### Fase 3: Migracion ML Engine
1. Crear `apps/ml-engine/src/data/database.py`
2. Implementar PostgreSQLConnection con metodos:
   - `get_ticker_data()`
   - `execute_query()` con traduccion MySQL→PostgreSQL
3. Actualizar `config/database.yaml`
4. Crear `.env` con credenciales

### Fase 4: Entrenamiento Modelos
1. Instalar dependencias ML: xgboost, scikit-learn, joblib
2. Ejecutar `train_attention_models.py`
3. Validar metricas de modelos
4. Generar reporte de entrenamiento

### Fase 5: Documentacion
1. Actualizar DATABASE_INVENTORY.yml
2. Actualizar ML_INVENTORY.yml
3. Crear carpeta TASK con CAPVED

---

## 2. Estimacion de Entregables

| Entregable | Complejidad | Archivos |
|------------|-------------|----------|
| fetch_polygon_data.py | MEDIA | 1 |
| database.py | ALTA | 1 |
| Config files | BAJA | 3 |
| 12 modelos | ALTA | 36 |
| Documentacion | MEDIA | 4 |

---

## 3. Orden de Ejecucion

```
[1] Ambiente Python → [2] Datos → [3] Migration → [4] Training → [5] Docs
         ↓                ↓             ↓              ↓            ↓
      venv OK       469K bars     database.py    12 modelos    TASK folder
```