# 03-PLANEACION - ML Data Migration & Model Training ## Fecha: 2026-01-25 ## Fase: PLANEACION (P) ## Estado: COMPLETADA --- ## 1. Plan de Ejecucion ### Fase 1: Preparacion Ambiente Python 1. Crear venv en WSL: `~/venvs/data-service/` 2. Instalar dependencias: aiohttp, asyncpg, pandas, numpy, python-dotenv ### Fase 2: Carga de Datos 1. Crear script `fetch_polygon_data.py` 2. Configurar API key de Polygon 3. Ejecutar carga para 6 tickers x 365 dias 4. Validar datos insertados ### Fase 3: Migracion ML Engine 1. Crear `apps/ml-engine/src/data/database.py` 2. Implementar PostgreSQLConnection con metodos: - `get_ticker_data()` - `execute_query()` con traduccion MySQL→PostgreSQL 3. Actualizar `config/database.yaml` 4. Crear `.env` con credenciales ### Fase 4: Entrenamiento Modelos 1. Instalar dependencias ML: xgboost, scikit-learn, joblib 2. Ejecutar `train_attention_models.py` 3. Validar metricas de modelos 4. Generar reporte de entrenamiento ### Fase 5: Documentacion 1. Actualizar DATABASE_INVENTORY.yml 2. Actualizar ML_INVENTORY.yml 3. Crear carpeta TASK con CAPVED --- ## 2. Estimacion de Entregables | Entregable | Complejidad | Archivos | |------------|-------------|----------| | fetch_polygon_data.py | MEDIA | 1 | | database.py | ALTA | 1 | | Config files | BAJA | 3 | | 12 modelos | ALTA | 36 | | Documentacion | MEDIA | 4 | --- ## 3. Orden de Ejecucion ``` [1] Ambiente Python → [2] Datos → [3] Migration → [4] Training → [5] Docs ↓ ↓ ↓ ↓ ↓ venv OK 469K bars database.py 12 modelos TASK folder ```