trading-platform/orchestration/tareas/TASK-2026-01-25-ML-DATA-MIGRATION/03-PLANEACION.md
Adrian Flores Cortes c4d1524793 [TASK-2026-01-25-ML-DATA-MIGRATION] docs: Add CAPVED documentation for ML data migration task
- Created full CAPVED folder with METADATA, 01-06 phases, and SUMMARY
- Updated _INDEX.yml with new task entry
- Documents: Polygon data loading, MySQL→PostgreSQL migration, 12 attention models

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 06:17:40 -06:00

1.6 KiB

03-PLANEACION - ML Data Migration & Model Training

Fecha: 2026-01-25

Fase: PLANEACION (P)

Estado: COMPLETADA


1. Plan de Ejecucion

Fase 1: Preparacion Ambiente Python

  1. Crear venv en WSL: ~/venvs/data-service/
  2. Instalar dependencias: aiohttp, asyncpg, pandas, numpy, python-dotenv

Fase 2: Carga de Datos

  1. Crear script fetch_polygon_data.py
  2. Configurar API key de Polygon
  3. Ejecutar carga para 6 tickers x 365 dias
  4. Validar datos insertados

Fase 3: Migracion ML Engine

  1. Crear apps/ml-engine/src/data/database.py
  2. Implementar PostgreSQLConnection con metodos:
    • get_ticker_data()
    • execute_query() con traduccion MySQL→PostgreSQL
  3. Actualizar config/database.yaml
  4. Crear .env con credenciales

Fase 4: Entrenamiento Modelos

  1. Instalar dependencias ML: xgboost, scikit-learn, joblib
  2. Ejecutar train_attention_models.py
  3. Validar metricas de modelos
  4. Generar reporte de entrenamiento

Fase 5: Documentacion

  1. Actualizar DATABASE_INVENTORY.yml
  2. Actualizar ML_INVENTORY.yml
  3. Crear carpeta TASK con CAPVED

2. Estimacion de Entregables

Entregable Complejidad Archivos
fetch_polygon_data.py MEDIA 1
database.py ALTA 1
Config files BAJA 3
12 modelos ALTA 36
Documentacion MEDIA 4

3. Orden de Ejecucion

[1] Ambiente Python → [2] Datos → [3] Migration → [4] Training → [5] Docs
         ↓                ↓             ↓              ↓            ↓
      venv OK       469K bars     database.py    12 modelos    TASK folder