trading-platform/orchestration/tareas/TASK-2026-01-25-ML-DATA-MIGRATION/06-DOCUMENTACION.md
Adrian Flores Cortes c4d1524793 [TASK-2026-01-25-ML-DATA-MIGRATION] docs: Add CAPVED documentation for ML data migration task
- Created full CAPVED folder with METADATA, 01-06 phases, and SUMMARY
- Updated _INDEX.yml with new task entry
- Documents: Polygon data loading, MySQL→PostgreSQL migration, 12 attention models

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-25 06:17:40 -06:00

2.1 KiB

06-DOCUMENTACION - ML Data Migration & Model Training

Fecha: 2026-01-25

Fase: DOCUMENTACION (D)

Estado: COMPLETADA


1. Inventarios Actualizados

1.1 DATABASE_INVENTORY.yml

  • Agregada seccion data_status con:
    • Configuracion de Polygon API
    • Detalle de tickers cargados (6)
    • Conteo de bars por ticker
    • Total: 469,217 bars

1.2 ML_INVENTORY.yml

  • Actualizada version a 2.2.0
  • Agregado changelog con:
    • Migracion MySQL→PostgreSQL
    • Nuevo modulo database.py
    • Entrenamiento de modelos

2. Reportes Generados

2.1 Training Report

  • Path: apps/ml-engine/models/ATTENTION_TRAINING_REPORT_20260125_060911.md
  • Contenido:
    • Configuracion de entrenamiento
    • Metricas por modelo
    • Distribucion de clases
    • Feature importance
    • Recomendaciones de uso

3. Archivos de Configuracion

Archivo Proposito
apps/data-service/.env Credenciales Polygon + PostgreSQL
apps/ml-engine/.env Credenciales PostgreSQL
apps/ml-engine/config/database.yaml Config BD con deprecacion MySQL

4. Carpeta TASK Creada

orchestration/tareas/TASK-2026-01-25-ML-DATA-MIGRATION/
├── METADATA.yml
├── 01-CONTEXTO.md
├── 02-ANALISIS.md
├── 03-PLANEACION.md
├── 04-VALIDACION.md
├── 05-EJECUCION.md
├── 06-DOCUMENTACION.md (este archivo)
└── SUMMARY.md

5. Impacto en Documentacion

Documentos Afectados

Documento Cambio
DATABASE_INVENTORY.yml +30 lineas (data_status)
ML_INVENTORY.yml +15 lineas (changelog)
_INDEX.yml (tareas) +1 tarea

Sin Propagacion

  • Este proyecto es STANDALONE
  • No requiere propagacion a otros proyectos

6. Proximos Pasos Documentados

  1. Level 1+ Models: Requieren >5 anos de datos historicos
  2. API de Predicciones: Exponer modelos via FastAPI
  3. Dashboard ML: Visualizacion de metricas en frontend

7. Referencias Cruzadas

  • ADR-ML-001: PostgreSQL como fuente unica (02-ANALISIS.md)
  • Training Report: models/ATTENTION_TRAINING_REPORT_*.md
  • Inventarios: docs/90-transversal/inventarios/