--- id: "ANALISIS-GAPS-ML-FIRST-2026-01" title: "Analisis de Gaps - Reordenamiento ML-First" type: "Analysis" project: "trading-platform" version: "1.0.0" created_date: "2026-01-04" author: "Orquestador - Tech Leader" --- # Analisis de Gaps - Reordenamiento ML-First ## 1. Resumen del Analisis Este documento identifica los gaps entre el estado actual del proyecto y los nuevos objetivos priorizados: | Objetivo | Estado Actual | Gap | Criticidad | |----------|---------------|-----|------------| | 80% win rate en operaciones | TPSL tiene 85.9% accuracy pero no validado en real | Validacion OOS | **CRITICA** | | 30-100% rendimiento semanal | No hay backtesting con este objetivo | Backtesting intensivo | **CRITICA** | | Prediccion max/min multi-TF | Solo 15m y 1h implementados | Extender a 4H, D, W | **ALTA** | | LLM con fine-tuning | Solo prompts estaticos | Dataset + LoRA training | **CRITICA** | | MCP Server para ejecucion | No existe | Desarrollo completo | **CRITICA** | | Integracion Binance BTC | Parcial, no optimizado | Estrategias BTC | **ALTA** | | Visualizacion TradingView | Componentes basicos existen | Overlays ML | **MEDIA** | --- ## 2. Matriz de Gaps Detallada ### Gap 1: Validacion Temporal de Modelos (Out-of-Sample) **Descripcion**: Los modelos actuales no tienen una estrategia clara de validacion con datos no vistos durante entrenamiento. **Estado Actual**: - Walk-forward validation mencionado pero no implementado consistentemente - No hay exclusion explicita del ultimo ano de datos - Riesgo de overfitting en backtests **Requerimiento**: ```python # Estrategia de split temporal requerida DATA_SPLIT = { 'training': '2014-01-01 a 2024-01-01', # 10 anos 'validation': '2024-01-01 a 2024-07-01', # 6 meses (walk-forward) 'test_oos': '2024-07-01 a 2025-01-01' # 6 meses (NUNCA visto) } ``` **Accion Requerida**: 1. Implementar funcion `temporal_train_test_split()` con exclusion del ultimo ano 2. Modificar pipeline de entrenamiento para usar este split 3. Reportar metricas separadas para train, val, test_oos **Archivos a Modificar**: - `apps/ml-engine/src/training/data_splitter.py` (crear) - `apps/ml-engine/src/pipelines/phase2_pipeline.py` - `apps/ml-engine/config/validation_oos.yaml` --- ### Gap 2: Prediccion Multi-Temporalidad **Descripcion**: RangePredictor actual solo predice para horizontes de 15m y 1h. **Estado Actual**: ```python # Actual HORIZONS = {'15m': 3, '1h': 12} # Solo 2 horizontes ``` **Requerimiento**: ```python # Requerido para objetivo de 30-100% semanal HORIZONS = { 'scalping': {'5m': 6, '15m': 4}, # 30min - 1h 'intraday': {'1H': 4, '4H': 2}, # 4h - 8h 'swing': {'4H': 6, '1D': 2}, # 1-2 dias 'position': {'1D': 5, '1W': 1} # 1 semana } ``` **Accion Requerida**: 1. Extender clase RangePredictor para soportar multiples horizontes 2. Crear modelos separados por temporalidad o modelo multi-output 3. Implementar feature engineering especifico por temporalidad 4. Entrenar y validar cada configuracion **Archivos a Modificar**: - `apps/ml-engine/src/models/range_predictor.py` - `apps/ml-engine/config/models.yaml` - `apps/ml-engine/src/data/features.py` --- ### Gap 3: Objetivo de 80% Win Rate **Descripcion**: El objetivo especifico es lograr 80% de operaciones ganadoras. **Estado Actual**: - TPSL Classifier tiene 85.9% accuracy en clasificacion - Pero accuracy != win rate en trading real - No hay backtesting que valide este objetivo **Analisis**: ``` Para lograr 80% win rate se necesita: 1. Risk:Reward conservador (1:1 o menor) - Con RR 1:1 y 80% WR: Profit Factor = 4.0 - Con RR 0.5:1 y 80% WR: Profit Factor = 2.0 2. Filtros de alta confianza - Solo tomar senales con confidence > 0.80 - Reducir numero de trades pero aumentar calidad 3. Gestion de posicion - Partial take profits - Trailing stops - Break-even rules ``` **Accion Requerida**: 1. Ajustar configuracion de TPSL para RR conservador 2. Implementar filtros de confianza alta 3. Backtesting con objetivo explicito de 80% WR 4. Implementar gestion de posicion avanzada **Archivos a Crear/Modificar**: - `apps/ml-engine/src/backtesting/win_rate_optimizer.py` (crear) - `apps/trading-agents/src/strategies/high_winrate_strategy.py` (crear) - `apps/ml-engine/config/trading.yaml` --- ### Gap 4: Rendimiento 30-100% Semanal **Descripcion**: Objetivo agresivo de rendimiento semanal. **Analisis de Viabilidad**: ``` Para 30% semanal con 80% WR: - Necesitas ~15-20 trades/semana - RR promedio 0.5:1 (TP = 2%, SL = 4%) - O: RR 1:1 con mas apalancamiento Para 100% semanal: - Requiere apalancamiento alto (10x-20x) - O: Muchos trades con compounding - ALTO RIESGO - no recomendado inicialmente Estrategia Sugerida: 1. Empezar con objetivo 30-50% semanal 2. Usar apalancamiento moderado (5x-10x) 3. Compounding de ganancias 4. Escalar gradualmente ``` **Accion Requerida**: 1. Definir configuracion de riesgo por nivel de agresividad 2. Implementar calculator de position sizing para objetivos 3. Crear modo "aggressive" en trading agents 4. Backtesting con compounding **Archivos a Crear**: - `apps/trading-agents/config/aggressive_profile.yaml` - `apps/trading-agents/src/risk/compounding_calculator.py` --- ### Gap 5: LLM Fine-Tuning **Descripcion**: El LLM Agent actual usa prompts estaticos, no hay fine-tuning. **Estado Actual**: ```python # Actual - Solo prompts llm_config = { 'provider': 'ollama', 'model': 'llama3:8b', 'system_prompt': 'You are a trading assistant...' # 1500 lineas } ``` **Requerimiento**: ```python # Requerido - Modelo fine-tuned llm_config = { 'provider': 'ollama', 'model': 'trading-trader:v1', # Modelo custom 'fine_tuned': True, 'training_data': 'datasets/trading_decisions_v1.jsonl' } ``` **Dataset Requerido**: ```jsonl {"instruction": "Analiza esta senal ML", "input": {"delta_high": 0.8, "delta_low": 0.3, "phase": "accumulation"}, "output": "LONG recomendado. Fase de acumulacion con sesgo alcista..."} {"instruction": "Evalua entrada en XAUUSD", "input": {"price": 2650, "amd": "manipulation", "liquidity_swept": true}, "output": "WAIT. Fase de manipulacion activa, esperar confirmacion..."} ``` **Accion Requerida**: 1. Crear dataset de 1000+ ejemplos de decisiones de trading 2. Formatear en JSONL para fine-tuning 3. Setup entorno de fine-tuning (unsloth/axolotl) 4. Entrenar con LoRA 5. Convertir a formato GGUF para Ollama 6. Evaluar modelo fine-tuned **Archivos a Crear**: - `apps/llm-agent/datasets/trading_decisions_v1.jsonl` - `apps/llm-agent/training/fine_tune_config.yaml` - `apps/llm-agent/training/fine_tune.py` - `apps/llm-agent/training/evaluate.py` --- ### Gap 6: MCP Server para Ejecucion **Descripcion**: No existe un MCP server que exponga herramientas de trading al agente. **Estado Actual**: - LLM Agent tiene tools definidos internamente - No hay protocolo MCP implementado - No hay integracion estandar con Claude Desktop u otros clientes **Requerimiento**: ```typescript // MCP Server specification { "name": "trading-trading-mcp", "version": "1.0.0", "tools": [ { "name": "execute_trade", "description": "Execute a trade on MT4 or Binance", "inputSchema": { "type": "object", "properties": { "broker": {"type": "string", "enum": ["mt4", "binance"]}, "symbol": {"type": "string"}, "action": {"type": "string", "enum": ["buy", "sell"]}, "lots": {"type": "number"}, "sl": {"type": "number"}, "tp": {"type": "number"} }, "required": ["broker", "symbol", "action", "lots"] } }, // + 10 tools mas ] } ``` **Accion Requerida**: 1. Crear proyecto MCP Server en TypeScript/Python 2. Implementar tools de trading (10+) 3. Implementar conexion con MT4 (MetaAPI) 4. Implementar conexion con Binance 5. Crear cliente para integracion con LLM Agent 6. Testing completo **Archivos a Crear**: - `apps/mcp-server/` (nuevo directorio) - `apps/mcp-server/src/server.ts` - `apps/mcp-server/src/tools/trading.ts` - `apps/mcp-server/src/tools/analysis.ts` - `apps/mcp-server/src/connectors/mt4.ts` - `apps/mcp-server/src/connectors/binance.ts` --- ### Gap 7: Integracion Binance para Bitcoin **Descripcion**: La integracion con Binance existe pero no esta optimizada para BTC. **Estado Actual**: - Cliente Binance basico en trading-agents - Soporta multiples pares pero sin optimizacion - No hay estrategias especificas para BTC **Requerimiento**: ```python # Estrategias especificas para BTC BTC_STRATEGIES = { 'halving_cycle': { 'description': 'Posicionamiento basado en ciclo de halving', 'timeframe': 'weekly', 'indicators': ['stock_to_flow', 'puell_multiple', 'mvrv'] }, 'funding_rate': { 'description': 'Trading basado en funding rate de perpetuos', 'timeframe': 'hourly', 'indicators': ['funding_rate', 'open_interest', 'long_short_ratio'] }, 'whale_tracking': { 'description': 'Seguimiento de movimientos de ballenas', 'timeframe': 'daily', 'indicators': ['exchange_flow', 'whale_alerts', 'accumulation_score'] } } ``` **Accion Requerida**: 1. Entrenar modelos ML especificos para BTC 2. Implementar features especificos de crypto 3. Crear estrategias especializadas 4. Integrar con on-chain data (opcional) **Archivos a Crear/Modificar**: - `apps/trading-agents/src/strategies/btc_strategies.py` - `apps/ml-engine/src/data/crypto_features.py` - `apps/data-service/src/providers/onchain.py` (opcional) --- ## 3. Prioridad de Resolucion de Gaps | # | Gap | Prioridad | Esfuerzo | Dependencias | |---|-----|-----------|----------|--------------| | 1 | Validacion OOS | P0 | 3 dias | Ninguna | | 2 | Multi-temporalidad | P0 | 5 dias | Gap 1 | | 3 | 80% Win Rate | P0 | 5 dias | Gap 1, 2 | | 4 | 30-100% Semanal | P1 | 3 dias | Gap 3 | | 5 | LLM Fine-tuning | P0 | 10 dias | Ninguna | | 6 | MCP Server | P0 | 10 dias | Gap 5 | | 7 | Binance BTC | P1 | 5 dias | Gap 1 | --- ## 4. Impacto en Arquitectura Actual ### Cambios Necesarios ``` ANTES (Arquitectura Actual): Frontend ──> Backend ──> ML Engine ──> Trading Agents │ └──> MetaAPI (MT4) DESPUES (Arquitectura ML-First): ┌──────────────────────────────────────┐ │ MCP SERVER (nuevo) │ │ │ │ Tools: execute_trade, get_signal, │ │ modify_position, etc. │ └────────────────┬─────────────────────┘ │ ┌────────────────────────────────┼────────────────────────────┐ │ │ │ ▼ ▼ ▼ ┌───────────┐ ┌───────────┐ ┌───────────┐ │ LLM Agent │◄────────────────>│ ML Engine │ │ Brokers │ │ (fine- │ Analisis + │ │ │ │ │ tuned) │ Decisiones │ Modelos │ │ MT4/Binance│ └───────────┘ │ Multi-TF │ └───────────┘ └───────────┘ ``` ### Nuevos Componentes 1. **MCP Server** (`apps/mcp-server/`) 2. **Fine-tuning Pipeline** (`apps/llm-agent/training/`) 3. **Datasets** (`apps/llm-agent/datasets/`) 4. **Crypto Features** (`apps/ml-engine/src/data/crypto_features.py`) 5. **BTC Strategies** (`apps/trading-agents/src/strategies/btc_strategies.py`) --- ## 5. Estimacion de Esfuerzo Total | Fase | Dias | Recursos | |------|------|----------| | Preparacion Datos (F0) | 6 | ML-Specialist x1 | | ML Training (F1) | 15 | ML-Specialist x2 | | LLM Fine-tuning (F2) | 12 | ML-Specialist x1, Backend x1 | | MCP + Integraciones (F3) | 15 | Backend x2, MCP-Dev x1 | | Visualizacion (F4) | 10 | Frontend x2 | | **Total** | **58 dias** | **~13 semanas** | Con paralelizacion efectiva: **8-10 semanas** --- **Documento Generado:** 2026-01-04 **Autor:** Orquestador / Tech Leader