- Update vision, architecture and technical documentation - Update module definitions (PMC-001 to PMC-008) - Update requirements documentation - Add CONTEXT-MAP.yml and ENVIRONMENT-INVENTORY.yml - Add orchestration guidelines and references 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
4.6 KiB
4.6 KiB
| id | title | type | status | date | deciders | tags | project | created_date | updated_date | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ADR-003 | Motor de Generacion de Imagenes | ADR | Accepted | 2025-12-08 |
|
|
platform_marketing_content | 2025-12-08 | 2026-01-04 |
ADR-003: Motor de Generación de Imágenes
Fecha: 2025-12-08 Estado: Aceptado
Contexto
La plataforma necesita generar imágenes para marketing con:
- Alta calidad fotográfica
- Consistencia de marca (LoRAs)
- Control sobre composición (ControlNets)
- Capacidad de personalización
- Costos controlables a escala
Opciones:
- APIs de terceros (Midjourney, DALL-E, etc.)
- Modelos open source auto-hosteados
- Híbrido
Decisión
Motor Principal: ComfyUI + Stable Diffusion XL
Usaremos ComfyUI como motor de generación con SDXL como modelo base, complementado con APIs externas para casos específicos.
Componentes
-
ComfyUI Server
- Servidor dedicado con GPU
- API HTTP para ejecución de workflows
- Soporte para nodos personalizados
-
Modelos Base
- Stable Diffusion XL 1.0
- Checkpoints especializados (realismo, producto, etc.)
-
Adaptadores
- LoRAs para personalización de marcas/productos
- ControlNets para poses y composición
- IP-Adapter para consistencia de personajes
-
Integración vía ComfyDeploy o HTTP directo
Arquitectura
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ Backend │────▶│ Bull │────▶│ ComfyUI │
│ NestJS │ │ Queue │ │ Server │
└─────────────┘ └─────────────┘ └─────────────┘
│ │
│◀──────── Webhook callback ───────────┘
│
▼
┌─────────────┐
│ S3/MinIO │
│ Storage │
└─────────────┘
Workflows Predefinidos
- product_photo_synthetic - Fotografía de producto
- social_media_post - Posts para redes
- ad_variations - Variaciones A/B
- virtual_avatar - Personajes consistentes
Consecuencias
Positivas
- Control total: Personalización ilimitada de workflows
- Sin costos por generación: Solo infraestructura
- LoRAs propios: Entrenar modelos específicos de marca
- Sin censura externa: Control sobre políticas de contenido
- Escalable: Agregar más GPUs según demanda
- Open source: Sin dependencia de vendor
Negativas
- Infraestructura: Requiere servidor(es) con GPU
- Complejidad: Mantener ComfyUI y modelos actualizados
- Expertise: Necesario conocimiento de diffusion models
- Tiempo inicial: Setup más largo que usar API
Costos Estimados
| Componente | Costo Mensual (Estimado) |
|---|---|
| GPU Server (RTX 4090) | $300-500 cloud / $0 on-prem |
| Storage (500GB) | $20-50 |
| Bandwidth | $10-30 |
| Total | $330-580/mes |
vs API pricing: ~$0.02-0.08 por imagen × miles de imágenes
APIs Complementarias
Para casos donde SDXL no es óptimo:
| Caso | API Sugerida |
|---|---|
| Texto perfecto en imagen | Gemini/Ideogram |
| Generación de texto/copy | OpenAI GPT-4 |
| Video (futuro) | Runway/Seedream |
Alternativas Consideradas
1. Midjourney API
Pros:
- Calidad excepcional
- Sin infraestructura
Contras:
- No hay API oficial (solo Discord)
- Sin LoRAs personalizados
- Costos por imagen
- Políticas de contenido restrictivas
Rechazo: No viable sin API oficial
2. DALL-E 3 API
Pros:
- API oficial de OpenAI
- Buena calidad
Contras:
- Sin LoRAs
- Costos altos a escala ($0.04-0.08/imagen)
- Censura agresiva
Rechazo: Costos y falta de personalización
3. Replicate/Banana/Modal
Pros:
- SDXL en la nube
- Pago por uso
Contras:
- Costos similares a APIs
- Menos control sobre workflows
- Latencia adicional
Rechazo: Costo-beneficio no favorable
Plan de Migración
- Fase 1: ComfyUI local con workflows básicos
- Fase 2: LoRAs de marcas, ComfyDeploy
- Fase 3: Cluster de GPUs, auto-scaling
Referencias
Documento generado por: Requirements-Analyst Fecha: 2025-12-08