rckrdmrd/platform-marketing-content

Fork 0

rckrdmrd d0f47896e7 Initial commit - platform_marketing_content

2026-01-04 06:19:39 -06:00

4.3 KiB

Raw Blame History

ADR-003: Motor de Generación de Imágenes

Fecha: 2025-12-08 Estado: Aceptado

Contexto

La plataforma necesita generar imágenes para marketing con:

Alta calidad fotográfica
Consistencia de marca (LoRAs)
Control sobre composición (ControlNets)
Capacidad de personalización
Costos controlables a escala

Opciones:

APIs de terceros (Midjourney, DALL-E, etc.)
Modelos open source auto-hosteados
Híbrido

Decisión

Motor Principal: ComfyUI + Stable Diffusion XL

Usaremos ComfyUI como motor de generación con SDXL como modelo base, complementado con APIs externas para casos específicos.

Componentes

ComfyUI Server
- Servidor dedicado con GPU
- API HTTP para ejecución de workflows
- Soporte para nodos personalizados
Modelos Base
- Stable Diffusion XL 1.0
- Checkpoints especializados (realismo, producto, etc.)
Adaptadores
- LoRAs para personalización de marcas/productos
- ControlNets para poses y composición
- IP-Adapter para consistencia de personajes
Integración vía ComfyDeploy o HTTP directo

Arquitectura

┌─────────────┐     ┌─────────────┐     ┌─────────────┐
│   Backend   │────▶│   Bull      │────▶│  ComfyUI    │
│   NestJS    │     │   Queue     │     │   Server    │
└─────────────┘     └─────────────┘     └─────────────┘
       │                                       │
       │◀──────── Webhook callback ───────────┘
       │
       ▼
┌─────────────┐
│   S3/MinIO  │
│   Storage   │
└─────────────┘

Workflows Predefinidos

product_photo_synthetic - Fotografía de producto
social_media_post - Posts para redes
ad_variations - Variaciones A/B
virtual_avatar - Personajes consistentes

Consecuencias

Positivas

Control total: Personalización ilimitada de workflows
Sin costos por generación: Solo infraestructura
LoRAs propios: Entrenar modelos específicos de marca
Sin censura externa: Control sobre políticas de contenido
Escalable: Agregar más GPUs según demanda
Open source: Sin dependencia de vendor

Negativas

Infraestructura: Requiere servidor(es) con GPU
Complejidad: Mantener ComfyUI y modelos actualizados
Expertise: Necesario conocimiento de diffusion models
Tiempo inicial: Setup más largo que usar API

Costos Estimados

Componente	Costo Mensual (Estimado)
GPU Server (RTX 4090)	$300-500 cloud / $0 on-prem
Storage (500GB)	$20-50
Bandwidth	$10-30
Total	$330-580/mes

vs API pricing: ~$0.02-0.08 por imagen × miles de imágenes

APIs Complementarias

Para casos donde SDXL no es óptimo:

Caso	API Sugerida
Texto perfecto en imagen	Gemini/Ideogram
Generación de texto/copy	OpenAI GPT-4
Video (futuro)	Runway/Seedream

Alternativas Consideradas

1. Midjourney API

Pros:

Calidad excepcional
Sin infraestructura

Contras:

No hay API oficial (solo Discord)
Sin LoRAs personalizados
Costos por imagen
Políticas de contenido restrictivas

Rechazo: No viable sin API oficial

2. DALL-E 3 API

Pros:

API oficial de OpenAI
Buena calidad

Contras:

Sin LoRAs
Costos altos a escala ($0.04-0.08/imagen)
Censura agresiva

Rechazo: Costos y falta de personalización

3. Replicate/Banana/Modal

Pros:

SDXL en la nube
Pago por uso

Contras:

Costos similares a APIs
Menos control sobre workflows
Latencia adicional

Rechazo: Costo-beneficio no favorable

Plan de Migración

Fase 1: ComfyUI local con workflows básicos
Fase 2: LoRAs de marcas, ComfyDeploy
Fase 3: Cluster de GPUs, auto-scaling

Referencias

Documento generado por: Requirements-Analyst Fecha: 2025-12-08

4.3 KiB Raw Blame History Unescape Escape

ADR-003: Motor de Generación de Imágenes

Contexto

Decisión

Motor Principal: ComfyUI + Stable Diffusion XL

Componentes

Arquitectura

Workflows Predefinidos

Consecuencias

Positivas

Negativas

Costos Estimados

APIs Complementarias

Alternativas Consideradas

1. Midjourney API

2. DALL-E 3 API

3. Replicate/Banana/Modal

Plan de Migración

Referencias

4.3 KiB

Raw Blame History