AutoNiche AI - Arquitectura del Sistema

Publicado 12/03/2025 Actualizado 12/03/2025

Por Arturo Alcalá

visitas 2 min de lectura

1. Arquitectura General

El sistema se basará en una arquitectura modular, dividiendo las tareas en diferentes agentes especializados que trabajarán de forma coordinada mediante n8n.

📌 Componentes Principales

1️⃣ Entrada de Datos

Agente de generación de ideas (LLM en local)
Alternativa: Google Sheets / Base de Datos

2️⃣ Procesamiento de Contenido

Agente de generación de guiones (LLM)
Agente de generación de subtítulos y descripciones
Agente de síntesis de voz (F5 TTS)

3️⃣ Producción de Vídeo

Generación de clips con Stable Video Diffusion / ModelScope
Uso de imágenes libres de derechos o generadas
Ensamblaje con FFmpeg y mejoras con Rife AI

4️⃣ Publicación y Monetización

Generación de vídeo largo para YouTube
Extracción de fragmentos más virales para Shorts/TikTok
Generación de vídeos cortos optimizados para viralidad
Subida automática a YouTube, TikTok, Instagram y otras plataformas

2. Esquema de Conexión entre Componentes

📍 Flujo de Trabajo General

graph TD;
    A[Generación de Ideas] -->|IA local| B(Generación de Guion);
    B -->|Texto final| C(Síntesis de Voz);
    B -->|Texto final| D(Generación de Subtítulos);
    C -->|Audio generado| E(Generación de Clips con IA);
    D -->|Subtítulos optimizados| E;
    E -->|Clips generados| F(Edición y Ensamblaje con FFmpeg);
    F -->|Vídeo Final| G(Análisis de Contenido con Whisper);
    G -->|Detección de fragmentos virales| H(Generación de Shorts);
    H -->|Vídeos cortos| I(Publicación en TikTok, Instagram, Shorts);
    G -->|Vídeo largo| J(Publicación en YouTube);

📌 Tecnologías Usadas en Cada Etapa

Módulo	Tecnología / Herramienta
Generación de Ideas	LLM local (Mistral 7B, Phi-2, Mixtral)
Generación de Guion	GPT-4All / Mixtral / Ollama
Síntesis de Voz (TTS)	F5 TTS / Coqui TTS
Generación de Clips	Stable Video Diffusion, ModelScope
Edición y Ensamblaje	FFmpeg + Rife AI
Detección de Momentos Virales	Whisper AI + Análisis de Engagement
Generación de Shorts	FFmpeg (recorte automático)
Publicación Automática	n8n + API de YouTube / TikTok

3. Arquitectura de Software

📌 Elección de Infraestructura

✅ Sistema Operativo: Windows 11 (posible opción de Linux si mejora el rendimiento)
✅ Orquestación: n8n (automatización de procesos sin necesidad de código complejo)
✅ Gestión de Modelos de IA: Ollama, LMStudio, Hugging Face
✅ Bases de Datos: PostgreSQL / MongoDB / ChromaDB (para embeddings)

📍 Ejemplo de Flujo en n8n:

Agente de IA obtiene una idea de contenido
El guion se genera y almacena en la base de datos
Se genera la voz con F5 TTS
Se crean los clips y se ensamblan con FFmpeg
Se analizan los fragmentos más virales con Whisper AI
Se generan Shorts y se formatean automáticamente
El vídeo largo se sube a YouTube
Los vídeos cortos se publican en TikTok, Instagram y YouTube Shorts

4. Infraestructura Local y de Hardware

🔹 CPU: Procesador 8 núcleos 🔹 GPU: AMD RX 590X 🔹 RAM: Mínimo 32GB 🔹 Almacenamiento: SSD 1TB

Proyectos, AutoNiche AI

Esta entrada está licenciada bajo CC BY 4.0 por el autor.