Generas la página 1. Tu protagonista se ve perfecta. Generas la página 14. Su cara es un poco distinta. Para la página 22 ya no sabes si has dibujado a una persona o a una familia. Este es el fallo central de cualquier generador de cómic con IA, y la razón por la que la mayoría de los "cómics con IA" que ves online no cuentan una historia coherente — el reparto literalmente cambia de forma entre páginas.
Este post va de cómo mantener el mismo personaje en cada viñeta de cómic con IA: qué causa la deriva específicamente en cómics, la decisión de arquitectura que más ayuda (renderizar la página entera en una sola llamada), y cómo el pipeline de fichas de Lumora cierra las brechas que quedan.
Si quieres la teoría general de la consistencia de personajes en IA — para novelas, cómics y video — empieza por la guía completa. Este post se centra en lo específico de las páginas de cómic.
Por qué las viñetas derivan aunque las ilustraciones de novela no
Una novela puede pedir una ilustración por capítulo — quizá diez en total en un libro de 60 000 palabras. El modelo tiene mucho margen para interpretar al personaje porque solo hay diez interpretaciones con las que ser consistente.
Un cómic de 24 páginas con 4 viñetas por página son 96 "renderizados" separados de tus personajes. Cada viñeta es una oportunidad para que el modelo tome una decisión sutilmente distinta. Tres cosas hacen los cómics más difíciles que las ilustraciones de novela:
- Muchas caras pequeñas por página. Cuando una viñeta muestra a tu protagonista al otro lado de la habitación con 200 píxeles de cara, el modelo tiene muy poco lienzo donde trabajar. Los pequeños errores se acumulan.
- Poses de acción, contraplanos y ángulos extremos. Una novela puede describir al personaje mirando por la ventana. Un cómic pide "se lanza a la derecha mientras mira por encima del hombro izquierdo, con la boca abierta a mitad de un grito". Los modelos que clavan retratos frontales suelen inventar caras nuevas bajo esas condiciones.
- Composiciones con varios personajes. Las viñetas de conversación — dos caras, plano medio — son la composición más común en cómic y la más arriesgada para el intercambio de rasgos. El modelo ve dos referencias y puede mezclarlas.
Por eso el consejo estándar ("escribe buenos prompts") falla específicamente en cómics. Puedes escribir el mejor prompt de tu vida y aun así producir caras inconsistentes si el modelo no tiene un ancla que deba respetar.
La decisión de arquitectura: renderiza la página, no la viñeta
La mayoría de herramientas de cómic con IA que han salido este año generan una viñeta cada vez y luego las pegan. Suena natural — los cómics están hechos de viñetas, así que genera viñetas.
Es el diseño equivocado para la consistencia. Cada generación separada es otra oportunidad de deriva. Doce viñetas son doce tiradas de dados.
Lumora renderiza la página entera como una sola imagen. El modelo recibe un prompt que describe la maqueta de la página, la acción y los diálogos de cada viñeta, y una única ficha de referencia por cada personaje presente en esa página. Devuelve una imagen que contiene todas las viñetas dispuestas juntas. Dentro de ese único render, el modelo trata al personaje como una entidad coherente — la misma cara aparece en la viñeta 1 y en la viñeta 4 porque se compusieron en la misma llamada.
Esta decisión sola elimina aproximadamente la mitad del problema de consistencia. La otra mitad se resuelve con lo que adjuntas a esa llamada.
Cómo Lumora mantiene el mismo personaje en las 24 páginas
La primera vez que se referencia a un personaje en un proyecto, Lumora genera una ficha de 3 vistas — frontal, 3/4, perfil — sobre fondo neutro, en el estilo artístico elegido. Esa ficha es la verdad visual.
Si subiste una foto de referencia durante la preparación, esa foto entra en la generación de la ficha como input multimodal. El modelo recibe instrucción de preservar la fidelidad facial de la foto mientras aplica el estilo del proyecto solo al renderizado — grosor de línea, paleta de color, convención de sombreado. La foto controla quiénes son; el estilo controla cómo se dibujan.
Cuando empieza la generación de páginas, cada llamada de render incluye:
- Una descripción de la maqueta (cuántas viñetas, qué hay en cada una).
- Dirección por viñeta (acción, diálogo, ángulo de cámara).
- La ficha de cada personaje nombrado que aparezca en esa página, adjuntada como imagen multimodal de referencia.
- Una instrucción explícita en el prompt: "Usa la ficha de referencia del personaje para mantener la consistencia visual — debe verse exactamente como en su ficha."
El modelo de imagen que usamos (gemini-3.1-flash-image-preview, también conocido como Nano Banana 2) acepta hasta cinco imágenes de referencia por llamada, así que una página típica con 2–3 personajes principales más una referencia de localización encaja bien dentro del presupuesto. Para escenas multitudinarias, priorizamos a los personajes principales y dejamos a los secundarios como interpretaciones más libres.
La ficha de personaje se cachea para el proyecto, así pagas el coste de generación una sola vez y te beneficias en cada página posterior.
Mecánica viñeta a viñeta: a qué prestar atención en una página
Aun con todo lo anterior, hay patrones a nivel de página que afectan la consistencia. Los equipos que sacan cómics más limpios con Lumora hacen estas cosas:
Entre tres y seis viñetas por página. Menos de tres y tu cómic se lee más como una novela ilustrada — bien si es el objetivo. Más de seis y cada viñeta se vuelve pequeña, las caras pierden detalle, y el modelo tiene menos donde anclar. Tres a seis viñetas es el punto óptimo para la mayoría de los estilos.
No metas más de dos personajes nombrados en la misma viñeta. Un plano general con cinco personajes es técnicamente posible, pero espera que los nombrados se vean aproximados. Reserva las "viñetas de grupo" para momentos en los que la personalidad importa más que la precisión facial.
Los contraplanos se benefician de los primeros planos. Un primer plano usa más píxeles en la cara, dándole al modelo más espacio para renderizarla con precisión. Si una clave emocional ocurre en una página, dale una viñeta de primer plano.
Mantén los bocadillos de diálogo fuera del prompt del modelo. Lumora maneja el diálogo como una capa aparte sobre la imagen — el modelo no tiene que renderizar texto en la página. Pedirle que escriba el diálogo dentro de la viñeta perjudica tanto la consistencia como la legibilidad.
Qué pasa al regenerar una sola página
La regeneración por página es una función que los creadores usan constantemente. La primera generación de un cómic de 24 páginas cuesta unos 144 tokens (alrededor de seis tokens por página en calidad media). La mayoría de proyectos luego regenera 2–6 páginas concretas para clavar los momentos clave.
Cuando regeneras una página en Lumora, se reutilizan las mismas fichas de personaje. La página vuelve al modelo con exactamente las mismas referencias — prompt distinto, anclas iguales. Eso significa que una página regenerada sigue siendo consistente con el resto del cómic, no una nueva tirada de dados sobre la cara del personaje.
Si regeneras con un prompt de override (tu descripción libre de cómo quieres que se vea la página), las referencias de personajes siguen adjuntándose automáticamente. No tienes que acordarte de incluirlas — es la disciplina que el pipeline impone por ti.
Checklist práctico para consistencia en cómic
- [ ] Cada personaje nombrado tiene una descripción con 6+ detalles físicos específicos.
- [ ] Cada personaje nombrado tiene una ficha de 3 vistas generada y revisada.
- [ ] Has subido una foto de referencia para cualquier personaje en el que la fidelidad a una persona real importe.
- [ ] Has elegido un estilo (manga, americano, europeo, webtoon, realista) y no lo vas a cambiar.
- [ ] Las páginas con tres o más personajes nombrados están señaladas y aceptadas como más libres.
- [ ] Los beats emocionales están en viñetas de primer plano, no en planos generales.
- [ ] La maqueta se mantiene entre 3 y 6 viñetas.
Próximos pasos
La consistencia de personajes en cómic dejó de ser un ejercicio esperanzador de prompt-engineering el día que pudimos adjuntar referencias a cada llamada de página. Renderiza páginas enteras, adjunta la ficha, mantén un solo estilo, y tu protagonista será la misma persona en la página 1 y en la página 24. Ese es todo el truco.