Pienso en un texto cuyos destinatarios principales sean editores de libros -gente que trabaja en el mundo del arte y de la cual podríamos esperar un mínimo de sensibilidad- explicando porqué no deberían usar algoritmos generadores de imágenes para las obras que publican.
El algoritmo generativo se ha convertido en extraña musa de quienes, quizás, no tienen la paciencia, las competencias o la curiosidad para crear una obra original. Tal vez carecen de una visión sobre lo que un libro es: eminentemente, una pieza gráfica, una tecnología de lienzos sucesivos.
Si tuviera que ponerlo en simple: un libro con faltas de ortografía es un mal libro. La situación de las portadas no es distinta. Estas imágenes generadas por modelos predictivos adolecen de defectos formales y sustantivos y no saber percibirlo es una forma de analfabetismo, podemos decirlo así: esos editores no saben leer.
El Arte de la Mediocridad
Las imágenes generadas por algoritmos son, en su mayoría, genéricas y provienen de bases de datos que han sido alimentadas con obras de artistas reales. El resultado es un menjunje de estilos y conceptos que, pueden parecer interesantes o verosímiles vistos al voleo, pero realmente carecen de originalidad y sentido.
Tomemos esta imagen y los comentarios del ilustrador David López al periódico El País, en una de las controversias más recientes sobre el uso de estas herramientas:
“Hay muchas pruebas. Todas las imágenes realizadas por IA se parecen bastante, con un dibujo fotorrealista con gente anodina y que responde a cánones de belleza estrictos: narices pequeñas, pómulos altos, cuellos imposiblemente largos y los ojos son de dos personas distintas. También la IA tiene muchos problemas para dibujar partes donde el pelo interactúa con las orejas. El rostro tiene como un acabado muy perfecto, pero el fondo está desdibujado y no hay rastro de ninguna pincelada”
Se refiere a la portada de la novela "Juana de Arco" de Katherine J. Chen, lo que llevó a varias librerías de España a retirar el libro. Aunque la editorial Planeta afirma que la cubierta fue diseñada por un ser humano con herramientas convencionales que incorporan esta tecnología, críticos como David López argumentan que esto desvaloriza el trabajo artístico y plantea problemas éticos.
De paso repasa todas las alucinaciones y defectos de la imagen:
Las imágenes generadas son defectuosas, tienen proporciones extrañas o elementos inconexos. Además, suelen ser obvias y extremadamente simplistas, lo que refleja una falta de atención al detalle y de sensibilidad estética por parte de quien las aprovecha.
Usarlas es actuar de mala fe, dolosamente. Es pagar con falsa moneda, alimentar con comida descompuesta. Presupone lo peor de las personas, teniéndolas de antemano por algo menos que humano: brutas o no merecedoras de sentido. Significa que el destinatario proyecta a un otro como alguien que requiere lo mínimo, capaz de conformarse con las regurgitaciones de una máquina. Es una mezquindad hacia ese milagro que es el asombro y maravilla en nuestra mirada.
Tomemos esta portada como ejemplo:
Tenemos una figura central, una mujer cuyas connotaciones son orientales. Hay una idea de chorreo o manchas tipo acuarela, mal ejecutada. Los reflejos rojos de su pelo no tienen ninguna razón pues algunos se extienden o se cortan caprichosamente. Los pliegos de su ropa, con mucho esfuerzo pueden parecer una vorágine, pero solo son un montón de manchas arbitrarias que en la parte inferior terminan en líneas delgadas, algunas como si gotearan. Unas finalizan en ángulos rectos mientras otras terminan curvas; totalmente inconexas unas de otras. La guinda de la torta, una figura curva de fondo, como un sol naciente, que es un círculo mal hecho, incompleto. Qué decir del interior de ese “círculo” con un segundo color análogo que no tiene ningún tipo de propósito en la composición.
No solo hablemos de errores o alucinaciones. Estas imágenes generadas a menudo no respetan conceptos básicos como jerarquía, equilibrio, contraste. Un buen diseño no es solo una cuestión de gusto; es una forma de comunicación que debe guiar, entusiasmar, atraer al lector. Una imagen bien construida nos muestra algo que no habríamos podido percibir de otra manera. Algo que tal vez siempre está ahí pero que solo ahora vemos.
Estas portadas, al carecer de un entendimiento profundo de estos fundamentos, a menudo resultan en composiciones desordenadas, confusas. La culpa no es de la máquina, la máquina no puede tomar decisiones, solo es un loro que repite “promedios” siguiendo estadísticas.
Otro ejemplo:
Esta portada me apareció en redes sociales porque al parecer el libro ganó un premio. No pude encontrar una imagen más detallada que ésta:
No sé ni por donde partir por acá.
Tal vez me puedo limitar a decir: anatomía dejó el chat.
Puedo elaborar una justificación, y presuponer que una posible defensa de esta portada fuera por el derrotero de la monstruosidad o lo ominoso. Todas suposiciones de mi parte, sin duda, pero las he escuchado en otros casos: querer aprovechar el absurdo de la máquina como una estética particular.
Ahora, si esa es la intención, solo se sostiene en su propia declaración programática. Mala excusa. Es un hecho que el algoritmo hace eso con las caras, las manos, los cuerpos, sus proporciones. La intención no puede ser equivalente a los parámetros ya dados por la configuración de una máquina. No hay intención en algo que se deja completamente al azar. Los límites liberan, pero solo cuando hay autonomía, cuando decido someterme a la ley del material o la técnica.
Se puede ir más lejos. Quienes solo promptean imágenes parecen -además- no tener capacidad de componer o siquiera editar lo que producen, quedan sujetos a la programación limitante de la máquina, a la merced de sus ocurrencias. Y en ese último sentido, el montaje sigue pareciendo un mejor recurso. El collage es una forma de arte que requiere cuidado. Montar imágenes requiere capacidad técnica, tanto en herramientas como en la coherencia que debe tener la composición y estructura de una imagen.
Quiero mencionar que particularmente en la literatura de ciencia ficción y fantástica abundan portadas realizadas con algoritmos generativos, como los dos ejemplos que aquí muestro.
El autor de este último libro ha escrito una suerte de justificación sobre el uso de estos generadores en un texto que llamó: ¿Sueñan las IAs con humanos eléctricos?. En general el texto es apologético y realiza algunas analogías que me parecen falsas o descontextualizadas. Un argumento realmente ridículo es que intenta comparar la “creación” usando estos algoritmos con la invención y el uso del aerógrafo. Dice que este adelanto tecnológico fue desdeñado por muchos artistas y que hoy sin duda se considera una herramienta técnica. Especula que lo mismo ocurrirá con los algoritmos.
El concepto que no parece asomarse por ninguna lado aquí es el de articulación: un cuerpo, con determinados gestos, en relación a un material y con unas substancias, permite marcar una superficie para crear sentido. Aún una imagen sintética -quiero decir generada por vectores- se encuentra debidamente articulada. La articulación nos habla del cómo una imagen vino a existir en el mundo, nos permite re-construirla. No pasa así con un prompt.
Además, este autor se enfoca mucho en responder a las problemáticas éticas por derechos de autor y precarización de artistas -de manera discutible-, pero sobre todo creo que su texto yerra en reconocer que las imágenes que producen estas herramientas, son sencillamente feas y son totalmente aleatorias.
O si volvemos al tema editorial: tener una imagen no equivale a que la misma ipso facto se convierta en una portada.
La que acompaño aquí arriba (Yggdrasil), es un buen ejemplo de esto: la elección tipográfica es deficiente y carece de personalidad, el sombreado que utiliza es apenas una medida parche para separar efectivamente los elementos verbales del fondo, usa tres fuentes distintas de manera desproporcionada, desalineada y con un interlineado incómodo. El color blanco de la fuente no armoniza con los colores del dibujo. Los elementos verbales se sienten desconectados, superpuestos. Es feísimo.

Por otra parte, hay una evidente falta de distintividad en estas imágenes. Son todas muy similares y repiten los mismos recursos. ¿Quién quiere que su libro tenga una portada que sea igual a la de otros diez títulos en la estantería?
La sensación de que estas imágenes son "falsas" es palpable. Todas las cosas hablan y todo puede ser leído aunque no haya una intención comunicativa. Y estas portadas gritan que no tienen valor porque la editorial no pudo conseguir o no tuvo los recursos de presentar una propuesta interesante.
Juzguemos los libros por sus portadas
No se me malinterprete: antes de los algoritmos, ya existían portadas malas. Siempre habrán riesgos y apuestas. Quiero afirmar: el uso de algoritmos asegura ese resultado fracasado.
Así que, editores, la próxima vez que piensen en usar este recurso para sus portadas, piensen en el mensaje que están enviando, en lo genérico e incongruente que será la obra final y al hecho de que estarán comunicando que carecen de recursos estéticos para producir un resultado duradero, atractivo, conmovedor. No pasan piola.
¿Realmente quieren ser parte de una industria que se conforma con lo mediocre?
La respuesta debería ser un rotundo no.
Y para los lectores: lo correcto es que juzguen los libros por sus portadas.
Como nota final, encontré este link de editoriales españolas que usan IA, por si quieren agregar nuevas pestañas para editoriales de otros países:
https://docs.google.com/document/d/1HxgYqIIbmLShT2tfgpK8Sk6PgjrV3LvWeQNrEW1BvJk/edit?tab=t.0
Si llegaste hasta acá, agradezco tu like y comentario.
Comparte para que llegue a más gente. Todo mi trabajo es gratuito y tu apoyo me ayuda a mantenerme motivado y visible.











