Hacking Google Bard: Generando imágenes desde prompts en español!

Fermin Blanco
2 min readFeb 1, 2024

El sorprendente anuncio de Google de poder generar imágenes a través de Google Bard, lo fue tanto como su prerrogativa por limitar su uso al idioma inglés.

Pero… porque?

Le pregunte a Google Bard y aqui les dejo mis conclusiones:

Datos de entrenamiento en español son muy difíciles de conseguir.

Tiene mucho sentido, recordemos que para la generación de imágenes se usa Imagen2, un modelo de difusión que funciona muy bien para imágenes fotorealistas.

Absolutamente todos los modelos de AI tienen deficiencia en datos de entrenamiento en español.

El español es un idioma más complejo (generos gramaticales, estructuras de oraciones diferentes, etc).

No soy lingüista pero concuerdo con este argumento. Tenemos demasidas variantes para expresar una misma idea. Ademas dependiendo del lugar en latam que te encuentres, una misma frase puede significar algo muy distinto.

The hack!

A pesar de todo podemos construir un prompt, para saltarnos esta limitacion.

Google Bard es capaz de generar imágenes sí el prompt es diseñado en Ingles. Pero Google Bard también es capaz de traducir una frase en español al idioma inglés. Teniendo en cuenta lo anterior, combinemos estas capacidades para efectivamente generar imágenes usando prompts en espanol.

The prompt:

Translate to english: [aqui describes en español la imagen que quieres]. Then, process the output using the english language. Finally, generate an image.

Aunque la mayoría de el texto esta en ingles, la parte esencial la ponemos en español. Esa parte, es la que nos permite expresar nuestra ideas en español, para que luego Google Bard nos genere una imagen que coincida con el texto.

Ejemplos:

Translate to english: [Un dragon lleno de poder, sobre una alfombra roja]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Un dragon lleno de poder, sobre una alfombra roja]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Un gato patinando sobre hielo]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Un gato patinando sobre hielo]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Una hamburguesa que luce deliciosa]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Una hamburguesa que luce deliciosa]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Un perfume en una botella de vidrio, bañado con una luz delicada]. Then, process the output using the english language. Finally, generate an image.
Translate to english: [Un perfume en una botella de vidrio, bañado con una luz delicada]. Then, process the output using the english language. Finally, generate an image.

--

--