Hacking Google Bard: Generando imágenes desde prompts en español!
El sorprendente anuncio de Google de poder generar imágenes a través de Google Bard, lo fue tanto como su prerrogativa por limitar su uso al idioma inglés.
Pero… porque?
Le pregunte a Google Bard y aqui les dejo mis conclusiones:
Datos de entrenamiento en español son muy difíciles de conseguir.
Tiene mucho sentido, recordemos que para la generación de imágenes se usa Imagen2, un modelo de difusión que funciona muy bien para imágenes fotorealistas.
Absolutamente todos los modelos de AI tienen deficiencia en datos de entrenamiento en español.
El español es un idioma más complejo (generos gramaticales, estructuras de oraciones diferentes, etc).
No soy lingüista pero concuerdo con este argumento. Tenemos demasidas variantes para expresar una misma idea. Ademas dependiendo del lugar en latam que te encuentres, una misma frase puede significar algo muy distinto.
The hack!
A pesar de todo podemos construir un prompt, para saltarnos esta limitacion.
Google Bard es capaz de generar imágenes sí el prompt es diseñado en Ingles. Pero Google Bard también es capaz de traducir una frase en español al idioma inglés. Teniendo en cuenta lo anterior, combinemos estas capacidades para efectivamente generar imágenes usando prompts en espanol.
The prompt:
Translate to english: [aqui describes en español la imagen que quieres]. Then, process the output using the english language. Finally, generate an image.
Aunque la mayoría de el texto esta en ingles, la parte esencial la ponemos en español. Esa parte, es la que nos permite expresar nuestra ideas en español, para que luego Google Bard nos genere una imagen que coincida con el texto.