Inteligencia Artificial de Google convierte los textos a fotos
El modelo incluye un proceso de programación. Se espera que las imágenes sean de una alta calidad
Google no deja de innovar en los procesos de Inteligencia Artificial (IA).
La empresa norteamericana recientemente presentó el modelo de texto a imagen autorregresivo llamado Pathways (Parti), este sistema busca lograr que la generación de imágenes fotorrealistas de alta fidelidad, que involucra composiciones complejas y conocimientos del mundo sean más fáciles de construir.
Según la comunicación oficial de la compañía, los avances no solo han demostrado su capacidad de rendimiento, sino también de vanguardia en los sistemas de investigación y ejecución de procesos.
“Los avances recientes con modelos de difusión para la generación de texto a imagen, como ‘Imagen de Google’, también han demostrado capacidades impresionantes y un rendimiento de vanguardia en los puntos de referencia de investigación”.
Los creadores de este sistema destacan que este tipo de herramientas son “más interesantes” cuando permite “crear escenas nunca vistas”, que es el mercado específico en el que se desarrolla ‘Parti’, gestionando complejas indicaciones que le exigen mostrar el preciso conocimiento del mundo, lo cual consigue a través del motor de búsqueda de Google.
El sistema de ‘Patri’, también posee la capacidad de utilizar la Inteligencia Artificial (IA) y transformar el texto en imágenes.
Esto se lleva a cabo por medio de la generación de texto a imagen, solucionando un problema de modelado de secuencia a secuencia, a través de la programación por medio de palabras claves.
Los resultados del destino se miden a través de secuencias de tokens (cifrados de seguridad) de imágenes en lugar de que los tokens de texto. Por lo que el esquema funcional de ‘Parti’ utiliza una serie de datos de imágenes, ViT-VQGAN, el cual se encarga de codificarlas como secuencias que buscan aprovechar su capacidad para reconstruir las características de las imágenes de alta calidad.
Para cumplir con los objetivos, los investigadores también han creado PartiPromts (P2), un abanico de más de 1.600 indicaciones en inglés que puede ser utilizado para medir las capacidades de ‘Parti’.
Las indicaciones que P2 proporciona pueden ser tanto simples como complejas. Esto permite a los expertos medir el progreso con descripciones de hasta 67 palabras.
Fuente: elheraldo.co