in

La red neuronal ahora puede dibujar imágenes por descripción de texto

Los desarrolladores de Microsoft han desarrollado una nueva red neuronal adversaria que puede crear imágenes basadas en sus breves descripciones textuales. El sistema funciona gracias a un algoritmo que tiene en cuenta los detalles importantes de la descripción y se describe en detalle en la preimpresión en arXiv.

Muy a menudo, los algoritmos de imágenes se basan en redes neuronales adversas generativas (también llamadas adversarios generativos, GAN, redes adversas generativas), un tipo de redes neuronales artificiales que consta de un generador y un discriminador. La tarea de la primera es crear nuevos objetos similares a los objetos de la muestra de entrenamiento, a los que no tiene acceso, y la tarea de la segunda es decidir si el objeto generado pertenece a la clase de objeto de la muestra de capacitación disponible y dar la señal apropiada al generador.

Basados en este algoritmo, se crean programas que pueden dibujar obras de arte originales, crear modelos de terreno tridimensionales e incluso convertir bocetos en retratos fotorrealistas. Los desarrolladores del departamento de investigación de Microsoft bajo la dirección de Xiaodong He (Xiaodong He) para crear imágenes a partir de la descripción del texto desarrollaron un nuevo tipo de red GAN-neural: GAN atento (GAN de atención, AttGAN).

A diferencia de los algoritmos existentes que generan imágenes de toda la descripción, convirtiéndola en una oración vectorial, el nuevo algoritmo llama la atención sobre los detalles: es decir, evalúa cada palabra en la descripción y dibuja una imagen basada en ellos. Por lo tanto, los desarrolladores pudieron mostrar la efectividad del nuevo algoritmo para crear imágenes basadas en la descripción y por separado, la efectividad de agregar un componente «atento» a la red neuronal.

Recientemente, investigadores de la Universidad de Seúl presentaron otra red neuronal, que a partir de la descripción del texto de la acción genera un modelo tridimensional de su implementación. El modelo resultante se puede usar para hacer que el robot se mueva.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Loading…

0

Comments

0 comments

El primer hotel del mundo sin personal abierto

La historia del rey Arturo no se inventó: se encontraron nuevas evidencias