Los sistemas de generación de imágenes suelen tener dificultades con indicaciones sencillas, colocando objetos incorrectamente o ignorando por completo las relaciones espaciales..
Frente a este fastidioso problema, el equipo de investigación del Departamento de Ciencias de la Computación de la universidad israelí presentó una solución creativa que permite a los modelos de IA seguir estas instrucciones con mayor precisión en tiempo real..
Denominado Learn-to-Steer (Aprender a Dirigir), el sistema funciona analizando los patrones de atención internos de un modelo de generación de imágenes, lo que ofrece información eficaz sobre cómo organiza los objetos en el espacio..

No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.