La Red Neuronal Ha Aprendido A Generar Videos Basados en La Descripción De - Vista Alternativa

La Red Neuronal Ha Aprendido A Generar Videos Basados en La Descripción De - Vista Alternativa
La Red Neuronal Ha Aprendido A Generar Videos Basados en La Descripción De - Vista Alternativa

Vídeo: La Red Neuronal Ha Aprendido A Generar Videos Basados en La Descripción De - Vista Alternativa

Vídeo: La Red Neuronal Ha Aprendido A Generar Videos Basados en La Descripción De - Vista Alternativa
Vídeo: Tutorial de Deep Learning Sesión 1: Introducción a las redes neuronales 2024, Septiembre
Anonim

La inteligencia artificial crea videos con guiones, hasta ahora breves y borrosos, pero un día solo reemplazará a todo un estudio de cine.

Las redes neuronales ya son bastante buenas (y en muchos casos mejores que las personas) para reconocer patrones en una imagen y pueden describir en términos generales escenas completas. Las redes neuronales generativas realizan la transformación inversa y pueden formar una imagen basada en su descripción, o predecir el siguiente fotograma basándose en los anteriores.

Los desarrolladores belgas han ido aún más lejos, combinando estas capacidades en un único sistema que crea videos "de la nada", basándose en su propia experiencia de aprendizaje automático y texto de secuencia de comandos. Tinne Tuytelaars habló sobre esto en una reunión de la Asociación para el Avance de la Inteligencia Artificial (AAAI) celebrada en Estados Unidos.

La red neuronal funciona en dos etapas, según Tinne, como imitando el proceso creativo de una persona: en la primera etapa, se forma un "boceto" borroso y aproximado de cada cuadro, después de lo cual se especifican y agregan detalles. Una de las partes importantes de dicho sistema es la red neuronal discriminadora, que compara el resultado con videos "reales" adecuados para un escenario dado, y permite evaluar su calidad, mejorando el trabajo de la parte generativa del sistema.

norte

La red neuronal se entrenó en 10 escenas ("jugar golf en el césped", "kitesurf en el mar", etc.) y aprendió a separar acciones y circunstancias entre sí, y también pudo combinarlas de cualquier manera, creando videos, por ejemplo. "Golf en la piscina":

Image
Image

o "navegar en la nieve":

Image
Image

Video promocional:

Por supuesto, la calidad de tales animaciones aún está lejos de ser aceptable: los "videos" que duran alrededor de un segundo consisten en solo 32 cuadros con dimensiones de 64x64 píxeles.

Pero con la misma confianza es posible garantizar que estos números mejorarán rápidamente, porque no hace mucho el cine en sí solo podía presumir de una imagen turbia, retorcida y tonta. Si tal red neuronal se puede hacer realmente rápida y eficiente, Hollywood puede llegar a su fin: bastará con tomar el guión y la película estará lista. Esta oportunidad será útil para generar grandes conjuntos para entrenar otras redes neuronales y para crear nuevos algoritmos para comprimir y transmitir video en tiempo real.

Sergey Vasiliev

Recomendado: