Artículo en congreso ICLR aplicando Deep Learning para video

BSC participa en el congreso ICLR con paper en Deep Learning

Si le dieran un video de 10 minutos, pero solo 30 segundos para verlo y entender de qué se trata, echaria un vistazo al video para encontrar los segmentos más relevantes en este corto período de tiempo. Las redes neuronales artificiales (o Deep Learning) son muy buenas para resolver tareas cognitivas, como la comprensión de imágenes y videos, el reconocimiento de voz o la traducción, pero no pueden echar un vistazo rápido u hojear los datos proporcionados para acelerar sus decisiones.

El Barcelona Supercomputing Center que investiga en inteligencia artificial (con los investigadores Víctor Campos, Jordi Torres), en colaboración con la Universitat Politècnica de Catalunya (com los investigadores Xavier Giró-i-Nieto, Jordi Torres, Google (con el investigador Brendan Jou) y la Universidad de Columbia (con el investigador Shih-Fu Chang), publicamos un artículo de investigación en el congreso ICLR que presenta cómo se pueden mejorar estas redes neuronales para ignorar partes de los datos de entrada y al mismo tiempo preservar la precisión en la tarea objetivo. Esta es una aproximación muy interesante que permite hacer predicciones más rápidas y reducir el consumo de energía, que es clave para el despliegue en dispositivos portátiles. 

Si le interesa más detalle puede visitar la página web del proyecto o leer el artículo  Skip RNN: Skipping State Updates in Recurrent Neural Networks. El código para reproducir los experimentos está disponible públicamente, lo que esperamos ayude y aliente la investigación en el campo.

La conferencia International Conference on Learning Representations (ICLR) es una de las principales conferencias en el campo del Machine Learning (y Deep Learning). Dirigido y organizado por algunos de los mejores investigadores en el campo del Deep Learning y la inteligencia artificial, como Yann LeCun (NYU / Facebook), Yoshua Bengio (Université de Montreal), Oriol Vinyals (Google DeepMind), Aaron Courville (Université de Montreal) o Hugo Larochelle (Google).