Seminario "Carlos Segovia Fernández"

Cirugía de gradientes en redes neuronales para generalización de dominio

Charla a cargo de Enzo Ferrante


Viernes 19 de agosto - 15:30 hs

Ver charla en este link

Enzo Ferrante

Resumen. En aplicaciones de la vida real, como la clasificación de imágenes, los modelos de redes neuronales artificiales a menudo se enfrentan a escenarios en los que hay un cambio en la distribución de datos entre los dominios de entrenamiento y prueba. Cuando el objetivo es hacer predicciones sobre distribuciones de datos diferentes a las que han sido vistas durante el entrenamiento, se incurre en un problema de generalización de dominio. Los métodos para abordar este problema aprenden un modelo utilizando datos de múltiples dominios de origen, y luego aplican este modelo al dominio de destino.  Cuando se entrena una red neuronal con datos provenientes de varios dominios por medio del algoritmo
de gradiente descendente, los gradientes provenientes de cada dominio contienen información específica que es irrelevante para los demás, incluido el dominio de prueba. Nuestra hipótesis es que dicho desacuerdo puede degradar la capacidad de generalización del modelo. En este trabajo [1], caracterizamos los gradientes en conflicto que surgen en escenarios de cambio de dominio y diseñamos nuevas estrategias de acuerdo de gradiente basadas en "cirugía de gradientes" para aliviar su efecto.  Nuestro enfoque es validad experimentalmente en el problema de clasificación de imágenes con tres conjuntos de datos multidominio, proveyendo evidencia empírica sobre las mejoras ofrecidas por
nuestro método.
[1]: Domain Generalization via Gradient Surgery. L Mansilla, R Echeveste, D Milone, E Ferrante.
International Conference on Computer Vision (ICCV 2021). Ver link.

Bio. Enzo estudió Ingeniería de Sistemas en la UNICEN (Tandil, Argentina), realizó el Doctorado en
Informática en la Université Paris-Saclay y el INRIA (París, Francia), fue alumno visitante en la
Universidad de Stanford (California, EEUU) e investigador Fullbright en el Massachussets General
Hospital y la Escuela de Medicina de Harvard (Boston, EEUU), realizó su postdoctorado en el Imperial
College London (Londres, Reino Unido) y a fines de 2017 volvió a la Argentina como investigador
repatriado al sinc(i): Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional
dependiente del CONICET y la Universidad Nacional del Litoral. Allí lidera la línea de investigación en
Machine Learning para el análisis de imágenes biomédicas. Es también docente en la UNL, en la
Universidad Torcuato Di Tella y en la Universidad de San Andrés. En el año 2020 recibió el premio
Estímulo de la Academia Nacional de Ciencias Exactas, Físicas y Naturales, y el premio Ciencia y
Tecnología del Mercosur, por sus contribuciones al área de inteligencia artificial y el análisis de
imágenes biomédicas. Es además miembro de la Academia Joven de Argentina.

Modo de conexión: la charla será presencial y transmitida por ZOOM. Los datos de conexión son:
https://conicet-gov-ar.zoom.us/j/89227430870?pwd=ZjI2a2Uybkl6dllDbktzQWZieTlPdz09

ID de reunión: 892 2743 0870
Código de acceso: ?*?11Xsixy