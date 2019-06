Microsoft ha retirado de la web su base de datos de 10 millones imágenes, llamada 'MS Celeb', que se había empleado para desarrollar sistemas de reconocimiento facial de todo el mundo, entre ellos, investigadores militares y empresas chinas

Los 10 millones de imágenes utilizadas en la base de datos se recogieron de Internet sin el conocimiento ni consentimiento de los cerca de 100.000 de individuos que en ellas aparecen, al tratarse de imágenes publicadas bajo la licencia de Creative Commons, que permite usar estas imágenes con fines académicos, según señalan desde Financial Times.

Microsoft retiró la base de datos un par de días después de que este mismo medio desvelase la existencia del banco de imágenes. Otras dos bases de datos de reconocimiento facial también se han retirado desde la publicación de la información: el conjunto de datos de vigilancia Duke MTMC, creado por investigadores de la Universidad de Duke, y un conjunto de datos de la Universidad de Stanford, llamado Brainwash.

Sobre la eliminación de la base de datos, la compañía tecnológica ha comunicado a Financial Times que "el sitio estaba destinado a fines académicos. Fue dirigido por un empleado que ya no está en Microsoft y por eso ha sido eliminado". La base de datos de 'MS Celeb' había sido utilizada por varias organizaciones comerciales como IBM, Panasonic, Alibaba, Nvidia, Hitachi, Sensetime y Megvii, según diversas citaciones en documentos académicos de AI.

El nombre 'celeb' indicaba el uso de identidades de celebridades y personajes públicos, pero según el investigador Adam Harvey, que fue el que descubrió estas bases de datos, "explotaron el término celebridad para incluir a las personas que simplemente trabajan 'online' y tienen una identidad digital".

Muchos de los que estaban incluidos en la base de datos eran críticos con este tipo de prácticas. Es el caso, por ejemplo, de Adam Greenfield, escritor de tecnología y urbanista que fue incluido en el conjunto de datos y quien ha asegurado al medio citado que "no soy de ninguna manera una persona pública, no he cedido mi derecho a la privacidad de ninguna manera".

Expertos en tecnología consultados por Financial Times han expuesto incluso, que Microsoft podría haber violado el Reglamento General de Protección de Datos de la Unión Europea (RGPD) con la distribución del conjunto de datos de 'MS Celeb' después de que las regulaciones entraron en vigor el año pasado.

"Es probable que lo hayan retirado porque sus abogados expresaron su preocupación de que no tienen una base para procesar datos de categorías especiales, como las caras en virtud del Artículo 9 del RGPD", dijo Michael Veale, investigador de políticas de tecnología del Instituto Alan Turing.

En este sentido, Microsoft dijo que no estaba al tanto de ninguna implicación de RGPD y que la razón por la que se había retirado era "porque el desafío de la investigación ha terminado".

Aunque Microsoft ha eliminado la base de datos, todavía está disponible para los investigadores y las empresas que la habían descargado anteriormente. Harvey dijo que aún se está compartiendo en sitios web de código abierto. "No se puede hacer desaparecer un conjunto de datos. Una vez que lo publicas y la gente lo descarga, existe en los discos duros de todo el mundo" añadió el experto.