Aquellos que trabajamos en el sector de la ciberseguridad estamos acostumbrados a oír hablar de amenazas y medidas de defensa, pero casi siempre referidas a un entorno virtual. Sin embargo, existen otras dimensiones, como la seguridad física, que pueden afectarnos de diversas maneras.
Esta serie ha sido inspirada por la ponencia de Adam Harvey del Chaos Communication Congress de 2016: “Retail Surveillance / Retail Countersurveillance”. En ella abordaré algunos conceptos concernientes a sistemas de vigilancia y medidas de contra-vigilancia que pueden ser usadas para evitar el reconocimiento por parte de terceros.
Este primer artículo se centra en el reconocimiento facial, algunas de sus aplicaciones más controvertidas a día de hoy y sus implicaciones.
Figura 1: Anónimo. Imagen tomada de: http://luisjimenez.com/wp-content/uploads/2016/05/faception.jpg [Accedido el 15/05/2017]
La escritora Susan Sontag dijo una vez que fotografiar a alguien convierte a esa persona en objeto que puede ser poseído simbólicamente. Una vez obtenido, este objeto (la imagen) puede ser analizado para extraer información.
Los primeros estudios en busca de una máquina de reconocimiento facial datan de los años 60. No se realizaron grandes avances hasta los 90, cuando el DoD (Department of Defense) de los Estados Unidos inició el proyecto Feret, orientado a la adquisición, análisis e identificación de rasgos faciales, llegándose a recolectar una base de datos de unas 8.000 imágenes.
En comparación, FindFace dispone actualmente de una base de datos de medio millón de usuarios de Vkontakte (el Facebook ruso) que pueden ser identificados subiendo una fotografía a la aplicación.
La tecnología que permitió este salto cualitativo con la llegada del nuevo siglo fue el algoritmo Viola-Jones. Introducido en 2001, resulta eficiente, de buena precisión, exige poco hardware, es económico y permite su uso en sistemas ligeros.
Desde 2008 la combinación del algoritmo Viola-Jones y Open CV (una biblioteca de visión artificial) posibilita el uso de cámaras para la extracción de información de las imágenes, reduciendo en gran medida la intervención humana en el proceso.
Para disponer de un orden de magnitud de la cantidad de información que puede contener una imagen:
- Un recuadro de 1×1 píxel permite 256 combinaciones de color distintas.
- Una imagen de 7×6 píxeles ya contiene suficiente información para realizar un reconocimiento facial con una fiabilidad del 95% empleando el conjunto de datos faciales de AT&T.
- Una región de 12×16 píxeles permite el reconocimiento de acciones entrenando una red neural para interpretar la información extraída.
- Open CV emplea un formato de 20×20 píxeles (256^400 combinaciones posibles), conteniendo mucha más información que los casos anteriormente expuestos.
- 100×100 píxeles (((100*100)^256)^3 combinaciones posibles) es un 2.5% de una foto de Instagram. Esto da un viso de la cantidad de información que puede contener una imagen subida a una red social. Es por ello, que cada imagen de una cara subida a redes sociales como Instagram y Facebook es analizada y se extrae conocimiento tanto de la imagen como de sus metadatos asociados.
- A su vez, analizando una región de 100×100 píxeles de la frente de una persona capturada en vídeo es posible averiguar su pulso.
Figura 2: Richard McPherson, Reza Shokri, Vitaly Shmatikov, Región de 6×7 píxeles empleada para reconocimiento facial usando el conjunto de datos faciales de AT&T, ElDiario.es. Defeating Image Obfuscation with Deep Learning. Imagen tomada de: http://images.eldiario.es/fotos/informacion-suficiente-reconocimiento-facial_EDIIMA20170109_0587_19.jpg [Accedido el 15/02/2017]
La cuestión de la magnitud del volumen de información contenido en una imagen permite técnicas como la esteganografía, que permite ocultar información dentro de una imagen.
En cuanto a la información que se puede extraer de la cara de una persona, existen diversos estudios recientes que afirman que es posible la detección de criminales mediante el estudio de los rasgos faciales: “Automatic Inference on Criminality using Face Images” conducido por Xiaolin Wu y Xi Zhang de la Shanghai Jiao Tong University.
Los investigadores afirman que “encuentran algunas características estructurales discriminantes para la predicción de la criminalidad, como la curvatura labial, la distancia entre los rabillos internos del ojo y el llamado ángulo nariz-boca. Sobre todo, el descubrimiento más importante de esta investigación es que las imágenes de caras de criminales y no criminales forman dos variedades muy diferenciadas”.
Existen gran cantidad de estudios como este en que mediante el uso de tecnologías como redes neuronales, se analizan imágenes de rostros humanos en busca de dar respuesta a diversas cuestiones como por ejemplo si una persona tiene dotes de liderazgo en función del ancho de su boca. En este ámbito existe una empresa que ya está haciéndose un nombre por las características de sus servicios: Faception.
El CEO de la compañía israelí (Shai Gilboa) afirma que hay rasgos faciales codificados en el ADN y esto les permite identificar automáticamente la personalidad, empleo, cociente intelectual e incluso inclinaciones criminales de cualquiera en tiempo real, afirmando tener un ratio de acierto de entre el 85 y el 95%.
Sus clientes esperan emplear esta tecnología para aplicaciones de seguridad, tratando de identificar individuos que pudieran ser criminales, pedófilos, terroristas, etc.
La empresa suscita polémicas y preocupación por el posible arresto indiscriminado de personas inocentes. Sin embargo, el jefe de perfilado de la compañía (David Gavriel), sostiene que Faception es solamente una herramienta de apoyo que proporciona recomendaciones, identificando las amenazas en términos potenciales y que las decisiones últimas quedan en manos de los clientes.
Figura 3: Anónimo, Clasificadores de personalidad utilizados por Faception, Faception. Imagen tomada de: http://www.faception.com/our-technology [Accedido el 15/02/2017]
Estas afirmaciones invitan a la reflexión dado que el concepto base no es nuevo. En el siglo XIX la teoría pseudocientífica de la frenología gozó de gran difusión, sosteniendo la posibilidad de la determinación del carácter y los rasgos de la personalidad, así como las tendencias criminales, basándose en la forma del cráneo.
Gran cantidad de disciplinas pseudocientíficas similares tuvieron su momento en el pasado: personología, fisiognómica, metoposcopia, quiromancia… Todas ellas desterradas de la ciencia al basarse erróneamente en el determinismo biológico para afirmar que el destino de una persona está predeterminado.
Figura 4: Anónimo, Diagrama de las áreas del cráneo en función de con que atributo se relacionan. Imagen tomada de: http://omicrono.elespanol.com/wp-content/uploads/2016/01/PhrenologyPix.jpg [Accedido el 15/02/2017]
En los próximos años se espera la introducción de 50000 millones de dispositivos a internet, entre los que se encuentran productos como el Netatmo Welcome, una cámara IoT con reconocimiento facial que permite la identificación de individuos y la visualización de vídeo en streaming a través de internet mediante el uso de su aplicación móvil.
El resurgimiento de ideas fundamentadas en el perfilado psicológico de las personas basado en los atributos puramente biológicos, junto con la creación de un entorno en que puede haber gran cantidad de dispositivos con capacidades de reconocimiento facial, incrementa los riesgos que ya se prevén para el futuro ecosistema IoT que se está gestando actualmente, así como las amenazas a la privacidad de los individuos.
Las nuevas tecnologías nos permiten dar solución a gran cantidad de problemas, pero sobre todo nos permiten dar respuesta a gran cantidad de preguntas. Las máquinas no discriminan, ni son prejuiciosas, sencillamente hacen aquello para lo que son programadas. Es por ello que para poder hacer un uso adecuado y responsable de las tecnologías emergentes no sólo es necesario saber realizar las preguntas adecuadas, sino también interpretar correctamente las respuestas que nos proporcionan, siendo esta una tarea que todavía recae sobre los humanos que forman parte del ciclo.