sliderTecnología

Paredes que hablan: una IA puede revelar cuántas personas hay en una habitación y qué hacen

Gracias a la IA, una pared desnuda puede revelar cuántas personas hay en una habitación y qué hacen

Si usted se detiene a mirar una pared desnuda en una habitación, lo más probable será que no aprenda de ello nada más que el color de la pintura. Ahora, sin embargo, una nueva técnica puede hacer un barrido de esa misma pared en busca de sombras y reflejos imperceptibles para el ojo humano y analizarlos para determinar todo tipo de detalles, como el número de personas que hay en la habitación o cómo se están moviendo. El nuevo dispositivo permitiría espiar lo que ocurre detrás de las esquinas, extrapolar lo que sucede en la habitación a partir de un vistazo parcial, o controlar los movimientos de alguien que se halla fuera del campo de visión de una cámara.

Cuando una persona se mueve en una habitación, su cuerpo bloquea parcialmente la luz de cualquier tipo, lo que genera sutiles e indefinidas penumbras en las paredes. La ropa de colores vivos puede incluso proyectar sobre la pared un tenue brillo reflejado. Sin embargo, esas débiles señales suelen quedar ahogadas por la luz ambiente. “Si pudiésemos hacer algo parecido a sustraer ese término ambiental de lo que quiera que estemos observando, no quedaría otra cosa que el ruido de la cámara… y una señal”, explica Prafull Sharma, estudiante de doctorado del Instituto de Tecnología de Massachusetts (MIT).

Sharma y otros investigadores del MIT aislaron ese término ambiental filmando la pared de una habitación mientras sus ocupantes se movían por ella y tomando promedios temporales de los fotogramas. Ello les permitió eliminar las sombras cambiantes arrojadas por las personas y quedarse solo con la luz de la fuente principal y con las sombras de los muebles y de otros objetos inmóviles. Los investigadores retiraron entonces ese término del vídeo en tiempo real, gracias a lo cual pudieron visualizar las sombras en movimiento proyectadas sobre la pared.

Después, los autores filmaron las paredes desnudas de otras habitaciones donde los investigadores representaron diversas escenas y actividades. De una en una o en parejas, algunas personas se movían fuera del campo de visión de la cámara; otras se agachaban, saltaban o movían los brazos. Luego usaron los vídeos para entrenar un algoritmo de aprendizaje automático y que este aprendiera qué penumbras correspondían a qué comportamientos. El sistema resultante puede analizar en tiempo real el vídeo de una pared desnuda de cualquier habitación y determinar el número de personas que se encuentran en ella y cómo se mueven. El trabajo fue aceptado como presentación oral en el reciente Congreso Internacional de Visión Computarizada.

Aunque el nuevo sistema puede funcionar sin calibrado en cualquier habitación, muestra deficiencias cuando el alumbrado es escaso o cuando hay luces que parpadean, como las de un televisor. Además, solo puede inferir el número de miembros de un grupo y aquellas actividades para las que haya sido previamente entrenado. Y necesita una cámara de alta resolución, ya que las cámaras digitales corrientes crean demasiado ruido de fondo.

Pese a sus limitaciones, el método pone de manifiesto la capacidad del aprendizaje automático y del procesamiento de imágenes para transformar indicios imperceptibles en una vigilancia efectiva. “Es un hallazgo científico fantástico comprobar que una señal tan débil pueda usarse para predecir información”, valora Sharma. “Por supuesto, el ojo humano no puede hacer nada de eso.”

Las paredes desnudas distan de ser el primer objeto de apariencia inocente capaz de revelar secretos. “[Estos métodos] se conocen como “ataques de canal lateral” o “vigilancia de canal lateral”“, explica Bennett Cyphers, tecnólogo de la Fundación Frontera Electrónica, una organización sin ánimo de lucro que promueve los derechos digitales. “Consiste en recurrir a fuentes de información que no se corresponden directamente con lo que estamos buscando —fuentes que no están entre las formas normales de recabar información— para aprender cosas que no parecía posible llegar a saber.”

Los ataques de canal lateral pueden sacar partido de señales extremadamente modestas. El año pasado, un grupo de investigadores se valió de los reflejos de varios objetos brillantes, entre ellos una bolsa de patatas fritas, para reconstruir la imagen de la habitación circundante. Y también los sonidos y otras vibraciones pueden aportar mucha información indirecta. Por ejemplo, el audio de una persona que teclea en un ordenador puede revelar qué palabras está escribiendo. Y hasta un disco duro puede convertirse en un micrófono: en 2019, un equipo desarrolló un programa capaz de analizar la manera en que el sonido ambiental hacía vibrar la cabeza lectora de un disco duro, gracias a lo cual consiguieron grabar las conversaciones que tenían lugar cerca de la máquina.

También se han desarrollado sensores que, colocados en el suelo, detectan las vibraciones de los pasos, son capaces de discernir la identidad de un individuo o incluso de diagnosticar ciertas enfermedades. Muchas de estas técnicas se basan en el aprendizaje automático para detectar patrones que la inteligencia humana no puede percibir. A medida que se generalizan las grabaciones de alta resolución y aumenta la potencia de cómputo, es posible entrenar sistemas con señales muy diversas y extraer de ellas todo tipo de información que normalmente pasamos por alto.

Al menos por ahora, no parece que estos sistemas de vigilancia avanzada quiten el sueño a los defensores de la privacidad. “Este ataque por medio de paredes desnudas y otros ataques de canal lateral muy depurados no deberían preocupar a la gente común”, asegura Riana Pfefferforn, investigadora del Observatorio de Internet de Stanford. “Son trucos muy vistosos de investigadores académicos, pero que están muy lejos de ser operativos para las fuerzas policiales.” Su uso generalizado “queda muy lejos en el futuro, si es que llega a darse alguna vez. E incluso si acabara ocurriendo, la policía seguiría sin poder entrar en nuestra casa e instalar cámaras en las ventanas”. Cyphers está de acuerdo: “Hoy todo el mundo lleva encima un teléfono inteligente, muchísima gente tiene altavoces inteligentes en casa y sus coches están conectados a Internet”, señala. “Las empresas y los Gobiernos no tienen que echar mano de algo como filmar una pared desnuda para conseguir la información que desean”.

Aunque por ahora no es probable que los métodos de canal lateral tengan como objetivo a las personas comunes, puede que sí acaben encontrando algunas aplicaciones. “El Ejército y los servicios de inteligencia siempre han sabido encontrar usos concretos para cualquier tipo de método de vigilancia que caiga en sus manos”, apunta Cyphers.

Sharma coincide en que tales usos son posibles, pero apunta también que podría haber otros más inocuos. Por ejemplo, los vehículos podrían examinar las paredes desnudas como parte de un sistema autónomo de detección de peatones en zonas con poco ángulo de visión, como los aparcamientos. Y varios investigadores en técnicas de canal lateral han señalado que estas podrían usarse para cuidar a personas ancianas y detectar posibles caídas y otros problemas. Sharma añade que su sistema podría detectar caídas, pero solo si previamente ha sido entrenado con ejemplos. “Me niego a caerme en veinte habitaciones distintas para conseguir esos datos”, bromea.

Fuente: investigacionyciencia.es