Como encontrar uma pessoa e reconhecer sua pose usando Wi-Fi

Os pesquisadores aprenderam a reconhecer as posições e poses de pessoas dentro de casa com o uso dos sinais de Wi-Fi. Para fazer isso, eles usaram roteadores domésticos comuns e machine learning.

Para encontrar um homem (honesto), Diógenes usou uma lanterna, ou seja, o filósofo confiou apenas nos métodos de reconhecimento ótico. Hoje, no entanto, os cientistas sugerem o uso de sinais da rede Wi-Fi para fazer isso. Mais especificamente, o método desenvolvido por três pesquisadores da universidade Carnegie Mellon usa o sinal de um roteador Wi-Fi doméstico comum não apenas para identificar a localização de uma pessoa em um cômodo, mas também para identificar sua pose.

Por que os sinais de Wi-Fi? Existem vários motivos para isso. Em primeiro lugar, ao contrário do reconhecimento ótico, os sinais de rádio funcionam perfeitamente no escuro e não são impedidos por pequenos obstáculos, como móveis. Em segundo lugar, eles são baratos, diferentemente dos sistemas lidar e radares, outras ferramentas que poderiam fazer o trabalho. Em terceiro lugar, os sinais de Wi-Fi já são onipresentes, eles estão em todos os lugares. Mas até que ponto esse método é eficaz? E o que é possível fazer com isso? Vamos entender tudo isso agora.

DensePose: um método para reconhecer poses humanas em imagens

Para começar, no entanto, precisamos voltar um pouco. Primeiro, precisamos entender como reconhecer com precisão o corpo humano e suas poses em geral. Em 2018, outro grupo de cientistas apresentou um método chamado DensePose. Eles usaram o método com sucesso para reconhecer poses humanas em fotografias, ou seja, imagens bidimensionais sem dados adicionais para profundidade.

É assim que funciona: primeiro, o modelo DensePose procura os objetos nas imagens reconhecidos como corpos humanos. Então, esses objetos são segmentados em áreas distintas, sendo que cada uma delas corresponde a uma parte específica do corpo para ser analisada individualmente. Essa abordagem é usada porque as partes do corpo se movimentam de maneiras muito diferentes: por exemplo, a cabeça e o tronco se comportam de maneiras muito diferentes em relação aos braços e pernas.

DensePose: um método para reconhecer poses humanas em fotografias

O DensePose pode reconhecer com precisão as poses de corpos humanos em fotografias e até criar mapas UV de suas superfícies. Fonte

Assim, o modelo aprendeu a correlacionar uma imagem 2D com a superfície 3D do corpo humano para obter não apenas as anotações de imagem correspondentes à pose reconhecida, mas também um mapa UV do corpo representado na foto. Esse último permite, por exemplo, sobrepor uma textura na imagem.

O mais impressionante é que essa técnica pode reconhecer com precisão as poses de várias pessoas agrupadas nas fotos, mesmo aquelas fotos caóticas da “noite do baile” onde as pessoas ficam amontoadas e parcialmente em frente umas das outras.

DensePose: exemplos de reconhecimento de pose em fotografias

O DensePose reconhece com precisão as posições de figuras individuais de pessoas agrupadas nas fotos. Fonte

Além disso, se as imagens apresentadas no artigo e nos vídeos publicados pelos pesquisadores forem verídicas, o sistema poderá até lidar com credibilidade com as posições corporais mais incomuns. Por exemplo, a rede neural identifica corretamente pessoas em bicicletas, motocicletas e a cavalo. Ela também determina com precisão as poses de jogadores de beisebol, jogadores de futebol e dançarinos de break que geralmente fazem movimentos imprevisíveis.

DensePose: exemplos de reconhecimento de pose em fotografias

O modelo DensePose funciona bem mesmo para poses muito incomuns. Fonte

Outra vantagem do DensePose é que ele não exige poder computacional extraordinário para funcionar. Com uma GeForce GTX 1080, dificilmente uma placa de vídeo topo de linha, mesmo na época em que o estudo foi publicado, o DensePose captura 20-26 quadros por segundo em uma resolução de 240×320, e até cinco quadros por segundo em uma resolução de 800×1100.

DensePose por Wi-Fi: ondas de rádio em vez de fotos

Basicamente, a ideia dos pesquisadores da Carnegie Mellon era usar o modelo de IA de reconhecimento corporal de alto desempenho existente, o DensePose, mas alimentá-lo com sinais de Wi-Fi em vez de fotografias.

Para o experimento, eles construíram a seguinte configuração:

  • Dois suportes com roteadores domésticos TP-Link padrão, cada um equipado com três antenas: uma funcionando como transmissora e a outra como receptora.
  • A cena de reconhecimento foi posicionada entre esses pontos.
  • Uma câmera montada em um suporte, ao lado do roteador receptor, para capturar a mesma cena que os pesquisadores pretendiam reconhecer com o uso dos sinais de Wi-Fi.
DensePose por Wi-Fi: princípios gerais do método

Diagrama geral da bancada de teste para reconhecer poses humanas com o uso dos sinais de Wi-Fi. Fonte

Em seguida, o DensePose foi executado para identificar as posições corporais com o uso da câmera instalada ao lado do roteador receptor, depois ele passou a treinar outra rede neural que funcionava com os sinais de Wi-Fi do roteador receptor. Esse sinal foi pré-processado e modificado para que fosse feito um reconhecimento mais confiável, mas esses detalhes são irrelevantes. O ponto é que os pesquisadores foram realmente capazes de criar um novo modelo DensePose para Wi-Fi que reconstrói com precisão as posições espaciais dos corpos humanos com o uso dos sinais de Wi-Fi.

DensePose por Wi-Fi: cenas reconhecidas com êxito

Em boas condições, o modelo pode reconhecer poses humanas muito bem. Fonte

Limitações do método

Porém, escrever e publicar uma notícia do tipo “Cientistas conseguem enxergar através das paredes com o uso dos sinais de Wi-Fi” talvez seja uma atitude precipitada. Em primeiro lugar, “enxergar” aqui é algo bastante abstrato. O modelo não “enxerga” realmente o corpo humano, mas pode prever sua localização e pose com uma certa probabilidade de acordo com dados indiretos.

Visualizar qualquer coisa com detalhes complexos com o uso dos sinais de Wi-Fi é um desafio complexo. Esses aspectos são demonstrados em outro estudo semelhante no qual os pesquisadores experimentaram objetos muito mais simples do que corpos humanos, e os resultados foram, para dizer o mínimo, longe do ideal.

Visualização de objetos com o uso dos sinais de Wi-Fi

Visualização de objetos com o uso dos sinais de Wi-Fi: quanto menos pronunciadas as bordas, pior fica. Fonte

Além disso, é importante observar que o modelo construído pelos pesquisadores da universidade Carnegie Mellon é significativamente menos preciso do que o método original de reconhecimento de poses em fotografias, além de exibir “alucinações” bastante sérias. Em particular, o modelo tem dificuldade para lidar com poses ou cenas incomuns envolvendo mais de duas pessoas.

DensePose por Wi-Fi: falhas de reconhecimento

O modelo DensePose para Wi-Fi não faz um bom trabalho quando precisa lidar com poses fora do padrão ou com muitos corpos humanos em uma única cena. Fonte

Além disso, as condições de teste no estudo foram meticulosamente controladas: uma geometria simples e bem definida, uma linha de visão clara entre o transmissor e o receptor e a interferência mínima do sinal de rádio. Os pesquisadores configuraram tudo isso para que pudessem “penetrar” facilmente na cena com as ondas de rádio. É improvável que esse cenário ideal seja replicado no mundo real.

Portanto, não faz sentido ficar preocupado diante da possibilidade de alguém invadir seu roteador Wi-Fi para monitorar o que alguém faz dentro de casa. Se há algo com que se preocupar dentro de casa, são os eletrodomésticos. Por exemplo, alimentadores inteligentes para animais de estimação ou até mesmo brinquedos para crianças têm câmeras, microfones e conectividade na nuvem. Além disso, os aspiradores de pó robô têm até sensores LiDAR que funcionam perfeitamente no escuro e têm a capacidade de se movimentar.

E do lado de fora, existe um outro espião que está esperando por você, aquele de quatro rodas. Em termos de quantidade de informações coletadas, os carros contemporâneos estão muito à frente dos relógios inteligentes, alto-falantes inteligentes e outros dispositivos cotidianos.

Dicas