Wi-Fiを使用して壁の向こうの人間の位置や体勢を認識する方法

Wi-Fi信号を使用して屋内にいる人の位置とポーズを認識する方法が、大学の研究者によって実証されました。これに使用したのは、普通の家庭用ルーターと機械学習です。

古代ギリシャの哲学者、ディオゲネスがランプを灯して、(正直な)男を探したのは有名な話です。この哲学者が頼ったのは、光学的な認識手法だけでした。そして現代の科学者たちは、この目的にWi-Fi信号を使用することを提案しています。具体的に説明しましょう。アメリカ、ペンシルバニア州のカーネギーメロン大学の3人の研究者が開発したのは、普通の家庭用Wi-Fiルーターからの信号を使用して、部屋の中の人の位置を特定するだけでなく、その人のポーズまで識別する方法です。

なぜWi-Fiを使うのでしょうか?これにはいくつか理由があります。第一に、光学認識とは異なり、無線信号は暗闇でも完璧に機能し、家具のような小さな障害物に遮られることもありません。そして第二に、安価であることです。同じようなことはLiDAR(ライダー、光による検出と測距)のようなレーダー技術でもできるかもしれませんが、安価であるとは言えません。第三に、Wi-Fiはどこにでもあります。ちょっと手を伸ばせばすぐに届くところにあります。しかし、この方法はどのくらい正確なのでしょうか?また、その方法でできることは何でしょうか?詳しく見ていきましょう。

DensePose:画像内の人間の体勢を認識する方法

現在の話を始める前に、過去の事例に少し触れておきましょう。まず、一般的に人の体と体勢を正確に認識する方法を理解しておく必要があります。2018年に、別の科学者グループが「DensePose」と呼ばれる手法を発表しました。彼らはこの手法を使用して、写真、つまり奥行きのデータが追加されていない二次元画像に写っている人物のポーズを認識することに成功しました。

仕組みは次の通りです。DensePoseモデルはまず、人間の体として認識されるオブジェクトを画像内で探します。これらのオブジェクトは、それぞれ体の特定の部分に対応する個別の領域に分割され、個別に分析されます。この手法を使用するのは、体の部位の動きが非常に異なるためです。たとえば、頭と胴体は、腕や脚とはまったく異なる動きをします。

DensePoseは、写真に写っている人の体のポーズを正確に認識し、その表面のUVマップを作成することもできる。出典

その結果、このモデルは2D画像と人体の3D表面との関連付けを学習し、認識された体勢に対応する画像注釈だけでなく、写真に描かれた人体のUVマップも取得できるようになりました。後者は、たとえば画像にテクスチャを重ね合わせることを可能にします。

最も印象的なのは、「プロムナイト」の写真のように人々が身を寄せ合って、互いの一部を遮っているような雑然とした集合写真であっても、そこに写っている複数の人物のポーズをこの技術によって正確に認識できることです。

DensePose は、集合写真の中の個々の人物の位置を正確に認識する。出典

さらに、論文で紹介された画像や研究者が公開した動画を信じるのであれば、このシステムは最も変わった体勢であっても確実に対処できます。たとえば、ニューラルネットワークは、自転車、オートバイ、馬に乗っている人を正しく識別し、野球選手、サッカー選手、さらには予測不可能な動きをすることが多いブレイクダンサーの体の動きも正確に判定します。

DensePoseモデルは、珍しい体の動きもうまく処理する出典

DensePoseのもう1つの利点は、その動作に膨大な演算能力を必要としないことです。使用されたグラフィックカードは、GeForce GTX 1080(この研究が発表された時点であっても、最高級とはとうてい言えない性能)です。この条件で、DensePoseは240×320の解像度で毎秒20~26フレーム、800×1100の解像度で毎秒最大5フレームをキャプチャします。

Wi-Fiを使用するDensePose:写真の代わりに電波を使用

基本的に、カーネギーメロン大学の研究者の考えは、既存の高性能身体認識AIモデルであるDensePoseを使用し、写真の代わりにWi-Fi信号を入力するというものです。

実験のために構築した環境は次の通りです。

  • TP-Linkの標準的な家庭用ルーターを設置した2つのスタンド:一方が送信機で、もう一方が受信機です。
  • これらのスタンドの間に配置された認識対象のシーン。
  • 受信ルーターの隣のスタンドに設置されたカメラ。研究者がWi-Fi信号を使用して認識しようとしたのと同じシーンを撮影します。

Wi-Fiを使用して人間の姿勢を認識するためのテストベンチの全体図。出典

次に彼らは、受信ルーターの隣に設置されたカメラを使用して体の位置を特定するDensePoseを実行し、受信ルーターからのWi-Fi信号を使用して動作する別のニューラルネットワークをトレーニングするタスクを与えました。この信号は、より信頼性が高い認識のために前処理と修正が施されていますが、これは些細なことです。重要なのは、Wi-Fi信号を使用して人体の空間位置を正確に再構成する、Wi-Fiを使用する新しいDensePoseモデルを作成できたという事実です。

良好な条件下では、このモデルによる人間のポーズ認識は非常に優秀。出典

この方法の限界

しかし、「科学者により、Wi-Fiを使用して壁越しに物体を見ることが可能になる」のような見出しを急いで書くのは、まだ時期尚早なのでやめておいた方がよいでしょう。まず、ここでの「見る」という言葉はかなり抽象的です。モデルは実際に人の体を「見る」わけではありません。間接的なデータに基づいて、一定の確率で体の位置と体勢を予測することができるというだけです。

Wi-Fi信号を使用して複雑な詳細を視覚化するのは難題です。このことは、別の同様の研究でも実証されています。人の体よりもはるかに単純な物体での実験だったのですが、控えめに言っても、理想の結果とはほど遠いものでした。

Wi-Fi信号を使用した物体の視覚化:端部が不明瞭であればあるほど、成功しにくい。出典

また、カーネギーメロン大学の研究者が構築したモデルは、写真の体勢を認識する本来の方法よりもかなり精度が低く、かなり重度の「幻覚」を示すことにも注意が必要です。このモデルが結果を出すのに特に苦労するのは、珍しいポーズや2人以上の人物が登場するシーンです。

Wi-Fiを使用するDensePoseモデルは、標準的でないポーズや、1つのシーン内の多数の人の体の処理には適していません。出典

加えて、この研究のテスト条件は細心の注意を払って管理されていました。シンプルで明確に定義された形状、送信機と受信機の間の見通しの良さ、電波の干渉の少なさなどのあらゆる条件を整えた結果、電波でシーンを簡単に「透過」することができたのです。こんな理想的なシナリオが、現実世界で再現される可能性はまずないでしょう。

ですから、誰かがWi-Fiルーターにハッキングし、自宅での行動を監視するのではないかと心配している人がいるなら、安心してください。家庭内で心配すべきことがあるとすれば、それはスマート家電です。たとえば、カメラ、マイク、クラウド接続の機能は今や、ペットの自動給餌機子どものおもちゃにさえ実装されていますし、ロボット掃除機には暗闇でも難なく動作するLiDARの機能や、家中を隅から隅まで動き回る機能まで備わっています。

そして家の外でも、別の「スパイ」があなたを待ち構えています。四輪の「スパイ」です。収集する情報量という点では、最新型の自動車が収集する個人データの量は、スマートウォッチ、スマートスピーカー、その他の日常的なガジェットをはるかに超えています。

ヒント