顔認識AIの仕組み:embeddingと“似ている度”のはなし
「AIが顔の似ている・似ていないを判定する」と聞くと難しそうですが、 考え方そのものはシンプルです。ここでは専門用語をできるだけ避けて説明します。
顔を“数値の並び”に変換する
現在の顔認識AIは、1枚の顔写真を数百個の数字の並びに変換します。 この数字の並びを embedding(エンベディング/特徴ベクトル) と呼びます。 目の間隔、輪郭、鼻の形といった特徴が、まとめて数値として表現されているとイメージしてください。
“似ている度”は距離で測る
2つの顔が似ているかどうかは、この数値の並び同士がどれくらい近いかで判定します。 近ければ「似ている」、遠ければ「似ていない」。 似ている度をパーセントで表示しているのは、この近さを分かりやすく言い換えたものです。
同じ人なら写真が違っても近くなる
よくできた顔認識AIは、髪型やメイク、撮影場所が違っても、 同じ人物なら近い数値になるように学習されています。 だからこそ、別々の写真からでも「この顔とこの顔は似ている」と判断できるのです。
本サイトでは、こうした顔認識技術をエンタメ(似ている顔さがし)として楽しく使うことを目指しています。