顔認識AIの仕組み：embeddingと“似ている度”のはなし

2026-06-19

「AIが顔の似ている・似ていないを判定する」と聞くと難しそうですが、考え方そのものはシンプルです。ここでは専門用語をできるだけ避けて説明します。

顔を“数値の並び”に変換する

現在の顔認識AIは、1枚の顔写真を数百個の数字の並びに変換します。この数字の並びを embedding（エンベディング／特徴ベクトル） と呼びます。目の間隔、輪郭、鼻の形といった特徴が、まとめて数値として表現されているとイメージしてください。

2つの顔が似ているかどうかは、この数値の並び同士がどれくらい近いかで判定します。近ければ「似ている」、遠ければ「似ていない」。似ている度をパーセントで表示しているのは、この近さを分かりやすく言い換えたものです。

よくできた顔認識AIは、髪型やメイク、撮影場所が違っても、 同じ人物なら近い数値になるように学習されています。だからこそ、別々の写真からでも「この顔とこの顔は似ている」と判断できるのです。

本サイトでは、こうした顔認識技術をエンタメ（似ている顔さがし）として楽しく使うことを目指しています。