概要

顔認識アルゴリズムへの「一般正弦定理」の応用

モスタファ・デラス、ファウジャ・エル・ファリッシ、アブデラティフ・ベン・アブデラ

ヒューマンマシンインタラクションは、ロボット工学の将来にとって最も影響力のある要素の 1 つです。ロボットの入力を改善し、コマンドラインから可能な限り離れてセンサーとコントローラーに変更する必要があるためです。ヒューマンマシンインタラクション (HMI) とは、ユーザーインターフェイスを介した人間と機械間の通信と相互作用を指します。今日では、ジェスチャーなどの自然なユーザーインターフェイスは、人間が自然で直感的な動作を通じて機械を制御できるため、ますます注目を集めています。たとえば、ジェスチャーベースの HMI では、センサーとカメラを使用して人間の姿勢と動きをキャプチャし、人間の顔 (ユーザー) を認識して処理し、機械を制御します。ジェスチャーベースの HMI の主なタスクは、カメラとセンサーによって提供される RGB (赤、緑、青)、深度、スケルトン情報などのデータを使用して、人間の顔の重要な表情と動きを認識することです。多くの顔認識アルゴリズムは、目、眉、鼻、口などの顔の一連の幾何学的特徴を検出する特徴ベースの方法に基づいています。特徴点(特徴点)間の面積、距離、角度などの特性や関係は、顔認識の記述子として機能します。一般的に、顔を堅牢に記述するには、30〜60 個の特徴点を検出する必要があります。幾何学的特徴に基づく顔認識のパフォーマンスは、特徴位置アルゴリズムの精度に依存します。幾何学的定理と公式をより詳しく調べましょう。ただし、最高のパフォーマンスを発揮するポイントの数、重要な特徴、およびそれらを自動的に抽出する方法の問題に対する普遍的な答えはありません。これは、顔の特徴の全体的な幾何学的構成が認識に十分であることを意味します。前述のように、顔認識の問題には多くのアプローチがあります。その 1 つは、顔の特徴のポイントに基づいています。この場合、これらは正面肖像画のデジタル画像です。顔を堅牢に記述するには、30〜60 個のポイントが必要です。一部のポイントの位置は、顔の表情によって異なります。問題は 2 つあります。最も不変のポイントを定義および抽出し、顔認識に最適な幾何学的特徴セットを見つけることです。 10 年前、私たちは Sinus の概念/機能を別の哲学から逆説的に言い換えた定理を開発し、5 年後に「The General Sins」という名前でその定理を発表しました。General Sinus の論文では、結果、コンテキスト、背景について説明しました。Sinus 関数を一般化するにはどうすればよいでしょうか。一般的な sinus は、2 つのパラメーターを持つ Sin (x, y) によって定義されており、長方形でなくても n 角形で使用できます。では、一般的な sinus 関数を n 角形にどのように適用するのでしょうか。n 角形の性質に条件が適用されない、最小限かつ妥当な量のデータを使用して、n 角形のすべての固有の特性を決定するためです。この公式はユークリッド幾何学で最も一般化されていることを証明しました。一般正弦定理に基づいて、顔認識アルゴリズムのパフォーマンスを向上させることができます。一般正弦定理を適用することで、より多くの特徴点を扱い、各点間の距離や角度などのより正確な情報を取得できると同時に、アルゴリズムの処理時間が改善され、より高速になります。

免責事項: この要約は人工知能ツールを使用して翻訳されており、まだレビューまたは確認されていません