ジャグディッシュ G
クラスタリングとは、母集団またはデータ ポイントをさまざまなグループに分割するタスクです。同じグループ内のデータ ポイントは、他のグループ内のデータ ポイントよりも、同じグループ内の他のデータ ポイントに似ています。簡単に言えば、類似した特性を持つグループを分離し、それらをクラスターに割り当てることが目的です。これは、探索的データ処理の重要なタスクであり、パターン認識、画像分析、情報検索、バイオインフォマティクス、データ圧縮、特殊効果、機械学習など、多くの分野で利用されている統計データ分析の標準技術です。