ヴィマルクマール・B・ヴァゲラ、カルペシュ・H・ヴァンドラ、ナイルシュ・K・モディ
今日、データは関係構造に格納されています。これらのデータをマイニングする通常のアプローチでは、多くの場合、外部キー リンクを使用して複数の関係を結合し、単一の関係を形成します。これはフラット化と呼ばれます。フラット化は、時間の浪費、データの冗長性、データの統計的偏りなどの問題を引き起こす可能性があります。したがって、多数の関係でデータを直接マイニングする方法という重大な問題が発生します。与えられた問題の解決策は、マルチリレーショナル データ マイニング (MRDM) と呼ばれるアプローチです。他の問題は、関係内の無関係または冗長な属性が分類精度に貢献しない可能性があることです。したがって、特徴選択は、マルチリレーショナル データ マイニングにおける重要なデータ前処理ステップです。データ マイニングの関係から無関係または冗長な特徴をフィルター処理することで、分類精度が向上し、優れた時間パフォーマンスが実現され、モデルの理解しやすさが向上します。マルチリレーショナル ナイーブ ベイズ分類器用のエントロピー ベースの特徴選択方法を提案しました。私たちは、InfoDist 法とピアソンの相関パラメータを使用しています。これらは、マルチリレーショナル データベースから無関係で冗長な特徴を除外し、分類の精度を高めるために使用されます。私たちは PKDD 金融データセットでアルゴリズムを分析し、既存の特徴選択方法と比較して優れた精度を達成しました。