アフマド マレキ*、ヴァヒド ヴァジニア、アイダ フェクリ
プロモーターは、遺伝子の前にある DNA 配列の一部であり、遺伝子の調節因子として重要です。プロモーター予測は、遺伝子の位置を決定し、遺伝子発現を分析するのに役立ちます。したがって、バイオインフォマティクスの分野では非常に重要です。バイオインフォマティクスの研究では、生物学的データベースから新しい意味のある知識を発見するために、いくつかの機械学習アプローチが適用されます。この研究では、期待最大化クラスタリングとサポートベクターマシン分類器 (EMSVM) の 2 つの学習アプローチを使用して、プロモーター検出を実行します。期待最大化 (EM) アルゴリズムは、最初の段階でプロモーターと非プロモーターのアクティビティなど、類似および類似しない動作をするサンプルのグループを識別するために使用され、サポートベクターマシン (SVM) は、2 番目の段階ですべてのデータを正しいクラスカテゴリに分類するために使用されます。この方法を σ24、σ32、σ38、σ70 プロモーターに対応するデータセットに適用し、さまざまなプロモーター領域でその有効性を実証しました。さらに、提案されたアルゴリズムの適切なパフォーマンスを示すために、他の分類アルゴリズムと比較されました。テスト結果では、EMSVM が他の方法よりも優れたパフォーマンスを発揮することが示されています。