アブドゥルラハマン・A・ムーサ、ウスマン・マラミ・アリユ
国際がん研究機関によると、2018年に新たに診断された症例数(約210万人)で見ると、女性の乳がんは世界で最も多いがん種でした。
病気の結果を予測することは困難な作業です。データ マイニング技術は、予測セグメントを簡素化する傾向があります。自動化ツールにより、大量の医療データを収集することが可能になり、医療研究グループが利用できるようになりました。この研究の目的は、決定 3 分類器と記述統計を使用した機械学習アルゴリズムを適用し、後期に発症した患者の癌転移の可能性を予測するモデルの性能を評価することです。
材料と方法:乳がん疾患データセットは、ナイジェリアのソコト州にあるウスマヌ・ダンフォディヨ大学教育病院の放射線治療および腫瘍科から取得されました。データセットには、259 のインスタンスと 10 の属性があります。この研究の実験結果では、IMB SPSS (バージョン 23) ソフトウェア環境の決定 3 分類器を使用しました。実験では、2 つのクラスが使用されたため、2 × 2 混同行列が適用されました。クラス 0 = 転移なし、クラス 1 = 転移あり。データセットを 2 つのクラスに分割し、10 分割交差検証を使用してトレーニングとテストを行う教師あり機械学習アプローチを適用しました。
結果:乳がんの症例 259 件のうち、218 件 (84.2%) は転移しておらず、41 件 (15.8%) は体の他の部位に転移していた。モデルの全体的な精度は 87%、感度は 88%、特異度は 75%、精度は 98% であった。
結論:これらの結果に基づいて、決定 3 分類器を使用した機械学習アルゴリズムは、腫瘍の 87% がステージ IV であると予測し、腫瘍が体の他の領域に広がる可能性があることを示しました。