デビッド・K・クロケット、スティーブン・R・ピッコロ、スコット・P・ナラス、ジョイス・A・ミッチェル、ジュリオ・C・ファセリ
RET がん遺伝子の変異の多くは遺伝性甲状腺がんと直接関連していると報告されていますが、その他の変異は臨床表現型と明確に関連していないため、不確実な遺伝子変異体として分類されています。変異の重症度を判定するプロセスはコストがかかり、時間がかかります。情報科学のツールと方法は、この遺伝子型と表現型のギャップを埋めるのに役立つ可能性があります。この目標に向けて、野生型に存在する残基と変異配列に存在する残基の物理化学的特性の値の違いによって特徴付けられる良性と病原性の RET 遺伝子変異体を区別する機械学習分類アルゴリズムの能力が評価されました。ルール、ベイズ、回帰、最近傍法、サポートベクターマシン、ツリーなど、機械学習分類手法のさまざまなカテゴリから代表的なアルゴリズムが選択されました。次に、機械学習モデルを、変異の重症度予測に使用される確立された手法と比較しました。機械学習分類を使用すると、一次配列情報のみを使用して RET 変異の状態を正確に予測できます。配列相同性(オーソログ保存)またはタンパク質構造データに基づく既存のアルゴリズムは必ずしも優れているわけではありません。