容徐と全秋王
個別化医療とは、適切な薬を適切な患者に適切な量で投与することです。薬物反応に影響を与える可能性のある遺伝子変異を特定する研究である薬理ゲノミクス (PGx) は、個別化医療にとって重要です。遺伝子と薬物反応の関係を研究する計算アプローチは、個別化医療の活発な研究分野として浮上しています。現在、薬物と遺伝子の関係の体系的な研究は限られています。これは、大規模な機械が理解できる薬物と遺伝子の関係の知識ベースを構築し、最新の状態に保つことが難しいためです。科学文献には薬物と遺伝子の関係に関する豊富な情報が含まれているため、PGx 研究および個別化医療の究極の知識源となります。ただし、この情報の大部分は、機械が理解できないフリーテキストに埋もれています。生物医学文献から構造化された薬物と遺伝子の関係を自動的に抽出するアプローチを開発する必要があります。本研究では、MEDLINE から薬物と遺伝子の関係を抽出する半教師ありアプローチを紹介します。この手法では、1 つのシード パターンを使用し、2,000 万件の MEDLINE 抄録で関係が表現される可能性のあるさまざまな方法を反復的に学習します。私たちのアプローチは、MEDLINE から薬物と遺伝子の関係を抽出する際に高い精度 (0.961-1.00) を達成し、大規模な手動でキュレーションされた PGx 知識ベースである PharmGKB では入手できない多くの薬物と遺伝子のペアを発見しました。