フェイ・リー、ルル・カオ、ホイフェン・ウー、ジャンミン・チャオ
酵母ツーハイブリッドアッセイを使用して、幅広い構造クラスに属する 517 種類の天然、合成、環境化学物質のデータセットについて、エストロゲン受容体 (ER) に対するエストロゲン活性 (logREC10 として表される) をテストしました。この研究では、部分最小二乗法 (PLS) とサポートベクターマシン (SVM) の 2 つの方法を使用して、定量的構造活性相関 (QSAR) を決定しました。PLS モデルの Q2 cum は 0.678 であり、高い堅牢性と優れた予測能力を示しています。観測値と予測値の相関係数 (R) は 0.870 であり、最終的な QSAR モデルによる予測値が対応する実験値とよく一致していることを示しています。 PLS モデルには、Mor03p、L3e、R8p、RTv+、R8e、R1p+、R7p+、HATSv の 8 つの DRAGON 記述子が含まれており、これは化学的エストロゲン活性が原子特性 (原子サンダーソン電気陰性度、分極率、ファンデルワールス体積) に関連していることを意味しています。2 つのモデルから得られた結果を比較すると、SVM 法がセット全体で RMS 誤差 0.145 logREC10 単位で、全体的に最も優れたパフォーマンスを示すことがわかりました。さらに、化学構造に基づいていくつかの特定のファミリーに対して 3 つの線形 QSAR モデルが構築されました。これらの予測モデルは、潜在的なエストロゲン性内分泌かく乱化学物質を迅速に特定するのに役立つはずです。