Lubke GH、Laurin C、Walters R、Eriksson N、Hysi P、Spector TD、Montgomery GW、Martin NG、Medland SE、Boomsma DI
通常、ゲノムワイド関連研究では、加法的遺伝子モデルを使用して、各 SNP の表現型を個別に回帰します。劣性、優性、SNP-SNP、または SNP-環境相互作用の統計モデルは存在しますが、テストの負担により、ゲノムワイドデータに対してすべての可能性のある効果を評価することは非現実的です。私たちは、最初のステップがさまざまな種類の SNP の主効果と相互作用効果に敏感なフィルターで構成される 2 段階アプローチを提唱しています。目的は、SNP の数を大幅に削減して、2 番目のステップでより具体的なモデリングが可能になることです。フィルターとして使用できる「勾配ブースティング マシン」(GBM) と呼ばれる統計学習方法の評価を提供します。GBM では、遺伝子モデルの事前指定は必要なく、多数の共変量を含めることができます。したがって、GBM は、GWAS で使用されるパラメトリック フレームワーク内では実現できない複数の GxE 相互作用を調査するために使用できます。シミュレーションでは、GBM は GWAS で一般的に使用される標準的な加法回帰モデルに有利な条件下でも良好なパフォーマンスを発揮し、相互作用する変数の 1 つに主効果がゼロの場合でも相互作用効果の検出に敏感であることを示しています。後者は GWAS では検出されません。評価には、毛髪形態に関する実証データの分析が伴います。最高ランクの SNP の数の増加によって説明される表現型の分散を推定し、2 段階アプローチの最初のステップで 10K-20K SNP を選択すれば十分であることを示します。