Xiaoli Jiao、Xin Zheng、Liang Ma、Geetha Kutty、Emile Gogineni
新たに登場した第 3 世代 DNA シーケンシング プラットフォームである PacBio RS は、第 1 世代および第 2 世代のシーケンシング テクノロジーで生成される短いリードとは対照的に、非常に長いリード (最大 20 kb) を生成できるリアルタイムの単一分子ナノ ニッチ シーケンシング テクノロジーに基づいています。新しいプラットフォームとして、PacBio シーケンス データに関連するシーケンス エラー率と品質管理 (QC) パラメーターを評価することが重要です。この研究では、PacBio RS シーケンシング プラットフォームを使用して、既知の密接に関連する 10 個の DNA アンプリコンの混合物をシーケンスしました。上記のシーケンス実験から得られた Circular Consensus Sequence (CCS) リードを既知の参照シーケンスにアラインメントした後、リード QC なしではエラー率の中央値は 2.5% でしたが、SVM ベースのマルチパラメーター QC 方法では 1.3% に改善されました。さらに、De Novo アセンブリは、さまざまな QC アプローチの効果を評価するためのダウンストリーム アプリケーションとして使用されました。このベンチマーク スタディは、CCS 読み取りが後からエラー訂正されていても、ダウンストリーム バイオインフォマティクス分析の結果を成功させるには、CCS 読み取りに対して適切な QC を実行する必要があることを示しています。