スデシュナ・グハ・ネオギ、マリア・クレスチャニノワ、ミーシャ・カプシェスキー、イブラヒム・エマーム、アルヴィス・ブラズマ、ウギス・サルカンス
生物サンプル中の生体分子実体(転写産物、タンパク質、代謝産物など)の特性を高スループットで測定するさまざまな「オミクス」技術の範囲は拡大し続けています。このような実験の結果を統合的に調査できる情報システムが必要です。私たちは、分子生物学のさまざまな実験手法の結果を検索して視覚化するための統一されたフレームワークを提供するシステム、MoDa(分子データ ウェアハウス)を開発しました。ウェアハウス アーキテクチャは、サンプル、実験結果、遺伝子やその他の分子実体の特性のさまざまなタイプのフィルタリングとクエリの注釈に最適化されています。実装は BioMart テクノロジに基づいており、多次元データを操作するための手段が強化されています。ユーザー インターフェイスは Web ベースのアプリケーションです。すべてのデータ ウェアハウス プロジェクトで重要な考慮事項は、データの取得とクリーニングです。ウェアハウスにアップロードされたデータが一貫性があり、さらに統計分析を行うのに十分な注釈が付けられていることを保証するために、サンプルと研究対象データ、実験メタデータ、実験結果のリポジトリを実装しました。遺伝子再注釈パイプラインは、バイオエンティティ(「遺伝子」)次元に沿って収集されたデータに対する統一された参照システムを提供するために使用されました。開発されたデータウェアハウスインフラストラクチャは、高スループットの分子生物学技術を採用した共同プロジェクトに役立つと期待しています。