ジャン・アルマンゴー、セリーヌ・ブランド、ジョセフ・クリスティ=オレザ、ガイレーヌ・ミオテロ
生物多様性の基本単位である種の定義については、原核生物についてはまだ合意に達していません。現在では、微生物の多様性を評価するためのハイスループット分子ツールが利用可能ですが、環境サンプルには大量の低存在量の種が存在するため、地球上の細菌と古細菌の種の総数を推定することは依然として困難です。1995 年にインフルエンザ菌の全細胞ゲノムが初めて配列決定されて以来、7,000 を超える完全なゲノムが報告されています。ゲノム配列の急増により、多数の分類群の代表例の優れた文書化が行われています。これらのゲノムの注釈付けは新しい遺伝子予測ツールによって精度が向上していますが、プロテオゲノミクスは新しい遺伝子の発見、コーディング ドメイン配列の真の翻訳開始コドンの特定、シグナル ペプチド処理などのタンパク質レベルでの成熟イベントの特徴付けに役立つことが証明されています。この構造注釈付けに加えて、プロテオゲノミクスはタンパク質の機能に関する重要な洞察も生み出します。基本的に、プロテオゲノミクスとは、大型ショットガンプロテオミクス戦略とハイスループットタンデム質量分析法を用いて、大量のタンパク質配列データを取得することです。このような実験データは、ゲノム注釈の改善に使用されます。異なる細菌における遺伝子配列の逆転や、デイノコッカス種における翻訳の非標準開始コドンの使用などの予期しない結果は、これまでに記録された多数の修正のほんの一部にすぎません。今日、生命樹を完全に網羅した特定の代表セットのプロテオゲノミクス分析は、新しい株の正確な注釈のより優れた基盤となります。これにより、比較ゲノミクス研究が改善され、近縁種がどのように異なっているかを評価するのに役立つ可能性があります。