チェ・ジェジン、キム・ビョンジュ、キム・ソンフ
背景:現存するすべての動物の中で最大かつ最も種の多様性に富むグループである昆虫の「生物樹」は、現存する昆虫の複雑で予測不可能な進化の過程を簡略化した物語を捉える比喩的かつ概念的な樹と考えることができます。現在、最も一般的なアプローチは、各生物を表すために選択された遺伝子/タンパク質のそれぞれについて高度に整列可能な領域のグループを選択することによって、生物樹の代わりとして「遺伝子樹」を構築することです。しかし、このように選択された領域はすべての遺伝子/タンパク質の小さな部分、そして生物の全ゲノムのさらに小さな部分を占めています。過去数十年の間に、多くの現存する昆虫の全ゲノム配列が利用可能になり、情報理論を使用して配列アライメントなし(アライメントフリー法)で昆虫の「全ゲノムまたは全プロテオーム樹」を構築する機会が提供されました。
結果:昆虫の全プロテオームツリーは、(a) 人口統計学的グループ化パターンは遺伝子ツリーのものと類似しているが、グループの分岐順序、したがってグループ間の姉妹関係には顕著な違いがあること、(b) 主要グループの創始者はすべてツリーの根元近くで「爆発的な突発」により出現したことを示しています。
結論:生物の全プロテオーム配列はアミノ酸のアルファベットの「本」とみなすことができるため、情報理論のテキスト分析法を使用して、配列を並べることなく本のツリーを構築できます。このようなツリーは、現存する昆虫の進化と血縁関係の物語を構築する別の視点を提供します。