A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea

タイトルなど

  • A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea
  • Dongying Wu et al., Nature (2009)

僕とこの論文の関係

  • 読込度:あっさり(5 段階中 2 番目に低い)
  • 専門性:そこそこある気がする(5 段階中 4 番目に低い)

研究の背景

  • 1000 種近くの原核生物ゲノムが解読されているが,単離培養可能な原核生物の全ての taxonomic space に対して,ゲノム解読済みの生物種はとても偏りがある(と著者らは主張している)。
  • Genomic Encyclopedia of Bacteria and Archaea (GEBA) プロジェクトは,原核生物の全 taxonomic space をできるだけ網羅できるように,生物種の系統関係を考慮しながら解読するゲノムを選び,シークエンシング,アセンブリアノテーションを行うことを目指している。
    • 200 生物種が選ばれ,そのうち 159 種に高い優先度を与えている。
    • 論文執筆時までに 106 種についてはアノテーション付けまで完了しており,Integrated Microbial Genomes (IMG) database portal および GenBank からデータを取得することが可能になっている。
    • 一分子シークエンシングの技術が確立されてきたら,単離培養不可能な生物種もゲノム解読の対象とする,という意思表明が,論文中でされていた。

研究内容

  • 論文のメッセージはシンプルで,"ゲノム解読する生物種をランダムに選ぶことに比べて,できるだけ系統的に離れた生物種を選ぶことで,新たなタンパク質ファミリーをより効率的に発見することができる" ということに尽きる。
    • 新たな生物種をゲノム解読することで,どの程度の個数新たなタンパク質ファミリーを発見することができるかを,ランダムに選んだ場合と GEBA プロジェクトの基準で選んだ場合で比較している。
    • 同じ生物種数のゲノム解読した場合,系統的に離れている生物種を選んだ方が新たなタンパク質ファミリーをより多く発見することができる,という結果が得られた。(ある程度自明だとは思うが。)

感想

  • 大規模なプロジェクトが戦略的に原核生物のゲノム解読を進めてゆくことについて,科学的意義は大きいと感じた。
    • どの生物種のゲノムを読むかは,大規模プロジェクトと個別研究で棲み分けされてゆくのではないだろうか。
    • 近い未来,原核生物だけでなく,菌類界や原生生物ゲノムも,同様に戦略的かつ網羅的に解読されることになるかもしれない。
  • しかし,ゲノム解読を行う生物種をどのように選ぶかについては,ad hoc な部分が残っているように感じた。
    • 論文中で示唆されている生物種選択の目的関数は,i) 生物多様性,ii) タンパク質ファミリーを発見する効率,であった。
    • これらの目的関数を最大化することが,最適な生物種の選択方法には求められる。
    • GEBA プロジェクトでは,small subunit (SSU) リボソーマル RNA に基づく系統樹を描き,その系統樹から生物種を選んでいるが,その選ぶためのアルゴリズムが最適であるかどうか,という検証は行われていない。

気になった引用論文

  • The integrated microbial genomes (IMG) system in 2007: data content and analysis tool extensions. NAR (2008)
    • 論文によると,アノテーション作業(遺伝子同定,機能予測,など)をこの IMG のシステムでできるようだ。
    • 今度ゲノム解読プロジェクトに加わるときには,試しに使ってみても良いかもしれない。
  • A simple, fast, and accurate method of phylogenomic inference. Genome Biol. (2008)
    • phylogenomics アプローチで系統樹を推定するときに,どのタンパク質の配列を用いれば良いか,についての論文。

論文を読んで今後必要だと思った研究

  • 全 taxonomic space を網羅するようにゲノム解読が進んだとして,それらのゲノムデータからどのような生物学的な知見を抽出するかについて,必ずしも明確な答えが比較ゲノム分野内にあるとは思えない。この課題について,複数の cutting-edge な視点が望まれているように感じている。
  • ゲノム解読を行う生物種を選択するアルゴリズムについて,ad hoc なやり方ではなく,最適性を保証できる手法を開発することは,bioinformatician の役割だと思う。