A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea
タイトルなど
- A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea
- Dongying Wu et al., Nature (2009)
僕とこの論文の関係
- 読込度:あっさり(5 段階中 2 番目に低い)
- 専門性:そこそこある気がする(5 段階中 4 番目に低い)
研究の背景
- 1000 種近くの原核生物ゲノムが解読されているが,単離培養可能な原核生物の全ての taxonomic space に対して,ゲノム解読済みの生物種はとても偏りがある(と著者らは主張している)。
- Genomic Encyclopedia of Bacteria and Archaea (GEBA) プロジェクトは,原核生物の全 taxonomic space をできるだけ網羅できるように,生物種の系統関係を考慮しながら解読するゲノムを選び,シークエンシング,アセンブリ,アノテーションを行うことを目指している。
研究内容
- 論文のメッセージはシンプルで,"ゲノム解読する生物種をランダムに選ぶことに比べて,できるだけ系統的に離れた生物種を選ぶことで,新たなタンパク質ファミリーをより効率的に発見することができる" ということに尽きる。
- 新たな生物種をゲノム解読することで,どの程度の個数新たなタンパク質ファミリーを発見することができるかを,ランダムに選んだ場合と GEBA プロジェクトの基準で選んだ場合で比較している。
- 同じ生物種数のゲノム解読した場合,系統的に離れている生物種を選んだ方が新たなタンパク質ファミリーをより多く発見することができる,という結果が得られた。(ある程度自明だとは思うが。)
感想
- 大規模なプロジェクトが戦略的に原核生物のゲノム解読を進めてゆくことについて,科学的意義は大きいと感じた。
- どの生物種のゲノムを読むかは,大規模プロジェクトと個別研究で棲み分けされてゆくのではないだろうか。
- 近い未来,原核生物だけでなく,菌類界や原生生物ゲノムも,同様に戦略的かつ網羅的に解読されることになるかもしれない。
- しかし,ゲノム解読を行う生物種をどのように選ぶかについては,ad hoc な部分が残っているように感じた。
気になった引用論文
- The integrated microbial genomes (IMG) system in 2007: data content and analysis tool extensions. NAR (2008)
- 論文によると,アノテーション作業(遺伝子同定,機能予測,など)をこの IMG のシステムでできるようだ。
- 今度ゲノム解読プロジェクトに加わるときには,試しに使ってみても良いかもしれない。
- A simple, fast, and accurate method of phylogenomic inference. Genome Biol. (2008)
- phylogenomics アプローチで系統樹を推定するときに,どのタンパク質の配列を用いれば良いか,についての論文。
論文を読んで今後必要だと思った研究