Transcriptome genetics using second generation sequencing in a Caucasian population

タイトルなど

  • Transcriptome genetics using second generation sequencing in a Caucasian population
  • Stephen B. Montgomery et al., Nature (2010)

僕とこの論文の関係

  • 読込度:★★★☆☆
  • 専門性:★★★☆☆

素人解説:eQTL (expression quantitative trait loci) の文脈とこの論文

  • 遺伝型と表現型。この両者の関連性を発見し,さらに分子細胞生物学の言葉でその関連性を解き明かすことは遺伝学に携わる研究者の大きな野望なのではないだろうか。QTL 解析は,表現型(ヒトの場合,疾患の罹患率など。麦などの植物の場合,背の高さや穂の大きさなど)を定量的に評価し,その表現型と相関のある遺伝子座を絞り込んでゆくための手法である。

遺伝型と表現型の関連付けについて,それを結びつける分子細胞生物学的な考察はひとまず置いておいて,まずは遺伝型と表現型の対応付けをしてしまおう,という戦略である。従来の QTL 解析が時間を掛けて "絞り込んでゆく" アプローチとなってしまうには,二つの理由がある。

  1. 第一に,遺伝型を調べるための多型マーカーの解像度の問題があった。当然ながら,多型マーカーの解像度を超えて,ある表現型の原因遺伝子座を同定することは不可能である。そこでまずはゲノムワイドに粗い解像度のマーカーを使って標的となる遺伝子座を限定し,さらにその領域の中の多型マーカーを調べるという段階的な戦略に頼らざるを得なかった。この状況は,SNP アレイの登場で,劇的に変化する。HapMap プロジェクトに代表されるように,ヒトの SNP を網羅的に調べることが可能になったためだ。そのため,それぞれの個人が有する SNP を多型マーカーとして利用可能になり,所謂 "single-nucleotide resolution" での多型マッピングが可能になったためだ。
  2. 第二に,従来の QTL 解析では,F1 世代,F2 世代と交配を重ねる必要があった。その最大の理由は,家系データを用いることにより原因遺伝子座の検出感度を向上(偽陽性率を低下)させることができることにある。研究に時間を掛けるにつれて次の世代のデータが利用可能になり,それにより原因遺伝子座を限定してゆくことができる。このパラダイムもまた,SNP アレイの登場により(少なくともトレンドとしては)変化している。ヒト個体の全ゲノム規模の SNP データを安価に手に入れられるようになったため,10,000 人規模の Case-Control 対照研究が現実的になったためだ。多型データを手に入れられる個体数の急激な増加は,むしろ家系データを使うこと以上の感度の向上をもたらした。

このように従来の QTL 解析は,SNP アレイの商用化に伴い,GWAS (Genome-Wide Association Study) へと進化したのだ。

  • ここで紹介する論文は,遺伝型の多型を調べるために HapMap データ(すなわち,SNP アレイの結果)を利用し,表現型の定量化のために次世代シークエンサーを利用している。ここでは,表現型をリンパ芽球様細胞における mRNA の発現量と定義し,次世代シークエンサーのリードを使って定量化している。このように RNA の発現量の差異(個体差)の原因遺伝子座は,eQTL (expression quantitative trait loci) と呼ばれる。eQTL を同定しようとする研究は,SNP アレイの登場により遺伝型の調査,RNA 発現量の定量化の両方の観点において進化したが,この研究では,RNA 発現量の定量化に次世代シークエンサーを用いることの可能性を模索している。


論文の内容のまとめ

  • What did they perform?
    • HapMap プロジェクトで SNP を調査済みの 63 人の白人集団のリンパ芽球様細胞における mRNA の発現量を Illumina GAII (37-base pairs, paired-end sequencing) を使って定量化した。
    • HapMap プロジェクトで得られている SNP データと今回新たに得られた mRNA の発現量の定量データを組み合わせることにより,eQTL 候補を検出した。
  • What did they realize?
    • Illumina GAII 1 レーン分のデータ(約 10 million reads)を用いた eQTL 解析は,RNA定量化に SNP アレイを用いた eQTL 解析と同等の dynamic range を有するだけでなく,alternative transcript および abundant transcript の定量に優れることを示した
    • 次世代シークエンサーを用いた eQTL 解析により,SNP アレイを用いた eQTL 解析よりも高い感度が実現できることを示した
  • Why is this study valuable?
    • 本研究の最大の価値は,1 レーン分のデータで SNP アレイと同等以上の感度で eQTL 解析が可能であることを実証したことにあると思われる。


感想

  • 生物学的考察ではなく生命科学的手法に主眼を置いた研究であると言ってしまえばそれまでだが,eQTL 解析の感度を向上させたことが新たな生物学的な発見に繋がる,というストーリーを想起することが難しい結果の構成になっている。

事実,本論文で得られている生物学的知見は,例えば Veryieras et al., PLoS Genet. (2008) で得られている知見と同等のものであるようだ。eQTL の文脈において次世代シークエンサーの有用性を実証した価値とそのための努力は確かに素晴らしいと感じると同時に,生物学的発見の希薄さを残念に思う。リンパ芽球様細胞を用いた実験において eQTL 解析の感度向上を示すに留まらず,より幅広い細胞系列に対して網羅的な eQTL 解析を行うことにより SNP と mRNA 発現量の関係性を細胞系列ごとに調査し,細胞系列ごとの特徴を考察するような研究であったなら・・・という素人的な感想を持った。恐らく,そのような大規模な研究を行う場合には,次世代シークエンサーを用いることによる感度の向上よりも,次世代シークエンサーを用いることによるコストの増加がネックになってしまい,SNP アレイを用いた方が実験計画的に優れているのだろうと感じつつも。