2014年2月14日金曜日

Blue Pippin - PacBioデータを最大限に生かす組み合わせ

Icahn Institute for Genomics and Multiscale Biology、Mount Sinai (NY)の研究者、Dr. Robert Sebraによると、Blue PippinはPacBioのロングリードアドバンテージを最大限に生かす、最高のマシンです。


Blue Pippinとは何か?

通常、ライブラリ作製をすると、狙ったサイズでシェアリングしても、短い長さのDNA断片も混ざってきてしまいます。
AMPureビーズ精製で途中何度も短いフラグメントを除く作業が入りますが、これは数~数十bp位の非常に短いフラグメントを除くためのもの。
例えば20kbを狙ってSMRT Bellを作ったときの、1kbのBellを取り除きたい時、AMPure濃度を変えて行うプロトコルもあるにはありますが、きっかり取り除くことは難しいそうです。

であれば、ライブラリをゲルに流して、大きなサイズだけを切り出し、という手が思いつくかもしれません。
そうです。
それを自動でやってくれるのがBlue Pippinです。 

カセットには5レーンあって、最大4サンプルまで一度に、あと1つのレーンはマーカーを一緒に電気泳動で流し、取りたいサイズのマーカーが来たら、電流の方向を変えて、取りたいサイズのサンプルを別の穴に入れる、
と、ざっくり言えばこんな感じです。

どのサイズで区切ったら良いのか、というのは、10kb、7kb、4kbと今は3種類あり、DNA量によって使えるサイズの限度があります。
7kbで区切る、という意味は、例えば作製した20kb SMRT Bellライブラリを電気泳動して、7kb以上の長さのSMRT Bellだけ抽出する、ということです。

そもそも、短いライブラリが混ざると何がいけないのか?
良く聞かれる質問です。

ライブラリが短いと、SMRT Cellのウェル、ZMWに入りやすいのです。
経験上、3kbより短いライブラリはそれ以上の長さのものよりもZMWに入りやすいようです。
MagBeadsとかで、長いライブラリを優先的にZMWの穴にロードする技術はあるのですが、それでも、20kbと3kbでは、圧倒的に3kbが穴に入りやすいらしい。
らしい、というのは実際の観察は不可能なので、データから予想するしかないからです。

そうするとどうなるか?

短いライブラリが競争で勝ってしまうと、出力するデータの、特にサブリードが短いものばかりとれてしまう。
サブリードというのは、SMRT Bell ライブラリの長さを超えることはありえないので、結局、長いライブラリを読んでいることにはならない。

このグラフは、Dr. Sebraが、同じMRSAサンプルを、Blue Pippinサイズセレクション有り無しで読んだ時のサブリードの分布です。
上が無し、下が有り (SMRT Cellの数と目盛が違うのに注意)
注目すべきは、サブリードのN50 が、Blue Pippin無しのときが5,000bp、有りのときが12,500bpという点!
これは今までのデータと比較するとすごいことなんです。


今、PacBioを使って20kbライブラリをSequenceするときは、Blue Pippinによるサイズセレクションがほぼ必須になりつつあります。
彼らは今、NA12878のサンプルを、Blue Pippinサイズセレクションした後のライブラリを使って、読み続けています。
もう既に30x以上、読んだそうです。

この、Sage Science社のテクニカルノートのPDF版が欲しい方は、いつものように、info_pac(アット)digital-biology.co.jp までお気軽に。
誰にでも差し上げます。

ちなみに彼(Dr. Sebra、Bobbyという愛称で呼ばれています)は、写真ではわかりづらいですがすごい面白い人物です。
ユーモアがあり、ファッションにこだわり、日本が好きで、昔DJをやってたくらい音楽が好きで、かつ良い意味でのクレージー、そして紳士です。
今度日本に呼ぼうかなあと計画していますが、まだわかりません。 その時はお知らせします!


0 件のコメント:

コメントを投稿