2014年7月20日日曜日

コスト比較は気をつけよう

1週間に1度、更新するつもりが、6月に1回書いてからもう7月も後半!
何と! 一日のページビューが100を下回っていたことに気がついたので慌てて書くことに。
言い訳すると、最近Twitterにはまってまして。
そっちで誰かのをリツイートして満足していました。

さて、先週の金曜日、「164委員会」という会員制セミナーで、各シークエンサーメーカーや機器メーカーを集めたNGSセミナーがありました。
残念ながら私は参加せず、別の者がPacBioの紹介を。

聞くところによると、PacBioのコストに関する質問が出たそうな。
「ヒトゲノム50xのデータをPacBioで出すのに、いくらかかるか?」

まあ、この手の質問は良くあるんですが、HiSeqやProtonのコストと比較するのはナンセンス、とまでは言わないけれど気をつけなくてはいけなんです。
これを読んでいるひとは何となくわかると思いますが、目的が違う。

ヒトゲノムを
PacBioで50x読んだら、デノボアセンブリ ができる
HiSeqで50x読んだあとは、リシークエンス 

ヒトゲノム(に限らずギガbp単位のゲノム)をデノボアセンブリしようとするのは、はっきり言って、大型プロジェクトですよ。
ワシントン大学のCHM1ヒトゲノム57xも、いろんな研究所との共同研究。
そして彼らのアセンブリサイズは3.25Gで、今までの2.83Gより長かった。
ということは今まで読めていなかったところが結構あったということ。
リファレンスゲノムを疑って、今まで読めなかったところを読む、そういうチャレンジングな目的で使うのです。
(リファレンスゲノムを信じて、それにマッピングして例えばSNPを見つけようというのであれば、ショートリードを選んでください。)

ワシントン大学がやっている同じことをPacBio無しでやろうとすると、NGS用に何種類もライブラリ作って、BACやFosmidも用意して・・・と、膨大な手間と時間とカネがかかってしまう。
ヒトゲノムプロジェクトをやり直すわけですから。
少なくともそのかなりの予算をPacBioに与えれば、大分時間が節約できるでしょうね。

と、まあ具体的金額に触れずに書いてきましたが、現実的なコストで言うと、3Gbの50xカバレッジで1000万円~2000万円と言ったところでしょう。
1000万も幅があるのかよ!
と突っ込みを入れられそうですが、ライブラリのクオリティが良いか、とか、腕がうまいかどうかとか、いろいろ条件があるので一概にいくら、と保証できる数字は書きません。
これに、試薬やキットに含まれない、周辺機器を使うコスト、人件費、光熱費その他、がかかります。

シークエンスにかかる時間は、3時間Movieを8個のSMRT Cellで24時間+試薬調整、ベースコールや転送にかかる時間も混みこみで+4時間=28時間
これを50回分ランするとして、1400時間
単純に24で割るとおよそ59日
実際は土日や深夜に出てきたくないから、3ヶ月くらい?

このコストと時間を、リシークエンスだけに費やそうというのは、結構贅沢です。
どうしても他のテクノロジーでは読めない部分を読みたい、という強いモチベーションと資金が必要ですね。
とりあえず全ゲノム読んでみよっか? みたいな使い方はできません。


できることが違うのだから、同じ条件で比較しても、見ているのは全体のほんの一部。
イタリアのスーパーカー・フェラーリと、日本のハイブリッドカー・プリウス。
前者の売りはラグジャリーとステイタス、後者の売りは環境と安全性能。
同じ車でも、燃費で比較するひとはいませんよね。
(ちょっと違うかな?)


NGSを比べるとき、「Gbあたりのコスト」って、良く目にしません?
たいていHiSeq2500が圧倒的にコストが安く、書かれているんですよね。
でも今度からは、Oxford Nanoporeも参加しますよ。 
彼らのPromethION は、2000 channelsから、 毎分1Gb出すそうですからね(https://twitter.com/mason_lab/status/479763895238672384)。

Oxford Nanoporeの話はまた今度するとして、コストの比較を書くとき、こんなのはどうだろう?
「1000bp以上のリードに限ったときのGbあたりのコスト」
これなら当面、PacBioひとり勝ち。相手はSangerくらいですから。
Moleculoがあるって? なーるほど。 でもキット・試薬はいくらかかるんでしょう。





0 件のコメント:

コメントを投稿