2013年5月4日土曜日

期待しているアセンブリ関連の論文


ゴールデンウィーク中日、皆さんはどのようにお過ごしでしょうか?
私は今年も昨年も、5月3日にアメリカ本社とウェブ会議しました。
もちろん家から参加ですけど。
どうせ長距離旅の予定は無いのでいいんですが・・・。
 

さて、昨年(2012年)、PublishされたPacBioToCAは、ここでも前に書きました。
経験上、大きなゲノムでは途中で止まってしまったりと、いろいろとチャレンジが多いツールでもあるんですが、今のところ、Pacと合わせてイルミナ等のショートリードをやっているひとたちは、とりあえず最初に試してみるエラー補正ストラテジーだと思います。

このツールの作者は、Sergey Koren氏らのグループです。 彼らがまた、別の論文をSubmitしましたので、ご紹介します。

こちらから取得できます( http://arxiv.org/abs/1304.3752

PacBioToCAを使ったエラー補正から、データを変えていろいろ結果を比較し、私は結構面白い論文だなと思いました。
ここで出てくるC1、C2、XLという言葉について、聞き慣れないひともいると思うので説明します。
これはポリメラーゼのバージョンで、Pacではケミストリーと呼んでいます。 C1のCはChemistryのC。
XLというのはエキストラロングのこと。
C1は一昨年のケミストリーで、平均リード長は2000bp未満。昨年1月リリースのC2で3000bp、昨年秋リリースのXLで4000 bpと、どんどん伸びています。
もちろん今年も新ポリメラーゼがリリースされますよ。お楽しみに。

この論文で、Pacは結構コスパが良い、と最後の方で言っています。
私は他のシークエンサーがどれくらいランニングコストがかかるのかわかりませんが、Pacで出てくるデータの価値と価格を比較した論文はそう無いので(他に一報あるのを知っていますが)、チェックしても面白いと思います。 ただあくまでアメリカでの価格ですよ (^v^)


エラー補正と言えば、HGAPという方法も昨年末に公開されました。
こちらはロングライブラリーのデータだけを使って、短めのリードを補正に使う方法です。
以前、(http://pacbiobrothers.blogspot.jp/2013/03/blog-post.html)こちらに書きました。

実際バクテリアサイズのゲノムアセンブリであれば、HGAPでほぼ完結しますよ。 
試したうち9割くらいのひとは、非常に驚いて満足されています!
残り1割、ですか? 本当は試した全てのひとが満足している、と言いたいところですが、実際に存在するリピートが長かったり、ランしたセルが足りなかったりと、そういう場合もありますからね。

ちなみにSMRT Analysisというフリーの二次解析ソフトでは、標準装備されています。

その、HGAPですが、間もなくPublishされるという情報が入ってきました!
これも楽しみです。 技術的には大型ゲノムにも応用可能な方法ですので、各方面で使用されることを大いに期待しています。

0 件のコメント:

コメントを投稿