2016年7月11日月曜日

CCSでアセンブリも、あり!

毎日暑いですね。
そんな時はアイスかかき氷!
私は普段、冷たいものはあまり食べないですが、こうも毎日暑いと食べたくなりますよ。
「黒糖ぜんざい」
沖縄で食べたかきごおりです。ぜんざい、と呼ぶそうですが。
これはおいしかった。


さて、PacBioでのゲノムアセンブリといえば、ロングリード(CLR)を互いにエラーコレクションして行なうのが「定説」と思っている方も多いと思います。
CCSというのは、Circular Consensus Sequenceの略で、比較的短いライブラリを何度も読んで、1分子のDNAの精度を高めていく方法。

何回も同じDNAを読むことで、出力された配列のコンセンサス配列(1分子DNA由来)を、99%以上に高めることができるのです。
今の試薬P6-C4なら、5パス以上で99%の精度に達することも可能です。

ライブラリの長さにもよりますが、1kbから2kbなら、十分精度の高いリード(CCS)を出力することも可能で、それを使ってアセンブリを行なった論文がこちら


8個のSMRT Cell から得られた平均 1,319 bp、99.7%の精度(平均10パス)、94 Mb分のCCSを使って、アセンブリ。
アセンブラーは、MIRA 4.0

この論文はメタゲノムなので、完全ゲノム配列を作るのが目的ではありません。
マーカー遺伝子が読めていればOK
Phylotype Specific な配列データベースを作成するには、どんな配列もバイアス無く読めるPacBioが最適というわけです。

CCSを使った、アセンブリの論文でした。

0 件のコメント:

コメントを投稿