2016年6月20日月曜日

Dovetail - de novo Assembly 専門のテクノロジー(1)

大型ゲノムのデノボアセンブリといえば、これまで良く使われてきた方法として、
ショートリードでがっつりショットガンシークエンス &
PacBioで10x程度読んでScaffold

というのがありました。
この方法は、PacBioだけでアセンブリすることが(予算的に)できないときや、既にHiSeqで200xくらい読んでいてContigもたくさんある、というときなどに使われてきたと思います。
これからも、この方法は多く使われるでしょう。

では、PacBioで50x程度読んでアセンブリしたけれど、もう少しContigやScaffoldとして配列を長く伸ばしたい、という場合はどうしたら良いでしょう?
3つ方法があります。
1つめは、連鎖解析。これは古くから、植物などのゲノムアセンブリのバリデーションに使われてきたと思います。
2つめは、BioNanoのIyrsなど、Physical Mapping情報を使って、PacBio ContigをScaffoldingしていく方法。PacBioで読んだヒトゲノムの論文にも紹介されています。
3つめは、別のシークエンス技術を併用する方法。ショートリードでScaffoldする方法です。

今日は3つめの、ショートリードでScaffoldする話です。
今さら?と思われるかもしれませんが、Chicago Library、ってご存知ですか?

Dovetail Genomicsという会社と、UC Santa Cruzが開発した、通常のMate Pairよりも離れた場所の配列情報を読むためのライブラリ作製技術です。
もともと、ゲノムの3D 構造を見るための、Hi-Cという技術があります(Hi-Cの詳細に興味のあるかたは2009年の論文を参照)。
Hi-C: Lieberman-Aiden et al., (2009)

このHi-Cを使って、PacBioで読んだヤギのゲノムのContigを、染色体の長さレベルに伸ばそう(オリエンテーションも考慮して)としたプロジェクトは、PAG2015で発表がされました。

Hi-Cと非常に似ているのですが、Chicagoライブラリーは、in vitro で行なうところが大きく違います。
Chicagoは、Cell-free Hi-C for Assembly and Genome Organization の略らしいです(ここ)。

では、どんなふうに作っているのか。
Dovetail社はそれを使ってどんなビジネスを展開しているのか?
は次回のお楽しみ!






0 件のコメント:

コメントを投稿