2017年1月24日火曜日

PAG報告 パート4 BioNanoでスキャフォルド

ゲノムアセンブリには、PacBioのシークエンスは今や欠かせない、必須の手段と言えるでしょう。
PacBioのシークエンス無しにデノボアセンブリの発表をすると、オーディエンスから「何でPacBioを使わなかったの?」と聞かれる始末。
これはPAGのあるセッションで私が実際に目にした事実です! 
5年前は、精度がどうの言われていたので、それからすると感慨深いなあ。

とは言ってもコストの問題やゲノムサイズの大きさで言うと、PacBioだけのシークエンス&アセンブリで完結できる生物種は、少なくともPAGに登場する生物の中では少ないようです。
そんなときに使われるのが、最近良く話題になっている新しいスキャフォルドの方法。
今回のPAGで登場したのは

  • BioNano Genomics社のIrys
  • Dovetail Genomics社のChicagoメソッドとHiC
  • Phase Genomics社のHiC
  • NRGene社のDeNovoMAGIC

このうちDovetailとNRGeneのセミナーには参加してきました。

上記の前提として、PacBioやショートリードで読んだ配列のContigが既にあります。
そしてこれらのContigの、向きと並びをそろえて真ん中をNで埋める、いわゆるScaffoldを作るのにこれらの技術が使われているのです。

BioNanoのテクノロジーは前も紹介しましたね。
Physical Mappingという技術でゲノム上の特定塩基だけを認識してラベリングし、DNAがナノチェンバーを通過する際に蛍光を検出、特定塩基のあった場所のゲノム上の位置情報を出力します。
100Mb以上の長いきれいな(Nickの無い)ゲノムDNAを用意するのがミソで、これが出来ないと蛍光が間違った場所についてしまい、データがダメになってしまいます。
でもうまくきれいなDNAを取れれば、ゲノムアセンブリの結果がとても向上するみたいです。

Complex Genomeのセッションで、Maize GenomeのB73リファレンスゲノムを作った話の中、PacBioとIrysが使われていました。

  • PacBioはP6-C4でx65
  • Irysはx60のマップ情報(100kbあたり11マップ)

PacBioデータをFalconでアセンブリしたあと、IrysマップでスキャフォルドしてPseudoChromosomeを作った発表でした。
ちなみにPacBioだけからのContigは、平均して5つのBACクローンの配列をカバーしていたそうです。
PacBioで配列レベルを明らかにし、IrysでContigの向きと順番をそろえたということ。
20本の染色体のうち14本で、180箇所のテロメアリピート領域を配列レベルでしっかり読めたという話でした。これはPacBioがすごかった話。

もうひとつはSolanaceae、ナス科のナス属のアセンブリの話で登場していました。
ショートリードのアセンブリではN50がどうやっても650kbしかいかなかったそうですが、Irysデータを加えたらMbレベルになったそうです。
遺伝子数は、いろんな報告があるそうですが、35,000くらいだそうです。ヒトより多い。
それはそうと、ナス科の植物はやたら種類が多いそうですね。
ジャガイモ、ピーマン、トマト、トウガラシ、タバコ、ホオズキ、そしてナス。

さて次は、Dovetail、HiC、Phase、NRGeneについてです。お楽しみに。

0 件のコメント:

コメントを投稿