2013年11月28日木曜日

アーバスキュラー菌根ゲノムからわかったこと

 
「共生」という言葉は、高校の生物で初めて耳にしたと思います。
私たちの細胞には、ミトコンドリアがあって、これが独自のゲノムを持っていて、エネルギーを作り出している云々。
その時素直に、「へえー、生物の中にも生物が住んでいるんだあ」と驚いた記憶があります。
それから腸の中には腸内細菌が住んでいて、やつらが何をしているのかはわからないが、定期的にヤクルト飲んでいれば健康でいられると、そのままTVコマーシャルを信じていた学生時代。

大学では、真菌(Fungi)という生き物の不思議さに大変驚きました。
核がたくさんあるやつや、HaploidとDiploidが人生の半々くらいなやつ。
酒造や発酵に必須で、古くから人類の文化と切っても切れない関係のやつ。
はたまた抗生物質を作ってくれて人類を病気から救ってくれたやつ。
しかし現代ではカビキラーによって、見つけ次第排除されるかわいそうな運命になっているやつ。

そして共生

植物の根っこに共生するアーバスキュラー菌根(Arbuscular mycorrhiza fungus)という種類があります。
その一種である、Rhizophagus irregularis のゲノムが、国際チームによって読まれました。

この生物、155MbのゲノムサイズでHaploid
ニンジンの根っこに共生した株から取り出したゲノムを、Sanger、454、Illumina、そしてわれらがPacBioで読んだそうです。
IlluminaはHiSeq2000を使用し、シングルエンド100bpを37,094,828本出力。
PacBioはXL-C2ケミストリーで、3.5μgのゲノムからライブラリを作成、SMRT Cellを9つ使用し、120分Movieでラン。
出力結果は、Max22kb、平均3kbのリードが139,080本。総塩基数 766 Mbp (デフォルトクオリティフィルタリング後の値)

少ないとお思いでしょうが、これは150Kアップグレードする前の装置で読んだ数字です。
その頃は、1セルあたりの出力が100 Mbp 弱だった。

ま、とにかく、9セル使って120分で読んで、155 Mbp ゲノムのおよそ5xはカバーできたわけです。
今なら、セル数は半分の4つくらいでこれくらい出ますかね。

アセンブリの方法は、先ず、Sanger、454、Illuminaのデータをまとめて、一度フィルターにかけます。
この真菌はATリッチなので、GCが45%以上あるリードはバクテリア由来のコンタミらしい、として、別途分けておくフィルターです。
残ったリードが約3000万本、3,781 Mbp
これを、CLC-Bio Genomics WorkBench のde novo hybrid assembly にかけ、91 Mbp、28,371本のScaffold(N50 = 4.19 kb)を得たそうです。

さらに、このScaffoldと、PacBioの5x分のロングリードを混ぜて、PacBioのAHA(A Hybrid Assembler)でさらにScaffoldingし、101 Mb、12,421本のScaffold(N50 = 15.16 kb)を得ています。

それでも12,000本、N50 が15 kbpかあ・・・

今なら、20kbライブラリも可能だし、180 Movie もあるし、新酵素もあるし、解析ではPB Jelly 2 という別のPac用Scaffoldツールもあるので、それらを試すともっとアセンブリも改善するでしょうね。
(もしかして現在進行中かも)

Tisserant et al. "The genome of an arbuscular mycorrhizal fungus provides insights into the oldest plant symbiosis" PNAS, Suppl. Fig S1 より
 
PacBioはゲノムアセンブリにしか使われていませんが、ショートリードのアセンブリ結果から、遺伝子配列の解析もされています。
その結果、 植物に共生する真菌らしく、、彼らの遺伝子セットからは、細胞壁を消化する代謝酵素遺伝子が失われていたり、リンの吸収に役割のある遺伝子がたくさん含まれていたり、そのようなことがわかったそうです。
 
 

0 件のコメント:

コメントを投稿