まず、基本的なことから説明します。すべての生物にはゲノムがあります。
ゲノムはDNAでできています。あなたの細胞のそれぞれは、その中にあなたのゲノムのコピーを詰め込んでいます。ゲノムを取扱説明書やレシピ本のように考えることができます。ゲノムには、あなたの体がそのように働き、そのように見えるために必要なすべての指示や「レシピ」が書かれています。
ヒトのゲノムは、4種類30億個のDNA塩基で構成されています。それぞれの塩基は、DNAの「アルファベット」の中の4つの「文字」のうちの1つで表現されます。あなたのDNAのほとんどは、他の人のDNAと同じように見えるでしょう。しかし、ゲノム上に存在する何千もの遺伝子におけるこれらの文字の綴りや配列のわずかな違いが、あなたをユニークにしている一因なのです。
ウイルスにもゲノムがあります。ウイルスのゲノムは、DNAか、RNAと呼ばれる類似の分子でできています。あなたのゲノムと比較すると、ウイルスのゲノムはとても小さいものです。例えば、COVID-19の原因となるコロナウイルスのRNAゲノムは約3万文字です(これはヒトゲノムの10万分の1です)。インフルエンザやインフルエンザウイルスのゲノムはさらに短く、約13,500文字のRNAである。
すべてのウイルスが人を病気にするわけではありません。しかし、病気になるウイルスのゲノムには、私たちの細胞に感染し、自分のコピーを増やし、拡散するために必要なすべての命令が書かれている。これらの指令のわずかな違いによって、異なるウイルス、あるいは同じウイルスの異なる亜種や系統が、異なる外見や行動をとるようになるのである。科学者は、ウイルスのゲノムを研究することによって、そのウイルスについて多くのことを知ることができる。
ウイルスゲノムシーケンスとは何か?
ウイルスのゲノム配列とは、ウイルスの遺伝物質、つまりゲノムを構成する塩基や文字の配列や順序のことです。仮に書き出すとしたら
と書くと、約3万文字の羅列になります。重要なのは、特定のウイルスに含まれる文字列を正しい順序で並べることです。
RNAの場合、科学者はA、C、G、Uという文字を使いますが、これはRNAの4つの塩基(アデニン、シトシン、グアニン、ウラシル)のそれぞれを表しているのです。DNAも同様で、ウラシルの代わりにチミンを表すTが使われています。このように、ウイルスの塩基配列の順番を決定することをゲノム解読といいます。
ウイルスのゲノム配列決定で何がわかるか?
ウイルスとウイルスゲノムは常に変化しています。その理由は、細胞がときどき間違いを犯すからです。
感染した細胞の中でウイルスゲノムがコピーされるとき、時々「誤字」が入り込んでしまうのです。たいていの場合、そのようなスペルミスは大きな違いを生み出さない。しかし、時には、ウイルスの見た目や振る舞いを変えてしまうことがあり、それが重要な意味を持つことがある。COVID-19の原因となるウイルスがどこから来たのか、正確には誰も知らない。しかし、おそらくコウモリのような他の動物のコロナウイルスから発生し、それが誤って人間に感染するような形で変化したのであろう。
ゲノム配列の解読により、科学者たちはこの新しいヒト型コロナウイルスが人々の間で発生した直後に発見しました。当初、科学者たちが知っていたのは、中国で人々が突然呼吸器系の症状で体調を崩したということだけでした。そこで科学者たちは、このウイルスの発生源と思われる市場で働いていた人から採取したウイルスのサンプルのゲノムを配列決定しました。そのRNA配列を、これまでの研究で得られた他のウイルスのゲノム配列と比較したところ、そのウイルスが、これまで人に感染したことのないコロナウイルスであることがすぐにわかりました。
人に関する限り新しいウイルスであるにもかかわらず、そのゲノムを基にすぐに多くのことがわかったのです。というのも、科学者たちは、以前に人々に大発生をもたらした関連コロナウイルスの研究を行っていたからです。その研究によって、科学者がスパイク・タンパク質と呼ぶものをコードする遺伝子を含む、コロナウイルスのゲノムの重要な部分のいくつかがわかっていました。
このスパイクは、ウイルスが細胞に感染するために重要であることもわかっていた。また、ワクチンや治療法のターゲットとして有用であることも分かっていた。コロナウイルスのゲノム配列を決定し、そのゲノムを他のウイルスのゲノムと比較することができたので、発見後すぐにこのようなことがわかったのです。
つまり、ゲノム配列の解読は、多くの有用な事柄を明らかにすることができるのです。
新しいウイルスを特定したり、どのようなウイルスが誰かを病気にしているのかを知ることができます。また、ウイルスの遺伝子とそれがコードするタンパク質に基づいて、ウイルスがどのように私たちを病気にするのか、また、それを阻止する方法について、科学者にアイデアを与えることができます。あるウイルスが世界中で人から人へと広がっている場合、科学者はゲノム配列を使ってその動きや変化を追跡することができます。
COVID-19とインフルエンザウイルスのゲノム配列解析の目的とは?
科学者たちは、何十年にもわたってインフルエンザウイルスを追跡してきました。現在存在するウイルスと過去に存在したウイルスを比較するために、ゲノムを利用しているのです。ゲノム配列に基づいて、特定の遺伝子の綴り方に重要な違いがあるかどうかを調べるのである。ある種の変更は、全く大きな違いをもたらさない。しかし、ウイルスが人から人へと広がりやすいかどうか、あるいは病気になりやすいかどうかに影響するものもある。
毎年、科学者たちはインフルエンザのゲノム配列を使って、インフルエンザ・ワクチンに何を含めるかを決めている。インフルエンザ・ウイルスは長い間存在し、常に変化しているため、1人のインフルエンザ患者から採取されたサンプルでも、微妙に異なるバージョンが見つかることがあります。通常の年では、科学者たちは何千ものインフルエンザ・ウイルスの配列情報を入手し、公衆衛生上の決断を下すのに役立てています。
COVID-19のパンデミックでは、ゲノム配列の解読が重要な役割を果たしました。ゲノム配列は、科学者がコロナウイルスがどのように広がり、どのように変化しているかを追跡するのに役立っています。また、ゲノム配列を調べることで、どのような変化が心配に値し、どのような変化が心配に値しないかを知ることもできます。
例えば、ボストンでのある研究では、約800のウイルスのゲノムを用いて、コロナウイルスがどのように初期に広がっていったかを調べました。ゲノムのわずかな変化から、コロナウイルスがヨーロッパやアメリカの一部から何十回となくボストン地域に侵入したことがわかりました。
科学者たちは、COVID-19の原因となるコロナウイルスがどのように動いているかを理解し、新しい変異体が発生したときにそれを捕らえるために、配列の解読を続けています。このプロセスはゲノム・サーベイランスと呼ばれています。
ゲノムサーベイランスでは、多くのサンプルの塩基配列を決定します。これにより、新たな変異体、つまり1つ以上の変異を持つウイルスゲノムを発見することができます。
発見された変異体の中には、ただ消えてしまったり、何の変化もないものもあります。ゲノムの変化が心配なものである場合、科学者はそれらを "variant of interest "と "variant of concern "のいずれかに分類しています。デルタやオミクロンのようなコロナウイルスの変種については、皆さんもよくご存じでしょう。
オミクロンについて科学者が早くから懸念していた理由の一つは、この亜種にはゲノムに約50のタイプミスや突然変異があることです。これらの変異の多くは、ワクチンや私たちの免疫システムがウイルスを攻撃するために使用するスパイク・タンパク質にも見られます。
これらの変異のために、オミクロンはCOVID-19の原因となるオリジナルのコロナウイルスよりも速く拡散します。科学者たちは、新しい亜種がこれからも出てくると予想しています。ゲノム解読と監視を続けることで、ウイルスの先を行くことができるのです。科学者たちはゲノム解読を利用して、興味のあるウイルスを特定し追跡することができる。
ウイルスのゲノム配列はどのように決定されるのか?
ゲノム配列の決定は、以前よりずっと簡単で安価になりました。また、ウイルスゲノムはサイズが小さいので、ヒトゲノムよりも配列決定が簡単です。ここでは、その主な手順を紹介します。
抽出
. 科学者は、ウイルスが含まれる試料からRNAまたはDNAを抽出する。
試料調製
. 科学者は試料を準備する。例えば、RNAやDNAを小さく切り刻んだり、末端に特定の断片を加えたりする必要があるかもしれない。具体的な手順は、科学者がどのタイプの機械を使うかによって異なる。
塩基配列の決定
. 科学者はサンプルを配列決定装置に入れる。この機械は、DNAまたはRNAの塩基または文字の順序を示す信号を読み取る。
解析
. 機械は、個々にゲノム全体をカバーしない文字の列をたくさん作ることになる。それをコンピュータを使って完全なゲノム配列にまとめ、新しい配列が他のものと比べてどのような違いがあるかを特定するのです。