九大熱研HOME活動報告書2001年度情報医学班

情報医学班

活動目的

 21世紀に入り,人類はゲノム全ての配列を手に入れた。生命科学は,方法論的に大きな変化を遂げ,加速度的に発展すると考えられる。医学に携わ る以上,この時代の流れには逆らうことはできず,臨床に進む学生であっても,学生時代に相応の知識に触れておくことはマイナスでないと考える。
 現在の代表的なトピックスや新興分野を学び,考察することを通して,ポストゲノム時代の生命科学ひいては医学の在り方を考えることを目的とする。

参加者

洲崎 悦生(6年),森 桂(4年),市川 太祐(3年)
部外参加者
鍵本 忠尚(6年)

活動概要

◆勉強会(4〜8月)
 ○ポストゲノム時代のバイオロジー
  概論 / プロテオミクス / SNPs / DNAマイクロアレイ / ゲノム創薬 / 構造ゲノミクス
 ○バイオインフォマティクス
  概論 / 「ゲノム情報生物学」抄読 / E-cellプロジェクト
◆6月22日 中山敬一先生(九州大学生体防御医学研究所教授)を交えてのディスカッション
◆8月17,18日 山形県鶴岡市 慶應義塾大学先端生命科学研究所 見学
◆10月10日 総括

活動報告


<ポストゲノム時代の生命科学〜ゲノム計画の果 たした意義>


 今から10年ほど前、ヒトのもつゲノムの塩基配列を片っ端から解読していこうと言い出した人物がいた。最近よく耳にするようになったヒトゲノム 計画の始まりである。提案者はDNAの二重らせんモデルを解明した一人であるジェームス・ワトソンであった。そして、2001年の2月にその大まかな配列 解析が終了したと報じられた。ヒトの持つ全染色体の塩基配列をATGCの並びに変換してしまう。極めて有機的な生命現象から無機的な電子情報への変換、こ れがヒトゲノム計画の本質の一つといえるだろう。これまでも遺伝子単位での塩基配列のデータベース構築は行われてきたが、これを網羅的に行ったことがこの 計画の最大の意義といえる。

 さて、従来の生物学・医学の様々な分野はゲノム情報を利用することで大きく変わろうとしている。そのような分野としてこの後の各論で扱う、構造 ゲノミクス、SNPs解析、プロテオミクスなどが挙げられる。これらは考え方そのものは以前よりあったのだが、ゲノム解析およびそれに並行した技術の進歩 によって飛躍的な発展を遂げた分野である。一例としてSNPs解析をとれば、これは代謝などに関わる遺伝子の一塩基多型を解析するというものである。この 解析結果から単因子の遺伝子異常では説明できない多因子性の疾患(糖尿病、がん等)へのなりやすさ、更には個人の体質を推定することができる。多くの遺伝 子を調べるというこの解析の性質上、どうしても網羅的なゲノム情報が必要となるため、これもヒトゲノム計画を抜きにしては語れないものである。

 また、生命を情報として捉えることにより新しく生まれた学問がある。これはバイオインフォマティクスと呼ばれている。これは膨大な量の生命情報 を扱うために生まれた学問であり、これまでの生物科学の本流であった実験生物学とは趣を異とするものである。これについては後ほど詳しく触れる。

 ただし、大まかな塩基配列の解読が終ったとはいえ、これだけではゲノム情報としてはまだまだ不完全である。情報の意味付け、具体的に言うなら伝 子位置の同定などがまだ残っている。また塩基配列情報そのものも完全に正確なものではないとも聞く。開始から10年経ったとはいえ、このようにやっとス タートラインに立ったぐらいの感も否めないが、ヒトゲノム計画がこれからの生物学・医学に多大な影響をもらすことはまちがいないであろう。そうはいっても いまいちピンとこない人も多いだろうが、渦中にいるというのはそういうものである。二重らせん構造の解明から約50年たった今、やっとDNAという言葉が 定着してきたようにゲノム解読のインパクトもあと20年ぐらいしたら一般のレベルに定着するようになるのかもしれない。

 このような流れの中生まれた新しい研究分野について幾つか紹介する。

・プロテオミクス

 ある時ある細胞(あるいは組織)に発現している蛋白を網羅的に解析する手段や技術をプロテオミクスと呼ぶ。ゲノム解析(ゲノミクス)から造られ た言葉である。細胞ネットワークや細胞プロセスにおける全体的な生物学的情報を得る事を目的としている。具体的には,2次元電気泳動(2D-PAGE)に より得られたスポットを,質量分析計(マススペクトロメトリー)などを使って分析する。さらに,それらのタンパクの相互作用を解析する。プロテオームの データベース化も現在進められている。

・構造ゲノミクス

 構造ゲノミクスとは、言うなればゲノム解析の三次元版といったものである。今、よく言われているゲノム解析を設計図の解読とするなら、それに対 応した部品の同定がこの構造ゲノミクスになるだろうか。ただし、この部品の同定は網羅的なものであり、今までのように何かの機能が欠損したハエやマウスか らその機能を担っていた遺伝子を推測し、それに対応したタンパク質を取り出してくるといった同定とは性格の違うものになる。

 それでは次に具体的な手順を示す。私達の体を構成しているタンパク質の数は莫大なものになるので、なかなか片っ端から調べていくのはあまりに非 効率である。よって、手間をはぶくために、同じような立体構造をとると思われるタンパク質同士をそれぞれの仲間に分けるという手段がとられる。そうして、 多くの群に分けたあと、それぞれの群の中で代表となるようなタンパク質を選び出す。こういった選別過程を経た後、その代表タンパクに対して構造解析と機能 解析が行われる。一番最初の例でいくと、部品の形と、その部品の働きを調べているわけである。これが構造ゲノミクスの一連の流れになる。このようにして、 タンパク質のカタログみたいなものができる。

 さて、このカタログの使用法として、創薬への応用が挙げられる。薬を創る時、面倒なのは標的(たとえばレセプ ター)にくっつく分子つまりは薬の原型となるものを探す過程である。この過程において、先に述べたタンパク質のカタログが役に立つ。たとえば、レセプター のある部位にくっつく分子を探したいとする。その時はまずその部位の情報を入力して、カタログと照らし合わせてみる。すると、似たような部位をもつタンパ クがいくつか候補にでてくる。それぞれの候補タンパクの研究が進んでいればそれらのタンパクと相互作用する分子の情報も同時に提示される。このようにし て、標的レセプターにくっつく分子を探す過程を大幅に省くことができる。ここでは創薬を例にとって説明したが、構造ゲノミクス、つまりタンパク質のカタロ グづくりは、いろいろな手間を省くことが出来るという意味で大きな可能性を秘めているといえるであろう。


・SNPs(single nucleotide polmorphism)

 DNA一塩基における個々の多様性である。30億塩基対からなるヒトゲノムの99.9%は全員が共有しており、わずか0.1%(300万塩基 対)にこの変異があると考えられている。つまり、約1000塩基に1個の割合で存在する遺伝子多型が、個々の容姿・体質に変化をもたらしている。具体的に は common disease への感受性や、薬物の効果・副作用の違いが大きくSNPsに依存しているのではないかと考えられ、現在精力的にSNPsの解析が進められている。これが疫 学的臨床データと融合することで、疾患の遺伝的要因がより明確になるだろう。また必要な患者に、適切な量で、必要な薬剤を投与することや、莫大なコストが かかる創薬では、効率よく被験者を選び治験を進めることが可能になるかもしれない。

・DNAチップ/マイクロアレイ

 細胞内では大量の遺伝子が発現し、それらが多数の相互関係を結んでいる。これまでは複数の遺伝子産物をとりだし局所に焦点をあてるというスタイ ルが主流であり、また技術的にそれ以上は無理であった。 しかし、最近開発されたDNAチップ/マイクロアレイでは、細胞内の遺伝子発現を同時に,そして 時間に沿った変化を追うことができる。

 具体的には、あらかじめチップに貼り付けたcDNA(遺伝子のセット)に、ある細胞の転写産物であるmRNAをふりかけることで、相補的なもの 同士が結合する。mRNAには蛍光物質がラベルされているので、何がその細胞で発現されているかを可視化することになる。2つの細胞のmRNAを同時にふ りかけると、両方の発現の差を色具合で比べることができる。 遺伝子産物を縦軸に、時間軸を横軸にすると、各遺伝子産物の時間的変化を色の強度の変化として追うことになる。DNAチップ/マイクロアレイは未知の遺伝 子産物も一緒に扱っている。そのため既知遺伝子産物のタイムコースと比べることで、未知のものの機能や関連性を類推することができる。また、ある実験条件 (薬剤投与など)を加えることで変化する遺伝子発現も観察することができ、様々な応用が期待されている。



<生命科学とコンピュータの活用 〜Bioinformatics・生命情報学>


 20世紀後半の生命科学は、生命の働きを分子・遺伝子という部品に還元し、部品の集合が生命であるという考え方を基盤とした実験生物学であっ た。その流れの中ヒトゲノムの解読が完了したが、この段階では部品のカタログ情報が揃っただけである。そこで、それらが集合をなし複雑な相互作用をして生 命活動を営むという観点から合成論的アプローチが必要となってきた。生命活動をシステムとしてみるとき、遺伝子やその発現、機能、相互作用などをそれぞれ 情報として扱い統合する、ここに生命科学と情報科学の融合、Bioinfomatics・生命情報学の重要性がある。

 物質的な生命活動には様々なレベルがある。個体・組織・細胞・分子・遺伝子、そしてその相互作用。これらの蓄積された情報を体系化することで、 生命活動のネットワークシステムという枠組みで扱いうるものとなる。コンピュータの使用は、このように大量の情報を扱い、複雑な相互作用をプログラム化す る作業で必然となってくる。現在それぞれのレベルでのデータベースが構築されつつあり、Webで公開されている。同時にデータベースを使ってのデータ解 析・アルゴリズムの開発も進められ、生物学のみならず、物理学、化学、数学、工学など、幅広い分野が参画することになる。

 Bioinfomaticsを用いることで全体の"ふるまい"をみることが可能になる。そのシステムの中において個々の物質がもつ意味が問われる のであ る。このような概念に科学的根拠を与え得ることを試みるのが、Bioinfomaticsと言えるだろう。

 応用の一つとして細胞のシュミレーションがあげられる。細胞内で刻一刻と変化する現象を情報として数式化し、コンピュータ上で再現する。このよう なプロ ジェクトに取り組んでいるのが、慶応大学の富田勝先生の教室である。


<冨田研究室見学>


 8月17・18日の両日,山形県鶴岡市に今年開設された先端生命科学研究所の見学及び,同研究所教授の冨田勝先生との談話の機会を得た。施設見学 は,講 師の内藤泰宏先生にお世話していただいた。

◆施設

 実験施設棟及び,インフォマティクス棟の2棟で構成されている。
 実験施設棟は,庄内平野を広く望む土地に作られ,立地条件としては最高の場所である。建物は"box-in-box"という特殊な建築方法で作 られ,外壁に余計な配線,パイプラインなどを取り付けなくてもよい様に,さらには設備の増設が簡単にできるように作られている。周囲から不審な施設と受け 取られないようにという配慮である。ここでは主に代謝経路の各物質の濃度や反応に関する定数の算出など,シミュレーションに必要な実験データを集めてい る。 また,学生用の実験室や,冬の積雪を考えた福利施設(宿泊,エンターテイメント設備)もある。

 一方のインフォマティクス棟は,鶴岡公園内の施設の一つとして作られており,周囲 にはビオトープ,レストランなどが配置され,内部には市民に 開放される図書館もある。こちらではコンピュータを使って様々なシミュレーションの構築を進めており,大学院生が熱心にキーボードに向かっていた。

◆E-cell project

 細胞全体の「振る舞い」を見るべく,冨田先生の研究室にて1996年より開発が開始された,汎用細胞シミュレーション環境ソフトがE-cell である。冨田研究室では,E-cellを用いて赤血球モデル・バーチャル自活細胞モデルなどを作成している。我々の最大の関心事の一つがこのE-cell であり,実際のデモンストレーションをインフォマティクス棟にて見学することができた。

 E-cell自体は,細胞シミュレーションを行うための材料と場を提供するための「シミュレーション環境」ソフトであり,実際にどのようなシミュ レー ションを行うかはもちろん研究者が規定することになる。

 赤血球モデルでは,赤血球内の各代謝経路,及び細胞内外環境が規定され,各代謝経路の物質濃度の時間変化がグラフとして出力される。条件を変化 させる(例えばグルコース濃度を1/2にする)と,それによる変化がグラフ上で示される(G6P以下の濃度が下がり,経路の始めにある物質から徐々に定常 状態に回復してくる)。シミュレーションを走らせると,約120日目に代謝の破綻を来し,細胞死となる。120日!そう,実際の赤血球寿命とぴたり一致す る。皆が感嘆の吐息を漏らした一瞬だった。しかし,疾患モデルの構築となると,なかなかうまくいっていないとのことだった。それがその疾患に関する知見が 不足しているためなのか,それともシミュレーションの組み立てが悪いのかは今のところ不明だと言う。現時点での「シミュレーションを行う」ことの問題点の 一つがここにある。

 自活細胞モデルは,最小のゲノムサイズ(約500遺伝子)をもつマイコプラズマの遺伝子セットを参考に,生存に必須の127個の遺伝子からな る。これらの遺伝子の発現によりグルコースの摂取やATPの合成,細胞膜の合成などを行う。遺伝子はクリック一つでノックアウトが可能であり,シミュレー ションの可能性を存分に発揮する一つのモデルであると感じた。

 今後は,さらにモジュールを拡張し,総合シミュレーション環境を実現する次世代E-cellの開発を行っているとのことである。 なお,E-cellに関する詳細は,「ゲノム情報生物学」(中山書店)を参照のこと。


◆冨田先生との談話

 冨田勝・慶応大学教授は,バイオインフォマティックスという分野の中でも,異色の研究を進めているという印象を受ける。バイオインフォマティク スは,その主流が「ゲノムデータの解析」であり,冨田先生のように細胞全体の振る舞いを見ようと,シミュレーションを作るという動きは,決して多くはな い。もともとが情報科学畑の出身であり,人工知能の研究ですでに成功を修めていた先生ならではの仕事であろう。我々は,ポストゲノムの勉強会を進める中で 浮かんでいたいくつかの疑問や,E-cellをはじめとするシミュレーションの仕事について先生に質問した。

〜なぜシミュレー ションをしようと考えられたのですか。
 生命の中では多くのシステムが並列,同調して全体を作っている。このような閉じられた系は人工知能などと違って定義しやすく,コンピュータを用 いて解析するにはもってこいだと思った。ゲノムなんて,たった30億bp,CD-ROM一枚分ですよ!あまりにもうまくできすぎている。人工知能より面白 そうだと思いました。

 結局,仕組みではなく,「ふるまい」を見たい。それをアシストするために実験をし,データを集める。ここではメタボローム(代謝経路の解析)をは じめと する実験も一緒にできるようになっているけど,それはそういうことを1箇所でまとめてやってしまおうという事です。

〜自分たちの見方では,実験を進めるのに必要な知見,例えば仮説を立 てるのにシミュレーションをやるという感覚があります。
 実験で得られるのは仕組みです。生命はインフォメーションであるというのが私の捉え方です。シミュレーションは仕組みを再現するのでなく,そこ から要約して「ふるまい」を見るのです。シミュレーションは実験の補助道具ではありません。今はシミュレーションをしても実験的な裏づけがないからダメと いう感じですが,将来的にはある論文を評価する時に,現在の知見を元にしたシミュレーションと合致するか,つまりは全体の中でその結果がどのような位置を 占めるかということが問題になるかもしれません。

〜どのようにシミュレーションを組み立てるのですか。
 生命の中の様々なシステム,例えば代謝経路などのモデルを作りますね。コンピュータ上では数式です。作る中で,実際の細胞の振る舞いと合わない ならば,どこかにmissingがあるだろうと考えます。現在はまだまだシミュレーションの技術確立は不十分で,いいアルゴリズムを作るのは難しい。今は 皆がagreeする段階のことを再現する事を目指しています。ただ,シミュレーションをするためには,網羅的,定量的,重み付けを判断するデータが欠かせ ません。現在のように,例えばAとBの分子が矢印で結ばれるなんて図がありますが,ああいう定性的な解析ではシミュレーションはできません。そこが一番の ネックであり,またそういう理由から,シミュレーションをする事で現在の表面的な定性的生物モデルを深めていく糸口になると思っています。生命科学の最終 目的は,生命の再現,再現性の確立ですから。

 ただ,シミュレーションは現実の再現とは違います。もしそうなら,クォークレベルからやらないといけない。どこで「手を抜く」かが問題ですね。

〜バイオインフォマティクスと言うと,ゲノム解析ばかりで,先生のよ うな事をやっている人は少ないように感じます。
 たとえばhomology searchなんて,結構簡単だし,実験やってる人たちから感謝されますしね。情報系の人たちが参入してきた時に,とっつきやすい所だからでしょう。

〜E-cellは,全然知らない人にはとても扱いにくいインターフェ イスになってますね。
 User friendlyにすると,どこかで限界が生じるし,たいしたプラスにならないので,そういうことはしません。ある程度のレベルを要求するなら,そうなり ます。コンピュータ言語にしたって,複雑なソフトを作るには,簡単な言語ではダメで,相応に勉強しないといけないでしょ?

〜どのような応用があるでしょうか。
 例えばゲノムデザインなど。E.coliなどを「家畜化」する試みなどでは,必須遺伝子のみを残し,余分な遺伝子はカットして,有用な蛋白を合 成するように効率的,効果的にデザインするなど,シミュレーションが力を発揮するでしょう。実験仮説を導き出すツールとしては,私はそういう使い方は考え ていない。シミュレーションはバイオロジーに貢献するというような主従関係ではなく,生命の本質を理解するための並列な武器です。実験系とコンピュータ系 両方の融合が必要です。(内藤先生:例えばシグナル伝達などで,組み合わせパターンとその確率をリストアップするようなツールは作れるでしょう)。

◆訪問を終えて

 「生命はインフォメーションである」「細胞の振る舞いを見る」「現在の生命科学は定性的である」「シミュレーションによって,生命をより深く理 解できる」  いずれも,オリジナリティにあふれ,示唆に富むいくつかの重要な視点である。今だ浸透していない意見かもしれないが,今後の生命科学を担う 世代として,肝に銘じておきたい言葉だ。これらの視点を得る事ができただけでも上々の成果である。

 一方で,シミュレーションそのものについては,まだまだ発展途上だと感じた。アルゴリズムの未熟さ,必要なデータの圧倒的な不足があり,シミュ レーションを組み立てる段階で発生するトラブルがいずれに起因するものかも見極めにくい。アウトプットも,物質濃度がグラフ化される程度のものである。同 時に,実験で証明されているものではないという点も今はまだ大きなネックとなっている。しかし近い将来,必ずシミュレーションが生命科学のメインとなる転 換点が訪れると考えられる。実験施設と情報科学施設が併設しているこの研究所は,最先端の研究を集中的に行える画期的な研究所ともいえるだろう。まさに, 「実験系とコンピュータ系両方の融合」を実践している施設である。


<総括>

 ポストゲノム時代の生命科学を考える,というテーマで始めたこの活動班では,今後のコンピュータの活用の重要性を認識し,最先端のバイオイン フォマティクス研究所を見学した。活動を通じて,生命をトータルで見るマクロな視点と同時に,細かに一つ一つを分析していく大切さを強く痛感した。激動の 時代に突入する生命科学と,その応用たる医学の世界で多大な貢献をするための,実に重要な知識と示唆を得た活動となった。


◆参考文献

○E-cell
Software environment for whole cell simulation. Tomita M et al. Bioinfomatics 15 72 1999
富田勝研究室 http://www.e-cell.org/
「ゲノム情報生物学」 富田勝 中山書店

○バイオインフォマティクス
Computing 2010: from black holes to biology   Declan Butler. Nature 1999 402 c67-c70
Swift action needed to close the skills gap in bioinformatics  Marlie MacLean, Colin Miles Nature 1999 401 10
Don't leave the biology out of bioinformatics  Peter Campbell Nature 1999 401 321
Finding the complete bioinformaticist  David Jones Nature 1999 401 841-842
Genome complexity, robustness and genetic interactions in digital organisms Richard, E.L. et al. Nature 1999 400 661-664
Exploring the Systems of Life  Dennis Normile Science 1999 284 80-81
ポストゲノム時代のバイオインフォマティクス(京都大学化学研究所)
 http://www.genome.ad.jp/Japanese/PGI/bioinfo.html

○ポストゲノムの生命科学
細胞工学 1月号 2001 20 (1)  ゲノム研究から見た21世紀の生命科学
実験医学 1月号 2001 19 (1)  新世紀医療をめざすゲノム医科学とバイオベンチャー
医学のあゆみ 1月13日発行 196 (2)  ゲノム生物学からポストゲノム医学へ 
ゲノムからの医学・生物学研究 小笠原 直毅 実験医学 1999 17 (19) 2512-2515
21世紀の医学をめぐって 豊島久真男他 最新医学 56 (1) 7-20
ヒトゲノムプロジェクトのこれまでのこれから 清水信義 最新医学 56 (1) 21-25

○プロテオミクス
何ができる? マススペクトロメトリー 谷口寿章 細胞工学 2001 20 (2) 241-249
脳のプロテオーム解析 磯辺俊明 ほか 細胞工学 2000 19 (11) 1678-1683
質量分析法の微量タンパク質構造解析への応用とプロテオーム解析 谷口寿章 実験医学 1999 17 (19) 2550-2554
ポストゲノム研究の扉を開くプロテオーム 次田晧他 細胞工学 2000 19 (7) 1054-1059, 19(8) 1234-1239
Genomics: Functional links between proteins   Andrej Sali Nature 1999 402 23-26
A combined algorithm for genome-wide prediction of protein function Edward M,Marcotte. et al. Nature 1999 402 83-86
A synthetic oscillatory network of transcriptional regulators  Michael B, Elowitz. et al. Nature 2000 403 335-338
A post-genomic challenge: learning to read patterns of protein synthesis   Alison Abbott Nature 1999 402 715-720

○SNPs
SNP解析が創薬・医療におよぼすインパクト 藤田芳司 実験医学 2000 18 (14) 1876-1880
機能ゲノム科学と創薬 野口照久 医学のあゆみ 2001 196 (6) 404-407
多因子遺伝病 羽田 明 Molecular Medicine 2000 37 (11) 1234-1239
HLAとポストゲノムシークエンシング   猪子英俊 Molecular Medicine 2000 37 (5) 504-516
ゲノム多様性解析による疾患感受性遺伝子のマッピング 田宮 元他  Molecular Medicine 2000 37 (5) 526-531

○DNAチップ・マイクロアレイ
マイクロアレイが知りたい!(連載)田中利男他 実験医学 2001 17 (6-15)
A heuristic graph comparison algorithm and its application to detect functionally related enzyme clusters  H, Ogata. et al. Nucleic Acids Res 2000 28 (20) 4021-4028
マイクロアレイの斜め読み(土門英司研究室) 
 http://infofarm.affrc.go.jp/ ̄domon/opinion/array2.htm
新規マクロアレイの評価と応用(郡司渉) 
 http://sutncs.ed.noda.sut.ac.jp/ ̄j8300613/reseach.html
久原哲研究室
 http://www.grt.kyushu-u.ac.jp/grt-docs/mogt/index.html
Statistical problems involving microarray data   
 http://www.stat.berkeley.edu/users/terry/zarray/Html/list.html


九大熱研HOME活動報告書2001年度情報医学班
Last modified on 2003/09/18
九州大学医学部熱帯医学研究会
tropical-adm@umin.ac.jp
Academic Society of Tropical Medicine Kyushu University
Copyright 1965-2007 All rights reserved.
DHTML Menu by Milonic