タイトル:脳における予測と文脈生成 講  師:銅谷賢治 レポータ:森川幸治・妻藤公啓 川人さんの方から総合的な話をしていただきましたが、私の方からは簡単な補足 をします。本日の一番の山場は、この後の石井先生、佐藤先生による講義で、予 測とは何かを体にたたきこもうという講義ですので、そのための時間をなるべく 確保しようと思います。 ○スクールのねらい  私のほうからは、今回のこのようなプログラムになった経緯を説明します。川 人さんから十分説明されていますが、脳の情報処理というのは古典的には視覚だっ たらRetinaから一次視覚野、二次視覚野、さらに高次の処理というように一方向 的に考えられていましたが、そうではないことがいろんな実験からわかってきて いて、その文脈依存性というのが重要だと言われています。では、その文脈とい うのはいったいどこから来るかというのは非常に大きな謎です。これは天下り的 に神様が与えてくださるわけではないはずで、ボトムアップ的にいろんなものを 予測していく部分と、それをもとにしてさらに入力の処理の仕方を変えていくと いう、相互作用的な働きがあるのではないか、という可能性が考えられます。そ う考えたときに、数学的にもそういった構造がいろんなところに出てきます。実 際にこの後の石井先生、佐藤先生の話の中では、例えばカルマンフィルタなども あるし、 3日後の講義のRajesh Raoさんの講義でも、そういうものが脳のモデル になるという話があると思います。そこで、予測ということを一つのキーワード として、脳のいろんな場所の情報処理のメカニズムを探ってみようというのが、 川人さん、ディレクターの人達とも知恵を寄せ合って作ったこのプログラムなわ けです。 ○小脳・基底核・大脳皮質の役割分担  私自身この数年、脳のグローバルなレベルでの機能分担について考えてきてい ます。古典的に言われるのは、大脳皮質の後ろの方は感覚処理をしていて、前か ら真中の方は運動処理をしていて、一番前の方は、認知的な高次の処理をしてい るというのが、Traditionalな考え方です。小脳とか大脳基底核は運動に関わっ ているというのが、教科書にも書いてあるようなことです。例えば小脳の病気で 複数の微妙な体の動きがコントロールできなくなるとか、大脳基底核の病気、例 えばパーキンソン病でだと、運動が正しくおこせなくなる。この結果として手足 が震えてしまうという、という症状がでると言われています。最近のいろんな実 験結果、特にそのPETとかfMRIとかを使った人間での脳活動計測の結果からは、 初めは言葉や言語に関する認知課題ををやらせたら大脳皮質の言語野が活動する だろうとか想定するわけですが、必ずしもそうではない。例えば小脳の方に活動 が見られることなどがわかってきたわけです。しかも、それだけではなくて解剖 学的にも妥当であることがわかってきました。 ○小脳・基底核から前頭前野への出力  昔は小脳とか大脳基底核というのは、主に運動野と結合があると言われていた わけですが、ところが最近、解剖学のテクニックが発達してきて、より細かいこ とがわかるようになってくると必ずしもそうではない、ということがわかってき ました。これは、Peter Strickのグループがやっている実験です。大脳皮質のあ る部分にウィルスを注入するわけですが、このウィルスはここに来ている神経の 末端から感染して、軸索をさかのぼって伝染していいきます。さらにまた次の神 経に感染してさかのぼるという形で、神経連絡を一段だけでなく複数段トレース することができるようになります。そうすると、小脳とか基底核というのは視床 を介して大脳皮質とつながっているわけですが、大脳前頭前野の46野と呼ばれて いる、一般には視覚の作業記憶などの認知処理に関わっているといわれている場 所に小脳や大脳基底核から信号が行っているかどうかが調べられるわけです。そ れをやってみると実際に小脳の出力部位である歯状核や、大脳基底核の出力部で ある淡蒼球にも感染した細胞が見られるました。つまり、小脳と大脳基底核は、 必ずしも運動野だけではなく、前頭前野にも出力を送っていることが証明された のです。また別の実験で小脳は、空間の認知や注意とかにかかわる頭頂にも出力 を送っていることがわかりました。また大脳基底核のほうは、側頭葉の方にも出 力を送っていることが明らかになりました。このように小脳や大脳基底核は、必 ずしも運動そのものではなくて、空間処理とか視覚イメージの操作とかに関わっ ていることが示唆されてきています。そうすると昔は大脳皮質がやっているとさ れていたことが、小脳も関わってくる、大脳基底核も関わってくることがわかっ てきました。そうするとそれぞれの違いは何かが却ってわかりにくくなってしま うことがあります。 ○運動の想像と小脳  これは小脳の役割は運動そのものだけではないという脳活動イメージングの例 で、実際に指を運動させたときはこのあたりが活動するのですが、指の運動を想 像して本当は指を動かさない場合でも小脳の一部が活動するということが示され ています。 ○視覚的注意と小脳  さらに視覚関連で言うと、このような図形がどんどん提示されるときに、赤い 四角が何回出てきたかを数えるといった活動をしたときも、やはり小脳が活動す ると言われています。 ○基底核と確率的予測  これは大脳基底核の方で、一種のパターン識別といえるかもしれませんが、ラ ンダムな図形パターンを見て、その結果、明日は晴れるとか明日は雨が降るといっ た規則を学習させるわけです。記憶障害の人は普通の人と同じぐらい学習できる のですが、大脳基底核の病気であるパーキンソン病の人は、非常に悪いという結 果です。 ○中脳ドーパミン細胞の報酬予測  大脳基底核というのは中脳のドーパミン細胞の投射を非常に強く受けることに 特徴があるわけですが、そのドーパミン細胞の活動を測ったスイスのSchultzの グループの実験で非常に面白いことがわかってきました。ドーパミン細胞は報酬、 例えばえさとか水とかに応答することは以前から知られていて、例えばサルに何 も学習させていないときに、ジュースを与えると反応するわけです。ところが、 ライトがついてしばらくしてからレバーをちゃんと押すと、ジュースがもらえる ということを学習させた後には、もともとはジュースをもらった時点で反応して いたのが、そのようには反応せずに、ライトが点いた時点ですでに反応するよう になってしまいます。つまりこの細胞は、報酬そのものではなく、報酬を予測す ることに対して応答していて、予測されきっている報酬に対しては応答しなくなっ ていると見ることができます。そういうわけで大脳基底核の一部であるドーパミ ン細胞も、運動そのものというよりは、報酬の予測に関わっているのではないか と言われて始めてきたわけです。 ○学習の3つの基本的な枠組み  このようにいろんな種類の実験のデータを手がかりに、運動だけではない小脳 や大脳基底核の役割は何なのかということを考えてみたわけです。これはニュー ラルネットワークの学習理論などで使う、学習の3つの基本的な枠組みです。教 師付き学習というのは入力が入ってきて、それに対して出力を出したときに、正 しい出力はこれですよという教師信号があって、それとの誤差信号を使って学習 させます。強化学習は、具体的な教師信号は与えられないけれども、今の出力が 良かったか悪かったかというスカラー値の信号を与えられる。それをもとに、自 分の入出力写像、行動の仕組みを学習させる枠組みです。さらに教師無し学習に なると何をしろとは何も言われません。しかし入力信号をつぶさに観察すると、 これがランダムノイズであればどうしようもないわけですが、普通は何らかの環 境から来た信号は何らかの構造を持っているわけです。例えば信号がいくつかあ るところにグループ上に分布しているとか、ある方向に軸が非常に伸びているな どの構造があるわけです。それを見つけることによって、入力信号をグループ分 けしたりとか、いくつかの独立な成分に分類したりするのが教師無し学習です。 こういった学習のフレームワークが実は、脳の大脳皮質と小脳と大脳基底核を特 徴付ける一番重要なものなのではないかと考えてみたわけです。 ○Cerebellum - Supervised Learning  小脳に関しては明日非常に詳しくお話があると思いますが、下オリーブ核とい うところから小脳に向かってくる線維が、運動などの誤差をコードしているらし い、しかもそれに応じた形で、小脳の出力細胞であるプルキンエ細胞のシナプス 伝達効率が変わるということが知られているわけです。それを使うと誤差を最小 化するような入出力写像を与えるような学習ができるはずだということは、最初 はMarrやAlbusが提案し、実験的も伊藤正男先生、最近は川人さん、北澤先生な どの実験と解析によりサポートがどんどん入ってきています。そいういった教師 付き学習の枠組みは川人さんの話にあったように環境のモデルを作ったり、ある いは環境の逆モデル、一種のコントローラを学習することにも使えるわけです。 しかし、われわれの行動がすべて教師付き学習で説明できるかというと、ある種 の合目的的な行動を形作ろうという場合にはこれだけではだめなわけです。 ○Basal Ganglia - Reinforcement Learning  その場合使うのが強化学習というもので、ある行動をやった結果、自分の思い 通りの成果が得られたかどうかという、結果の評価をもとに自分自身の行動の仕 方を改善していこうというわけです。先ほど説明しましたような報酬の予測のメ カニズムは強化学習の理論の中では非常に重要な要素になってきます。それはあ さって、小池さんと鮫島さんの方から話があると思いますが、そういった報酬の 予測に基づいて自分の出力を変えていくというわけです。実際に大脳基底核には 報酬に依存するような振る舞いというのはドーパミン細胞だけではありません。 彦坂先生の話にもありますが、大脳基底核の中で眼球運動の方向を示していると いわれていたニューロンの特性が、実は報酬の予測に大きく依存しているという ことが示されています。そう言う意味で、大脳基底核というのは報酬の予測に基 づいて現在の感覚情報を取り入れて、望ましい運動を選んでいくという役割を担っ ているのではないかということが強く示唆されているわけです。 ○Cerebral Cortex - Unsupervised Learning  私自身は川人さんのグループに5年ぐらい前に入って、川人さんは小脳をやろ う、私は大脳基底核をやろうということで、小脳と大脳基底核ということをテー マにしてきたわけですが、解剖学的には小脳と大脳基底核の間には直接の結合は ないわけです。もし、小脳と大脳基底核が相互作用をするとすると大脳皮質を介 さなければいけないわけです。実際、この後で話をしますが、強化学習をやらせ る場合にも、ごく素朴な強化学習よりも予測モデルを使った強化学習の方が非常 に効率良く学習も制御もできるということがわかっているので、その間の相互連 絡が必要だろうと考えられます。初めは私にとっての大脳皮質は大脳基底核と小 脳を結ぶ一本の線でしかなかったわけですが、やはり大脳皮質が線というのはお かしいということで大脳皮質の役割を考えているところですが、情報表現という のは何をやる上でも非常に重要なわけです。感覚情報をどう表現するか、運動情 報をどう表現するか。例えば、我々の感覚器、例えば視覚にしても体性感覚にし ても非常に多くのセンサがあって、生の情報をそのまま使うようでは学習の効率 が非常に悪いものになってしまいます。それをうまく整理して、特徴ある成分を 抽出した上で、強化学習や教師付き学習などによる内部モデルの獲得をやらない と現実的にはうまく進まないだろうと思われるわけです。そう言う意味で感覚情 報などの特徴抽出と大脳皮質のモデルには長い歴史があります。70年代の初めに Malusburgとか甘利先生が、視覚野の細胞の特徴抽出がいかにできるかというこ とでパイオニア的な仕事をされています。最近では、手を変え品を変えて、独立 成分分析(Independent Component Analisis)やSparce Codingという形でいろい ろやられていますが、基本的にはHebb型の学習と全体をRegulateするような双方 向のダイナミクスというものを使って学習ができることが示されているわけです。 ○学習アルゴリズムによる専門化  このような多くの実験結果と数理モデルをあわせて考えると、次のような可能 性が浮かび上がってきます。小脳というのは下オリーブ核から来る誤差信号をも とにした教師付き学習をメインにやっているのではないか、大脳基底核というの は黒質からのドーパミン性の報酬予測入力を使った強化学習をやっているのでは ないか、大脳皮質というのは必ずしも特定の教師信号というものはないけれども シナプス可塑性と皮質間あるいは皮質内部のダイナミクスを使った教師無しの学 習、それによって感覚情報とか運動情報とかのよりよい表現というものを作って いくという形で機能しているのではないかと考えられるわけです。 ○学習モジュールの機能分担と統合  今回のスクールの中4日間のうち、初日は小脳におけるダイナミクスあるいは 情報の予測ということをメインに理論と実験の両方からの話をお願いしています。 2日目は報酬の予測ということで、主に大脳基底核を中心に話をしていただきま す。大脳皮質には非常に多数の領野があってそれらの間に相互結合があって深い 階層を持ったシステムを構成しているわけですが、統計的予測とさらにそれを階 層化したときの予測ということを3日目、4日間のテーマとして設定しています。 ○Learning to stand up  最後に強化学習の具体例の話をします。これは、強化学習とはこういうものだ というのつかんでもらうのにとても適しているのでよく使っているビデオですが、 起き上がり運動を学習するロボットの実験を、この数年間森本君と一緒にやって きています。基本的にはロボットにどうやったらいいですよということは教えな いで、頭の位置が地面からどれだけ高く上がったか、ということを報酬として、 強化学習によりそれが実行できるようなコントローラの学習をさせます。単純に すぐ頭を上げるということでは直立状態には辿り着かなくて、それに至る途中の 状態で、どれくらいうまくいっているか、あるいは転びそうなまずい状態なのか という状態の評価を学習し、その状態の評価をもとに行動の仕方を学習するわけ です。 ○Learning to stand up (Movie)  最初はシミュレーションから始めましたが、最近は実物でやっています。こ ういうよにはじめは訳もわからずにどたばた動いている。それがシミュレーショ ンで数百回、さらに実物にしてから100回ぐらい学習させると、起き上がり運動 が学習されるわけです。 ○強化学習における予測  このように強化学習を実際のロボットの行動学習にも使おうとして実験をやっ ていると、やはり単純な強化学習だけでは非常に弱く、さらにいくつかの要素を 組み合わせ行くことではじめて、複雑な力学形での学習が現実的な時間内ででき るようになるということがわかって来ます。ひとつは、状態の評価をだけではな くて、ある行動を取ったらどういうことになるかという状態変化を予測するとい う要素です。これを使って予測した状態がどれぐらい報酬に結びつくかというこ とを予測するというメカニズムを使うと強化学習の学習の効率が非常に良くなり ます。動物とか人間の行動全体というものは一種のゴールを達成するための強化 学習の枠組みで捉えられるわけですが、その中でもある状態でこの行動を取った ら結果はこうなりますとう予測モデルを、教師付き学習の形で獲得していくこと が必要になるわけです。もうひとつ、数式的には単にsとかaとか書いてある"状 態"や"行動"といったものを、実際どのように決めるかということです。センサ 情報というのは非常に冗長性があると同時に多くの欠落した部分を持っていて、 そういったものを補っていくことが非常に重要な要素になってきます。それがう まくできないとなかなか現実問題として学習系を組むことができない。そのため に、入力情報の特徴を捉える表現を教師付き学習で与える大脳皮質のメカニズム が非常に重要になってくるのではないかと思います。また、先ほどの起立運動の 成功例というのは、最初からいきなりセンサー値を読んでモータへ出力を送ると いうのではなく、階層構造を用意して、上のレベルでは大雑把な姿勢の系列を考 えて、下のレベルでは細かいトルクのパターンを計算することをやっています。 こういったモジュール化・階層化のメカニズムが必要になってきます。このよう に、現実的に動くシステムを作っていく中で、いろんな学習要素がどう組合され なければいけないかということがわかってきます。そういった観点から、先ほど 見せたようなダイナミクスの予測、報酬の予測、あるいは統計的な予測による表 現の獲得といったものをどう組合せていくかを理解していくことが、脳の全体と しての働きを知る上で非常に重要なのではないかと思っています。今回のスクー ルでは、日ごとにそれぞれ切り分けて話をしていきますが、それらをどう組合せ るかということもこれから是非考えていく必要があると思っています。 ○複数の予測モデルによるモジュラー制御  最後に、状態の予測器がどのようにありがたいかという具体例として、複数の 予測モデルによるモジュール制御について紹介します。さっきのロボットもそう ですが、人間の腕にしても体にしても、非常に非線型が強いので、単一のコント ローラですべてのことをやらせようというのは非常に難しいわけです。そこでや ろうとしているのは、個々のコントローラは線型で定常なんだけど、それをうま く切り換えることで非線型、非定常な制御課題がきちんとできるようにしようと いうことです。そこで一番問題になるのは、必要なときに必要なモジュールをい かにどう選ぶかということです。一つの解決方法は、中央集権的な司令塔がすべ てを知っていて、今はあなた、次はあなた、とモジュールの選択を指令するとい うものですが、ではその司令塔自身をどう学習させるかというのが非常に難しい 問題なわけです。そこでモジュール選択をある程度ボトムアップ的に行うための メカニズムとして最近考えているのが、予測モデルを使った状況の切り分けです。 この方式では、個々のモジュールというのは線形で定常な予測モデルしか持たな いわけです。だから個々のモデルがきちんと予測ができるのは非線型システムの ある動作点のまわりとか、パラメータの変わるシステムのある一局面だけ、例え ば車の運転では雨の日と晴れの日ではパラメータが違うわけですが、晴れの日だ けちゃんと予測できる、といった感じのものです。それを使ってみんなで、よー いどんで予測させるわけです。予測したモデルのうち、現在の環境の状態変化を 一番正しく予測したモデルが勝ち残る。そのモジュールを選択して、その予測器 に対応するコントローラを使うことで、その予測器が予測する状況のもとでは良 く働く制御器が選ばれるという形で、全体としては複雑な制御課題を比較的単純 な問題に分割して制御しようというということを行います。ここでは"選ぶ"と言 いましたが、実際には予測誤差のガウス関数を正規化したもの、いわゆる Softmax関数というものを使ってアナログ的に重み付けをして、それがだんだん とデジタル的な重み付けに変わっていくようにしています。 ○'Acrobot'の振り上げ学習  これは複数の予測モデルがどのように働くかを示す例で、非常に非線型性が強 い鉄棒運動のロボットで、ぶら下がっているとか上にいる状態とかを4つの局所 設計モジュールを使って動きを予測して、その予測をもとに今どれが担当すべき かを決めていく。 ○振り上げ制御例  (動画を見ながら)色の変化で担当するモジュールを表していますが、非常に 非線型性が強い制御システムでモジュールの切り替わる様子が見て取れると思い ます。これは一つの例で、このように予測モデルをうまく使うと単純な強化学習 ではとてもできないような複雑な制御ができる可能性があることを示しています。 以上、このスクールのカリキュラムがどのようなモチベーションでできて来たか を伝えたかったわけです。ダイナミクスの予測、報酬の予測と統計的な予測が、 どのように組み合わされて脳の各部位でどう処理されているかということをこの スクール全体で考えていきたいわけです。 以上です。質問などありませんか。 Q ボストン大学の渡辺です。先ほどUnsupervised Learningが大脳皮質、 Supervised Learningが小脳という考えを示されたわけですが、Unsupervised Learningが大脳皮質で起こっていると考えられる根拠をお聞かせ願えればと思い ます。と申しますのは、実験的な場面において、MITのTommy Poggioらのグルー プがSupervised LearningとUnsupervised Learningに関して、実験とモデルをど う統合するかを考えたときにResponse Feedbackというものを提案していまして、 それはどういうものかというと、例えばPsychophysicsである実験をやった場合 に、Taskに対して反応して、その反応が正しいか正しくないかを示すのが Response Feedbackというのですが、これはある種のSupervised Learningの Signalではないかと考えられるわけです。その場合、Perceptual Learningは確 かにResponse Feedbackがなくても成立するのですが、Response Feedbackがある と相当能率良くLearningが形成されることが最近わかってきています。 Perceptual Learningは実は視覚第1野もぁwVぁw@wNは第2野が相当関与する こと がわかっているのですが、そうしますと、これは一つの仮説ですがSupervised Learningには大脳皮質がかなり関与していることが考えられるのではないかと思 いますが、そのあたりはどのようにお考えでしょうか? ようするに私が言いた いことはSupervised Learningはここで、Unsupervised Learningはここであると いった考え方をおっしゃいましたが、果たしてそうなのでしょうか? A 実は教師付き学習と教師なし学習は便宜的な分け方でもあるわけです。教師付 き学習というのは入力xに対して出力yが出ることを学習するのですが、その代わ りに入力xと出力yの組を覚えてしまおうとして、それを入力としてしまえば教師 信号は特にないので、教師なし学習にもなる。といった形で教師付き学習の枠組 みを教師なし学習の一般的な枠組みに置き換えることができるので、その境界と いうのは必ずしも厳密に分かれているわけではありません。一つの解釈としては、 もともと何も手がかりがなく入力信号だけから分類をしなければならないとする と、例えば2つのカテゴリーがあってもふたつの分布は非常に隣接していて分離 しにくい。それが、フィードバックがあると、その軸の方向に分布がきれいに分 離されるということになると、仮に同じ教師なし学習を使っていたとしても、効 率良く学習されるという可能性があると思います。しかし、おっしゃる通り、大 脳皮質においても何らかの誤差信号を伝えるメカニズムがないとは完全には言いき れないので、実験データを見て詳しく考える必要があると思います。 Q ドーパミンが強化学習に使われるとおっしゃっいましたが、前頭前野にもドー パミンが投射されていて、ワーキングメモリとの関連で重要だという説もあるの ですが、前頭前野でのドーパミンの働きは強化学習的なものなのでしょうか? A 大脳基底核のドーパミンは行動自体の選択に関わってくると思われますが、大 脳皮質のドーパミンが何をしているかということに関しては、行動の強化に使わ れているか、あるいは感覚信号の重み付けに使われているという可能性もありま す。報酬の予測に関わる入力信号は行動上も重要な信号であるわけで、それは脳 でもしっかり表現して、すぐに忘れないように短期記憶に保持しておくというこ とが必要になってくるわけです。私達の先ほどのロボットの実験では、感覚信号 を表現する時に、基底核の強化学習モデルではドーパミン細胞の活動に対応する、 報酬予測の時間変化の信号を使って重み付けをしてます。将来の報酬に全然関係 ないような状況は非常に大雑把に表現しておいて、報酬の予測信号が強く変化す るようなものに関しては細かく状態変数を設定することをやっているわけです。 一つの可能性として、感覚信号をすべて同じに扱うのではなく、行動上の有用性 に応じて重み付けして表現するために大脳皮質ではドーパミン新語が使われてい る、というのが私のSpeculationです。 Q 小脳の教師信号は脳が作るのでしょうか? A 環境が作る場合と脳が作る場合があると思います。例えば視覚ターゲットを追 いかけるタスクでは、網膜の上でのターゲットの動きという情報が直接誤差信号 になります。ただし場合によっては、脳の中で小脳の出力と別の信号との引き算 をしてやって、自分で誤差信号を計算することが必要になります。例えば、明日 フィードバック誤差学習の紹介があると思いますが、そこでやられていることは もともとは感覚信号の誤差でしかないものを一種の体の近似モデルを作って運動 信号の誤差に変換するということがされていると想定しています。この場合は脳 の中で特定の学習に必要な誤差信号そのものを計算するというプロセスが働いて いると考えられます。 Q 一番最初のところで、PrefrontalとDentate nucleusの間の結合があるとありま したが、そのようなSubCortical RegionとCortical Regionの間の結合は Cerberal Cortexの場所に依存しているものなのか、それともまんべんなく Projectionが広がっているのかについてどのようにお考えですか A 最近の解剖学の結果というのは、小脳のここと大脳皮質のここと、大脳基底核 のここと大脳皮質のこことというようにかなりSpecificにつながっていると言わ れています。実際、小脳とか大脳基底核のごく一部が壊れた患者さんでは、そこ から投射している大脳皮質の障害と非常に似た症状が見られます。 Q 大脳皮質のある一部分と小脳とは結合していないとか、大脳基底核とは結合し ていない領域というのはあるのでしょうか? A 小脳や大脳基底核に向かっていく方は、大脳皮質の広範な部位から入っていま すが、出力は特定のところに行っています。小脳とか大脳基底核の投射先は主に 前頭葉で、感覚野には比較的少なく、一次感覚野には出力を送っていないと言わ れています。また両方から投射が来ていても、例えば補足運動野というところに は、大脳基底核は強く投射していますが、小脳からの入力は弱いといった強弱の めりはりはあります。 Q 小脳と大脳基底核の出力は大脳皮質で混ざっているだろうとおっしゃっいまし たが、両方とも先に視床を通りますが、その間で混ざることはないのですか? A 視床のレベルではかなり別れていると解剖学的に言われています。 Q 疾患から得られているデータと、こういう所見と矛盾していないかどうかとい う点において、例えばパーキンソン病ではドーパミンを投与すると押さえること ができるのですが、そのようなことも矛盾なく説明することができますか? A パーキンソン病において運動障害がなぜ起こってくるかということですね。私 がした話というのは報酬をもとにして行動を組み立てるほうの話で、パーキンソ ン病の場合に、報酬予測がおかしくなるという例も最近でてきていますが、一番 良く知られているのは運動障害です。それをきちんと説明するという点ではこの モデルはまだ不十分だと思います。ドーパミン系が弱まってしまうというのは、 報酬予測の部分だけではなく、大脳基底核の回路自体の動作点が非常におかしい ところに行ってしまって、正常な動作ができなくなっている側面もあるわけです。 そういう意味で、運動の実行と抑制のバランスを保つという部分をドーパミンは 担っていると言われているわけですが、その部分と報酬予測の役割とを統一的に 説明するような理論にしようとは思っていますが、今のところはまだきちんとし たものはできていないです。