こんばんは、4年の織茂です。


先日、行動主義心理学を漁っていたらスキナーの「オペラント条件付け」というものを見つけました。

報酬や罰則で行動を変化させる方法で、強化学習でも利用されていますね。

イルカショーで例えると、イルカが特定の行動をしたらエサを与えることで、イルカに芸を覚えさせたりするやつですね。

教育も同じで、「抑制したい行動に対しては叱り、増進させたい行動に対しては褒めて、
ご褒美を与えることで、子供の行動を誘導している」と思われます。

 

生活における報酬と罰則とは、「快」と「不快」の刺激なのかもしれません。

その場合、「快」と「不快」の刺激を用意すれば、行動はコントロールできるということでしょうか。

自身の生活における「快」の刺激を考えた時、マズローの5段階欲求に出てくるものが挙げられると思います。

では、僕たちの「行動」はこれらの「欲求」によって誘導されているのでしょうか。

 

また、マズローの欲求はいずれも「より遺伝子の保存に繋がるもの」かつ「生まれながらに持っている普遍的な欲求」なのではないかと感じます。(承認欲求や自己実現も含め)

ということは、「私たちの”行動”というものは遺伝子によって誘導されているものが多いのでは?」と感じてしまいます。
(もちろん、行動には、その人が過ごしてきた環境や経験にも影響されると思いますが)

そうなると、「行動」とは、「意思や魂といった崇高なものによって引き起こされるもの」ではなく、「遺伝子によって定められた欲求によって誘導されるもの」なのかもしれません。

(欲求を満たすことを「報酬」とした時、環境や個体の差によって「報酬に至るまでの経路が変わり」、価値観や行動に差が出るのでは、と思いますが。「平和な地域では協調性があったほうがお腹を満たせることができ、紛争地域では攻撃的な方がお腹を満たせる。しかし、両者とも食事をしたいという根本的な欲求は同じ」といった感じでしょうか?あくまで例えであって一概には言えませんが。)

 

そして、AIには習得できない人間の特性として、よく「意思」が挙げられますが、この「意思」とは本当に生物だけの不可侵領域なのでしょうか?

意思っていうよりは、「遺伝子によって設計された欲求を利用し、環境に影響を受けつつ、学習した行動」の方が近い気がしてしまいます。

そう考えると、AIにも意思を持たせることはできそうですね。。

なんか癪に触ります。。。

 

遺伝子に畏怖しつつ、意思について悩む日曜日でした。

(この疑問を解決するためにも、次は認知科学?に触ってみようかな。。)

 

 

おわり

 

 

 

P.S.

プログラムが意思を持って考え、行動した場合に、初めてそれを「AI」と呼ぶのかもしれませんが。

世間のAIの定義ってすごく緩いですよね。

 

頭の中の殴り書き、失礼致しました。