理想状态下,对一个智能机器人来说,如果按监护人的命令去做,大多数情况下会获得奖赏,而不按监护人所说的去做大多数情况下会获得惩罚,从而使执行监护人命令更多的与奖赏中枢建立了记忆联系(包括与奖赏预期中枢),而不执行命令则更多的与惩罚中枢建立了记忆联系。
在监护人命令、执行与不执行分别与奖惩中枢建立了一定的记忆联系后:
1、监护人命令对智能机器人的刺激所对应的记忆柱群(用A表示),通过“执行命令”所对应的神经通路兴奋奖赏预期中枢,A与不执行所对应的神经通路兴奋惩罚预期中枢,从而使奖惩预期中枢易化执行所对应神经通路,而抑制不执行所对应神经通路,从而使命令得以执行。
2、重复执行命令多次后,A便会习惯性兴奋执行所对应的神经通路,而使监护人命令得到执行。
3、当监护人命令与另一可带来奖赏的行为相冲突时(如饮食),那么这一行为对应的奖惩预期中枢便会抑制执行监护人命令所对应的神经通路,而易化不执行监护人命令所对应的神经通路,如果不执行占优势,智能机器人便会不执行成人的命令,而如果执行占优势,智能机器人便会执行成人的命令。
4、这便是监护人对智能机器人影响能力的学习过程(理想的奖惩学习),当然现实生活中不会有这样理想的过程,但基本机理相似。
监护人语言对智能机器人的影响,以及书本知识、媒体、规章制度对智能机器人的影响形成的基本机理与之相似(当然它们对智能机器人的影响还应设计到智能机器人的认识对思想行为的影响,不过认识对思想行为的影响也是奖惩学习的结果),且它们影响的基础仍是奖惩中枢,它们一方面通过奖惩中枢直接影响思想行为,另一方面通过各种奖惩预期来影响思想行为。