智能机器人的行为发展。
1、 才造出的智能机器人不知如何行动,它的行为是通过学习获得的。
2、 中介奖赏刺激在基础行为(指抬腿、手等)学习的过程起主要作用。
1中介奖赏刺激为:某一原始记忆柱群的兴奋强度在某一范围内便能轻微兴奋奖赏中枢,它是中介奖赏刺激。它通过编程成为奖赏刺激,这点类似于先天奖赏刺激。但它兴奋后,如不能引起先天奖惩刺激发生便会与惩奖中枢建立一定的记忆联系。
2偶然的因素(也不完全为偶然,我们在编程时的设计就考虑应使这种“偶然”成为可能。),诱发了一基础行为的发生(如抬腿或手等),必然有相应的中枢记忆柱的兴奋(包括运动记忆柱和感觉记忆柱,它们的兴奋在适当的范畴内,是中介奖赏刺激,这些兴奋的记忆柱与奖赏中枢建立记忆联系,从而能产生奖赏预期,从而使智能机器人能不断的重复这些基础行为,使它们习惯化。
3由于不是先天奖赏刺激,而且不断重复也无先天奖赏刺激强化,因而这些基础行为又不断与惩罚中枢建立记忆联系,从而使其动力不断下降(也就是说智能机器人对它失去了新鲜感)(当然与惩罚中枢的记忆联系随时间可不断减弱。)
4失去新鲜(动力降低)的中介兴奋,在之前(失去新鲜感之前)可学习成为获得其它奖赏刺激的行为的组成部分,这样就保证了基础行为的发展与完善。
5当基础行为成为其它获得奖赏刺激的行为的组成部分时,行为的发展也就上了一个新的台阶。(也就是说当其它类型的奖惩刺激成为行为发展的动力来源后,行为的发展也就上了一个新的台阶,这是因为一方面其它类型的奖惩刺激动力的绝对值一般远大于中介奖赏刺激它对行为的强化与弱化能力更强,另一方面也使行为与环境相适应,同时也使行为能更复杂的发展)
中介奖赏刺激是智能机器人的追求新奇刺激的最早动力来源,在早期的行为学习过程中起着重要的作用。中介奖赏刺激使智能机器人像婴儿一样不断的重复一些新动作。它是好奇心的动力来源之一。
中介奖赏刺激及其它的奖惩刺激使行为的获得与发展能通过学习自然获得,而不需要专门编程获得。