结合人的学习发展,我想智能机器人的学习可大致分为三个阶段。而第一阶段最为重要。奖惩系统的学习是学习的核心,是最重要的。
一、基础学习阶段。
才制造出的智能机器人存在先天和中介奖惩刺激,在这些奖惩刺激的影响下形成各种相应的奖惩预期。
1、 有了简单的奖惩预期就会有简单的目的、简单的注意力分配,会产生基本行为的学习,最终使行为习惯化。如视觉的注意等。
2、 通过奖惩学习会形成基本与环境相适应的简单的注意习惯,注意又影响了记忆内容。
3、 形成与环境相适应的回忆习惯。
4、 由于推理设计到一些规则的记忆和比较高级的注意力的分配,开始时智能机器人应不具有推理的能力,只能进行一些简单的推理的记忆。
5、 早期更多的是普通性回忆及想像性回忆,状态性回忆需要奖惩系统发展到一定程度才会出现。
6、 认识对行为的影响处于发展初期。
通过奖惩学习会获得一些新的奖惩预期刺激,如监护人的面容、面部表情、一些语言,在这些基础上会逐渐获得另一些能力。(新的奖惩预期刺激的形成往往与一些能力的发展相互促进,如监护人的面部表情要成为奖惩预期刺激,首先需要具有视觉注意的能力。)
1、 行为的复杂。
2、 语言能力。
3、 模仿习惯、欲望、能力。
4、 进一步完善的注意习惯。
5、 逐步发展完善的想像性回忆、状态性回忆。
6、 对简单推理的记忆、应用。
7、 认识对行为的影响形成并不断完善,逐步形成现实判断体系。
这些发展为进一步的学习提供了基础。在交流与实践中形成对某些媒体内容的奖惩预期(不同媒体可有不同的标志对象被注意,作为奖惩预期刺激)
二、媒体学习阶段,类似于人的学校学习。
在这个阶段获得知识的同时,奖惩系统、能力也不断发展完善。为下一步的工作提供角色培养。
三、工作学习。
为社会创造价值的阶段。