加载中!
时 间 记 忆
<<  < 2008 - >  >>
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
最 新 评 论
加载中!
专 题 分 类
加载中!
最 新 日 志
加载中!
最 新 留 言
加载中!
搜 索
用 户 登 录
加载中!
友 情 连 接
博 客 信 息
加载中!


 
 
补充说明
[ 2008-3-14 22:10:00 | By: chenghw ]
 

《奖惩中枢与学习》、《生存与情绪》、《生存与注意力》、《奖惩系统的学习与发展》这几篇文章分别讨论了学习、情绪、注意力、奖惩系统的学习与发展,有的虽然不是直接针对智能软件的,但从别一方面讨论了智能软件的学习理论、情绪、注意力等问题。它们可以做为《智能软件的编写》这篇文章的补充。

下面是在这些文章的基础上所做的进一步讨论,也是对前面blog的总结。

一、智能软件的高级结构与功能

智能软件的高级中枢主要包括:一个主注意目的中枢、动力(奖惩)中枢(它包含动力预期中枢)、注意力分配中枢、亚主注意对象中枢,就能表达所有的思想行为。它们的核心是动力中枢。

1、              主注意目的的改变是预期动力的作用,预期到某一对象出现后与现有目的相比对动力中枢的兴奋能力更强,使这一对象出现便会成为主注意目的。预期到某一对象出现后主注意目的或阶段主注意目的能实现,则使这一对象出现成为阶段主注意目的,它的动力根据主注意目的或前一阶段主注意目的的动力来分配。预期动力大于一定的值而又不能成为当前的主注意目的或阶段主注意目的,则成为对应的亚主注意对象。注意力的分配根据预期动力大小的绝对值来分配。用编程实现这些功能从理论上来说很容易,我就不详述了。

2、              对象刺激后产生的预期动力的绝对值越大,则对象被分配的注意力越多。应激神经中枢兴奋的特点是当预期到能给我们带来强烈奖惩的事件时,注意力高度集中于与之相关对象,因而应激中枢应是动力预期中枢与注意力分配中枢。

3、              状态性回忆(兴奋)的实现。阶段主注意目的对象、各个亚主注意对象按预期动力的大小来分配注意力,从而在这些对象的易化下完成回忆,其特点是谁分配的注意力越多,它对与之建立有记忆联系的记忆柱的易化的能力越强。普通回忆是各个注意及亚注意对象都均等的分配了注意力,一般情况下任何一个对象都无法单独触发回忆,而想像回忆的情况是一个对象分配了大部分注意力,这一个对象就能触发回忆。智能软件(或小孩)进行普通回忆与想像回忆是长期奖惩学习的结果,因为进行一种类型的回忆时,如果注意力分配错误多数情况下无法正确回忆,这样会形成无法完成目的的奖惩预期,从而使这种注意力分配模式被淘汰。那么再次回忆时不同对象对预期中枢的兴奋能力会发生变化,而使注意力会重新发生分配,多次回忆后最终会产生正确的注意力分配,在注意力正确分配的情况下一般会产生正确的回忆,在奖惩中枢的参与下这种分配模式被选择,最终成为习惯。

二、             智能软件的奖惩(动力)中枢、奖惩学习

奖惩中枢对思想行为的影响主要通过两方面:

  1、在实现目的的过程中或实现目的后获得奖赏刺激能强化记忆,相反则弱化记忆,奖惩越强则强化或弱化越强。同时获得的奖惩越强,对象获得的注意力越多,记忆柱的兴奋超强,则思想行为之间记忆联系的越强。(目的完成自然获得奖赏,相反获得惩罚)

  2、通过奖惩预期中枢只使那些更能兴奋奖赏预期中枢的思想、行为被选择。

奖惩学习的影响

  1、对于一群能兴奋奖惩预期中枢的对象,我们应选择那个做为主注意目的或阶段主注意目的的能力是通过学习获得。

  2、在注意时应习惯性注意什么是学习获得。回忆时什么情况下回忆什么……等等。总之大脑的高级功能是奖惩学习的结果。

3、各种认识对行为的影响 是奖惩学习的结果。

三、智能机器人的奖惩系统

将下面的人换成智能机器人,神经通路换成记忆柱群便是智能机器人的奖惩系统。

奖惩中枢、先天奖惩刺激、与奖惩中枢存在一定强度记忆联系的神经通路共同组成的系统我们称为奖惩系统,它的发展状态通过各种对行为产生影响的刺激或认识反应出来,这些刺激和认识包括对错、好坏判断,成人语言,书本知识、媒体等。

研究奖惩系统的发展变化规律意义重大。

心理学的潜意识(可认为是早期的奖惩体验带来的奖惩联系的习惯化的结果)、自我、本我、特质(遗传限制下,奖惩中枢影响下选择形成的神经兴奋习惯的集合)等都能用奖惩系统学习理论结合神经兴奋习惯形成的原理容易的解释。

通过上面的讨论可知如果要弄清道德、文化、规章制度如何对人产生影响及影响是如何形成的,同时弄清如何让人通过学习形成对它们适当的反应,就必须研究奖惩系统的发展变化规律。

四、智能机器人学习的基础

一个刺激如果不带来一定的奖惩预期,智能机器人便不会对这一刺激做出进一步的反应,只有带来一定的奖惩预期,它才会通过这一刺激产生目的、习惯。才会对刺激做出进一步的反应(目的反应、习惯反应)这是它与环境(包括监护人)进行信息交流的基础。

如果它的奖惩系统出了问题便无法进行正常的信息交流,也就无法正常学习各种能力。

人类的孤独症很明显是奖惩系统出了问题,当然也就无法正常的进行信息交流、学习。当然如果智能机器人的奖惩系统设置失当也可能会产生孤独症。

五、注意力的分配与预期动力的关系

注意力的分配主要根据预期动力大小来分配,如总注意力是1、而目的下二个亚主注意对象及一个主注意对象由主注意对象进行回忆时,有2个亚主注意对象,如果它们的预期动力分别是:两亚A2/3A、主3/2A,则1+2/3+3/2=19/6,分配的注意力为:6/194/199/19,则易化能力……。一般情况下注意力中枢对记忆柱的易化远大于记忆柱之间的易化兴奋能力。不管是主注意目的对象,还是亚主注意目的对象,其预期动力都会随时间的发展而衰减。

与环境相适应的状态性兴奋能力是不断发展的。

六、状态兴奋

某一刻大脑的兴奋,是由前一刻大脑的兴奋(易化)状态诱发,兴奋状态包括主注意对象兴奋产生的易化,亚主注意对象产生的易化,它等同于主注意对象的兴奋及各个亚主注意对象的兴奋分别乘于所分配的注意力的比值,而产生的易化的叠加,也被我称为状态兴奋。

我在对象的识别中将论述,这种兴奋模式(状态兴奋)能使智能机器人区分任一两个不同的对象(前提是它们的差别能被感知),也就是兴奋状态具有特异性,这种特异性使一个能诱发推理的兴奋状态,不会意外诱发想像。

兴奋状态又具有非特异性,这是因为任何兴奋都是模糊兴奋,也就是说两个兴奋状态只要组成它们的对象中有一个对象相似便可能诱发相同的兴奋,这种兴奋特点是想像推理及其它高级功能的基础……。没有模糊兴奋我们不可能做到举一反三。如果一个状态兴奋诱发了想像带来奖赏,那么与之相似的状态兴奋都可能诱发想像,其中只有能带来奖赏的状态兴奋被奖惩中枢选择。

七、对象的识别(智能软件)

在解决任何从没有处理过的问题时,都会产生解决这个问题的目的(除非多次解决这个问题后,解决它成为习惯性兴奋)

  对象的识别。

  1、两个对象相差太大,一次注意就能识别。

  2、两个对象相似,一次注意不能识别,需再次注意到它们的不同之处才能识别,两个不同的对象虽相似,但总有不同的地方。对一种类型的对象多次正确识别后会形成识别习惯。

  3、在注意的过程中可能出现的回忆干扰。

  比如对一组信号的注意,在A显示后,B显示,会出现奖励物质,或在A显示后,D显示,会出现奖励物质,而在B出现后A出现或A显示后B不出现,都不出现奖励物质,由于是状态兴奋及并行兴奋,及它们都是由ABD易化,因而可能产生回忆干扰,而无法区分两组信号,这种情况可以采取:

  1'认识到第N次注意对解决问题更有帮助,从而使在解决这一问题的目的下第N次注意更能兴奋奖惩预期中枢,而被分配分配更多的注意力,对ABBA情况来说,如果第一次信号被分配的注意力更多,如:对AB来说注意力的分配为3/2AB,而对BA来说注意力的分配为3/2BA,这样这两组信号之间的兴奋差异就非常明显了。

  2'或者在注意时引入新的注意对象作为中介,这些新的注意对象不会或很少发生回忆干扰,这样回忆的每个过程就很少发生回忆干扰,比如在ABBAAD等注意顺序时引入其它的时空或对象信息与它们建立联系,如AB出现时位于某空间,而其它的在不同的地方,回忆时由刺激(AB等)回忆起它们的空间位置(或其它对象),然后以回忆的新对象来回忆结果,这样由于每个过程都很少有回忆干扰那么整个过程便也会很少发生干扰。

  以上的讨论说明了我们可以通过多次注意后的状态性兴奋来区分任一两个不同的对象。对于1'2'两种情况,第一次通过这种策略完成任务后,这种策略在目的下便与奖惩预期中枢建立了记忆联系。第二次再碰到类似情况后(所谓类似就是有部分共同的神经通路兴奋),由这部分共同的神经通路在目的下会回忆起这种策略从而又执行这种策略,最终会成为习惯。

八、智能机器人的回忆、想像

1、一般性回忆(普通回忆):

  多个重要的注意对象都基本均分了注意力,任一个对象所分配的注意力不能单独触发兴奋,也就是回忆。(在目的对象参与下这些对象对奖惩预期中枢的易化兴奋能力相似,即对完成目的影响相似,所以分配的注意力差不多)

  2、想像性回忆:

多个重要的注意对象没能基本均分注意力(如果均分无法完成回忆),其中一个或部分对象分配了大部分注意力,由它便能触发回忆,而且没参与触发回忆的对象成为回忆的亚注意对象,在适当的回忆状态下被习惯性的或有意的参与随后的回忆诱发。比如回忆一匹马是否在一间房内跑过,马、跑、屋都是对象都基本均分了注意力,如记忆中无这事件发生,便无法进行一般性的回忆(因为对象马、跑、屋对正确回忆都是重要的对象,所以在目的下它们对奖惩预期中枢的兴奋是相同的,这种兴奋能力是奖惩学习的结果)。而对于想像性回忆:想像马在屋里跑,马、跑这两个对象对触发想像更有帮助,在触发想像的目的下对奖惩预期中枢的兴奋更强。(想像目的下,什么特点的对象在那一阶段更能兴奋奖惩预期中枢是长期学习的结果,具有某些特点的对象能促使想像的完成……)。

3、想像的过程是:

在某一状态刺激下,通过回忆使想像马在屋里跑的特点成为主注意目的,想像回忆过程可多种多样,一个可能的过程是,先给马跑分配了大部分注意力而对象屋做为普通亚主注意对象分配了少部分注意力,从而回忆起标志马跑的特点的对象,然后以屋做为主注意对象,回忆起标志某些对象在屋里跑的特点,马跑做为亚主注意对象。在回忆的过程中可能会习惯性的以马为主注意对象其它的为亚主注意对象,回忆起标志马的某些特点的对象……也可能习惯性的以屋内的某一物体为主注意对象…….

4、一些说明

在想象的过程中就像我们在现实中观察马在屋里跑。我们观察时也是一个一个对象的观察,有一个主注意对象,也有几个亚主注意对象。

可以说想象是回忆的组合。它是特殊的回忆。也就是说智能机器人可像我论述的那样进行想像。

  想像性回忆后,想像内容与标志想像的神经通路建立了记忆,下次通过一般性回忆,回忆了想像的内容,也会明白它是想像的(兴奋了标志想像的神经通路,这个标志不需要专门设置)。

  对想像性回忆也有一些判断机制,这些判断机制是长期奖惩学习中获得的,如通过推理时、空回忆来评估想像内容现实发生的可能等。

  一类对象引起注意后,如果首先进行识别(如一未知声音刺激),对小孩更有利,那么多次注意、识别后,注意后的识别便会成为习惯。

  许多识别需要多次注意对象的不同属性(比如对人的识别),进行状态性回忆。

  识别成为习惯后,注意对象时就会习惯性注意对象的一些不同属性(对这些属性的注意有利于识别),以它们做为对象完成状态性回忆,从而完成识别。

  这便是一般性回忆的诱发,由于一般性回忆最常发生,因而进行回忆时更多的是一般性回忆被习惯性诱发。

  5、一般性回忆向想像性回忆的转化:

  在一特异性目的下,当通过尝试一些方法(这些方法是学习获得的)一般性回忆仍无法完成时,随后一些神经通路(由记忆柱组成)便可能被兴奋(这些神经通路被随后兴奋是学习的结果),比如一般性回忆没能完成时,成人可能会对这一状态进行描述,小孩(或智能机器人)也会模仿描述,这些描述就会对应相应的神经通路,在这种状态下我们如果诱发了想像性回忆(成人诱导或其它方法)而使目的得到完成,想像性回忆在那种状态下便与奖惩预期中枢建立了记忆联系,从而使想像性回忆在这种状态下经常被选择兴奋,最终成为习惯。

所以要智能机器人具有想像的能力也并不是难题。

九、智能机器人的推理

推理是一种回忆,是想像性回忆的特殊类型,推理方法的获得是奖惩学习的结果,对推理结果的应用也是学习的结果,推理时的注意力分配与想像性回忆的类似,普通回忆无法完成目的,而通过获得的信息特点,回忆起推理,获得的信息的状态易化可以诱发推理。

当在目的下执行某些类型的想像或回忆或推理的结果时,多数情况下完成目的,从而使目的下的这些回忆形式与奖赏预期中枢更多的建立了联系,反之则与惩罚预期中枢建立联系。 

推理过程我在智能软件的编写这篇文章中已述。

十、认知对行为的影响(智能机器人)

按我的理论编写的智能软件,其认知是这样对行为进行影响的(当然也间接说明了人的认知如何对行为进行影响的)。

由某刺激对象(比如:可信人的言语),经过某些特殊的回忆,回忆起某一目的对象的实现,然后按回忆去回忆实现,而在目的下这一刺激经特殊回忆过程能兴奋奖赏预期中枢(目的完成后兴奋奖赏中枢从而使刺激、特殊回忆的标志对象与奖赏中枢建立起记忆联系)。经常能使目的实现的特殊回忆一般是普通性回忆、推理等,而刺激对象一般为可信人的言语等。比如一个智能机器人认为可信的人,说一物体会进行S运动,则智能机器人便会认为这一物体会进行S运动。这种认识是经过长期奖惩学习形成,然后习惯化的。

同理,由某些刺激经过另一些特殊的回忆,而回忆起目的对象的实现,然后按回忆去回忆实现,而目的下某刺激特殊回忆过程兴奋的是惩罚预期中枢(目的不能完成兴奋惩罚中枢,从而使刺激、另一些特殊回忆的标志对象与惩罚中枢建立起记忆联系)。经常使“行为”目的不能实现的一般是一些类型的想像,而刺激对象一般为不可信人的言语等。

那么由可信人的言语内容通过普通性回忆,推理而自然回忆起目的的实现,便能通过(可通过状态性兴奋:言语内容、普通性回忆标志对象、目的对象进行回忆)回忆兴奋奖赏预期中枢,从而通过行为获取目的。

而由不可信人的言语或想像回忆起目的的实现。便兴奋惩罚预期中枢,从而不通过行为来获取目的。

其它的影响认知对行为影响对象或思维过程方法相似。

下面举个例子说明人(智能机器人)的认识是如何影响行为的。我们可将小孩换成智能机器人,同时设置的智能机器人的奖惩系统与小孩相似。

  一小孩在客厅玩,突然卧室内发出声音,刺激小孩的听觉中枢,声音刺激转化为动力,如果大于玩的动力,他便会注意声音,产生回忆(通过学习形成的习惯)声音性质的目的,对声音的性质习惯性产生回忆(在环境状态下,对某类型的声音如何产生回忆受到了奖惩学习的影响)。回忆起这一声音是卧室内一箱子发出的,再回忆起(以箱子和卧室内某些环境为对象进行普通性回忆),母亲曾从中拿出果冻给他吃(这时会兴奋奖赏预期中枢,从而产生奖赏预期,由于整个过程是普通性回忆及现实刺激,同时由于回忆起吃的东西在某地方,而他去拿了吃往往会成功,从而获得奖励,因而预期动力的大小与现实获得果冻的动力差不多),如果获得食物的动力大于玩的动力,他便会产生获得食物的目的,为获得放在箱子内的果冻便会产生打开箱子获得果冻的目的(阶段主注意目的)(而如果回忆起自己打不开箱子的情况,无法兴奋奖赏中枢,而只会兴奋惩罚预期中枢,获得食物分配的动力便不会为正,便不会产生自己去打开箱子的目的),这样他便会产生打开箱子获得食物的目的,并习惯性(这种习惯是长期学习获得的)的产生走到箱子附近的目的,去打开箱子,但箱子中无果冻(没有食物的情况下,在箱子中获得果冻的动力便为负)。

  这时他回忆起电视中仙女给小孩好吃的,他想像仙女到客厅中给他送好吃的成为目的,这时如果以获得食物为主注意目的,而在目的下以标志想像的对象来回忆总兴奋惩罚预期中枢(因为在只能想像实现某目的的情况下,去实现这一目的往往不能实现,也就是说兴奋了惩罚中枢),也就是说目的为负动力,不可能成为目的……。

  以上论述了在奖惩中枢的参与下,人的认识是如何对思想行为发挥作用的。

十一、智能机器人如何区分真实回忆、发生与非真实回忆、发生

下面我将讨论智能机器人如何区分真实回忆、发生与非真实回忆、发生,下面是讨论的基础。奖惩中枢(动力中枢)在其中发挥着核心作用。

某认识(也包括回忆、想像等)(任何一种类型认识都存在特异的标记对象,这些对象不需要我们编程时专门设置)所对应的神经通路如果在任何目的下一般都能兴奋奖赏预期中枢,即在这一认识指导下的行为总能使目的完成,因而总能与奖赏预期中枢加强记忆联系,而在这一认识下如果不用行为追求目的则无法完成目的(当然如果在某些目的下,这一认识下目的总不能完成,则它就与惩罚预期中枢建立了记忆联系)。那么在这样的认识下产生的目的其动力为正。

什么是真实回忆、发生,什么是非真实回忆、发生,我们判断的标准是:

当由一事件对象(或回忆起的事件对象)通过普通性回忆、推理等这些现实回忆,回忆起目的实现,然后按回忆去实现目的,一般情况下总能实现,那么这一事件便是现实发生过的。反之由现实回忆,回忆起目的的实现,而用行为去实现时,一般情况下目的不能实现,那便是非现实发生过的事件。

现实发生的事件和非现实发生的事件都有各自的特点,如何迅速判断可通过学习获得,并不需要总是通过行为实现来区分。比如由现实时空刺激、普通性回忆回忆起的事件便会认为是现实发生的。由于我们直接看到的事件经过现实回忆(比如小孩看到母亲拿着苹果),然后按回忆去实现目的,一般情况下总能实现,因而看到的对象、事件我们便会认为是现实发生的,我们直接看到的、摸到的等等一般情况下都被我们认为是现实发生的。

通过学习我们会获得以下能力,一般情况我们会用真实回忆的对象通过现实回忆所获得的结果去指导我们的行为,而不会用非真实回忆的对象通过回忆所获得的结果去指导我们的行为。

对现实与非现实的判断能力是不断发展的,这种能力与注意记忆习惯密切相关。

十二、智能机器人的意识

智能机器人大脑的兴奋状态及刺激状态能诱发回忆(记忆柱的兴奋),这些回忆、认识又能影响行为。诱发什么样的回忆可被奖惩中枢选择(选择的是对智能机器人有利的回忆),最终成为回忆习惯。

意识就是感知刺激(包括环境及大脑兴奋状态),(习惯性)回忆经验(也就是对刺激做出认识),并能由认识指导习惯。

对刺激做出认识(意识)有利于智能机器人对刺激的反应,从而被奖惩中枢选择。

随经验的发展,意识内容是不断发展的。

十三、智能机器人的意志

意志就是自觉地确定目的并支配其行动以实现预定目的的心理过程。

智能机器人根据动力确定目的,在用行为或思维实现目的的过程中,目的动力不断发生变化,同时不断回忆起具有一定动力的对象,当有对象的动力大于目的的动力时,新的目的便会产生……。智能机器人有主注意目的,且有注意目的的改变就会有意志,它能自觉地确定目的并支配其行动以实现预定目的。

十四、智能机器人的情感

高兴是目的完成后,紧张去除的情绪体验。也可描述为是受到奖赏后的神经反应。不高兴可描述为受到惩罚后的神经反应。神经反应包括以下几个方面。

1 奖赏中枢(或惩罚)被兴奋。奖惩的兴奋使它追求引起高兴的刺激而逃避引起惩罚的刺激,并能加强刺激的记忆。

2 与相应的内分泌对应的神经的兴奋。神经内分泌使机体各脏器的功能与刺激(奖惩刺激)相适应。

3 与运动相应的神经的兴奋(它实际上是2中所述的部分功能)。神经内分泌通过调节运动器官的功能使它们与环境相适应。

4 与感知有关的神经的兴奋。

神经的兴奋反应状态通过内分泌等使机体功能与环境刺激相适应(奖赏刺激)。它们的核心是奖罚中枢的兴奋。

 

对智能机器人来说,它受到惩罚后也有神经反应有:

1 有奖惩中枢。

2 它虽没有内分泌,但它有神经(记忆柱)发挥着与内分泌部分相似的功能。即通过神经(记忆柱)使机体各组成部分的功能与刺激相适应,包括运动部件。

3 有与感知有关的神经的兴奋。

因而,智能机器人也应有高兴与不高兴,只是在非主要功能上与人稍有不同。

智能机器人在某些强烈惩罚或预期强烈惩罚状态下,如果通过应激攻击一般能获得奖赏(包括逃避惩罚),在这些状态下它便会不断应激攻击,这便是愤怒。

智能机器人在某些强烈惩罚或预期强烈惩罚状态下,如果通过应激攻击不能获得奖赏,而通过逃避能获得奖赏,在这些状态下它便会不断应激逃避,这便是恐惧。

十五、监护人、道德、文化等对智能机器人的影响

理想状态下,对一个智能机器人来说,如果按监护人的命令去做,大多数情况下会获得奖赏,而不按监护人所说的去做大多数情况下会获得惩罚,从而使执行监护人命令更多的与奖赏中枢建立了记忆联系(包括与奖赏预期中枢),而不执行命令则更多的与惩罚中枢建立了记忆联系。

在监护人命令、执行与不执行分别与奖惩中枢建立了一定的记忆联系后:

1、监护人命令对智能机器人的刺激所对应的记忆柱群(A表示),通过“执行命令”所对应的神经通路兴奋奖赏预期中枢,A与不执行所对应的神经通路兴奋惩罚预期中枢,从而使奖惩预期中枢易化执行所对应神经通路,而抑制不执行所对应神经通路,从而使命令得以执行。

2、重复执行命令多次后,A便会习惯性兴奋执行所对应的神经通路,而使监护人命令得到执行。

3、当监护人命令与另一可带来奖赏的行为相冲突时(如饮食),那么这一行为对应的奖惩预期中枢便会抑制执行监护人命令所对应的神经通路,而易化不执行监护人命令所对应的神经通路,如果不执行占优势,智能机器人便会不执行成人的命令,而如果执行占优势,智能机器人便会执行成人的命令。

4、这便是监护人对智能机器人影响能力的学习过程(理想的奖惩学习),当然现实生活中不会有这样理想的过程,但基本机理相似。

监护人语言对智能机器人的影响,以及书本知识、媒体、规章制度对智能机器人的影响形成的基本机理与之相似(当然它们对智能机器人的影响还应设计到智能机器人的认识对思想行为的影响,不过认识对思想行为的影响也是奖惩学习的结果),且它们影响的基础仍是奖惩中枢,它们一方面通过奖惩中枢直接影响思想行为,另一方面通过各种奖惩预期来影响思想行为。

十六、智能机器人的判断体系的形成

将下面的小孩用智能机器人代替便是智能机器人的判断体系的形成。

“是”等判断词的内涵与外延都是在长期的学习过程中形成的。比如:当成人说某人就是A(比如是大人)而某人硬实是A,那么在小孩的实践中,某人就不断与A的属性建立多种联系,而当小孩将这些属性应用到实践中时一般会带来正确结果,应用这些属性的方法便被选择下来。

在某一语言环境状态下当我们听到BA时,在回忆时便会习惯的由A回忆它的属性,并在对B进行回忆时习惯性的应用A的属性,对“是”的这种反应能力是学习获得的。而在某一语言环境状态下当我们听到B不是A时,对B进行回忆时不会习惯性的应用A的属性,否则便不会带来正确的结果,也就不会获得奖赏。

好、坏、对、错及对事件的认识及对这些认识的反应都是长期学习形成的。比如认为是对的就去实行,错的就不去实行,才会获得奖赏否则便会获得惩罚。

在奖惩中枢的作用下认识与行为一致。

通过长期的奖惩学习小孩会形成自己的认识、判断与行为体系。

十七、智能机器人的行为获得与发展

智能机器人的行为发展。

1 才造出的智能机器人不知如何行动,它的行为是通过学习获得的。

2 中介奖赏刺激在基础行为(指抬腿、手等)学习的过程起主要作用。

1中介奖赏刺激为:某一原始记忆柱群的兴奋强度在某一范围内便能轻微兴奋奖赏中枢,它是中介奖赏刺激。它通过编程成为奖赏刺激,这点类似于先天奖赏刺激。但它兴奋后,如不能引起先天奖惩刺激发生便会与惩奖中枢建立一定的记忆联系。

2偶然的因素(也不完全为偶然,我们在编程时的设计就考虑应使这种“偶然”成为可能。),诱发了一基础行为的发生(如抬腿或手等),必然有相应的中枢记忆柱的兴奋(包括运动记忆柱和感觉记忆柱,它们的兴奋在适当的范畴内,是中介奖赏刺激,这些兴奋的记忆柱与奖赏中枢建立记忆联系,从而能产生奖赏预期,从而使智能机器人能不断的重复这些基础行为,使它们习惯化。

3由于不是先天奖赏刺激,而且不断重复也无先天奖赏刺激强化,因而这些基础行为又不断与惩罚中枢建立记忆联系,从而使其动力不断下降(也就是说智能机器人对它失去了新鲜感)(当然与惩罚中枢的记忆联系随时间可不断减弱。)

4失去新鲜(动力降低)的中介兴奋,在之前(失去新鲜感之前)可学习成为获得其它奖赏刺激的行为的组成部分,这样就保证了基础行为的发展与完善。

5当基础行为成为其它获得奖赏刺激的行为的组成部分时,行为的发展也就上了一个新的台阶。(也就是说当其它类型的奖惩刺激成为行为发展的动力来源后,行为的发展也就上了一个新的台阶,这是因为一方面其它类型的奖惩刺激动力的绝对值一般远大于中介奖赏刺激它对行为的强化与弱化能力更强,另一方面也使行为与环境相适应,同时也使行为能更复杂的发展)

  中介奖赏刺激是智能机器人的追求新奇刺激的最早动力来源,在早期的行为学习过程中起着重要的作用。中介奖赏刺激使智能机器人像婴儿一样不断的重复一些新动作。它是好奇心的动力来源之一。

中介奖赏刺激及其它的奖惩刺激使行为的获得与发展能通过学习自然获得,而不需要专门编程获得。

十八、智能机器人的模仿能力的获得

要讨论智能机器人的模仿,首先让我们来讨论人的模仿能力是如何形成的。然后再讨论它的模仿能力。

 模仿能力:

  1、成人的行为与小孩的行为有共同的结果(奖惩),以这一结果为中介,从而使自己的行为与感知的成人的行为之间建立了记忆联系。(比如拿起苹果吃)(看到成人的行为会兴奋相应的神经通路,而小孩的行为也会兴奋相应的神经通路,它们之间能建立起相应的记忆联系。)

  2、感知到成人的行为及结果,由于这一结果能带来奖赏预期,小孩便追求这一结果,通过各种方法,最终在正确行为下实现这一结果,下次在追求这一结果时……,从而小孩的行为与感知的成人的行为之间建立。

  3、一般情况下,如果行为相同,往往会获得相同的结果,反之如果追求的结果相同,也往往要求有相似的行为。也就是说对结果的模仿往往会带来对行为的模仿。这种联系不断发展。

4、感知了成人的某些特点的行为获得的结果,小孩自己去实行时总能获得奖赏,从而使成人某些特点的行为与自己相对应的一些行为能共同兴奋奖赏预期中枢,从而形成模仿成人的欲望。

5、多次模仿后便会形成模仿的习惯。

6、先从简单的行为模仿,形成习惯(想模仿某一动作,便会习惯性的完成)。随不断发展,这种模仿能力也不断发展、完善。

可看出小孩对成人的模仿首先是因为结果,必须有经常带来奖赏的结果,然后是模仿行为可经常带来奖赏的结果。只有这样模仿才能成为欲望与习惯。行为模式与奖惩模式的相似性是其基础。

智能机器人的模仿

那么智能机器人是否有模仿人的欲望与习惯呢?如果行为模式与奖惩模式与人相似则必然会形成模仿人的习惯与欲望。而如果都不相似则会有模仿能给其带来奖赏结果的欲望与习惯。当然开始为了便于智能机器人的学习,我们应尽量让其行为模式与奖惩模式与人具有部分相似性,否则将会大大增加我们的工作量。

十九、智能机器人可能的学习发展过程

结合人的学习发展,我想智能机器人的学习可大致分为三个阶段。而第一阶段最为重要。奖惩系统的学习是学习的核心,是最重要的。

一、基础学习阶段。

才制造出的智能机器人存在先天和中介奖惩刺激,在这些奖惩刺激的影响下形成各种相应的奖惩预期。

1 有了简单的奖惩预期就会有简单的目的、简单的注意力分配,会产生基本行为的学习,最终使行为习惯化。如视觉的注意等。

2 通过奖惩学习会形成基本与环境相适应的简单的注意习惯,注意又影响了记忆内容。

3 形成与环境相适应的回忆习惯。

4 由于推理设计到一些规则的记忆和比较高级的注意力的分配,开始时智能机器人应不具有推理的能力,只能进行一些简单的推理的记忆。

5 早期更多的是普通性回忆及想像性回忆,状态性回忆需要奖惩系统发展到一定程度才会出现。

6 认识对行为的影响处于发展初期。

   通过奖惩学习会获得一些新的奖惩预期刺激,如监护人的面容、面部表情、一些语言,在这些基础上会逐渐获得另一些能力。(新的奖惩预期刺激的形成往往与一些能力的发展相互促进,如监护人的面部表情要成为奖惩预期刺激,首先需要具有视觉注意的能力。)

1 行为的复杂。

2 语言能力。

3 模仿习惯、欲望、能力。

4 进一步完善的注意习惯。

5 逐步发展完善的想像性回忆、状态性回忆。

6 对简单推理的记忆、应用。

7 认识对行为的影响形成并不断完善,逐步形成现实判断体系。

   这些发展为进一步的学习提供了基础。在交流与实践中形成对某些媒体内容的奖惩预期(不同媒体可有不同的标志对象被注意,作为奖惩预期刺激)

二、媒体学习阶段,类似于人的学校学习。

  在这个阶段获得知识的同时,奖惩系统、能力也不断发展完善。为下一步的工作提供角色培养。

三、工作学习。

为社会创造价值的阶段。

二十、编程说明

1 如何通过编程使智能机器人具有模糊兴奋、回忆的能力我的文章中已做说明。

2 主注意目的中枢的编程实现从理论上说是很简单的。它的主要功能是记忆主注意目的对象,至于什么对象会成为记忆的对象通过几句简单的编程语句(比较不同对象之间的动力大小)就可以实现(可参看我的一些小程序)至于对其它记忆柱的易化作用,根据它们的动力的大小通过注意力分配中枢来影响。

3 注意力分配中枢的作用我在前面已述,它的功能实现从理论上来说是很简单的。

4 状态兴奋的实现前面已述。其编程实现从理论上来说是简单的。

5 编程实现奖惩中枢的结构与功能从理论上说也是容易的。这方面参看我的小程序。

综上所述,通过编程实现我所论述的智能软件的结构功能,从理论上说不难,这样获得的智能机器人可具有象人一样的智能。

不管大家对我的理论有何看法,但我的理论可编程实现,并能使智能机器人具有真正的智能。

 

 

 

 
 
  • 标签:智能软件 
  • 发表评论:
    加载中!
     
         
       
         
    Powered by Oblog.