> 概要地说,学习可以分成两大类型:
操作制约:
培训时,教给动物作出某个反应以获得一个奖品。例如,如果最后结果是令人期待的,"坐下"之类的反应就可能会重复,因此结果决定反应。
经典制约:
指不自觉反应,比如流口水,与一个中性刺激物伴随发生,而与奖品不相联系。
概要
正强化
就是一个奖品(某种令人期待的东西),在做出反应后立即给予,能够增加同样行为反应再次出现的可能性。比如说,如果发出"坐下"的命令,狗能够坐下,我们给它一点美味的食物作为奖励,那下次发出同样命令后,这只狗就很可能再次坐下。
如果希望达到更好的效果,奖品应该:
1. 迅速给予
2. 连贯
3. 有吸引力
负强化
负强化常常与惩罚混为一谈。这是某种不愉快或令人讨厌的东西,当作出反应后马上拿开时,就会增加那种回应再次出现的可能性。比如,当狗停止拉脖链时松开绳,就会告诉狗,跟着走不象拉着脖链走路那么痛苦。
主强化
主强化是指动物逐渐发育而寻求的任何刺激物(奖品),即本能地知道那是"好的",或缺少那个可能是"坏的"。比如说食物、水和交配。
次强化
动物必须学习知道次强化是与主强化相连的。因此,"好狗"等词或拍拍头就成了正强化。
正惩罚
正强化或负强化能增加前述的反应再次出现的可能性,而惩罚的目的是为了达到相反的效果。惩罚会减少前述反应再次出现的可能性。
正惩罚是一个令人厌恶的刺激物或事件的补充,比如,朝狗大喊大叫或拿掌掴它可以被认为是一个惩罚,如果这能导致行为的减少。
要想达到最好的效果,惩罚必须是:
1. 迅速
2. 连贯
3. 足够令人厌恶
负惩罚
收回一个令人愉快的刺激物或事件从而导致某种行为的减少,这就是一个负惩罚。比如,在狗做出一个不可接受的行为后,立即把它关进一个处罚室,如果这样能导致那种行为的减少,那这就是一个负惩罚。
无论是强化还是惩罚,时机掌握都是至关重要的。反应和惩罚或强化相隔的时间必须极短,少于半秒才能让动物把二者联系起来。反应做出5秒种后才进行强化,事实上就会使学习时间增加一倍。
概要:
强化(正、负)能增加一个反应再次出现的可能性;
惩罚(正、负)能减少一个反应再次出现的可能性。
强化和惩罚都可以是正的或负的,都需要在动物做出反应后立即实施,这样动物才能把二者联系起来。
上一页 [1] [2]