| 轻轻松松,自己调教爱宠(转自CPN“牛头铁蛋”) |
| By wangming 发表于 2008-3-5 11:29:00 |
不知道您有没有注意到,经常会见到这样一些话题。 我家的狗狗出了什么样的状况,我该用什么方法来训练它、制止它? 在我刚养狗的时候,也经常会有这样的问题,而且有些状况还让我颇为苦恼,甚至有时恼羞成怒。直到偶然中从若干资深前辈那里借来几本关于宠物行为心理的专业书籍,并认真拜读且稍加试验以后,才顿悟其中奥妙。 其实,我们首先要了解的并不是该怎么办。而是我们首先要了解行为调教背后的原理,只要懂得了原理,方法千万,又何必拘泥于一种方法呢?毕竟,主人自己创造的方法才更适合调教自己的宠物。 所以,鄙人愿与您一起分享调教爱宠背后的原理。
比奖励更有效的 增强原则 增强物是什么? 增强物—即任何与某项行为共同出现,通常会增加该行为发生频率的事物。 增强物可以分为两种,正增强物和负增强物。正增强物是指被训练对象希望获得的事物,如食物、抚摸、称赞。而负增强物是指训练对象希望躲避的事务,如被揍、施训者不悦的表情。例如驾车时不系安全带,车辆发出的报警声就是负增强物。
只要是宠物本来就会出现的行为,无论它多么罕见,我们都可以用正增强来加强这个行为。例如每次召唤自己的宠物回到你身边,当它过来时就温柔的拍拍它,那么通过增强这个行为,它回到你身边的机率就会越来越大。但是,增强法则的重点在于你无法增强一个从不发生的行为,比方说你无法运用增强法则加强狗狗跳霹雳舞的动作。 现在来说到负增强,负增强物源于一个厌恶刺激,被训练对象通过改变一个行为,从而让厌恶刺激消失。那么这个厌恶刺激即可增加该行为的发生频率,这类厌恶刺激就是负增强物。 例如你正想随地吐痰,而在此时你缺发现我从兜里掏出了一把刀指着你,那么你的反映当然是把嘴闭上停止吐痰动作。在这个例子当中,我手里的刀是一个厌恶刺激,你停止吐痰是为了躲避这个厌恶刺激。所以我用一个厌恶刺激来增强了你停止吐痰的动作。如果你每次想吐痰的时候,我都能拿刀相向,那么你做出停止吐痰的这个动作所发生的频率就会越来越高。以至于到最后即便我不在,你也不会轻易的吐痰,因为不一定什么时候厌恶刺激就来了。
关于增强,再贫两句。以上详解了通过正负增强做法增加行为发生的频率,但需要注意一点,就是正负增强物出现的时间点要抓准。否则,你本希望增强狗狗坐下的行为,结果它站起来时你才给增强物,那么狗狗就搞不准你到底是要增强它哪一种行为了。众位想想,如果你早上起床才夸老婆昨晚很迷人,会不会比当时就增强她的行为来的效果好?哈哈 增强物的大小以及意外的大奖 如果你是使用食物做为增强物的话,那么这个增强物的体积应该尽可能的小,以便于动物能尽快吞吃节省时间,并且能在训练中多做几次增强,这点想必每个人都清楚了。然而给与一个意外的大奖,不管是对人类还是动物都是极为有效的增强技巧。所谓意外的大奖就是比常用的增强物可能大上10倍,而且是被训练对象根本就没想到的。 众位仔细回想一下海洋馆里的海狮在做表演的时候,训导员除了给予小鱼作为增强海狮当前的行为以外,他们也会偶尔的给予一条体型很大的鱼或者一整条大鱿鱼作为增强物,而这种意外的大奖往往会让海狮有一个瞬间的停顿然后再去吃(因为它根本就没想到),之后你会观察到海狮动作完成的质量以及积极性都会有一个明显的改变。其实咱们人类不也是如此么,如果老板在未通知你的前提下,突然给了你一笔大额奖励,那么你的工作行为、热情会不会被极大的增强?这笔意外的奖金要比你的年终奖增强效果好多了。 制约增强物 或许平时您在家教育自己的宠物时发现,当它出现了你希望予以增强的行为时,你根本不可能立即给与增强物,尤其是用食物增强时更是如此。例如你希望狗狗在距离你50米远的地方坐姿静候,当它做到的时候你怎么可能马上给与增强物?再例如当你希望海豚腾空跃起去触碰悬挂的球,当它已经碰到球的那一刻,你更不可能天外飞仙似的去给它增强物。所以在这个时候我们就会用到制约增强物。
制约增强物——是指一个原本不具意义的信号(声音、光线、动作或其他),刻意让它在增强物出现之前或出现期间出现。(好像挺绕口的,哈哈。)举个例子你就明白了,现实生活当中,制约增强物比比皆是。红包就是一种制约增强物,红色的纸包其实与钱并没有直接关系,而是我们人类刻意的把红色纸包与钱做出了关联,这样当我们看到人家送来的红包时就自然会想到钱。同理,钱也是一种制约增强物。 在您读完俺这篇枯燥乏味的帖子之后,准备运用增强原理调教自家爱宠之前,首先要做的就是让您的爱宠知道制约增强物的重要性,做法就是刻意的让制约增强物与您真正的增强物产生关联。通常您的爱宠在接收到制约增强物的时候,会表现出一个瞬间的停滞,然后开始寻找真正的增强物,如果是这样表现的话,表示您的爱宠已经充分了解了制约增强物。 在它了解了之后你会发现,制约增强物的威力大到超乎你的想想,爱宠可能会为了获取制约增强物而不知疲劳的做出正确的行为,虽然它真正的增强物有可能才是一块小小的饼干。 回头想想我们人类不也是如此么。还记得刚才我举例说钱也是制约增强物吗?对呀,本身钱就是一张张的纸片,是我们人类刻意把这些纸跟商品做出了关联,所以我们人类同样会疯狂的做出行为来得到钱这个制约增强物,而往往越是有钱的人对于获取制约增强物的行为会更加疯狂。 提示:这次俺臭贫的制约增强物可能您看完会有些许迷糊,也许您会问我该选择什么当做制约增强物。别着急,下次俺给您接着说到目前国际上比较流行的响片训练法,到时候看完您就豁然开朗了。 响片训练 在国外,从上世纪90年代开始越来越多的动物驯养师开始使用操作制约、塑形法、正增强和制约增强物,于是也有了越来越多的宠物主人开始学习。由于很多宠物主人所使用的制约增强物是一种内含金属弹簧片的塑料响片,于是他们便把这种训练称为响片训练法。 上次咱们说道制约增强物,其实响片就是制约增强物的其中之一,由施训者把响片这个制约增强物人为的与增强物做一个关联。例如在每次给与增强物的当时或之前,都会插入响片的声音,以此方法,被训练对象很快就会了解制约增强物(响片的声音)与增强物(或许是食物)之间的关联。所以按照上次所讲,在你不能马上就给予增强物而偏偏又必须增强被训练对象当前正在发生的行为时,我们就可以使用响片当作制约增强物。 举例来说,假设我已经把响片发出声音与喂海豚吃鱼做出了关联。 那么现在我需要训练海豚从水池当中跃起去撞击悬挂的皮球,在耐心等待之后海豚果然跃起,并且正在用嘴巴触及皮球,这个瞬间动作正是我们希望海豚增强的,可是在这一瞬间海豚还在半空中啊,我们不可能立即给与增强物(鱼),所以在海豚做出正确动作的瞬间,我会让响片发出声音,由于响片已经与增强物(鱼)联系在了一起,所以响片声音的意思就是——好了宝贝,你做对了,快来领取奖励吧。在这个连续的动作训练当中,如果你不使用制约增强物,反复多次海豚也可能做对动作,但它不会明白你要的究竟是什么?跳跃的高度?激起的水花?。。。。。。。 比较有意思的一个事情就是,在响片训练当中,反复许多次以后,被训练对象有可能不在重复行为,而会主动的显示出行为的意愿。嘿——你看,我又让你按下响片了,我再做一次,还让你按下响片。看官们仔细想想,金毛巡回猎犬在巡回反复的过程当中不也是这个道理么。
乱七八糟说了一大堆,这下您应该看明白制约增强物是咋回事了吧?当然我无意诱导各位使用响片来作为制约增强物,只是举例说明利用响片作为制约增强物的方法。还是那句话,明白原理就好,方法您自己创造。 下次咱们再说说利用两种或若干种制约增强物指导爱宠去做一个繁琐的连贯的行为,也算互动吧。 继续加油,宝贝 话接上回,如果作为宠物主人的您已经完全了解制约增强物,而且您的爱宠也已经记住并懂得了一种制约增强物,那么真正的乐趣就要来了,您马上就能体会到跟狗狗互动沟通的美妙了。 我文字功力比较差,为了能让您明白,我就还是以举例方式表达吧。 比如说您是以哨子作为制约增强物,而且狗狗现在已经完全懂得您吹哨的意义。通常您吹哨的时候所表达的意思是——宝贝你做的很正确,快来领取奖品吧,行为结束了。 那么现在您可以在下达这个哨音之前再插入一个轻吹的哨音,让这个轻吹的哨音与结束的哨音做一个关联,很快动物就会懂得这个轻吹的哨音是在引领它通往结束的哨音。而这个轻吹的哨音是什么意思呢?意思就是——加油宝贝,你就快做到了。 好了,现在您可以开始享受人与动物之间的互动了。接着举例: 例如你想让狗狗帮你拿拖鞋。 狗狗在屋里溜达并离拖鞋很近的时候,轻吹哨——加油宝贝,你就快做到了。 狗狗靠近拖鞋,轻吹哨——加油宝贝,你就快做到了。 狗狗用嘴触碰拖鞋,轻吹哨——加油宝贝,你就快做到了。 狗狗叼起拖鞋,轻吹哨——加油宝贝,你就快做到了。 召唤狗狗来,轻吹哨——加油宝贝,你就快做到了。 狗狗朝你走来,轻吹哨——加油宝贝,你就快做到了。 狗狗来到你面前,用力吹下哨——宝贝你做的很正确,快来领取奖品吧,行为结束了。 Hoho,我想这次我把制约增强物以及引申用法借着举例勉勉强强的给您说明白了吧?当然,我只是举例而已,具体的应用千变万化,乐趣多多。 变化性增强时至 之前咱们讲的内容,我总在提起给予增强物,或许您以为当动物产生了正确的行为时,我们必须要每次都给予增强物,否则它的正确行为会很快消失。但实际情况却是,只有在动物学习的阶段才需要持续的给予增强物,一旦这个行为学习结束,它将自行获得增强。想想看,如果您的配偶已经习惯饭后刷碗,而你却每天3顿饭後都在厨房门口夸奖对方,那么他、她会不会觉得你有神经病?为了让一个已经学成的行为更加可靠和持久,我们需要做的并不是每次都予以增强,正好相反,我们应该有选择性的予以增强,而且是选择它完成质量较好的行为予以增强,心理学家把这种增强方式称为——变化性增强时至。 想想看,如果你买了一辆新车,每次着车一拧钥匙门就着,但是某天当你拧钥匙门的时候突然发现打不着火了,那么你很快就会放弃打火的行为而变成给4S店打电话询问故障。但是反过来说,如果你有一辆又老又破的车,每次着车都需要反复的拧钥匙门来点火,在这个时候你一定会很有耐心地反复拧钥匙门来尝试启动汽车,这就是因为你拧钥匙门的这个动作长期以来一直受到变化性增强,所以你才会长期稳定的维持这个行为。类似的例子有很多,赌博就是其中之一,有输有赢的变化性增强,同样让很多人都在稳定的维持这个行为。 迷信行为 守株待兔这个故事,相信大家在听到的时候都会觉得故事比较夸张,教育意义比较大而已。其实,这种事情经常在发生,无论是人类还是动物身上都是如此。如果狗狗经过客厅摆放的沙发时,正好在沙发下面捡到了一块肉干,那么往后的一段时间,狗狗或许会经常到沙发下面掏一掏。如果我们在倒垃圾的时候,正巧在垃圾桶里捡到100块钱,那么往后的几天,我们同样也会格外的注意垃圾桶里的物体。 如果某项行为与后果毫不相干,但动物仍然出现该行为以求得到增强,心理学家称此行为为——迷信行为。例如:有些篮球运动员在罚球之前会亲吻手腕,然后嘴里默念,然后才是做出投篮动作。 动物接受训练时也经常会产生迷信行为,它可能做出一些你并未要求的反映,但这些反应经常被意外的增强而受到强烈的制约。例如动物可能会出现它必须呆在特定环境下,出现特定坐姿才能获得增强物的样子,当你突然给它换一个训练环境时,它的行为确难以理解的突然间做不好了,这时如果再想探究原因所在肯能需要花费很多精力,所以比较好的做法是,行为训练完成部分之后,在即将要进行训练时变化所有你认为不重要的情境变数,以免发展出一些日后可能成为障碍的意外制约行为。(全文完)
罗罗嗦嗦给您念叨了好一阵子,至此已经大致上把增强原则给您介绍了一遍,相信借由这些增强原理已经可以培养或纠正您的爱宠很多行为了。我想,随着有耐心的朋友在看过本帖并加以实践之后,也会有更多的宠物不会因为跟主人的沟通不畅而遭到误解甚至体罚。那么,俺的目的也就算达到了,hoho。 另外,狗狗跳舞、猫咪空翻、海豚钻圈等等行为原本是它们不会出现的,也就是说这些行为是我们无法用增强原则来训练的。但是你知道吗,这些让我们感到惊奇无比的动作,其实也是我们自己就能训练宠物达成的,或许在不久的将来,我将再次与您一起分享——塑形法。
 |
| |
|
| ): |
| By GJYMMUMJ(游客)发表评论于2008-11-20 20:45:00 |
[emot]8[/emot] |
| |
|
| torjap |
| By IIDGDSVN(游客)发表评论于2008-6-3 0:20:00 |
~~(qennea) |
| |
| 发表评论:
| |
站点公告
页面载入中,请稍等。 |
站点日历
|
最新日志
页面载入中,请稍等。 |
最新评论
|
最新留言
页面载入中,请稍等。 |
友情链接
页面载入中,请稍等。 |
站点统计
页面载入中,请稍等。 |
日志搜索
页面载入中,请稍等。 |
用户登陆
|
| | | |