核心概念:在操作性条件作用中行为的后果,诸如奖励和惩罚,会影响行为再次发生的可能性。
操作性条件作用之所以重要,至少有两大原因,首先,操作性条件作用所能说明的行为远比经典作用多,其次,它能解释自愿行为,而不只是反射性行为。
斯金纳的激进行为主义。
桑代克所做的实验中,饥饿的动物不断试错,寻找问题解决方案以获得实物奖励。渐渐的动物的错误反应被消除,而有效反应则被印在心里,桑代克称之为效果律。其内容是动物的行为引发积极或消极的后果,而这些后果决定了动物是否重复先前的行为。
强化的力量。人们在平时闲聊时经常提到奖励,斯金纳称其为强化物,因为这个术语听起来够客观。斯金纳将强化物定义为任何跟随并加强反应的刺激。对于大多数人来说,食物、金钱和性都能起到强化物的作用,关心、赞扬和微笑也能起到类似的作用。这些都是正强化。正强化是出现在反应后能够增加相关行为再次发生可能性的刺激。
通过消除令人不快或厌恶的刺激来达到强化的作用,心理学家称之为负强化,这里的负类似于数学中的减,正类似于数学中的加。
连续强化与间歇强化。
连续强化,对每次正确反应用于奖励,会让被强化对象很快明白什么样的反应是受到鼓励的,此外,连续强化对于塑造复杂的新行为非常有用。我们可以说连续强化是塑造新行为的最佳策略。
不过连续强化的确存在一些不足之处,首先只要有一次正确反映,没有得到奖励,学习者就很容易以为自己的反应不正确,一致性是该方法获得成功的关键所在,令人高兴的是,一旦目标行为已经形成,有效强化所需的模式就会发生了变化,这时我们就可以使用间歇强化。
对部分而非全部正确行为进行奖励不太频繁的奖励,无论是对动物还是对人。间歇强化是维持以习得行为的最有效方法,在实践过程中,社会强化和奖励的混合使用,能使强化方式向间接强化过度,变得更容易。
间歇强化的一大优点是,它能有效阻止消退过程的发生。
强化程序主要有两种形式:一种叫做比率强化程序,另一种叫做间隔强化程序。
比率强化程序。根据正确反映发生次数进行奖励的程序就是比率强化程序,心理学家又将这种程序分为两类:固定比率强化程序和变动比率强化程序。
固定比率强化程序,多见于工业企业。工人根据完成产品的数量获得相应回报,也就是大家平日里所说的多劳多得,零售业也使用这种强化程序。
变动比例强化程序不太具有可预测性。电话销售员的工作便属于这种方式,在实现下一次销售前,他们永远不知道还要打多少电话,实现销售就是他们的强化物。
变动比例强化程序通常会比其他强化程序产生更多的反应。
间隔强化程序时间是间隔强化程序的本质。心理学家把间隔强化程序也分成两类固定间隔强化程序和变动间隔强化程序。
职场中通常采用的是固定间隔强化程序,强化物可能是定期发放的工资或每月员工会议上老板给予的奖励,每周对学生进行的检测,也属于固定间隔强化程序,在所有这类情况中,时间间隔没有改变。因此两次奖励之间的时间是恒定的,固定间隔强化程序通常会导致较低的反应频率。
在所有的强化方式中,变动间隔强化程序可能是最不可预测的,在变动价格强化程序中,奖励和惩罚之间的时间间隔是变化的,由此产生的反应频率会很高。
比率强化程序中你控制着奖励的频率,因为你工作的越快或达到获得奖励所需的工作量的时间就会越短,在间隔强化程序中,无论你工作的速度是快还是慢,你都无法让时间更快的消逝,在一定量的时间过去之前,你无论如何都得不到奖励。变动间隔强化程序应用在课堂中的例子是突击检测。
初级强化物和次级强化物。
满足基本生理需求的刺激能够提供强化,称为初级强化物。
金钱或考试分数的提供了另一种强化需要通过与初级强化物联系起来才能发挥强化作用,因此他们就成为了操作性反应的条件强化物或次级强化物。表扬赞许的微笑,商家使用的回馈卡以及社会各种,嗯,地位的象征,都属于这里的强化物。
零钱罐与代币制。
本能漂移。训练很好的猪,在经过一段时间之后,又会恢复他们的本能行为,这就叫做本能漂移。用来描述这种妨碍习得性行为的天生反应倾向。
精神病院通过建立起所谓的代币制,发掘出瞧见强化物的力量,以此来鼓励健康良好的行为。在代币制中工作人员用塑料代币强化洗漱,梳理、或服药的行为,病人很快学到他们可以用代币换取自己非常想要的奖励和特权。
普雷马克原理。
参与喜欢的活动的机会可以被用来强化不太喜欢的行为,心理学家称之为普雷马克原理。新父母可以用普里马克原理,让孩子收拾床或洗碗碟,比如孩子完成这些任务后,父母才允许他们和朋友玩儿。