獎勵的惡果(上):為何「胡蘿蔔與棍子」不是好方法?

獎勵的惡果(上):為何「胡蘿蔔與棍子」不是好方法?
Photo Credit: Alan O'Rourke, flickr, CC BY 2.0
我們想讓你知道的是

其實每個人都已經具備了內在動力,人們早已擁有了把事情做好的願望。而這正是為什麼,當我們給予個體外在獎罰時,嘗試干擾個體的行為時,他們的表現變得更糟糕了——因為當我們那樣做時,我們其實是在用外部動力來取代個體的內在動力。

如何讓員工更積極的工作?如何保持與呵護孩子的興趣?如何激勵自己完成某個目標?

這些是幾乎每個人都會遇到的問題,而你可能對以下常見的方法並不陌生:企業會透過薪水來吸引體力或腦力勞動力,會透過提高獎金去強化員工的積極性,也會透過指責、減薪、解僱等懲罰手段來規範員工;父母也試圖透過糖果或讚美來強化孩子的某些行為,也會透過體罰或責罵來削弱孩子的某些行為。

這種利用人類「趨利避害」的本性,透過外部獎勵(如,給錢、表揚)來加強個體的某種行為,或透過外部懲罰(如,罰錢、體罰)來削弱個體的某種行為的方法,西方俗稱為「胡蘿蔔與棍子」(carrot and stick)。

我們甚至還會用胡蘿蔔與棍子的方法來對待自己——當自己完成了某個目標後,會購買一些禮物送給自己,會與家人朋友慶祝自己的成功;當自己做錯了某件事情時,我們會陷入自責、懊悔,我們會在心理或現實中用各種手段懲罰自己。

那麼,心理學家是如何看待「胡蘿蔔與棍子」這一方法的呢?這一方法是否真的有效呢?

那些金錢買不到的東西

《獎勵的惡果》一書中,作者艾爾菲.科恩(Alfie Kohn)寫道:

社會普遍認同於一個觀點:激勵他人去做某事的最好方法,就是在他人按照我們的意願行動時給予獎勵。

學者們已經對此展開了討論,並將這一觀點的源頭追溯到行為主義的傳統。流行行為主義的核心觀點是:「如果你做這個,你就會得到那個。」

很少有人去審視這一方法的合理性,人們關心的是他們會得到什麼回報,以及在什麼情況下這些回報會得到承諾和兌現。我們理所當然地認為這是養育孩子、教導學生、管理員工的合理之道。

我們答應一個五歲孩子,如果他在超市裡不吵不鬧的話就給他買泡泡糖。我們給十幾歲的學生打A來鼓勵她更加努力地學習。我們對銷售員許諾,如果他銷售掉足夠多的公司產品,就可以到夏威夷度假。

但這樣做真的有效嗎?

在研究人員做的一個減肥實驗中,受試對象得到承諾,如果每次過秤顯示體重下降,他們就能每週兩次得到5美元的獎勵(那個年代5美元是不小的獎勵)。

剛開始時,那些得到獎勵的人確實收效明顯,可在之後的五個月裡他們的體重都反彈了。相反,那些沒有得到獎勵的人卻變得越來越苗條。

另一項大型研究招募了測試對象參加戒煙計畫,該研究結果發表於1991年。一部分測試對象每週上交進展報告並因此得到獎勵,另一部分測試對象則得到反饋(戒煙建議),以加強他們戒煙的動力,其餘的測試物件(控制組)則什麼也沒有。

結果如何?第一周獎勵組上交報告的人數是其他組的兩倍,但三個月以後,獎勵組的測試對象比反饋組,甚至比控制組的測試對象抽煙更多。

實驗還表明,獎勵組的測試對象撒謊說已經戒煙的可能性比其他組高一倍。事實上,對那些既接受獎勵又得到反饋的測試對象來說,「金錢獎勵反而削弱了有針對性的反饋帶來的積極影響」。獎勵不僅沒有幫助,而且是有害的。

與減肥和戒煙相比,關於如何運用行為主義理論幫助更多的人養成系安全帶習慣的研究更多。有一位行為主義的熱心擁護者及其同事們選取了9家公司的28個方案來做效果述評,這些方案旨在促使員工系好安全帶。

在6年間,他們觀察記錄了將近50萬輛汽車,結果發現,通過獎勵來促使系安全帶的做法長期效果最差。

在後續的從一個月到一年以上不等的測試中,他們發現那些受到現金或其他獎勵的人,系安全帶的人數從原來的增加了62%反而變成下降了4%,而沒有使用獎勵的方案則使系安全帶的人數平均上升了152%。

該研究報告的作者們顯然事先沒有料到這樣的結果,他們不得不承認:「從即時和長期的角度來看,都是非獎勵策略的影響更大,這一點是基礎強化理論沒有預料到的,也是和理論不一致的。」

簡單地說,獎勵的最佳效果是短期的,要使行為變化持久,通常需要保持獎勵源源不斷。

我的一個銷售員朋友曾自豪地跟我說,他在教育他的侄兒時,使用了「基本的交易手段」,亦即乖乖聽話就給吃薯條作為「獎勵」,不聽話就不給薯條作為「懲罰」(注意:對人的感受來說,拿掉獎勵就等於遭受懲罰),之後收效甚佳,他說教育小孩的最重要的就是搞清楚獎罰規則,這樣小孩才會聽你的話。

我相信不少人都持同樣的觀點。但上面的實驗告訴我們,這種策略在短期裡可以很有效,但只要獎罰的源頭消失後,獎罰的效果就會蕩然無存。換句話說,無論我朋友的獎罰規則設定得多好,他的侄兒都很可能在他不在的時候,變得不再聽話。

另外,持續使用獎勵手段來影響個體的行為,不止會導致個體對獎勵產生依賴,而且還會對獎勵產生越來越高的期待——昨天一個糖果就可以讓孩子聽話,但今天可能要兩個糖果,明天可能要三個糖果。

總而言之,獎罰一般只在短期有效果,長期而言,獎罰帶來的行為改變是無法持續的。

那些獎勵能換來的惡果

但是,上面的實驗都是透過物質來獎勵被試的,如果我們換一個方式——透過讚美、表揚等方式來進行「心理獎勵」,會不會就有效果了呢?

書裡提到:

對表揚與成績之間的關係所做的研究出奇得少,大部分人相信,稱讚某人幹得出色就能使他在將來更有效地學習或工作。「如何管理」一類的書籍充滿了各種應該表揚員工的建議,但據我所知,沒有一項研究仔細考察過這麼做是否真的能改進工作表現。

不過,有兩位學者對收集到的有關課堂表現的研究材料做了回顧分析,其中一位發現,「表揚與學生的成績上升不相關」,而另一位得出結論:「教師表揚的頻率和學生學習的進步並不總是成正比,即使在兩者成正比時,其關聯性也太低,沒多大意義。」

最近的兩項實驗證明了這一點。在一項實驗中,以色列的五六年級學生被要求完成一項需要創造性的任務,與那些既沒得到表揚也沒受到批評的實驗物件相比,那些得到表揚的學生再接著做相似的任務時,完成的品質降低,甚至低於他們得到表揚前的品質。

同時,在一系列對美國大學生做的研究中,「表揚實際上一直使技巧性的工作表現受到損害」。研究人員得出結論:「這些結果表明,破壞技巧性工作的有效方法是提前準備好表揚完成任務者。」

看來,無論是物質還是心理獎勵(也可以說是社會獎勵),其效果都不盡理想,甚至有反效果之嫌。更糟糕的是,還有不少心理學實驗指出,獎勵甚至會帶來創造力下降、判斷力下降等多種負面效果。書裡還提到:

1980年代,在創造力研究領域領先的特麗莎.艾瑪比爾發表了兩篇對使用獎勵予以抨擊的報告。

在第一篇報告中,一些年輕的富於創造性的作者們花了五分鐘時間來想想他們的工作能帶來的獎勵,結果他們的創作數量明顯不如那些沒有被要求這麼想的作者,而且他們創作的品質也低於他們自己原先的水準。

接著,艾瑪比爾對兒童和成年人進行了一系列的研究,在這項研究中,她要求兒童和成人完成各種任務,包括製作拼貼畫和編故事等。一部分受試物件得到實物獎勵,其他人則沒有。

結果再次證明了獎勵會扼殺創造力,而這與任務的類型、獎勵的種類、給予獎勵的時機以及受試物件的年齡等因素都無關。

到了1992年,研究人員不斷發現獎勵會削弱人們的表現。艾瑪比爾和她的同事發現,對於職業藝術家,如果某幅作品是受委託而作——即提前約好了報酬,那他的創造性就會大打折扣。

馬克.萊帕曾經是艾瑪比爾的導師,他和一位研究生一起做了個研究,他們召集了一些四、五年級的學生來完成一個類似於妙探尋凶的棋類遊戲任務。

與那些沒有獎勵承諾的學生相比,得到許諾說如果完成得好就能拿到玩具的學生不僅解決方法不夠系統,而且花的時間更長。更加令人不安的是,一個星期後,那些期望得到獎勵的學生在完成另一項完全不同的任務時,表現也不如沒有獎勵的學生。

安.波季阿諾和瑪麗.貝雷特則發現,和那些對學習本身感興趣的學生相比,那些受外部動力驅使——即學習是為了得到獎勵和他人的贊成、認可——的孩子較少運用高級的學習策略,在標準化學業考試中分數也較低。受獎勵驅使的孩子的成績甚至低於前一年考分與他們相同的孩子。

綜合上述,無論是物質還是心理上的獎勵,雖然都能短暫的刺激個體的積極性,但卻無法讓個體培養出長期的行為習慣,也無法讓個體的表現變得更好。

現在,我們知道獎勵帶來的效果如何,以及獎勵會對個體造成什麼負面效果,但更重要的問題是——為什麼獎勵會導致這些負面效果呢?如果獎勵不管用的話,有什麼是管用的呢?

第三種驅動力

在另一本書《驅動力》Drive,台版《動機,單純的力量》)裡,暢銷作家、管理思想家丹尼爾.平克(Daniel Pink)把人的行為驅動力分成了三種,平克指出:

  • 第一種驅動力指的是「生物衝動」,其來自我們對基本生存的需求,例如對食物、安全與性的需求。
  • 第二種驅動力指的是「外在動力」,其主要來自前面提到的「胡蘿蔔加棍子」,例如對獎金、社會認同的追求,以及避開懲罰、損失的慾望。
  • 而第三種驅動力指的是「內在動力」。

我們看看以下實驗就能明了:

哈利.哈洛(Harry F.Harlow)是威斯康辛大學心理學教授,在20世紀40年代,他建立了世界上最早研究靈長類動物行為的實驗室之一。1949年的一天,哈洛和其他兩個同事找了8只恒河猴進行為期兩周的有關學習行為的實驗。

研究者們設計了如下圖所示的一個簡單裝置。要解開這個裝置需要三步:拉出立銷,解開掛鉤,掀開有鉸鏈的蓋子。這一連串的動作對你我而言易如反掌,但對於實驗室裡不足14千克的猴子來說就要有挑戰性得多了。

實驗員把這個裝置放在籠子裡觀察猴子們的反應如何,同時也為兩周後測試猴子解決問題的能力做好了準備。

但是很快,奇怪的事情發生了。沒有受到任何外界的鼓勵,實驗員也沒有給它們任何指示,猴子就開始專心致志地玩起這個裝置來了,而且不解開不甘休,看起來似乎還很享受。

很快,它們就弄明白了這個裝置是怎麼回事。等到哈洛第13天、第14天用這些猴子進行實驗時,它們已經駕輕就熟。它們時不時地解開這個裝置,而且速度很快,在三分之二的情況下能在60秒內解開。

現在,這就有點奇怪了。沒有人教這些猴子怎麼挪開立銷、鬆開鉤子、揭開蓋子,它們成功了也沒有人給它們食物或者感情上的獎勵,連一點點掌聲也沒有。這與靈長類動物行為表現的普遍觀點背道而馳,包括像人類這樣腦容量更大、毛髮更少的靈長類動物。

當時,科學家們認識到行為有兩種主要的驅動力(drive)。第一種驅動力是生物性驅動力:人類以及其他動物飲食以止餓,飲水以解渴,交配以滿足性欲。但這個因素在這個實驗中並沒有出現。

哈洛在報告中說:「解開裝置不會給他們帶來食物、水或性快感。」但是,僅剩的另一種已知驅動力也無法解釋猴子的這種特別行為。

如果生物性驅動力來自內部,那麼第二種驅動力則來自於外在動機:做出特定行為時環境會帶來的獎勵或懲罰。

對人類而言,這是千真萬確的,人類會對這種外力做出精確地反應。如果你承諾加薪,我們會工作得更努力;如果你說考試得A會有獎勵,我們就會學習更長時間;如果你威脅說遲到或者填錯了表就扣錢,我們就會準時到達,小心翼翼地填好每個表格。

但是這並不能解釋猴子的行為。哈洛也百思不得其解,你甚至可以聽到他抓腦袋的聲音。他寫道:「在這個實驗中觀察到的行為對動機理論提出了一些有趣的質疑,即便在沒有特別外部誘因的情況下也可以完成有效的學習,並維持這種學習。」還可能是什麼原因呢?

為了回答這個問題,哈洛提出了一個新理論,實際上這可以稱為第三種驅動力。他說:「完成任務取得的成績就是內在獎勵。」

猴子解開裝置僅僅是因為它們發現這麼做很好玩,因為它們喜歡這麼做,而這項任務所帶來的愉悅感就是獎勵。

如果這個觀點太激進,那麼之後發生的事情則更是只會增加疑問和爭論。也許這種新發現的驅動力,也就是最後被哈洛稱為內在動機(intrinsic motivation)的東西的確存在,但是顯然它從屬於前兩種驅動力之外。

如果猴子解開裝置可以得到葡萄乾作為獎勵,那麼它們本應該會毫無疑問地表現更好。但是哈洛這麼做的時候,猴子們犯的錯誤卻越來越多,裝置解開的次數也有所減少。

哈洛說:「將食物引入現在的實驗,會打亂了它們的表現,這一現象在之前的文獻中沒有提到。」

1

圖片來源:《驅動力》

具體來說,第三種驅動力指的就是「內在動力」,它有多個源頭,它可以來自自身的興趣、成長的需求、助人的愉悅、成就感、滿足感等等。

而內在動力與前兩種動力最大的區別就在於——內在動力是自給自足、自得其樂的,亦即不依賴他人/外部因素,也能獲得滿足。另外,與外在動力不同,內在動力往往更能促使一個人表現出更高的效率、創造力。

《驅動力》這本書最大的亮點就是——平克指出,其實每個人都已經具備了內在動力,人們早已擁有了把事情做好的願望。

而這正是為什麼,當我們給予個體外在獎罰時,嘗試干擾個體的行為時,他們的表現變得更糟糕了——因為當我們那樣做時,我們其實是在用外部動力來取代個體的內在動力。

獎勵的惡果(下):活化內在驅動力的三大條件

本文經4THINK授權刊登,原文刊載於此

責任編輯:朱家儀
核稿編輯:翁世航