狗的行為訓練建模方法

強化對提高行為反應的頻率起著非常重要的作用。但是如果妳想用它來進行行為訓練，妳必須在訓練過程中讓目標行為至少出現幾次。

反之，當狗無法達到目標行為或無法直接出現某個行為時，該行為的頻率就無法增加和加強。

所以，在這種情況下，就需要強化操作條件原理，使目標行為或壹種行為出現並強化，即行為塑造。

什麽是行為塑造？

行為塑造是從斯金納博士的操作條件的作用理論發展而來的。

它是壹種用來塑造狗無法直接做出目標行為的方法，使狗的目標行為越來越近，最後這種目標行為逐漸強化。

行為建模又稱連續逼近法，是壹系列連續的動作來逼近和強化目標行為，最終使狗做出目標行為並穩定下來。

行為建模廣泛應用於訓犬。

比如飛盤狗的訓練過程:

讓狗狗對玩具(球和結)感興趣→學會追逐玩具→學會拿著玩具交換→培養狗狗玩飛盤→近距離抓飛盤→遠距離抓飛盤。

在這壹系列的過程中，形成了壹系列的動作。

同時，訓狗師在抓飛盤的過程中，要感到快樂，對每個階段的進步給予及時的鼓勵。這個過程就是強化，是壹個循序漸進的過程。

行為塑造的特征

相關階段

行為建模通常用於更復雜的行為。壹個復雜的行為很難只靠壹步就達到目標行為。

因此，在行為塑造的過程中，最終的目標行為往往被分解為相互關聯的階段性目標行為。

比如狗學裝死的過程，可以提煉為以下階段性目標行為:

狗走到我身邊→挨著我坐下→挨著我躺下→挨著我躺下→完全挨著我躺下→挨著我躺下保持壹會兒→最後狗還是躺著不動。

在階段性目標行為中，第壹階段目標行為也是初始行為，是最簡單的行為訓練階段，也是狗狗容易習得的行為。

人離開狗後還躺著不動是終極目標行為。

所以最後階段的目標行為也叫終目標行為，是塑造結果的終極目標行為。

漸進性

在行為塑造的過程中，每個階段的目標行為都是相互聯系的，是壹個不斷逼近的行為。只有在前壹個行為完成的基礎上，才能進入下壹個目標行為，從而形成壹系列遞進的過程。

比如訓練狗去撿球:

把狗帶到壹個安靜的房間，在房間的某個地方放壹個球。

這壹培訓和塑造過程的步驟是:

狗看著球的方向→靠近球→觸球→用嘴觸球→用嘴叼起球→不能含在嘴裏→叼著球往回走→把球吐在人家手裏。

狗只有朝球的方向看，才能靠近球。

有可能是觸球之後的觸球行為，以此類推，最終壹步步達到目標行為。

行為塑造的過程，其實就是從狗狗最簡單最容易獲得的動作開始，壹步步向最終的目標行為邁進的過程。

使用加強和減弱策略。

在行為塑造的過程中，每個階段接近目標的行為，其實都是壹種新的行為。

狗狗每達到壹個預定的階段目標，訓練師都要加強。

當強化達到壹定程度時，訓練者會停止強化，這往往會導致行為的消失。其實這個過程就是行為淡化的過程。

當然，停止強化的主要目的是進入下壹階段的目標行為。

比如狗狗第壹次摸飛盤，主人會很開心的抱抱狗狗，和它拔河，給他吃的。

這其實是對狗的壹種強化，信息增強的狗會繼續表現出類似的行為。

在最初的幾次中，訓狗師會繼續給予及時的回應以加強。

當訓犬師覺得不再需要加強簡單的觸摸飛盤時，如果狗狗繼續出現，只是觸摸飛盤，訓犬師應該不會有反應。

因為如果繼續強化，狗狗只會做出那種簡單的摸飛盤的行為，不會再有撿起飛盤或者把飛盤還給主人的行為。

同樣的，當狗狗只是簡單的摸了幾次飛盤，得到訓導員的回應，狗狗就會失去繼續摸飛盤的興趣。

有時候訓狗師不得不教狗如何用壹些方法握住起跳盤。

比如模仿學習，強化其他狗在學習狗面前拿著起跳板的行為。有些狗狗會嘗試學習其他狗狗如何拿起起跳板，希望得到訓犬師的積極回應。

當狗狗脫盤時，訓犬師要及時給予積極的回應。此時，這個過程就是用飛盤來強化狗狗的新行為。