部分強化

この記事を引用しています。 Praveen Shrestha, “Partial Reinforcement,” in Psychestudy, November 17, 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

部分強化は連続強化と異なり、毎回行動を強化するのではなく、一定の間隔や時間の比率で強化するだけである。 5545>

このタイプの強化は、行動を維持または形成する上でより強力とみなされる。 また、この形式のスケジュールから獲得された行動は、消滅に対してより強いことが分かっている。

反応の一貫性のない、またはランダムな強化としての部分強化の定義は、学習者の観点から問題を複雑にしかねない。 研究者たちは、強化の間隔や比率の様々な種類をカバーしようとする部分強化の基本スケジュールを4つに分類している

1.強化の間隔と比率が異なる場合、強化の間隔と比率が異なる場合、強化の間隔と比率が異なる場合、強化の間隔と比率が異なる。 固定インターバルスケジュール

固定インターバルスケジュール(FI)では、正しい反応に対して強化が利用可能になる前回と次回の間に、例えば1分経過していなければならない。 この間、反応の回数は関係ない。 これにより行動速度が変化する。
強化直後の反応速度は通常遅くなるが、次の強化の時間が近づくにつれて確実に増加する。
例. 5545>

2.可変間隔スケジュール

可変間隔スケジュール(VI)では、強化が利用できるようになるまでの経過時間を変化させることが許される。 強化は時間の経過を条件とするが、その間隔はランダムに変化させる。 各間隔は例えば1分から5分、あるいは2分から4分と変化する可能性がある。 被験者はいつ強化が来るかを知ることができないため、反応速度は比較的安定している
。 例:ある漁師が海岸で一定時間待っていると、毎日同じ数の魚が釣れるが、釣れる間隔が同じではない。

3. 固定比率スケジュール

固定比率スケジュール(FR)では、一定数の正しい反応がなされると強化が行われる。 強化は正しい反応の数によって決定される。 例えば、スキナー箱の中の空腹のネズミはレバーを5回押さないと餌が現れないとする。 従って、5回目の反応ごとに強化が行われます。 強化が提示される比率は同じです。

例. 例:セールスウーマンが靴を1足売るごとにインセンティブを得る。 靴の質は関係なく、売れた数だけ高い報酬がもらえる。 固定比率スケジュールでは生産量が最大になる。

4.価値比率スケジュール

価値比率スケジュール(VR)では、可変数の正答がなされた後に強化が行われる。 10:1の可変比率スケジュールでは、その後の正しい応答が強化される前になされなければならない正しい応答の平均数は10であるが、強化に対する正しい応答の比率は、例えば、1:1から20:1まで無作為に変化することが許されるかもしれない。 通常、被験者はいつ報酬が来るかわかりません。 その結果、応答は高く、安定した割合でやってきます。

例:可変比率スケジュールの実例は、人がFacebookの投稿をチェックし続け、時々「いいね!」の数を数える方法です。

重要評価

異なるスケジュールには異なる利点があります。 比率のスケジュールは、その予測可能性のため、間隔のスケジュールよりも高い回答率を引き出すことが知られている。

For Instanceでは、工場の労働者が彼が製造したアイテムごとに支払われることを考える。

変動スケジュールは予測可能性が低いので、消滅に抵抗する傾向があり、行動の継続が自己奨励される。 ギャンブルや釣りは可変スケジュールの典型的な例とされている。

部分強化は行動を絶滅に強くするという事実があるため、連続強化スケジュールを使って新しい行動を教えた後、切り替えることがよくあります。 Praveen Shrestha, “Partial Reinforcement,” in Psychestudy, November 17, 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

.

コメントを残す

メールアドレスが公開されることはありません。