Partial Reinforcement

Citeer dit artikel als: Praveen Shrestha, “Partial Reinforcement,” in Psychestudy, 17 november 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

Partial reinforcement, in tegenstelling tot continuous reinforcement, wordt alleen versterkt met bepaalde intervallen of ratio’s van tijd, in plaats van het gedrag elke keer opnieuw te versterken. Deze vorm van het plannen van bekrachtiging na een bepaald aantal correcte reacties of een bepaald tijdsinterval wordt ook wel intermitterende bekrachtiging genoemd.

Deze vorm van bekrachtiging wordt als krachtiger beschouwd in het handhaven of vormen van gedrag. Ook is gebleken dat gedrag dat met deze vorm van schema’s is verworven, beter bestand is tegen uitdoving.

De definitie van gedeeltelijke bekrachtiging als inconsistente of willekeurige bekrachtiging van responsen kan de zaak compliceren vanuit het oogpunt van een lerende. Onderzoekers hebben vier basis schema’s van gedeeltelijke bekrachtiging geclassificeerd die verschillende soorten intervallen en verhoudingen tussen bekrachtigingen trachten te dekken.

1. Fixed-Interval Schedule

In een fixed interval schema (FI), zeg een minuut, moet verstrijken tussen de vorige en volgende keren dat versterking beschikbaar wordt gesteld voor correcte responsen. Het aantal reacties is irrelevant gedurende de gehele tijdsperiode. Dit veroorzaakt verandering in de snelheid van gedrag.
De reactiesnelheid is gewoonlijk langzamer onmiddellijk na een versterking maar neemt gestaag toe naarmate de tijd voor de volgende versterking dichterbij komt.
Voorbeeld: Iemand die per uur betaald wordt, ongeacht de hoeveelheid werk.

2. Variable-Interval Schedule

In een variabel interval schema (VI), worden variërende hoeveelheden tijd toegestaan tussen het beschikbaar stellen van bekrachtiging. Versterking is afhankelijk van het verstrijken van de tijd, maar het interval varieert in willekeurige volgorde. Elk interval kan variëren van, bijvoorbeeld, één tot vijf minuten, of van twee tot vier minuten. De proefpersoon is niet in staat te ontdekken wanneer de versterking komt; vandaar dat de snelheid van de reacties relatief constant is.
Voorbeeld: Een visser wacht een bepaalde tijd aan de kust, en hij vangt waarschijnlijk elke dag hetzelfde aantal vissen, maar het interval tussen de vangsten is niet hetzelfde. Als vis als versterking wordt beschouwd, dan is dat inconsistent.

3. Fixed-Ratio Schedule

In een fixed ratio schema (FR) wordt versterking gegeven nadat een vast aantal juiste reacties is gegeven. De versterking wordt bepaald door het aantal juiste reacties. Laten we bijvoorbeeld aannemen dat de hongerige rat in de Skinner doos vijf keer op de hendel moet drukken voordat er een voedselbolletje verschijnt. Daarom volgt beloning op elke vijfde reactie. De verhouding is dezelfde voor de te presenteren versterking.

Voorbeeld: Een verkoopster krijgt een stimulans na elk paar schoenen dat ze verkoopt. De kwaliteit doet er niet toe, want zij krijgt meer betaald voor een groter aantal verkochte schoenen. De kwantiteit van de output wordt gemaximaliseerd in een schema met vaste verhoudingen.

4. Waardevol-verhoudingsschema

In een waardevol-verhoudingsschema (VR) wordt de beloning gegeven nadat een variabel aantal juiste antwoorden is gegeven. In een 10:1 schema met een variabele verhouding is het gemiddelde aantal correcte reacties dat moet worden gegeven voordat een volgende correcte reactie wordt versterkt 10, maar de verhouding van correcte reacties tot versterking kan variëren van bijvoorbeeld 1:1 tot 20:1 op een willekeurige basis. De proefpersoon weet gewoonlijk niet wanneer de beloning zal komen. Als gevolg daarvan komt de respons in een hoog, gestaag tempo.

Voorbeeld: Een praktisch voorbeeld van een variabel verhoudingsschema is hoe iemand zijn Facebook-post blijft controleren en van tijd tot tijd het aantal ‘likes’ telt.

Kritische evaluatie

Verschillende schema’s hebben verschillende voordelen. Van verhoudingsschema’s is bekend dat ze een hogere respons uitlokken dan intervalschema’s, omdat ze voorspelbaar zijn.

Zie bijvoorbeeld een fabrieksarbeider die betaald krijgt per artikel dat hij vervaardigt. Dit zou de arbeider motiveren om meer te produceren.

Variabele schema’s zijn minder voorspelbaar, zodat ze de neiging hebben om uitdoving te weerstaan en de voortzetting van gedrag wordt zelf aangemoedigd. Gokken en vissen worden beschouwd als een van de klassieke voorbeelden van variabele schema’s. Ondanks hun onsuccesvolle terugkoppeling, zijn beiden hoopvol dat nog één trekje aan de gokautomaat, of nog één uur geduld hun geluk zal veranderen.

Omdat gedeeltelijke bekrachtiging gedrag weerbaar maakt tegen uitdoving, wordt vaak overgeschakeld – op het aangeleerd hebben van een nieuw gedrag met behulp van Continu Bekrachtigingsschema.

Citeer dit artikel als: Praveen Shrestha, “Partiële bekrachtiging,” in Psychestudy, 17 november 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.