Reforço Parcial

Cite este artigo como: Praveen Shrestha, “Reforço Parcial”, em Psychestudy, 17 de novembro de 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

O reforço parcial, ao contrário do reforço contínuo, só é reforçado em certos intervalos ou proporção de tempo, ao invés de reforçar o comportamento a cada vez. Esta forma de programação de reforço após certo número de respostas corretas ou determinado intervalo de tempo também é denominada como reforço intermitente.

Este tipo de reforço é considerado mais poderoso na manutenção ou modelagem do comportamento. Além disso, os comportamentos adquiridos a partir desta forma de programação foram considerados mais resistentes à extinção.

A definição de reforço parcial como reforço inconsistente ou aleatório de respostas pode complicar a questão do ponto de vista do aprendiz. Os pesquisadores classificaram quatro programações básicas de reforços parciais que tentam cobrir vários tipos de intervalos e proporções entre reforços.

1. Horário de intervalo fixo

Em um horário de intervalo fixo (FI), digamos um minuto, deve decorrer entre o tempo anterior e posterior que o reforço é disponibilizado para respostas corretas. O número de respostas é irrelevante durante todo o período de tempo. Isto causa uma mudança na taxa de comportamento.
A taxa de resposta é normalmente mais lenta imediatamente após um reforço, mas aumenta constantemente à medida que o tempo para o próximo reforço se aproxima.
Exemplo: Alguém que recebe pagamento por hora, independentemente da quantidade de trabalho.

2. Horário de intervalo variável

Em um horário de intervalo variável (VI), é permitido que decorram quantidades variáveis de tempo entre a disponibilização das armaduras. O reforço está dependente da passagem do tempo, mas o intervalo varia em ordem aleatória. Cada intervalo pode variar de, digamos, um a cinco minutos, ou de dois a quatro minutos. O sujeito é incapaz de descobrir quando o reforço viria; portanto, a taxa de respostas é relativamente estável.
Exemplo: Um pescador espera na costa durante um certo tempo, e muito provavelmente captura o mesmo número de peixes todos os dias, mas o intervalo entre as capturas não é o mesmo. Se o peixe é considerado reforço, então é inconsistente.

3. Calendário de proporção fixa

Num calendário de proporção fixa (FR), o reforço é fornecido depois de um número fixo de respostas correctas terem sido feitas. O reforço é determinado pelo número de respostas corretas. Por exemplo, vamos considerar que o rato esfomeado na caixa Skinner tem de pressionar a alavanca cinco vezes antes de aparecer uma pastilha de comida. Assim, o reforço segue cada quinta resposta. A proporção é a mesma para que o reforço seja apresentado.

Exemplo: Uma vendedora recebe um incentivo depois de cada par de sapatos que vende. A qualidade é irrelevante, pois ela é paga mais por um maior número de sapatos vendidos. A quantidade de produção é maximizada em um cronograma de relações fixas.

4. Calendário de relações de valor

Em um cronograma de relações de valor (VR), o reforço é fornecido após um número variável de respostas corretas terem sido feitas. Em um cronograma de relação variável 10:1, o número médio de respostas corretas que teriam que ser feitas antes que uma resposta correta subseqüente fosse reforçada é 10, mas a relação de respostas corretas ao reforço pode variar de , digamos , 1:1 a 20:1 em uma base aleatória. O sujeito geralmente não sabe quando uma recompensa pode vir. Como resultado, a resposta vem em taxa alta e constante.

Exemplo: Um exemplo prático de horário de proporção variável é como uma pessoa continua a verificar o seu post no Facebook contando o número de likes de vez em quando.

Avaliação Crítica

Diferentes horários têm vantagens diferentes. A relação de horários tem sido conhecida por obter maiores taxas de respostas do que os horários de intervalo devido à sua previsibilidade.

Para a Instância, considere um trabalhador de fábrica sendo pago por item que ele fabrica. Isto motivaria o trabalhador a fabricar mais.

As programações variáveis são menos previsíveis, portanto tendem a resistir à extinção e a continuação do comportamento é auto incentivada. Os jogos de azar e a pesca são considerados entre os exemplos clássicos de horários variáveis. Apesar do seu feedback mal sucedido, ambos estão esperançosos que mais um puxão na slot machine, ou mais uma hora de paciência irá mudar a sua sorte.

Por causa do fato de que o reforço parcial torna o comportamento resistente à extinção, ele é frequentemente trocado – para ter ensinado um novo comportamento usando o Programa de Reforço Contínuo.

Cite este artigo como: Praveen Shrestha, “Reforço Parcial”, em Psychestudy, 17 de novembro de 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning/reinforcement-punishment/partial-reinforcement.

Deixe uma resposta

O seu endereço de email não será publicado.