Please enable JavaScript.
Coggle requires JavaScript to display documents.
Prueba 2 // Psicología de Aprendizaje, Contingencia Positiva Cuando pasa…
Prueba 2 // Psicología de Aprendizaje
Condicionamiento instrumental/Operante
Es un tipo de aprendizaje en el que un comportamiento se vuelve más o menos probable dependiendo de sus consecuencias.
Se basa en la idea de que las conductas que son seguidas por un refuerzo (recompensa) tienen más probabilidad de repetirse en el futuro, mientras que las conductas seguidas por un castigo tienen menos probabilidad de repetirse.
Thorndike "Ley de efecto"
-Las respuestas seguidas de consecuencias satisfactorias tienden a hacer repetidas, ya que hay una recompensa. Mientras que las respuestas seguidas de consecuencias desagradables tienden a ser evitadas. Por lo que comienza a asociar conductas con la recompensa que tendrá, y la motivación será la recompensa.
-Evento satisfactorio: mayor asociación.
-Evento molesto: menor asociación.
Procedimiento de ensayo discreto:
(Experimento que hace Small, basado en los experimentos y métodos de Thorndike)
Animal escapa. Respuesta instrumental solo se realiza una vez en cada ensayo (velocidad, latencia, elecciones correctas).
Ver cuanto se demora hasta llegar al final, por lo que hace una medición.
El Procedimiento tiene un inicio y un fin.
Hay un objetivo, y luego que llega al fin del laberinto se le da la recompensa al ratón (individuo) y luego de esto será removido.
Solo se puede hacer una vez, no hay interrupciones entre medio del experimento.
Thorndike:
Propone un modelo experimental basado a ensayos discretos que cada vez que se muestran la respuesta instrumental se corta el experimento.
Skinner "Operante libre"
Procedimiento de operante libre
No limitar la cantidad de veces que el animal pueda dar la respuesta.
Repetición de escape. Sin restricción de la respuesta instrumental. Más ecológica, natural.
Cualquier respuesta que se requiera para producir una consecuencia deseada es una respuesta instrumental.
"No importa como se llegue al resultado, sino que se cause el efecto deseado"
Ej. La puerta, no importa como se abra si con las manos o los pies, pero que finalmente se tiene que abrir.
Operante
Es una forma de medir la conducta en unidades significativas.
Es cualquier conducta aislada (algo que yo puedo cuantificar y observar, alejado de su conducta habitual) del comportamiento general, que modifique ciertas circunstancias. Ósea es una conducta que al hacerlo tendrá consecuencias.
Ej. Apretar una palanca (conducta), es algo que puede dar consecuencias. Y el apretar la palanca da lo mismo como se haga.
Moldeamiento (base de los procesos educativos):
Secuencia de pasos progresivos que permiten conseguir un determinado entrenamiento.
Es el proceso secuencial de conducta que tiene que aprenderse para desarrollar cierta conducta en un espacio de tiempo. A partir de lo que ya se sabe, se va agregando información para llegar al objetivo.
Evaluar el nivel inicial
(el niño solo sabe tocar 2 notas en el violín)
"Donde estoy al inicio"
Dividir en pasos progresivos
(dividir los pasos para poder llegar al objetivo, como por ejemplo enseñarle más notas, escalas, canciones y así bien distributivo de manera creciente)
"Cuales son los pasos que tengo que hacer para poder llegar al objetivo"
Definir la respuesta final
(que un niño toque en violin una canción especifica de Mozart)
"Donde quiero llegar"
Skinner:
Manténgase el experimento, pero cuando se logra la conducta démosle la libertad al animal para repetir la conducta instrumental infinitas veces y veamos como afecta y que afecta la conducta instrumental.
Reforzador
Es lo que tiene por función potenciar conductas, es decir aumentar la probabilidad que se lleve a cabo una cierta conducta.
Un reforzador va a hacer más efectivo cuando se da más cerca de la respuesta instrumental. Ya que mientras más tiempo pasa entre la respuesta instrumental y la entrega de el reforzador menos eficiente será el reforzador.
Los Reforzadores son subjetivos, ya que son relativos al contexto del individuo.
(Ej. el niño limpia y se le entrega un chocolate en ese momento, será más efectivo que si el niño limpia y al final del día le dan el chocolate)
Reforzador instrumental
El reforzamiento puede incrementar la variabilidad de la respuesta, por lo que ésta puede establecerse como una operante.
Varios aspectos del reforzador determinan sus efectos sobre el aprendizaje y des-
empeño de la conducta instrumental: cantidad, latencia , calidad, que recibió el sujeto antes (contexto)
Variablidad
Pertinencia
Tasa de respuesta
Procedimientos del Condicionamiento Instrumental
Reforzamiento
Reforzamiento Positivo
Se le
dará
algo
agradable
Ej. Cuando un niño obtiene arriba de un 6,5 se va al McDonald. (Se estimula al niño a sacar buenas notas)
Contingencia positiva
Incremento de tasas de respuestas
Reforzamiento Negativo
Se le
quitara
algo
desagradable
Ej. Si un niño se come toda la carne, no se tendrá que comer el coliflor (que no le gusta).
(Se estimula al niño que tiene que comer proteína)
Contingencia negativa
Incremento de tasas de respuestas
Castigo
Castigo Positivo
Se le
dará
algo
desagradable
Ej. Un niño se mancho toda la ropa con barro en el parque, por lo que el padre lo retara en publico frente a todos.
Contingencia positiva
Disminucion de tasas de respuesta
Entrenamiento por omisión (Castigo negativo)
Realizar una acción,
que por
consecuencia
quitarme
lo
que me gusta
Ej. Que me castiguen no pudiendo salir el domingo, y por consecuencia no voy a poder jugar hockey (hockey= lo que mas me gusta/placer)
Contingencia negativa
Disminucion de tasas de respuesta
Condicionamiento clásico
Es por continuidad temporal y espacial, y No hay ganancia.
En este condicionamiento se asocia una respuesta involuntaria y un estimulo.
Programas de reforzamiento y conducta de elección
Es la regla o criterio que determina en qué instancias o momentos exactamente se va a entregar ese reforzador después de que ocurra la respuesta deseada.
Programas simples
Programas de Razón
El reforzamiento depende únicamente del número de respuestas que realiza un participante. Sin importar cuándo ocurren esas respuestas. (Aprendizaje por repetición, respuestas se van contando)
Reforzamiento continuo; a cada respuesta instrumental emitida le sigue el Rf.
Reforzamiento parcial; situaciones en que la respuesta instrumental sólo es reforzada algunas veces.
Programa de RAZÓN FIJA
Programa de reforzamiento en que debe ocurrir un número fijo de respuestas para que la siguiente respuesta sea reforzada.
(Ventana de tiempo de respuesta, el pulso)
Tiende a ver una pausa, ya que se cuanto tengo que esforzarme, y se cuanto gano.
Dosifico mi esfuerzo
No hay incertidumbre
No varia el numero, ya que siempre es lo mismo.
Programa de RAZÓN VARIABLE
Programa en que el número de respuestas necesario para
producir reforzamiento varía de un ensayo a otro. El valor del programa se refiere al número promedio de respuestas que se necesitan para obtener el reforzamiento.
La incertidumbre es incentivo, para poder tener un beneficio.
Varia el numero.
Es más continua.
Ej. El Uber, ya que si trabaja horas extras puede ser que tenga más dinero. Pero como su sueldo no es fijo no sabe cuanto ganara o si ganara dinero.
Programa de Intervalo
Programa de reforzamiento en que una respuesta es reforzada sólo si ocurre después de que ha transcurrido una cantidad establecida de tiempo desde el último reforzador o desde el inicio del ensayo.
(A partir de una respuesta, se disponibiliza por un intervalo de tiempo un nuevo reforzador)
Programa de INTERVALO VARIABLE
Se entrega el reforzamiento a la primera respuesta que ocurre después de que ha transcurrido una cantidad variable de tiempo desde el último reforzador o desde el inicio del ensayo.
Ej. el perro debe sentarse en un determinado tiempo, y si no lo hace es que se perdió el estimulo y no recibe el reforzador aunque lo haga después del periodo de tiempo, ya que no queda asociado.
Se sabe que cada un tiempo haya algo pero no necesariamente se cumple. Ya que hay incertidumbre.
Ej. Examen sorpresa cada semana aproximadamente. Esto hace que la persona, en el tiempo de espera estudie, ya que no sabe si se hará el examen o no.
Programa de intervalo y DISPONIBILIDAD LIMITADA
En programas de intervalo fuera del laboratorio, es más común que los reforzadores sólo estén disponibles por períodos limitados.
Los reforzadores solo están disponibles por periodos limitados, además del tiempo se le suma la disponibilidad.
Ej. La comida en una cafeteria. En la mañana pueden haber medialunas, pero quizás en la tarde ya no hayan.
Programa de INTERVALO FIJO
Reforzamiento en que se entrega el reforzador a la primera respuesta que ocurre después de que ha transcurrido una cantidad fija de tiempo desde el último reforzador o el inicio del ensayo.
(Ej. en Jueguito, si lo haces bien pasas de nivel (siendo este el reforzador)
Otro ejemplo, el perro, sentarse 3 minutos, golosina)
Para obtener lo que quiero tengo que esperar un intervalo de tiempo.
La tasa de respuesta aumenta cuando viene el reforzador
Ej. Se sabe que todos los lunes hay prueba. Por lo que las personas a medida que se acerque el lunes comenzaran a estudiar, no antes.
Mecanismos motivacionales
La estructura asociativa del condicionamiento instrumental (Thorndike)
Perspectiva molecular ASOCIACIÓN.
Es abstracta, ya que no considera la vida actual y es especifica -> (Estimulo, respuesta, reforzador)
Es compatible con la tradición teórica del condicionamiento pavloviano.
Que postula Thorndike/Teorías asociativas
Estructura asociativa del condicionamiento instrumental
Se refiere básicamente a cómo se forman los vínculos o conexiones entre tres elementos clave: Estimulo-Respuesta-Consecuencia.
Cuando un estímulo es seguido inmediatamente por una respuesta, y esta respuesta produce una consecuencia positiva (algo agradable o beneficioso como comida), entonces el vínculo o asociación entre el estímulo y la respuesta se fortalece.
Por el contrario, si después de la respuesta ocurre una consecuencia negativa (algo desagradable), entonces el vínculo entre estímulo y respuesta se debilita.
Asociaciones E-R y la ley de efecto:
Ley del efecto:
Esta ley establece que cuando una respuesta va seguida de una consecuencia satisfactoria, la asociación E-R se fortalece y aumenta la probabilidad de que esa respuesta se repita ante el mismo estímulo en el futuro. Por el contrario, si la consecuencia es insatisfactoria, la asociación E-R se debilita y disminuye la probabilidad de repetir esa respuesta.
Asociaciones E-R (Estímulo-Respuesta):
El aprendizaje se produce mediante la formación de asociaciones o conexiones entre un estímulo ambiental específico (E) y una respuesta conductual particular (R) del organismo.
Criticas respecto a lo que plantea Thorndike
Es la teoría de dos procesos (Experimento a prueba de transferencia pavloviano instrumental
Se critica que Thorndike abordó ambos tipos de condicionamiento (instrumental y clásico) como "procesos aislados", sin considerar que pudieran estar conectados de algún modo en lugar de ser totalmente independientes.
Teoría de la devaluación del reforzador; Asociación R-C.
La crítica señala que la teoría de Thorndike fue limitada al centrarse únicamente en las asociaciones E-R, sin considerar adecuadamente que los organismos también codifican y aprenden asociaciones entre sus respuestas (R) y las consecuencias (C) o reforzadores específicos que obtienen.
"El reforzador no es parte de la asociación, según Thorndike"
La regulación conductual (Skinner)
Perspectiva molar ECOLOGÍA. (Implica su énfasis en estudiar patrones integrados de conducta en los contextos ambientales naturales de los organismos)
Principio de Premack y sus aplicaciones:
“Las cosas que nos gustan más, actuaran de manera reforzadora”.
Este principio establece que cualquier conducta de alta probabilidad (más frecuente o preferida) puede ser utilizada como reforzador para incrementar la probabilidad de ocurrencia de una conducta de baja probabilidad (menos frecuente)
Teoría de éxtasis conductual
Aplicación del concepto de “homeostasis” a la regulación de la conducta.
Este "éxtasis conductual" interno actuaría como un reforzador automático que mantendría y estimularía la emisión futura de esas conductas
Punto de éxtasis conductual: Forma en la que un individuo naturalmente distribuye sus conductas cuando no hay restricciones para su comportamiento.
Contingencia instrumental: Cualquier regla expuestamente, que no me permite hacer lo que yo quiero.
Contingencia Positiva
Cuando pasa algo pasa otra cosa
Contingencia Negativa
Cuando pasa algo NO pasa lo otro