본문 바로가기
📘기초심리학

조작적 조건형성에 대해 알아보기

by 샤인인포 2023. 11. 5.

조작적 조건형성은 미국의 스키너라는 사람이 파블로프의 고전적 조건형성에 영향을 받고 그 이론을 확장하여 연구한 학습 메커니즘을 말합니다. 행동주의 이론을 학습이론으로 더욱 정교하게 다듬었다고 할 수 있습니다. 오늘은 스키너가 연구한 조작적 조건형성의 연구배경, 주요 연구, 기본 개념 등에 대해서 알아보도록 하겠습니다.

조작적 조건형성
조작적 조건형성

 

1. 조작적 조건형성의 연구 배경

1904년 미국에서 태어난 스키너는 어렸을 때부터 독립적으로 생각하고 행동하는 편이었으며, 확실한 증거가 없으면 그 누구의 주장도 잘 믿지 않았다고 합니다. 원래는 작가가 되고 싶었던 그는 다양한 책을 읽으면서 왓슨과 파블로프의 연구를 알게 되었고, 새로운 학문인 심리학을 공부하기 위해서 하버드 대학 대학원에 진학했습니다.

대학원에 진학한 스키너는 행동주의의 입장에서 연구를 지속하는 데 별 어려움이 없을 정도로 논리적으로 사고했다고 합니다. 스키너는 '어떤 행동이 만족스러운 결과를 낳으면 그 행동이 증가한다'는 손다이크의 효과의 법칙에 착안하여 우연한 행동의 결과물로 보상이 나오는 공간 일명 스키너 상자에 동물을 넣고 행동을 관찰하기 시작했습니다. 

 

2. 스키너 상자 실험과 주요 개념

2-1. 스키너 상자 실험

스키너는 쥐 나 비둘기 같은 동물을 자신이 고안해 낸 상자에 넣고 행동을 연구했습니다. 레버를 누를 때마다 자동으로 먹이가 나오도록 설계한 상자입니다. 우연히 레버를 누른 쥐가 먹이를 공급받았고, 그 결과 레버를 누르는 행동이 증가하게 됩니다. 그러다가 먹이통의 먹이가 다 떨어져서 레버를 눌러도 먹이가 나오지 않게 되면 쥐는 몇 차례 시도하다가 더 이상 레버를 누르지 않습니다. 그리고 그다음 실험에서는 레버를 누를 때마다 계속 먹이를 주는 것이 아니라 미리 설정한 시간이나 혹은 레버를 누르는 횟수에 따라 먹이를 주기 시작했습니다. 이 경우에는 레버를 누르는 학습의 속도는 레버를 누를 때마다 먹이가 나오던 이전 실험 때보다는 약간 늦지만, 시간이 지나면 쥐는 이전처럼 열심히 레버를 누르게 됩니다. 그리고 이 상황에서도 먹이통의 먹이가 다 떨어져서 더 이상 먹이가 나오지 않았을 때, 쥐는 이전 실험에서보다 레버 누리기를 더 오래 지속했습니다. 

 

2-2. 주요 개념

  • 강화 : 반응이 다시 발생할 빈도를 증가시키는 것입니다. 쥐가 먹이를 얻기 위해 레버를 열심히 누르게 되는 것을 강화되었다고 합니다. 강화는 다시 정적강화와 부적강화로 나눌 수 있으며, 정적강화는 유쾌자극을 제시하여 행동의 빈도를 증가시키는 것입니다. 예를 들면 밥을 잘 먹는다고 칭찬을 받게 되며 더 잘 먹으려고 하는 것입니다. 부적강화는 불쾌 자극을 없애서 행동의 빈도를 증가시키는 것입니다. 예를 들면 발표자에 대한 보충수업을 면제시켜 줌으로써 발표 동기를 높이는 것이라 할 수 있습니다.
  • 처벌 : 처벌은 이전의 부적 행동의 빈도를 줄이는 것입니다. 처벌은 정적 처벌과 부적 처벌로 나눌 수 있습니다. 정적 처벌은 불쾌한 자극을 제시하여 행동의 빈도를 줄이는 것입니다. 예를 들면, 잘못된 행동에 대해 체벌을 가함으로 그 행동을 줄이는 것입니다. 부적 처벌은 유쾌 자극을 없애서 행동의 빈도를 줄이는 것입니다. 예를 들면 방청소를 하지 않은 아이에게 컴퓨터를 못하게 하는 것이라 할 수 있습니다. 하지만 처벌은 공격성이나 무기력을 유발하는 부작용이 있기 때문에 바람직하지 않은 행동을 방지할 뿐 바람직한 행동을 학습시킬 수 없기 때문에 권장되지는 않습니다. 

 

3. 조작적 조건형성의 강화계획

3-1. 연속강화

반응의 횟수나 시간에 상관없이 기대하는 반응이 나타날 때마다 강화를 주는 것입니다.

3-2. 고정간격강화

일정산 시간 간격을 두고 강화물이 나오는 것으로, 지속성이 거의 없고, 강화시간이 다가오면서 반응률이 증가하는 반면에 강화 후에는 반응률이 떨어집니다. 예를 들면 주급, 월급, 일당, 정기적 시험등이 있습니다.

3-3. 변동간격강화

시간 간격을 두고 강화물이 나오는데, 그 간격이 변동하고 예측할 수가 없습니다. 느리고 완만한 반응률을 보이며, 강화 후에도 언제 강화물이 나올지 모르기에 거의 쉬지 않습니다. 쥐 실험에서 때로는 1분 후, 때로는 5분 후에 레버를 눌러야 먹이가 나오는 경우를 예로 들 수 있습니다. 

3-4. 변동비율강화

반응 횟수에 따라 강화물이 나오는데, 그 횟수가 변동하고 예측할 수가 없습니다. 어떤 때는 2번 누르고 나서, 어떤 때는 10번 누르고 나서 먹이가 나오는 경우로 슬롯머신과 같은 것을 예로 들 수 있습니다. 

 

위 4가지 강화계획으로 실험을 해보니 비율 계획이 간격 계획보다 학습 효과가 좋다는 것을 알 수 있었습니다.  한편, 강화물이 주어지지 않는 동안에도 반응이 지속되는 경향은 예측이 쉬운 고정 계획일 때보다 예측이 어려운 변동 계획일 때 더 높았습니다. 대표적인 변동비율 계획은 바로 도박입니다. 계속 돈을 잃으면서도 도박에서 손을 떼기가 어려운 이유입니다. 

 

4. 마무리

지금까지 조작적 조건형성에 대해서 알아보았습니다. 조작적 조건형성은 행동이 발생한 이후의 결과에 관심을 가지며, 인간의 행동경향이 환경으로부터 자극에 의한 것이라고 보았습니다. 관찰과 측정이 가능한 대상만을 연구해야 한다는 것 때문에 다양한 심리적 기제의 작용을 외면하여 인지주의에 흐름을 내주게 되었습니다. 하지만 현재까지도 학습과 동물 행동 관련 분야에서는 널리 활용되고 있습니다.