ПАУЗЫ НА РАСПИСАНИЯХ FR И VR НА ПРИМЕРЕ НАУЧЕННОГО ПОВЕДЕНИЯ ЖИВОТНЫХ

АНАСТАСИЯ ГАЛИЦКАЯ

В данном исследовании рассматриваются различия в продолжительности пауз после получения поощрения на расписаниях «фиксированное количество» (далее FR) и «случайное количество» (далее VR) на примере наученного поведения двух котов, а также сравнивается длительность пауз после получения животными поощрения и после пропуска поощрения на расписании «случайное количество». Результаты проведённого эксперимента показали, что на расписании «случайное количество» после получения поощрения также возникают паузы, которые короче пауз после поощрения на расписании «фиксированное количество». Кроме того, когда в 50% эпизодов поведения предоставление поощрения на расписании «случайное количество» было пропущено, паузы после пропусков поощрения оказались короче, нежели после подачи поощрения.

Тема эффектов, связанных с подачей поощрения на различных расписаниях, рассматривалась во многих исследованиях, главным образом, зарубежных авторов. Пауза, которая возникает после получения поощрения, является закономерным явлением для фиксированных расписаний – FR и FI. Пауза после получения поощрения на этих расписаниях продолжительнее, чем это необходимо для употребления поощрения. Ferster C. B. и Skinner B. F. в работе «Schedules of reinforcement» (1957) предположили, что поощрение выполняет функцию отличительного стимула и сигнализирует о том, что начинается период, в течение которого поощрение будет недоступно. Так, Griffiths R.R. и Thompson T. в работе «The post-reinforcement pause: A misnomer» (1973) подчеркнули, что термин «пауза после поощрения» можно трактовать также как «пауза, контролируемая поощрением». В работе Kello J. E. «The reinforcement omission effect on fixed-interval schedules: frustration or inhibition?» (1972) отмечено, что когда некоторые из предъявляемых на непрерывном расписании “фиксированный интервал” поощрения пропускали, продолжая при этом предъявлять стимул, предшествующий поощрению, паузы после этого стимула оказывались значительно короче, нежели паузы после получения поощрения.

Однако исследования показали, что пауза после получения поощрения характерна не только для фиксированных расписаний. Например, Priddle-Higson P.J, Lowe C.F. и Harzem P. в своей работе “Aftereffects of reinforcement on variable-ratio schedules” (1976) описали результаты экспериментов, проведённых на крысах, один из которых был посвящён сравнению продолжительности паузы после получения поощрения и после пропуска поощрения на расписании VR. Авторы сообщают, что, когда 50% эпизодов подачи поощрения на расписании VR были пропущены в случайном порядке, паузы в случае пропуска подачи поощрения были короче, чем паузы после подачи поощрения.

Как отмечает Schlinger (2008), Ferster и Skinner пришли к следующему выводу: поскольку параметр на расписании «случайное количество» трудно предугадать, и он часто бывает низким, поощрение не имеет такого сильного тормозящего эффекта, как на расписании FR, и поэтому паузы на расписании VR должны быть минимальны. Однако важным фактом является то, что исследователи отмечают наличие этих пауз в принципе.

Что касается эффекта, сопровождающего пропуск подачи поощрения (также известный, как «фрустрирующий эффект»), то его изучением занимались некоторые исследователи (например, Stout, Steven C.; Muzio, Rubén N.; Boughner, Robert L.; Papini, Mauricio R. в работе «Aftereffects of the surprising presentation and omission of appetitive reinforcers on key-pecking performance in pigeons» (2002), испытуемыми служили голуби), но, в основном, на фиксированном расписании. Эффекты пауз при пропуске подачи поощрения на расписании VR освещались мало, российские исследования на эту тему нами найдены не были. Поэтому нам было интересно провести небольшое исследование, взяв в качестве испытуемых двух домашних котов, чтобы подтвердить или опровергнуть гипотезу Priddle-Higson P.J, Lowe C.F. и Harzem P. (1976) о том, что на расписании VR паузы после пропуска подачи поощрения короче пауз после предъявления поощрения.

Таким образом, в нашем эксперименте мы хотим подтвердить, что:

Паузы после предъявления поощрения бывают и на случайных расписаниях.
Паузы на случайном расписании (в данном случае – VR) короче, нежели на фиксированном (в данном случае – FR).
Паузы после пропуска подачи поощрения на расписании VR короче, чем после предъявления поощрения.

МЕТОД

Испытуемые

В качестве испытуемых для проведения исследования были выбраны два домашних кота: абиссинский, 2,5 года и сибирский, 15 лет (далее – «испытуемый 1» и «испытуемый 2» соответственно).

Оба кота постоянно находились в одной квартире, на момент начала эксперимента и на протяжении всего эксперимента не демонстрировали новых поведений, не связанных с экспериментом, а также признаков плохого самочувствия. Оба кота на протяжении всего эксперимента получали привычный рацион, но продукт, служивший в эксперименте поощрением (пищевая добавка для кошек), перестал предоставляться за неделю до начала эксперимента и не предоставлялся испытуемым в другое время, кроме как во время экспериментальных сессий. Таким образом, были искусственно созданы условия депривации и увеличена ценность данного поощрения для испытуемых.

Материалы

Для проведения эксперимента использовались следующие материалы, которые можно разделить на две группы.

Во-первых, это действия и объекты, ставшие стимулами, которые воздействуют на поведение испытуемых в рамках эксперимента:

Резиновая игрушка-пищалка, 2х2,5 см. Использовалась по принципу кликера: после мини-тренинга, направленного на соединение стимулов, звук, издаваемые при нажатии на эту игрушку, стал для котов условным поощрением.
Безусловное поощрение – пищевые добавки для кошек в виде желатиновых капсул длиной 0,5 см, диаметром 0,2 см.

В качестве поощрения поведения «нажимать на переключатель» были выбраны пищевые добавки для кошек в виде желатиновых капсул. Выбор поощрения объясняется следующими эмпирическими наблюдениями:

По результатам наблюдения оба кота минимум один раз в день предпринимают попытки самостоятельно достать капсулы (до начала эксперимента упаковка с пищевыми добавками не убиралась из поля зрения животных).
Когда до начала эксперимента коты получали данную добавку трижды в день, они каждый раз показывали следующие поведения: как только капсулы доставали из упаковки, коты подбегали из другого конца комнаты, тянулись мордами к рукам того, кто в этот момент держал капсулу, пытались схватить её зубами или выбить из рук лапами.
Данная пищевая добавка за счёт низкой концентрации вещества в одной капсуле могла предоставляться в достаточно большом количестве – до 20 штук в день на одно животное без вредных последствий для здоровья животных.
Данную пищевую добавку можно было предоставить испытуемым достаточно быстро – за 2-3 секунды. Это исключало возможность поощрения не целевого поведения, появившегося непосредственно вслед за целевым.

Во-вторых, надо отдельно выделить предметы, которые использовались непосредственно для обеспечения эксперимента:

Конструкция, которая далее в статье будет называться «устройство для подачи поощрения» состояла из пластиковой воронки, к которой была присоединена пластиковая негнущаяся трубка с диаметром отверстия около 1 см длиной 80 см. Конструкция была прикреплена к краю стола под углом 45 градусов, трубка спускалась на пол. Пищевое поощрение подавалось экспериментатором вручную: капсулы опускались в воронку и, пройдя сквозь пластиковую трубку, падали на пол перед испытуемым. С момента реакции испытуемого и до момента подачи поощрения проходило не более двух секунд. В 5 см слева от трубки на полу был закреплён одноклавишный переключатель света с плавным ходом клавиши (для того, чтобы испытуемым не приходилось прикладывать значительных усилий). Клавишу можно было незначительным нажатием переводить из положения «вкл.» в положение «выкл.» и обратно. Переключатель не был подключен к электросети, т.к. использовался только как рычаг.

В-третьих, это материалы, которые использовались для фиксирования данных:

Секундомер, с помощью которого замерялась длительность пауз после предъявления поощрения и пауз после пропуска поощрения.
Бланк (форма записи результатов наблюдения) и маркер, в бланке маркером отмечались каждый эпизод поведения, длительность паузы после получения поощрения и длительность паузы в случае пропуска подачи поощрения.

Также следует описать условия, в которых проводился эксперимент.

На время эксперимента каждый из котов был по очереди помещён в закрытую комнату. Из нее до начала эксперимента были убраны стимулы, которые могли отвлекать животное: миски с кормом, игрушки и другие предметы, которыми коты, по результатам наблюдений, часто манипулируют. На протяжении эксперимента в комнате поддерживался примерно одинаковый уровень освещённости, кроме того, окна были закрыты для того, чтобы избежать воздействия уличного шума. Поскольку эксперимент с каждым из испытуемых проводился в разное время (т.к. не было возможности привлечь дополнительного участника для работы с двумя испытуемыми в одно и то же время на протяжении всего эксперимента), предварительно было проверено, что комната обеспечивает звукоизоляцию, необходимую для того, чтобы испытуемый, с которым в данное время сессия не проводится, не слышал звука, являющегося условным поощрением. Во время всех сессий удалось избежать появления посторонних ярких стимулов, которые изменили бы поведение испытуемых (внезапный шум, сильный запах, появление посторонних людей, животных или предметов), насколько это было возможно не в лабораторных условиях. Экспериментатор находился за столом, возле воронки устройства для подачи поощрения, таким образом экспериментатор был отделён от испытуемых дистанцией примерно в 120 см. Также на столе рядом с экспериментатором находились бланк для записи результатов наблюдения, маркер и игрушка «пищалка». Конечно, экспериментатор мог подавать поощрение вручную, кладя его каждый раз перед испытуемым, но опыт показал, что в этом случае животные иногда отвлекаются на присутствие экспериментатора в непосредственной близости, и это может повлиять на продолжительность пауз после получения поощрения, т.е. на чистоту эксперимента. Кроме того, использование устройства для подачи поощрения позволяло быстро предоставить поощрение и сразу зафиксировать необходимые параметры поведения испытуемых в бланке наблюдения, поскольку экспериментатор всё время находился на одном месте и при этом имел хороший обзор действий испытуемых.

Метод наблюдения

Для начала необходимо дать рабочее определение целевому поведению, воздействие на которое изучается в данном исследовании.

Поведение разворачивается в следующих условиях:

Вариант 1. После того, как кот нажал на переключатель, раздался звуковой сигнал, и кот получил поощрение, он опускает лапу/лапы с переключателя на пол, съедает поощрение и некоторое время остаётся на месте не далее, чем в 20 см от переключателя. Эпизод поведения начинается с того момента, как поощрение в виде желатиновой капсулы поступает с помощью устройства для подачи поощрения и оказывается перед мордой кота. До того момента, как кот снова нажмёт на переключатель, он может демонстрировать любую топографию, например: вылизывать шерсть, обнюхивать пол или устройство для подачи поощрения, смотреть на экспериментатора, мяукать и т.д. Эпизод поведения считается законченным в тот момент, когда кот снова нажимает лапой/лапами на переключатель. Новый эпизод отсчитывается с момента, как поощрение оказывается перед мордой кота.

Вариант 2. После того, как кот нажал на переключатель, раздался звуковой сигнал, но пищевого поощрения не последовало, он опускает лапу/лапы с переключателя на пол и некоторое время остаётся на месте не далее, чем в 20 см. от переключателя. Эпизод поведения начинается с того момента, как раздаётся звуковой сигнал плюс проходит две секунды – время, за которое поощрение ранее поступало через устройство для подачи поощрения. До того момента, как кот снова нажмёт на переключатель, он может демонстрировать любую топографию, например: вылизывать шерсть, обнюхивать пол или устройство для подачи поощрения, смотреть на экспериментатора, мяукать и т.д. Эпизод поведения считается законченным в тот момент, когда кот снова нажимает лапой/лапами на переключатель. Новый эпизод отсчитывается с момента, как раздаётся звуковой сигнал плюс проходит две секунды.

Описанное нами целевое поведение в эксперименте являлось зависимой переменной; независимыми переменными являлись три расписания подачи поощрения (FR и VR, а также VR с пропуском 50% эпизодов подачи поощрения).

Кроме того, необходимо описать поведение «нажимать на переключатель», поскольку целевое поведение происходит сразу после него. Рабочее определение поведения «нажимать на переключатель».

Поведение разворачивается в следующих условиях: кота запускают в комнату, где предварительно установлено устройство для подачи поощрения. Эпизод поведения начинается, когда кот подходит к переключателю, расположенному рядом с устройством подачи поощрения, и одной либо обеими лапами переключает клавишу в другое положение, после чего опускает лапу/лапы обратно на пол. Одно переключение соответствует одному эпизоду поведения испытуемого. Сразу после того, как кот перевёл клавишу на переключателе в другое положение, эпизод поведения считается законченным. Новый эпизод поведения отсчитывается с нового переключения клавиши.

Выбор именно этого поведения объясняется тем, что для проведения данного конкретного эксперимента требовалось поведение:

а) достаточно простое и не энергозатратное (в отличие от, например, выполнения сложных команд),

б) то, которое испытуемый способен демонстрировать с относительно высокой частотой, чтобы у экспериментатора была возможность зафиксировать наблюдения относительно пауз после получения поощрения, т.е. целевого поведения.

Таким образом, было выбрано поведение, состоящее из минимального количества движений.

Данные начального уровня (фаза А) собирались в течение 6 дней. Сбор данных фазы начального уровня начался после того, как с помощью методики «шейпинг» у котов было сформировано поведение «нажимать на переключатель». На фазе начального уровня поощрение подавалось на расписании FR-2, т.е. поощрялось каждое второе нажатие на переключатель. Каждый день проводилось две сессии, за одну сессию предоставлялось десять желатиновых капсул, служивших поощрением. Сессия заканчивалась после того, как все десять поощрений были получены животными.

Для сбора данных по результатам наблюдения в эксперименте использовался метод продолжительность. Был выбран именно этот метод, поскольку:

а) Параметром измерения в данном случае является временная протяжённость поведения;

б) Каждый эпизод поведения имеет чёткие начало и конец;

Кроме того, в первой части эксперимента (сравнение продолжительности пауз после подачи поощрения на расписаниях FR и VR) также фиксировались данные, полученные с помощью метода количество, поскольку нам необходимо было также доказать, что паузы на расписании «случайное количество» в принципе бывают, как и на расписании «фиксированное количество», т.е. мы измеряли параметр поведения «повторяемость по времени».

Наблюдение проводил экспериментатор – студент сертифицированного курса по прикладному анализу поведения. Данные вносились в формы записи результатов наблюдения каждый раз, когда поведение происходило. Формы записи результатов наблюдения для каждого расписания представлены ниже.

Таблица 1. Форма записи результатов наблюдения для расписаний FR (фаза начального уровня или фаза А) и VR (фаза работы или фаза Б)

В графе «Расписания» указаны расписания подачи поощрения – FR (фиксированное количество) и VR (случайное количество).

В графе «Дата» отмечался день, когда велось наблюдение.

Для обоих испытуемых в форму вносились данные по количеству пауз после поощрения на протяжении всей сессии (столбец «Пауза после поощрения» – если пауза была, в строку ставился знак «V»), а также по продолжительности каждой паузы в секундах (столбец «Продолжительность паузы»).

Также во второй части эксперимента заполнялась отдельная форма для фиксирования длительности пауз после поощрения и длительности пауз после пропуска поощрения на расписании «случайное количество» с пропуском подачи поощрения в 50% случаев.

Таблица 2. Форма для фиксирования длительности пауз после поощрения и длительности пауз после пропуска поощрения на расписании «случайное количество» с пропуском подачи поощрения в 50% случаев.

В графе “Дата” отмечался день, когда велось наблюдение.

Для обоих испытуемых в форму вносились данные по продолжительности каждой паузы в секундах после предоставления поощрения (столбец «Пауза после поощрения») и после пропуска поощрения (столбец «Пауза после пропуска»).

Дизайн

Весь эксперимент состоял из восьми фаз: A-B-A-B-C-B-C-B (соответственно расписание FR-2 – расписание VR-2 – расписание FR-2 – расписание VR-2 – расписание VR с пропуском подачи поощрения в 50% случаев – расписание VR-2 – расписание VR с пропуском подачи поощрения – расписание VR-2). Для эксперимента был выбран возвратный дизайн, поскольку в данном исследовании допускался возврат на предыдущую фазу, и необходимо было убедиться в том, что именно смена расписания подачи поощрения, а также пропуск подачи поощрения, а не посторонние переменные, влияют на продолжительность паузы после подачи поощрения.

Переход на каждую фазу производился после того, как показатели на предыдущей держались на стабильном уровне на протяжении минимум 3 дней. Происходило это следующим образом: количество необходимых для получения поощрения поведений «нажимать на рычаг» у животных уменьшалось или увеличивалось в зависимости от фазы, т.е. животные получали поощрение уже не после каждого второго нажатия, а сначала после второго, затем после первого, затем после третьего, затем после второго (в среднем, после 8/4 = 2 нажатий).

Далее рассмотрим фазы эксперимента подробнее.

Фаза А.

После того, как поведение было сформировано, началась фаза А – сбор данных начального уровня. На этой фазе в течение шести дней (две сессии в день, по десять эпизодов предоставления поощрения каждая) поощрение предоставлялось на расписании FR-2. Сначала подавался звуковой сигнал, затем сразу пищевое поощрение.

Фаза B.

Когда показатели начального уровня достигли стабильности и продержались на стабильном уровне 3 дня, было решено перейти к фазе работы – фазе B. На фазе B поощрение начало подаваться по новому расписанию – VR-2. Так же, как и на фазе А, сначала подавался звуковой сигнал, а следом за ним в течение двух секунд – пищевое поощрение. На этой фазе сессии также проводились дважды в день, каждая сессия длилась, пока не были предоставлены все десять поощрений. Фаза B длилась десять дней.

Фаза А (возврат).

Необходимо было проверить, изменятся ли показатели, если мы отменим расписание «случайное количество» и вернёмся на расписание «фиксированное количество». Если бы показатели не оказались близки к показателям начального уровня, а держались на уровне фазы B или выше, можно было бы предположить, что на изменения показателей фазы B повлияла не смена расписания подачи поощрения, а другие, не учтённые нами переменные. Поэтому после того, как показатели на фазе B достигли стабильности и продержались на одном уровне в течение пяти дней, мы вернулись на фазу А: вновь перевели животных на расписание подачи поощрения «фиксированное количество» FR-2 и держали на нём девять дней.

Фаза B (возврат).

И, наконец, необходимо было сделать аналогичную проверку для показателей фазы B, поскольку, если бы показатели на фазе проверки отличались от показателей, полученных после первого изменения расписания подачи поощрения, можно было бы усомниться в том, что именно прилагаемая независимая переменная в нашем эксперименте повлияла на изменения в продолжительности пауз после поощрения. Поэтому после того, как показатели продержались на стабильном уровне три дня, было решено перейти к фазе B (возврат). На протяжении восьми дней испытуемых снова держали на расписании подачи поощрения VR-2.

На следующих фазах эксперимента сравнивалась продолжительность пауз после подачи поощрения на расписании VR-2 и после пропуска подачи поощрения на расписании VR-2.

Фаза B.

Результаты четвертой фазы были взяты в качестве начального уровня. Переход на следующую фазу состоялся спустя четыре дня после достижения стабильности результатов.

Фаза С.

На фазе С, которая длилась восемь дней, мы изменили один из параметров эксперимента: теперь поощрение предоставлялось также на расписании «случайное количество», но в 50% случаев (в случайном порядке) подача поощрения пропускалась. Подавался звуковой сигнал, но пищевое поощрение не следовало. Начиная со второго эпизода продолжительность паузы резко уменьшилась. Испытуемые на этой фазе также начали демонстрировать топографию, которой не было на всех предыдущих фазах: оглядывались на экспериментатора, обнюхивали пол в радиусе примерно 50 см, заглядывали за устройство для подачи поощрения и т.д., т.е. пропуск подачи поощрения повлиял на их активность во время паузы.

Фаза В.

После того, как результаты на фазе C держались на стабильном уровне в течение четырех дней, было решено вновь вернуться на фазу B для того, чтобы проверить возможное влияние не учтённых нами независимых переменных на результаты, полученные на фазе С. Если бы показатели не увеличились, а остались прежними или, наоборот, уменьшились, это было бы признаком того, что на продолжительность паузы на расписании «случайное количество» повлиял не пропуск подачи поощрения, а посторонние, не учтённые нами факторы. Испытуемые держались на расписании VR-2 без пропусков подачи поощрения в течение десяти дней.

Фаза С.

Аналогично, необходимо было сделать возврат на фазу С – фазу, на которой во время подачи поощрения на расписании «случайное количество» делался пропуск подачи поощрения в половине случаев. Испытуемые вновь продемонстрировали снижение продолжительности паузы и более активное поисковое поведение (оглядывались, обнюхивали пол и устройство подачи поощрения и т.д.). На этой фазе испытуемых держали десять дней.

Фаза В.

Наконец, был осуществлён последний возврат на предыдущую фазу – фазу подачи поощрения на расписании «случайное количество» без пропусков подачи поощрения. В данном случае заканчивать эксперимент возвратом на эту фазу не является неэтичным. Поэтому через четыре дня после достижения стабильного уровня показателей на фазе С мы снова перевели животных на расписание VR-2 без пропусков подачи поощрения. Последняя фаза эксперимента продолжалась восемь дней.

Проверка на надёжность

Во время всех сессий прямое наблюдение за поведением испытуемых вёл экспериментатор. В первой части эксперимента на пятый и шестой дни фазы A, на четвертый, пятый и шестой дни фазы В, на четвертый и пятый дни возврата на фазу А (после фазы В), на пятый, шестой, седьмой дни возврата на фазу В (после фазы А), на третий, четвертый, пятый дни фазы С, на пятый, седьмой и восьмой дни возврата на фазу В (после фазы С), на четвертый и шестой дни возврата на фазу С (после фазы В) и на третий и четвертый дни возврата на фазу B (после фазы С) – т.е. 20 дней из 66 дней эксперимента (30% всех сессий) на сессиях проводилось перекрёстное наблюдение, в котором участвовал обученный экспериментатором человек, который также замерял с помощью секундомера продолжительность пауз после получения поощрения на расписаниях FR и VR, а также продолжительность пауз после пропуска подачи поощрения на расписании VR и вписывал результаты в аналогичные формы записи результатов наблюдения. Индекс надёжности в результате составил 100%.

Кроме того, участие в эксперименте двух испытуемых можно считать прямым повторением эксперимента один раз. Оба испытуемых показали сходные результаты по итогам проверки влияния расписаний подачи поощрения на продолжительность пауз после поощрения. Но, безусловно, несмотря на то, что индекс надёжности по результатам перекрёстного наблюдения достиг 100%, надёжность по независимым переменным в данном эксперименте невысока, что связано с самими условиями проведения эксперимента. Поскольку он проводился не в лабораторных условиях, невозможно было исключить влияние разнообразных отвлекающих стимулов: сама обстановка, уличный шум, а также необходимое в данном случае присутствие экспериментатора и его помощника во время перекрёстного наблюдения. Поэтому мы не можем с уверенностью утверждать, что полученные значения зависимой переменной являются результатом воздействия именно независимых переменных, запланированных в нашем эксперименте. Для того, чтобы прийти к выводу, можно ли распространить результаты эксперимента на всю популяцию, необходимо провести эксперимент в лабораторных условиях с соблюдением всех правил, также ещё минимум два прямых повторения эксперимента и систематические повторения (с теми же испытуемыми и с другими испытуемыми, меняя некоторые параметры, например, топографию поведения, которое было поставлено на расписания, параметры расписаний подачи поощрения и т.д.).

РЕЗУЛЬТАТЫ

На Графике 1, приведенном ниже, отображены все восемь фаз эксперимента:

График 1. Продолжительность паузы после поощрения на расписаниях FR-2, VR-2 и VR-2 с пропуском подачи поощрения.

На оси абсцисс обозначены даты, во время которых проводилось наблюдение. На оси ординат обозначены данные по средней продолжительности паузы после поощрения за каждый день наблюдения (в секундах). Фазы отделены друг от друга вертикальными линиями. Сначала остановимся подробнее на первых четырех фазах эксперимента (перевод с расписания FR-2 на VR-2 и обратно).

Графики на первых четырех фазах эксперимента отвечают критериям стабильности и разделённости. Три последних показателя расположены в одной плоскости и не двигаются к показателям следующей фазы, ни одна точка в конце фазы не совпадает с первыми тремя точками начала следующей фазы. Графики на фазах эксперимента B и С отвечают критериям стабильности и разделённости. Три последних показателя расположены в одной плоскости и не двигаются к показателям следующей фазы. При переходе с фазы В обратно на фазу С график не соответствует критериям стабильности и разделённости. Три последние точки на фазе С соответствуют значениям 3,8; 4 и 3,7 для испытуемого 1 и 5,4; 5,2 и 5 для испытуемого 2. А на фазе возврата к условиям В график вновь соответствует критериям стабильности и разделённости. Наконец, при повторном переходе с фазы С на фазу В график опять перестаёт соответствовать критериям стабильности и разделённости. Первые три точки графика на фазе возврата к условиям С соответствуют значениям 3,9; 3,7 и 3,5 для испытуемого 1 и 4,4; 4,7 и 4 для испытуемого 2, последние три – значениям 4; 3,7 и 4 для испытуемого 1 и 3,6; 4 и 3,9 для испытуемого 2.

ОБСУЖДЕНИЕ

Ниже для наглядности приведена Таблица 3 со средними показателями продолжительности пауз после поощрения на первых четырех фазах эксперимента (когда проверялось влияние расписания подачи поощрения на продолжительность пауз после поощрения).

Таблица 3. Средняя продолжительность паузы после поощрения (сек.) на первых четырех фазах эксперимента.

В Таблице 4 ниже представлены показатели фаз эксперимента с четвертой по восьмую (когда сравнивалась продолжительность пауз после подачи поощрения и после пропуска подачи поощрения).

Таблица 4. Средняя продолжительность паузы (сек.).

Для начала важно отметить, что паузы после поощрения фиксировались на всех расписаниях. Самыми продолжительными они были на расписании FR, самыми краткими – на расписании VR с пропусками подачи поощрения.

Рассмотрим изменения на первых четырех фазах эксперимента, когда проверялось влияние расписания подачи поощрения на продолжительность паузы после поощрения. Показатели на фазах первой (начальный уровень) и третьей (возврат на начальный уровень) близки, как и показатели на фазах второй (фаза вмешательства) и четвертой (возврат на фазу вмешательства), что позволяет сделать предположение о том, что на изменения повлияли выбранные и приложенные нами независимые переменные. На данном этапе очевидно, что зависимая переменная изменилась, и, скорее всего, благодаря запланированному вмешательству, а не сторонним факторам. Но после начала проверки влияния пропуска подачи поощрения на продолжительность паузы после поощрения продолжительность паузы хоть и уменьшилась, но не сразу, т.е. первые показатели новой фазы были близки к показателям предыдущей (графики на двух смежных фазах не отвечают критериям стабильности и разделённости). Это заметно на переходе между фазами последних четырех фаз. На переходе от фазы С к В (когда осуществлялся возврат к расписанию VR-2 без пропусков подачи поощрения) продолжительность паузы постепенно возрастала, но несколько точек на графиках у испытуемого 1 на фазах пять и шесть находятся на одном уровне. Поэтому можно поставить под сомнение то, что именно расписание с пропуском подачи поощрения (переход с фазы В на фазу С), а не какие-либо неучтённые нами переменные обусловили изменения в продолжительности пауз. Вероятно, следовало сделать ещё один повтор этих двух фаз, если бы мы обладали достаточным количеством времени. Аналогично, у обоих испытуемых на смежных фазах С и В несколько точек находятся на одном уровне, что ставит под сомнение влияние именно запланированных независимых переменных на увеличение продолжительности паузы после поощрения при возврате к расписанию VR-2 (без пропуска подачи поощрения). В данном случае также желательно сделать повтор этих двух фаз, вернувшись предварительно на начальный уровень, для того, чтобы исключить посторонние воздействия.

Интересно то, что уже на второй фазе А (возврат к условиям начального уровня) уровень различий в показателях обоих испытуемых несколько снизился. Несмотря на то, что испытуемый 2 стабильно демонстрировал на всех фазах эксперимента более высокие значения продолжительности паузы (как после получения поощрения, так и после пропуска подачи поощрения), чем испытуемый 1 (предположительно, это может быть связано с возрастом испытуемого 2), к концу эксперимента показатели обоих испытуемых стали более близкими. На первой фазе процентная разница в показателях для двух испытуемых составляла 25%, а на последней – 16%. Это может быть связано как с особенностями последствий пропуска поощрений на случайном расписании, так и с неучтёнными переменными, влияющими на эксперимент.

Немаловажно тут упомянуть, как проходила подготовка испытуемых к эксперименту. Для того, чтобы начать работу, было необходимо предварительно сформировать у котов поведение, которое затем должно было быть поставлено на разные расписания подачи поощрения. Поскольку поведение для эксперимента было выбрано достаточно простое, и, к тому же, коты изначально иногда демонстрировали сходное поведение с несколько отличающейся топографией, было решено не ставить его на команду, а сформировать с помощью методики «шейпинг». Данная процедура была проделана следующим образом.

Кота, которого кормили за пять часов до начала тренинга, запустили в комнату, где было установлено устройство для подачи поощрения. Некоторое время кот ходил по комнате, затем подошёл к устройству для подачи поощрения и начал его обнюхивать. В этот момент экспериментатор нажал на игрушку-пищалку и сразу же (в течение двух секунд) дал коту пищевое поощрение. Кот съел поощрение и продолжил ходить по комнате. Два раза после того, как кот приближался к устройству, он получал пищевое поощрение с предварительным сигналом игрушки-пищалки. Затем приближения к устройству перестали поощряться, кот ходил вокруг него, обнюхивал пол, а затем поставил лапу на край выключателя, после чего незамедлительно получил сигнал от игрушки-пищалки, а следом за ним – пищевое поощрение. Спустя четыре попытки кот нажал на переключатель, и экспериментатор предоставил условное (звуковой сигнал), а следом и безусловное (пищевая добавка) поощрения. Таким образом, необходимое поведение постепенно формировалось при помощи использования звукового сигнала, соединённого с пищевым поощрением, на каждом успешном шаге. Поведение «нажимать на переключатель» было сформировано в течение шести сессий. На четвёртой сессии поощрение предоставлялось уже непосредственно с помощью устройства для подачи поощрения. В общей сложности поведение «нажимать на переключатель» закрепилось у испытуемого 1 за три дня (по две сессии в день). Формирование данного поведения у испытуемого 2 происходило точно так же, как у испытуемого 1, и заняло четыре дня (по две сессии в день). Теперь после того, как каждого из котов запускали в комнату, он сразу направлялся к переключателю и демонстрировал поведение «нажимать на рычаг».

Изначально мы планировали также предоставить данные о количестве пауз на всех расписаниях в процентах, но паузы возникали на всех расписаниях после каждого эпизода, т.е. параметр «повторяемость» достиг 100% на всех фазах эксперимента.

Таким образом, можно предположить, что эксперимент с восьмифазным возвратным дизайном доказал наши гипотезы:

На расписании «случайное количество» после подачи поощрения так же возникают паузы. Причём они наблюдаются в 100% случаев.
Паузы после подачи поощрения на расписании «случайное количество» короче, нежели на расписании «фиксированное количество».
Паузы после пропуска поощрения на расписании «случайное количество» короче, нежели паузы после получения поощрения на том же расписании.

Чтобы выводы нашего эксперимента можно было экстраполировать на другие живые организмы, необходимо улучшить эксперимент, скорректировав его следующим образом:

При условии участия в эксперименте животных в качестве испытуемых необходимо проводить эксперимент либо в лабораторных условиях, либо в максимально приближенных к лабораторным. На поведение животных могут влиять такие стимулы окружающей среды, как фоновый шум, свет, наличие разнообразных предметов вокруг, а также присутствие экспериментатора. Поэтому пространство проведения эксперимента необходимо сделать максимально свободным от явлений, предметов и т.д., которые могут отвлекать животных, обеспечив неизменность стимулов на протяжении всего эксперимента. В частности, поместить в звуконепроницаемые камеры с постоянно генерируемым фоновым шумом одинаковой частоты, поддерживать одинаковый уровень освещённости, организовать наблюдение за экспериментом таким образом, чтобы животные не видели экспериментатора.
Желательна автоматизированная подача поощрений, т.е. поощрения не должны подаваться экспериментатором вручную. Это гарантирует:

а) точность измерений (без погрешностей)

б) то, что присутствие экспериментатора не станет стимулом, влияющим на зависимую переменную.

Вероятно, для проведения подобных экспериментов лучше подбирать животных не только одного вида, но и одного возраста (в нашем эксперименте участвовали коты возрастом 2,5 года и 15 лет), поскольку возраст испытуемых может влиять на скорость реакции и на паузы после получения поощрения.
Используя пищевое поощрение в экспериментах с животными, необходимо предварительно депривировать организм не только к поощрению (в нашем случае – пищевую добавку), но и к пище в принципе так, чтобы до начала эксперимента вес испытуемых составлял не более 80% от их веса при условии свободного доступа к пище.
При соблюдении перечисленных условий также желательно сделать фазу возврата на начальный уровень (т.е. на первую фазу) перед пятой по счету фазой С, на которой испытуемых переводят на расписание VR-2 с пропусками подачи поощрения. Это желательно сделать для того, чтобы убедиться в том, что условия на фазе С работают не только после условий на фазе В, но могут возникнуть и после фазы А.
Следует также провести параметрический анализ: например, после повторной фазы В вернуться на начальный уровень, а затем добавить ещё одну фазу, на которой изменить параметр независимой переменной (например, вместо расписания VR-2 поставить испытуемых на расписание VR-3).

Интересно то, что, несмотря на погрешности в соблюдении условий проведения эксперимента, наши изначальные гипотезы подтвердились: паузы после подачи поощрения на расписании VR были зафиксированы (причём в 100% случаев), и, как и предполагалось, оказались короче, нежели на расписании FR. При этом паузы на расписании VR с пропуском поощрения оказались короче всего. Во время перевода испытуемых на расписание с пропуском поощрения испытуемые демонстрировали изменения в топографии, свидетельствующие о возросшей поисковой активности.

Целесообразно, на взгляд автора, также будет проверить влияние на продолжительность паузы после поощрения и после пропуска поощрения таких параметров, как размер поощрения.

Отдельный интерес представляет подобный эксперимент с участием людей. В этом случае, на наш взгляд, наибольшую сложность представляет подбор поощрения с соблюдением этических правил (т.к. в экспериментах с людьми нельзя депривировать пищу и прочие сильные безусловные поощрения) с учётом случайных расписаний подачи поощрения (VR и VI) с достаточно высокими параметрами. Грамотный подбор расписания подачи поощрения является необходимым компонентом программы работы с поведением.

ЛИТЕРАТУРА

Ferster, C. B. and Skinner, B. F. «Schedules of reinforcement.» New York: Appleton-Century-Crofts, 1957.

Griffiths, R.R., Thompson, T. «The post-reinforcement pause: A misnomer.» The Psychological Record. 1973; 23: 229–235.

Kello, J. E. «The reinforcement omission effect on fixed-interval schedules: frustration or inhibition? Learning and Motivation», 1972, 3, 138-147.

Priddle-Higson, P.J., Lowe, C.F., Harzem, P. «Aftereffects of reinforcement on variable-ratio schedules.» Journal of the Experimental Analysis of Behavior. 1976 May; 25(3):347-54.

Schlinger, Henry D. «What 50 years of research tell us about pausing under ratio schedules of reinforcement». The Behavior Analyst. 2008 Spring; 31(1): 39–60.

ПАУЗЫ НА РАСПИСАНИЯХ FR И VR НА ПРИМЕРЕ НАУЧЕННОГО ПОВЕДЕНИЯ ЖИВОТНЫХ

Свежие записи

Меняйте поведение,

зная законы

его формирования