|
||||
|
Глава XV ПОДКРЕПЛЕНИЕ И ЗАВЕРШЕНИЕ ДЕЙСТВИЯ ПОДКРЕПЛЕНИЕ КАК ИНДУКЦИЯ Сформулированное в гл. XIV утверждение о том, что процесс подкрепления индуцирует изменения в механизмах компетентности мозга, нуждается в тщательной проверке. Имеется ли какое-либо сходство между процессами индукции, изучаемыми эмбриологами, и процессами подкрепления, изучаемыми бихевиори-стами? В гл. II процесс индукции рассматривался в качестве-модели хранения следов памяти. Какие нервные механизмы могли бы приходить в действие во время процесса подкрепления, который вызвал бы процесс индукции в мозгу взрослого организма? Наиболее спорная трактовка подкрепления, предлагавшаяся как бихевиористами, так и психоаналитиками, заключалась в попытке рассматривать подкрепление как фактор, уменьшающий влечение. Эта концепция основывается на двухфакторной теориш влечения: физиологические потребности приводят к состоянию напряжения в организме, которое проявляется в повышении общей» активности или в усилении нервной активации; поведение, направленное на уменьшение этого напряжения, и есть подкрепление. Некоторые авторы (например, Sheffield et al., 1955) считают, что организмы, напротив, стремятся к повышению напряжения и что изменения поведения сопровождаются ростом: напряжения. Этот аргумент устраняет необходимость во втором факторе. Однако влечение и подкрепление по-прежнему рассматриваются как взаимосвязанные явления. Между тем Эстес (1958) привел убедительные доводы в пользу концепции, согласно которой поведение строится по схеме «побуждение – стимул», а не-по схеме «побуждение – напряжение», однако эта концепция: оставляет без ответа как раз вопрос о том, какие же побуждающие стимулы управляют поведением. Ответ на этот вопрос сходен с тем, который был дан в предыдущей главе, а именно вопрос,, что такое «стимул», – не так прост, как кажется. Побуждающий стимул, как и сенсорный стимул, обусловлен работой корригирующего сервомеханизма, или гомеостата. Гомеостаты снабжены рецепторами, чувствительными к возбуждению в системе «внешний мир – внутренняя среда». Особые зоны мозга, чувствительные к осмотическим колебаниям, изменениям температуры, содержанию эстрогена, глюкозы и уровню углекислоты, находятся вокруг желудочков мозга; они расположены по средней линии; зти области связаны с механизмами, контролирующими поступление и расход агентов, к которым они чувствительны (гл. IX, X). Помимо этих центральных механизмов, в гомеостатических процессах принимают участие также другие, более периферические механизмы. Центральные гомеостатические процессы часто дополняются вторичными механизмами, которые обеспечивают более точно дозированную регуляцию указанных агентов. Примерами могут служить сокращения желудка в механизме пищевой регуляции во время голода или сухость во рту при жажде, а также регуляция циркуляции крови в сосудах кончиков пальцев для большего или меньшего охлаждения тела. Основные гипота-ламические терморегуляторы дифференцированно управляют температурой пальцев посредством кровообращения. Если взять в качестве модели голод, то можно видеть, что мозговой гомеостатический механизм с его центральными и периферическими чувствительными аппаратами имеет два реципрокно действующих компонента. Один из них сигнализирует о недостатке какого-либо агента и запускает регуляторный процесс, другой сигнализирует о насыщении организма и останавливает этот процесс. Можно также видеть, что фаза запуска регулятор-ного процесса характеризуется наличием потребности, а фаза прекращения вызывает состояние аффекта. Следовательно, оказывается, что потребности и аффекты, чувство заинтересованности представляют собой мотивационные и эмоциональные (в отличие от перцептивных) стимулы, иначе говоря, то, что бихевиористы называют влечениями. На языке этой книги потребности и аффекты являются управляющими образами, индикаторами процессов, связанных с состояниями мозга и таким путем: влияющих на организацию поведения во времени (гл. II). Каким образом механизмы, обеспечивающие состояния интереса, потребности и аффекта, модифицируют поведение организма и служат подкреплением? Путем вовлечения механизма памяти, которым обладает организм. В гл. II была сформулирована гипотеза, согласно которой структуры, ответственные эа долговременную память, как бы стимулируются в мозгу, подобно тому как стимулируются тканевые структуры в процессе эмбрионального развития. Внешнее сходство между процессами индукции, изучаемыми в эмбриональных тканях, и процессами подкрепления, изучаемыми в ситуации выработки условных рефлексов, легко сформулировать в следующих положениях: А) индукторы пробуждают и организуют генетический потенциал организма. Подкрепляющие агенты пробуждают и организуют поведенческие возможности организма. Б) Индукторы сравнительно специфичны в отношении действия, которое они вызывают, но, как правило, неспецифичны по отношению к индивидам и тканям. Подкрепляющие агенты довольно специфичны по отношению к тому поведению, которое они обусловливают, но, как правило, неспецифичны по отношению к индивидам и задачам. В) Индукторы детерминируют широкий набор индуцированных эффектов, детали уточняются процессами, протекающими в субстрате, по мере развития ткани. Подкрепляющие агенты определяют решение проблемной ситуации, детали поведенческого репертуара (конкретные формы поведения), используемого для достижения результата, сугубо индивидуальны. Г) Индукторы не являются просто агентами, запускающими развитие, они представляют собой нечто большее, чем мимолетные стимулы. Подкрепляющие агенты не просто агенты, запускающие поведение; они представляют собой особый класс стимулов. Д) Индукторы должны контактировать с субстратом, для того чтобы быть эффективными. Совпадение во времени – обязательное требование для того, чтобы реализовать подкрепление. Е) Простой контакт, хотя он и необходим, недостаточен, чтобы вызвать эффект индукции Индуцируемая ткань должна быть готовой к реакции, должна быть компетентной. Простое сочетание, хотя оно и необходимо, недостаточно, чтобы вызвать подкрепление; подготовленное состояние, недостаток информации, депривация, готовность, контекст, ожидание, внимание, создание гипотезы – вот только некоторые из терминов, используемых для описания тех факторов, которые создают компетентность организма, без чего подкрепление не может стать эффективным. Ж) Индукция обычно осуществляется благодаря двустороннему взаимодействию – благодаря химическому взаимодействию. Подкрепление является наиболее эффективным в оперантной ситуации, где последовательность действий самого организма немедленно используется как регулятор его последующего поведения. НЕЙРОХИМИЯ ПОДКРЕПЛЕНИЯ После всего, что уже сказано, остается вопрос, указывает ли описанное выше сходство процессов индукции и подкрепления на сходство их механизмов? С моей точки зрения, да. Какие же факты это подтверждают? Какие нервные процессы начинают действовать во время индукции? Для этого требуются анатомические пути, функционирующие во многих областях мозга, чтобы запустить в действие подкрепляющий «индуктор», химические агенты, стимулирующие реци-пиентную ткань к дифференциации. Пример подобного любопытного синтеза мы находим в нейрохимическом исследовании, проведенном Л. Стайном (рис. XV-1, XV-2).
Я подчеркнул бы еще и особое значение нейронной матрицы, на которой реализуется аминэргический подкрепляющий эффект. Эта матрица (нейронная сеть), чувствительная главным образом к холинэргическим веществам, и создает то, что в гл. XIV описывалось как компетентность мозговой ткани. Существуют данные, говорящие (рис. XV-5) о том, что адренэргическая стимуляция оказывает влияние на холинэргический механизм или по крайней мере – на активирующие и тормозящие механизмы мозгового ствола. Вспомним также, что в экспериментах Креча, Розенц-вейга и Беннета (рис. П-6) было обнаружено, что ацетилхолин участвует в эффекте влияния обогащенной среды на рост коры. Могут ли запускаться эти более продолжительные холинэргические процессы с помощью адренэргического механизма подкрепления или эти процессы протекают независимо от последнего?
Гликман и Шифф (1967) только на основе обширного обзора результатов, наблюдаемых в экспериментах по изучению влияния электрической стимуляции мозга на поведение, дали частичный ответ на этот вопрос. В этом обзоре выделяется два типа врожденных ответов, один из них состоит в «приближении», а другой в «удалении» от объектов-стимулов. Авторы установили корреляцию между участком электрической стимуляции в стволе мозга, откуда запускается подобный тип поведения, и положительным и отрицательным подкрепляющими эффектами при электрическом самораздражении (см. рис. V-1 и V-2). Они также высказали предположение относительно некоторых механизмов, посредством которых контролирующие кортикальные влияния (тормозящие и облегчающие) могут регулировать работу центрального эффекторного механизма ствола мозга. Однако они не поняли важности проблемы модификации поведения посредством подобных контролирующих корковых влияний. Это объясняется тем, что авторы не располагали фактами, которые указывали бы на вариабельную природу механизмов, приводящих к реакции (гл. XIV), в связи с чем возникает необходимость в особом, способном к модификациям состоянии, имеющем интегративные свойства. В настоящее время анатомическая основа подобных способных к модификации интегративных процессов найдена благодаря открытию системы адренэргических афферентов, берущих свое начало в стволе мозга и достигающих апимальных дендритов. коры больших полушарий. Факты, на которых основываются гипотезы о сущности процесса индукции, получены почти исключительно в опытах на животных. Однако недавний обзор проблемы мозговых поражений у человека, вызывающих серьезные нарушения процессов памяти, неожиданно подтвердил существование механизма, подобного тому, который здесь описан. Ограниченные поражения коры больших полушарий (включая гиппокамп) или базальных ганглиев не всегда коррелируют с нарушениями памяти. Однако г когда патологический процесс затрагивает структуры ствола мозга, у больных наблюдается «неспособность к образованию новых следов памяти, то есть антероградная амнезия (когда продолжительное заучивание не помогает)», несмотря на «сохранность активного состояния внимания, уровня бодрствования-мозга» и «нормальную способность мыслить, решать задачи и т. д.»; в таких случаях при выздоровлении интеллектуальная деятельность лишь «немного ухудшается по сравнению с нремор-бидным уровнем, несмотря на грубые нарушения памяти». Анатомически «ядра, разрушенные поражением, во всех случаях располагаются по средней линии, а именно в 2-3 мм от эпендимы. Иными словами, их расположение в зоне третьего желудочка (и сильвиева водопровода) оказывается более важным как фактор, определяющий их чувствительность, чем все другие свойства этих ядер» (Adams, 1969, р. 98-102). Нейрофизиологи также внесли известный вклад в изучение мозговых механизмов, определяющих процессы индукции как у человека, так и у животных. Несколько лет назад Грей Уолтер (Walter et al., 1964; Walter, 1967) проанализировал медленно протекающие изменения электрической активности мозга в различных ситуациях. Он обнаружил отрицательное отклонение электрического потенциала при действии одного сигнала, подготавливающего организм к Ответу на следующий, ожидаемый стимул. В наших экспериментах (Donchin et al., 1971; рис. XV-6 и XV-7) подобные отрицательные отклонения вызывались с помощью разнообразных подготовительных состояний ожидания и место возникновения изменений потенциала зависело от типа задания, требующего этого подготовительного состояния, например: если обезьяна или человек готовится, ничего не делая, к~ выполнению ответа, максимальная CNV (контингентная негативная вариация) появляется в лобной коре; если требуется подготовиться к моторному ответу, отрицательный потенциал появляется прежде всего в моторной коре и предшествует осуществлению движения; если требуется выполнить длительное ответное действие, например продолжительный подготовительный нажим на рычаг, максимальный отрицательный потенциал возникает в со-матосенсорной коре. Когда же наконец появляется ожидаемый второй стимул, отрицательный потенциал завершается резким положительным отклонением. В других экспериментах в ситуациях выработки оперантных условных рефлексов эти завершающие позитивные электрические потенциалы были связаны с появлением подкрепляющего агента (Clemente et al., 1964; Grandstaff, 1969; Lindsley, 1969). Таким образом, CNV с ее завершающим быстрым положительным потенциалом сигнализирует об ожидании-и его завершении, о подготовительных фоновых процессах, определяющих судьбу стимула, которые обсуждались в гл. XIV.
Непосредственный эффект может быть получен также с помощью отрицательной (катодной) и положительной (анодной) электрической стимуляции коры больших полушарий во время научения (Stamm, 1961; Morrell, 1961). Отрицательная стимуляция повышает скорость научения, положительная оказывает противоположное влияние. Все эти эксперименты дают убедительное доказательство того, что изменения электрического потенциала возникают в мозгу и до и во время подкрепления. Однако мы фактически ничего не знаем о тех механизмах, которые вызывают эти изменения электрического потенциала. Столь же мало знаем мы и о нейрохимических процессах, сопровождающих эти электрические изменения. Возможно, что CNV отражает или мобилизует «холинэргиче-скую компетентность», а положительные потенциалы возникаюг вследствие активации адренэргических путей или вызывает эту активацию. Тот факт, что электрические изменения связаны с подкреплением, открывает пути для изучения данной проблемы на поведенческом, гистологическом и химическом уровнях – пути, которые в течение ряда лет были полностью закрыты. Понимание подкрепления как процесса индукции выдвигает гипотезы, которые могут быть проверены в биологических исследованиях и помогут разгадать ту загадку, над которой полвека безуспешно бились бихевиористы. РЕГИСТРАЦИЯ ПОДКРЕПЛЕНИЯ Вспомним еще раз эксперименты с угашением (гл. III, XI), Регистрируя ряд физиологических индикаторов, мы видим, что-организм отвечает на новый стимул ориентировочной реакцией. Эта реакция угасает при повторном предъявлении стимула. Вспомним также, что после удаления миндалевидного ядра физиологические индикаторы ориентировочного рефлекса, такие, как кожногальваническая реакция (КГР), изменение частоты сердцебиений, дыхания, не обнаруживаются, несмотря на то, что-в других условиях эти физиологические ответы остаются сохранными. Как это ни парадоксально, поведенческое выражение ориентировочной реакции в этих случаях не только сохраняется, но и не угасает. Я интерпретирую этот факт таким образом, что после амигдалэктомии ориентировочный процесс не регистрируется в мозгу так, как это происходит в норме. В ситуации выработки условных рефлексов также отсутствует регистрация этих показателей, как это было обнаружено в опытах с обезьянами, перенесшими подобную операцию (Bagshow and Coppock, 1968; рис. XV-8). Если у нормальных животных наблюдается постепенное увеличение числа электрофизиологических ответов, возникающих во время предъявления стимула, и удлинение периода, во время которого появляются предвосхищающие ответы, то у оперированных животных подобных предвосхищающих КГР и увеличения их числа не наблюдается. Эти результаты говорят о том, что миндалевидное ядро интимным образом связано с организацией процессов во времени, обеспечивая процессы, участвующие в ответе на повторные события, иначе говоря, процессы серийной регистрации в памяти значимых событий. В нормальном организме существует как бы «внутреннее эхо» событий, без которого соответствующая регистрация не происходит.
То, что миндалевидное ядро участвует в процессе усвоения опыта, подтверждает и поведение животных (Douglas and Pribram, 1966). В простых задачах на различение часто повторяющихся объектов эти затруднения в регистрации событий почти не заметны. Однако, если порядок подкрепления изменяется таким образом (Barrett, 1969), что начинает подкрепляться ранее не подкреплявшийся стимул (переделка дифференцировки) или вводится новый стимул, как в том эксперименте, когда обезьяна должна была использовать опыт, полученный в другой, сходной, но не идентичной ситуации, животные, перенесшие амигдалэкто-мию, не могут решить задачу (Schwartzbaum and Pribram, 1960; рис. XV-9; Bagshow, Pribram, 1965). В таких опытах обезьяны, подвергшиеся амигдалэктомии, обнаруживают повышенную реактивность на новизну (по сравнению с контрольными животными) и эта реактивность сохраняется длительное время после того, как нормальные животные уже привыкли к ситуации. Эти результаты, а также результаты, полученные при изучении физиологических индикаторов ориентировочного рефлекса, говорят о том, что миндалевидное ядро обычно контролирует «контрастное усиление» нервных процессов, нервные механизмы латерального-торможения во входных каналах, принимающих информацию (что происходит всегда, если работает много нейронных аппаратов). Действие той системы, частью которой является амигда-лярный комплекс, состоит в подавлении эффекта разбаланси-ровки, возникающего при быстром изменении ситуации. Эти изменения ситуации приводят к смене режима работы: самоподавление возбуждения сменяется латеральным торможением в том широко распространенном в нервной системе реципрокном содружестве, которое составляет нейронный тормозный механизм- своего рода «заслонку» в системах «входа» (рис. XV-9)… Короче говоря, наличие нормально функционирующего миндалевидного ядра, по-видимому, вводит в действие «внутреннее эхо», что и приводит к регистрации соответствующих, то есть совпадающих с контекстом, событий; это происходит с помощью подавления эффекта воздействия каждого нового стимула, вызывающего значительную разбалансировку организма.
Сам факт регистрации событий посредством своего рода «внутреннего эха», удлиняющего время воздействия на мозг совпадающих событий, наводит на мысль о нейронном механизме-индукции. Работу амигдалярной системы можно понимать как усиление процесса индукции посредством предохраняющей интерференции (Pribram, Douglas and Pribram, 1969) и, таким образом, предоставление достаточного времени для того, чтобы «внутреннее эхо» могло проявиться. Только тогда, когда эти процессы интерференции контролируются, и может осуществляться завершение поведенческого акта и поведение непрерывно регулируется. УПРАВЛЕНИЕ ПРАВИЛЬНЫМИ И ОШИБОЧНЫМИ ОТВЕТАМИ Помимо механизма регистрации, существует еще один важнейший механизм, обеспечивающий длительное управление поведением, который мы называем завершением действия (commitment). Этот более тонкий процесс относится к тем явлениям, которые математические психологи называют «негативными случаями». Этот процесс следует за самой ранней фазой процесса регистрации и характеризуется началом активного игнорирования организмом тех явлений, которые уже происходили однажды, во теперь больше не подкрепляются. Имеются надежные доказательства того, что в этом процессе участвует гиппокамп, часть переднего мозга, примыкающая к миндалевидному ядру. Так, например, мы показали, что, если в ситуации различения число не-подкрепляемых (то есть негативных) стимулов варьирует от одного до четырех, выполнение задания нормальными животными почти не изменяется. Однако после удаления гиппокампа обезьяны значительно дольше обучаются заданию, в котором предъявляются четыре неподкрепляемых стимула, и скорость их научения пропорциональна числу подобных неподкрепляемых агентов (Douglas et al., 1969; рис. XV-10). Затем нормальные животные переходят ко второй фазе обучения: они учатся игнорировать новые неподкрепляемые стимулы. У обезьян, перенесших операцию удаления гиппокампа, механизм этой второй фазы нарушается; они не способны оценивать свои ошибки, если таковые делаются вследствие неподкрепления. Эта неспособность к оценке ошибок особенно заметно проявляется в тех ситуациях, когда требуется подавить предварительно заученные формы поведения (Douglas, 1967, Kimble, 1969). Однако изучение такого подавления выдвигает свои проблемы, которые составляют содержание следующей главы.
Механизм, обеспечивающий активное игнорирование ошибок, несомненно, действует в более широком диапазоне ситуаций, чем те, которые изучаются в лабораторных условиях. Во всех подобных ситуациях должна совершаться быстрая оценка соответствия наличных стимулов прежним результатам поведения (прежним подкреплениям). Структура коры гиппокампа, столь сходная во многих отношениях со структурой мозжечка, анатомически очень подходит для этой цели (рис. XV-11). Мгновенный подсчет вероятности ошибки или рассогласования (основанный на оценке текущих состояний гомеостазиса и влияния на него результатов выполнения последней или нескольких последних задач) может, следовательно, служить в качестве контекста (фона), по отношению к которому и определяется это соответствие, и таким образом может быть оценена правильность ответа. С этой точки зрения гиппокамп можно рассматривать как механизм регуляции подкрепления и выполнения задачи, аналогичный мозжечку.
Теперь обратимся к третьей группе проблем, связанных с модификацией поведения: модификации в процессе выполнения задания. В гл. XIV рассматривалась компетентность организма в процессе научения. В настоящей главе мы уточнили нервные механизмы процессов подкрепления, обеспечивающие завершение действия, и рассмотрели мозговые механизмы, участвующие в завершении задачи. Однако завершение задачи еще не означает достижение результата. В следующей главе мы покажем, как завершенные действия превращаются в акт поведения. РЕЗЮМЕ Длительные изменения компетентности могут возникать благодаря процессу, сходному с тем, который стимулирует эмбриональные ткани к дифференциации. Характерные черты эмбриональной индукции и поведенческих процессов, связанных с подкреплением, удивительно сходны. Факты показывают, что адренэргические химические процессы индукции стимулируют образование РНК и синтез протеина в механизме соединений весьма разветвленной нервной системы. Механизм индукции нуждается в защите от вмешательства на всех стадиях развития, иначе не будет получен нужный эффект. Большое число мозговых процессов обеспечивает завершение серии непрерывно подкрепляемых звеньев поведенческого акта после того, как они уже введены в действие. |
|
||
Главная | В избранное | Наш E-MAIL | Прислать материал | Нашёл ошибку | Наверх |
||||
|