arrow-downcheckdocdocxfbflowerjpgmailnoarticlesnoresultpdfsearchsoundtwvkxlsxlsxyoutubezipTelegram
Энциклопедия

Научное объяснение

Со времён досократиков и до наших дней проблемы, связанные с научным объяснением, привлекали внимание философов. Однако современные дискуссии по-настоящему начались с разработки Дедуктивно-Номологической (ДН) модели. У неё было немало сторонников (включая Поппера [Popper 1935, 1959], Брейтуэйта [Braithwaite 1953], Гардинера [Gardiner 1959] и Нагеля [Nagel 1961]), но наиболее подробное и влиятельное её изложение, безусловно, принадлежит Карлу Гемпелю [Hempel 1942, 1965; Hempel & Oppenheim 1948]. Эти статьи и реакция на них в значительной степени заложили основу для последующего обсуждения понятия научного объяснения. После нескольких общих замечаний о подоплёке этих дебатов и направлении, в котором они развивались (Раздел 1), мы опишем ДН-модель и её варианты, а затем обратимся к некоторым известным возражениям к ней (Раздел 2). Далее последует изложение истории различных попыток предложить альтернативную модель объяснения, включая модель Статистической релевантности Уэсли Сэлмона (Раздел 3), Каузально-механические модели (Раздел 4) и Унификационистские модели, предложенные Майклом Фридманом и Филиппом Китчером (Раздел 5). В Разделе 7 резюмируется содержание статьи и обсуждаются направления дальнейших исследований.

 

1. Контекст и введение
2. ДН-модель

2.1. Основная идея
2.2. Роль законов в ДН-модели
2.3. Индуктивное статистическое объяснение
2.4. Мотивация ДН-модели: Номическая вероятность и теория причинности как регулярности
2.5. Объяснительное понимание и номическая ожидаемость: Контрпримеры к достаточности
2.6. Стратегия скрытой структуры

3. СР-модель

3.1. Основная идея
3.2. СР-модель и события малой вероятности
3.3. Что объясняют статистические теории?
3.4. Причинность и отношения статистической релевантности

4. Каузально-механическая модель

4.1. Основная идея
4.2. КМ-модель и объяснительная релевантность
4.3. КМ-модель и сложные системы
4.4. Современные исследования

5. Унификационистское описание объяснения

5.1. Основная идея
5.2. Иллюстрации к унификационистской модели
5.3. Критика иллюстраций
5.4. Гетерогенность унификации
5.5. Концепция «Победитель получает всё»
5.6. Эпистемология унификации

6. Прагматические теории объяснения

6.1. Введение
6.2. Конструктивный эмпиризм и прагматическая теория объяснения
6.3. Объяснение как иллокутивный акт
6.4. Заключительные соображения о прагматических теориях

7. Выводы, открытые вопросы и направления дальнейших исследований

7.1. Роль причинности
7.2. Объяснение и другие эпистемические цели
7.3. Возможна ли единая модель объяснения?

Библиография

 

1. Контекст и введение

Как вскоре станет ясно, проблема «научного объяснения» ставит перед исследователем несколько взаимосвязанных вопросов. Прежде чем обратиться к подробному обсуждению конкурирующих моделей, будет полезно дать небольшое введение в проблему. Исходной предпосылкой большинства недавних дискуссий было то, что иногда наука даёт нам объяснения (а не то, что до объяснения не дотягивает, — например, «простое описание»), и задача «теории» или «модели» научного объяснения — охарактеризовать структуру таких объяснений. Таким образом, предполагается, что существует (на некоем достаточно абстрактном и общем уровне описания) единственный вид или форма объяснения, являющегося «научным». На деле понятие «научного объяснения» предполагает наличие по меньшей мере двух противопоставлений: во-первых, противопоставления тех «объяснений», которые типичны для «науки», и тех, которые для неё не типичны; во-вторых, противопоставления «объяснений» и того, что не является объяснением. Однако если говорить о первом противопоставлении, чаще всего в современной философской литературе считается, что существует значительная преемственность между теми видами объяснений, которые приняты в науке, и по меньшей мере некоторыми формами объяснения, используемыми в более повседневном, ненаучном контексте, причём последние в большей или меньшей степени обладают теми чертами, которые в детально проработанной, точной, строгой и т. д. форме характерны для первых. Кроме того, считается, что задача теории объяснения — понять, какие черты являются общими как для научного, так и для хотя бы некоторых более повседневных форм объяснения. Эти допущения помогают объяснить то, что в иной ситуации могло бы вызвать недоумение читателя, а именно, почему (как покажет эта статья) дискуссии о научном объяснении так часто используют как примеры, заимствованные из подлинной науки (например, объяснения траекторий движения планет, отсылающие к ньютоновской механике), так и более обыденные, в том числе опрокидывание чернильниц.

Если же говорить о втором противопоставлении, то, согласно большинству моделей объяснения, некий набор заявлений может быть истинным, точным, подкреплённым доказательствами и т. п., и, однако, ничего не объясняющим (по меньшей мере ничего, чему типичный искатель объяснений хотел бы найти объяснение). Например, все приведённые ниже модели научного объяснения будут согласны между собой в том, что описание облика конкретного вида птиц, которое можно найти в соответствующем указателе, сколь бы точным оно ни было, не является объяснением чего-либо, что может заинтересовать биолога (например, развития, характерных черт или поведения представителей вида). Такие описания являются «всего лишь дескриптивными». Однако различные модели объяснения по-разному определяют, в чем состоит противопоставление объясняющего и всего лишь дескриптивного описания.

С этим связана и другая проблема: хотя большинство создателей теорий научного объяснения предложили модели, включающие по меньшей мере некоторые случаи объяснения, которые мы не сочли бы относящимися к сфере науки, они, тем не менее, предполагали некоторые имплицитные ограничения того, какие виды объяснения они стремятся реконструировать. Нередко отмечалось, что слово «объяснение» (explanation) используется в повседневной речи по-разному: мы говорим об объяснении значения слова, объяснении подоплёки философских теорий объяснения, объяснении того, как испечь пирог, объяснении того, почему было принято определённое решение (то есть об обосновании решения) и т. п. Хотя различные обсуждаемые ниже модели иногда критиковались за то, что они не могли охватить все эти формы «объяснения» (см., например, [Scriven 1959]), очевидно, что это никогда и не было их целью. Вместо этого они, грубо говоря, стремились к объяснению того, почему случаются те или иные вещи, причём под «вещами» здесь можно понимать как конкретные события, так и нечто более общее: например, регулярности или повторяющиеся явления в природе. Парадигмы такого вида объяснения включают объяснение смещения перигелия Меркурия в рамках общей теории относительности, объяснение вымирания динозавров падением большого астероида в конце Мелового периода, предоставленное полицией объяснение автомобильной аварии (водитель был пьян, а на дороге — гололёд) и приводящееся в учебниках экономики стандартное объяснение того, почему монополии (в отличие от фирм на совершенно конкурентном рынке) будут повышать цены, сокращая выпуск продукции.

Наконец, скажем несколько слов о более широком эпистемологическом/методологическом контексте описанных ниже моделей. Многие философы считают такие понятия, как «объяснение», «закон», «причина» и «подкрепление контрфактических высказываний», принадлежащими к взаимосвязанному семейству или кругу «модальных» понятий. По хорошо знакомым «эмпирическим» мотивам Гемпель (и многие другие ранние сторонники ДН-модели) считал эти понятия недостаточно ясными — по крайней мере до проведения анализа. Предполагалось, что объяснение одного понятия из этого семейства через другие приведёт к «кругу» в рассуждении и что вместо этого их следует истолковывать в других понятиях, не относящихся к семейству модальных — понятиях, которые будут лучше удовлетворять тому, что считалось эмпирицистскими критериями понятности и проверяемости. Например, в предложенной Гемпелем версии ДН-модели понятие «закон» играет ключевую роль в истолковании понятия «объяснение», и его предположение заключается в том, что законы — это всего лишь регулярности, удовлетворяющие определённым дополнительным условиям, которые также приемлемы для эмпириков. Как мы увидим, эти эмпирицистские критерии (и связанное с ними нежелание использовать модальные понятия в качестве исходных) продолжали играть главную роль в моделях объяснения, разработанных вслед за ДН-моделью.

С ДН-моделью связано множество интересных исторических вопросов, которые по большей части остаются без ответа. Почему, раз возникнув, проблема «научного объяснения» становится важной темой философских дискуссий? Почему философы науки, придерживавшиеся «логического эмпиризма» и отстаивавшие ДН-модель, с такой готовностью приняли идею, что наука даёт «объяснения», учитывая склонность многих ранних позитивистов считать «объяснение» явлением достаточно субъективным или «метафизическим» и сравнивать его (не в его пользу) с «описанием», которое они считали гораздо более подходящей целью эмпирической науки? И почему обсуждение по крайней мере поначалу разворачивалось вокруг «объяснения», а не «причинности», хотя (как мы увидим) именно последнее понятие находилось в центре внимания в последующих дебатах, тогда как первое на вкус многих наших современников представляется несколько расплывчатым и плохо определённым? По меньшей мере отчасти ответ на этот последний вопрос состоит в том, что (как опять-таки будет более подробно объяснено ниже) Гемпель и другие сторонники ДН-модели унаследовали характерные для эмпириков или последователей Юма сомнения в отношении понятия причинности. Они полагали, что идеи каузальности приемлемы (научно или метафизически) только в той мере, в какой их возможно переформулировать или описать так, чтобы они удовлетворяли критериям осмысленности и правильности, принятым у эмпириков. Одним из очевидных способов добиться этого было счесть каузальные утверждения равносильными заявлениям о нахождении «регулярностей» (то есть явлений единообразной взаимосвязи в природе). Как раз эта идея и описывается ДН-моделью (см. ниже). Отчасти обаяние темы «научного объяснения» заключалось, таким образом, в том, что оно представляло собой более приемлемую замену сомнительной темы причинности (или позволяла к ней подступиться) [1]. Другим побудительным мотивом стал интерес Гемпеля и прочих ранних сторонников ДН-модели к таким неочевидно каузальным формам объяснения, как «функциональное объяснение» (которое используется в таких частных науках, как биология и антропология). Это тоже естественным образом привело к тому, что дискуссия развернулась вокруг более широкой категории объяснения, а не более узкого понятия «причинности» (ср. [Hempel 1965b]).

Рекомендованная литература: Сэлмон [Salmon 1989] даёт превосходный критический обзор всех моделей научного объяснения, обсуждаемых в данной статье. Работы Питта [Pitt 1988] и Рубена [Ruben 1993] — антологии, в которые включены важные работы.

 

2. ДН-модель

2.1. Основная идея

Согласно дедуктивно-номологической модели, научное объяснение состоит из двух основных «элементов»: экспланандума (explanandum) — предложения, «описывающего явление, которое следует объяснить», и эксплананса (explanans) — «класса предложений, приводимых для объяснения явления» ([Hempel and Oppenheim 1948], переиздано в [Hempel 1965, 247]). Чтобы эксплананс успешно объяснил экспланандум, следует соблюсти несколько условий. Во-первых, «экспланандум должен быть логическим следствием эксплананса», и «предложения, из которых состоит эксплананс, должны быть истинными» [Hempel 1965, 248]. То есть объяснение должно иметь форму состоятельного дедуктивного аргумента, в котором экспланандум является выводом из посылок, составляющих эксплананс. В этом и заключается «дедуктивный» компонент модели. Во-вторых, эксплананс должен содержать по меньшей мере один «закон природы», который должен быть существенной для вывода посылкой в том смысле, что при исчезновении этой посылки выведение экспланандума не будет валидным. Это — «номологический» компонент модели (где «номологический» представляет собой специальный философский термин, который — если вынести за скобки все тонкости — означает попросту «законный»). В самой своей общей формулировке ДН-модель может применяться для объяснения как «общих закономерностей» или «законов» (например, если воспользоваться примерами Гемпеля и Оппенгейма, почему свет подчиняется закону рефракции), так и конкретных событий, случающихся в конкретном месте в конкретное время (например, того, что в конкретном случае наблюдения частично погружённые в воду лодочные вёсла кажутся искривлёнными). Дополнительной иллюстрацией ДН-объяснения конкретного события может быть вычисление положения Марса в какой-то момент в будущем на основании ньютоновских законов движения, ньютоновского закона обратных квадратов, информации о массе Солнца, Марса, скорости обоих и занимаемом ими в данный момент положении. При таком вычислении различные ньютоновские законы оказываются существенными посылками, вместе с соответствующей информацией об исходных условиях (массе Марса, Солнца и т. п.) используемыми для выведения экспланандума (будущего положения Марса) посредством валидного дедуктивного аргумента. Таким образом, ДН-критерии оказываются удовлетворены.

 

2.2. Роль законов в ДН-модели

Понятие состоятельного дедуктивного аргумента, вероятно, кажется сравнительно ясным (или его хотя бы можно считать априорно понятым с точки зрения того, чтобы дать характеристику научного объяснения). Но что можно сказать о другом существенном элементе ДН-модели — законе природы? Основная интуиция, которой руководствуется ДН-модель, выглядит примерно так: внутри класса соответствующих истине обобщений можно отличить те, которые являются истинными лишь случайно, от тех, которые представляют собой «законы». Если использовать примеры Гемпеля, то обобщение

(2.2.1) Все члены школьного комитета Гринсбери в 1964 году — лысые если и является верным, то лишь случайным образом. Напротив, обобщение

(2.2.2) При неизменном давлении все газы при нагревании расширяются является законом. Таким образом, согласно ДН-модели, последнее обобщение в сочетании с информацией о том, что некий конкретный образец газа был нагрет при неизменном давлении, можно использовать для объяснения того факта, что газ расширился. Напротив, первое обобщение (2.2.1) в сочетании с информацией, что n являлся в 1964 году членом школьного комитета Гринсбери, не объясняет, почему n — лысый.

Хотя этот пример и может показаться достаточно понятным, но что именно отличает случайным образом соответствующие истине обобщения от законов? Это было предметом множества философских дискуссий, рассказ о большей части которых выходит за рамки данной статьи [2]. По причинам, раскрытым в Разделе 1, Гемпель полагал, что адекватная теория должна объяснять понятие закона без использования модальных терминов [3]. В своей работе 1965 года он рассматривает некоторое количество таких теорий [4] и приходит к выводу, что все они не удовлетворяют условиям, отмечая, что проблема определения понятия закона оказалась «чрезвычайно сложной» [Hempel 1965, 338]. Однако будет справедливым сказать, что под этим, по сути дела, он подразумевает, что законы — это всего лишь обобщения, из которых нет исключений, и которые описывают регулярности, удовлетворяющие определённым дополнительным характерным условиям, которые он в данный момент не способен сформулировать.

В последующие десятилетия было предложено несколько других критериев законности. Хотя у каждого из этих предложений были свои сторонники, ни одно не получило всеобщего признания [5]. Какие последствия это имеет для ДН-модели? Одна из возможных интерпретаций состоит в том, что всё, чего ДН-модель на самом деле требует, так это согласия относительно того, какие именно обобщения являются законами. Если такое согласие существует, то для ДН-модели не так важно, что мы не способны сформулировать абсолютно общие критерии, позволяющие во всех возможных случаях отличить случайным образом соответствующие истине обобщения от законов. Например, даже без адекватного представления о понятии законности мы, несомненно, можем согласиться, что (2.2.2) — закон, тогда как (2.2.1) — нет, и это — всё, что нам нужно, чтобы сделать вывод, что (2.2.2) может использоваться в ДН-объяснениях, а (2.2.1) — не может.

Однако, к сожалению, рассматриваемые нами ситуации не всегда так просты. Одним из важных вопросов, поставленных ДН-моделью, является объяснительный статус так называемых частных наук — биологии, психологии, экономики и т. п. Эти науки полны обобщений, по-видимому, играющих роль объяснений, но тем не менее не способных удовлетворить стандартным критериям законности. Например, хотя закон расщепления Менделя (М), согласно которому при половом размножении каждая из двух альтернативных форм (аллелей) гена, определяющая признак в хромосоме конкретного организма, имеет равную 0,5 вероятность попасть в гамету, широко используется в моделях эволюционной биологии, из него есть исключения (например, мейотический дрейф). То же самое можно сказать о принципах теории рационального выбора (например, обобщении, согласно которому предпочтения транзитивны), играющей центральную роль в экономической теории. Другие широко используемые в частных науках обобщения в сравнении с парадигматическими законами имеют очень узкие границы применимости, действуют лишь в ограниченных пространственно-временных сферах и лишены явной теоретической целостности.

По вопросу о том, считать ли подобные обобщения законами, ведутся довольно жаркие споры. Некоторые философы (например, Вудвард [Woodward 2000]) полагают, что такие обобщения удовлетворяют слишком малому количеству стандартных критериев, чтобы считаться законами, но тем не менее могут исполнять роль объяснений; если это так, то мы, вероятно, должны отказаться от требования ДН-модели, что все объяснения должны апеллировать к законам. Другие (например, Митчелл [Mitchell 1997]), выдвигая на передний план иные критерии законности, вместо этого заключают, что такие обобщения, как (М), являются законами, а потому не создают угрозы для требования, чтобы объяснения отсылали к законам. В отсутствие более строгого представления о законах сложно сопоставить эти конкурирующие утверждения и тем самым оценить последствия использования ДН-модели для частных наук. В целом в отсутствие общепризнанного представления о законности разумное объяснение лежащего в основании ДН-модели фундаментального отличия законов от утверждений, не являющихся законами, недостижимо: сложно оценить заявление, что все объяснения должны ссылаться на законы, без чёткого понимания того, что такое закон и почему он необходим для успешного объяснения. По меньшей мере достижение такого понимания — важная и пока ещё не решенная задача для сторонников ДН-модели.

 

2.3. Индуктивное статистическое объяснение

Предназначение ДН-модели — представить объяснение посредством его выведения из детерминистических законов, и это ставит очевидный вопрос об объяснительном статусе статистических законов. Объясняют ли они что-либо вообще, и если объясняют, то что именно и при каких условиях? В своей работе Гемпель [Hempel 1965] различает два вида статистических объяснений. Первый — это дедуктивно-статистическое (ДС) объяснение, которое предполагает выведение «более узкой статистической равномерности» из более общего набора посылок, по меньшей мере одна из которых является общим статистическим законом. Поскольку ДС-объяснение предполагает выведение объясняемого из закона, оно разворачивается в соответствии с общей моделью ДН-объяснения регулярности. Однако помимо ДС-объяснения Гемпель также выделяет особый вид статистического объяснения, называемого им индуктивно-статистическим (ИС). Оно предполагает категоризацию отдельных событий (например, излечение конкретного человека от стрептококковой инфекции) на основании статистических законов (например, закона, определяющего вероятность излечения при приёме пенициллина).

В то время как экспланандум в ДН- или ДС-объяснении может быть выведен из эксплананса, на основании приведённого выше статистического закона и информации о приёме пенициллина невозможно сделать вывод, что некий конкретный человек, Джон Джонс, излечился. Самое большее, что можно предположить, это большую или меньшую вероятность излечения. В ИС-объяснении отношение между экспланансом и экспланандумом является, согласно Гемпелю, скорее «индуктивным», чем дедуктивным — потому-то оно и называется индуктивно-статистическим объяснением. Детали предложенной Гемпелем теории сложны, но в целом основная идея такова: ИС-объяснение будет подходящим и успешным в той степени, в какой эксплананс обеспечивает высокую вероятность выводимого из него экспланандума.

Таким образом, если статистическим законом является то, что при приёме пенициллина вероятность излечения от стрептококка высока, и Джонс принял пенициллин и вылечился, эта информация может использоваться для ИС-объяснения излечения Джонса. Однако если вероятность исцеления невысока (например, ниже 0,5), а Джонс принял пенициллин, то, даже если он поправится, мы не можем использовать эту информацию для объяснения его выздоровления.

 

2.4. Мотивация ДН-модели: Номическая вероятность и теория причинности как регулярности

Почему мы предполагаем, что все (или хотя бы некоторые) объяснения имеют ДН- или ИС-структуру? Есть две идеи, играющие у Гемпеля [Hempel 1965] роль основного мотива для этого предположения. Первая связывает информацию, предоставляемую ДН-аргументом, с определённой концепцией того, что значит понимать, почему нечто происходит (она отсылает к цели или смыслу предоставления объяснения). Гемпель пишет:

ДН-объяснение отвечает на вопрос «Почему возникает объясняемое явление?», показывая, что явление вызывается определёнными частными обстоятельствами, указанными в С1, С2,…Ck, в соответствии с законами L1, L2,…Lr. Отмечая это, аргумент демонстрирует, что в конкретных обстоятельствах и при действии указанных законов следует ожидать возникновения определённого явления; и именно в этом смысле объяснение позволяет нам понять, почему это явление возникает. [Hempel 1965, 337 (курсив автора)]

Можно интерпретировать ИС-объяснение как естественное обобщение этой идеи. Хотя оно и не доказывает с точностью, что нам следует ожидать возникновения объясняемого явления, оно обеспечивает лучшее, на что можно в данных обстоятельствах рассчитывать: доказательство того, что возникновения объясняемого явления можно ожидать по меньше мере с высокой вероятностью, — и, таким образом, позволяет его понять. Говоря в более общем смысле, и ДН-, и ИС-модели объединяет идея, сформулированная Сэлмоном: «Суть научного объяснения может быть охарактеризована как номическая ожидаемость, то есть ожидаемость, основанная на законосообразных связях» [Salmon 1989, 57].

Второй основной мотив использования ДН-/ИС-модели связан с ролью в научном объяснении утверждений, описывающих каузальные связи. Среди философов существуют значительные разногласия по вопросу о том, являются ли все объяснения в науке и повседневной жизни каузальными, а также в чём состоит (и существует ли вообще) различие между каузальными и некаузальными объяснениями [6]. Тем не менее практически все, включая Гемпеля, согласны, что многие научные объяснения содержат информацию о причинах явлений. Однако Гемпель, как и большинство других первых сторонников ДН-модели, не желал рассматривать понятие причинно-следственных отношений как основу теории объяснения — то есть он не хотел просто сказать, что X должно присутствовать в объяснении Y, если и только если X — причина Y. Вместо этого приверженцы ДН-модели обычно искали такое описание причинно-следственных связей, которое удовлетворяло бы требованиям эмпириков, приведённым в Разделе 1. В частности, защитники ДН-модели, как правило, принимали в широком смысле юмовскую теорию причинности (теорию регулярности), согласно которой (в очень грубой формулировке) все каузальные утверждения предполагают существование некоторой соответствующей регулярности («закона»), связывающей причину и действие. Затем из этого делался вывод, что все каузальные объяснения «предполагают» (возможно, лишь «неявным образом»), что такой закон/регулярность существует, и, следовательно, что законы «задействованы» во всех подобных объяснениях — в точности так, как утверждает ДН-модель.

В качестве иллюстрации этого рассуждения рассмотрим следующее утверждение:

(2.4.1) Я толкнул письменный стол коленом, и из-за этого опрокинулась чернильница.

Утверждение (2.4.1) — это так называемое единичное каузальное объяснение, выдвинутое Майклом Скривеном [Scriven 1962] в качестве контрпримера для утверждения, будто ДН-модель описывает необходимые условия успешного объяснения. Согласно Скривену, утверждение (2.4.1) объясняет, почему чернильница опрокинулась, несмотря даже на то, что в нём явным образом не упомянут ни один закон или обобщение, и само оно состоит из одного-единственного предложения, а не дедуктивного аргумента. Гемпель ответил на это [Hempel 1965, 360ff], что «произошедший по некой причине» инцидент в (2.4.1) не следует оставлять без анализа или без всяких оговорок считать объяснением. Вместо этого следует проинтерпретировать (2.4.1) как утверждение, «имплицитно» или «неявным образом» отсылающее к существованию «закона» или регулярности, связывающей толчки коленом с опрокидыванием чернильниц. По мнению Гемпеля, именно имплицитное утверждение, что такой закон существует, «отличает» (2.4.1) от «простого повествования», в котором рассказывается, как чернила разлились вслед за толчком, но не подразумевается никакой каузальной связи, — повествования, которое (как думает Гемпель), очевидно, не будет объяснением. Такой связующий закон в ДН-доказательстве является номологической посылкой, которая, согласно Гемпелю, «имплицитно» подразумевается утверждением (2.2.1).

Существуют два родственных, но всё же отличающихся друг от друга способа интерпретации этого аргумента, каждый из которых может быть выведен из рассуждения Гемпеля. Согласно первому, Гемпель утверждает, что подлинная базовая структура (2.4.1) представляет собой нечто наподобие следующего:

(2.4.2) (L) Каждый раз, когда кто-либо задевает коленом стол, на котором стоит чернильница, и выполнены дополнительные условия K (где K уточняют, что толчок достаточно силён и т. д.), чернильница опрокидывается. (Оговорка о K необходима, поскольку не каждый толчок стола коленом заканчивается опрокидыванием чернильницы.)

(I) Я толкнул коленом письменный стол, на котором стоит чернильница, и выполнены дополнительные условия K.

(E) Чернильница опрокинулась.

Следовательно, в той мере, в которой (2.4.1) является объяснением, оно всё-таки «имплицитно» удовлетворяет ДН-/ИС-условиям и является ДН-/ИС-доказательством (а именно, замаскированным (2.4.2)).

Существует вторая интерпретация аргумента Гемпеля, которая, в отличие от первой, не требует от нас считать полное содержание (2.4.2) чем-то имплицитно содержащимся в (2.4.1). Вместо этого (2.4.2) рассматривается как идеал, с которым следует сопоставлять (2.4.1). (2.4.2) разъясняет, какую информацию должно содержать полное, абсолютно достаточное объяснение события E: эта информация содержится в (2.4.1) лишь частично, не полностью. Рассматривая вопрос с этой точки зрения, мы думаем о (2.4.1) как о наброске объяснения (ср. [Hempel 1965b, 423ff]), сообщающем часть сведений, содержащихся в (2.4.2), или отсылающем к более полному объяснению (2.4.2). В идеале единичные каузальные объяснения наподобие (2.4.1) следует заменить подробными ДН-объяснениями наподобие (2.4.2).

Однако основная идея каждой из этих интерпретаций заключается в том, что корректное объяснение роли каузальных утверждений в объяснении учитывает юмовскую теорию причинности (теорию регулярности) и приводит к заключению, что (по крайней мере, в идеале) объяснения должны соответствовать ДН-/ИС-модели. Давайте назовём этот аргумент аргументом «скрытой структуры» в ознаменование роли, отводимой им скрытой (или по меньшей мере неявной) ДН-структуре, которая, как утверждается, присутствует в (2.4.1).

Эта стратегия будет рассмотрена в параграфе 2.6, но позвольте мне для начала отметить характерную особенность обсуждаемой нами в данный момент дискуссии, которая может показаться загадочной. Далеко не очевидно, что конкретно входит в категорию «научное объяснение», но, поскольку (2.4.1), вероятно, является объяснением, речь идёт не об области, которую мы обычно называем «наукой», а о «повседневной жизни» или «здравом смысле». Это заставляет спросить, почему сторонники ДН-/ИС-модели не ответят на мнимый контрпример (2.4.1), просто указав, что данный случай не относится к категории «научное объяснение», — то есть заявив, что ДН-/ИС-модель не является попыткой реконструкции структуры таких объяснений, как (2.4.1), а, скорее, может применяться лишь для подлинно «научных» доказательств. Тот факт, что защитники ДН-модели нечасто избирают такую стратегию, свидетельствует о том, в какой степени (как отмечалось в Разделе 1) в большинстве дискуссий о научном объяснении неявным образом подразумевается, что существует значительное сходство и преемственность в структуре объяснений наподобие (2.4.1) и объяснений, которые с большей очевидностью относятся к категории «научных», и что это сходство должно отражаться неким общим описанием, подходящим для объяснений обоих видов. В самом деле, поразительной особенностью не только рассуждений Гемпеля [Hempel 1965], но и других размышлений о научном объяснении является то, что на самом деле значительное внимание уделяется «повседневным» единичным каузальным объяснениям наподобие (2.4.1), причём неявно предполагается, что выводы о структуре таких объяснений могут напрямую применяться для понимания объяснений научных.

 

2.5. Объяснительное понимание и номическая ожидаемость: Контрпримеры к достаточности

Как было показано выше, такие примеры, как (2.4.1), являются потенциальными контрпримерами для утверждения, что ДН-модель обеспечивает необходимые условия объяснения. Существует также некоторое количество хорошо известных контрпримеров для утверждения, что ДН-модель обеспечивает достаточные условия для удачного научного объяснения. Вот две иллюстрации.

Нарушения симметрии в объяснении. Во многих случаях выведение экспланандума E из закона L и исходных условий I кажется объясняющим его, но «обратное» выведение I из E и того же закона L таковым не кажется, несмотря даже на то, что последнее, как и первое, по всей видимости, удовлетворяет критериям успешного ДН-объяснения. Например, можно вывести длину s тени, отбрасываемой флагштоком, из его высоты h и положения солнца над горизонтом θ, а также законов прямолинейного распространения света. Такой вывод соответствует ДН-критериям и кажется содержащим объяснение. С другой стороны, выведение h из s и θ также соответствует этим критериям, но не кажется содержащим объяснение. Такие примеры предполагают, что по меньшей мере некоторые объяснения отличаются направленностью или асимметрией, к которым нечувствительна ДН-модель.

Иррелевантность в объяснении. Вывод может удовлетворять ДН-критериям и при этом, тем не менее, не быть объяснением, поскольку он содержит иррелевантные элементы помимо тех, что связаны с направленностью объяснения. Рассмотрим пример Уэсли Сэлмона [Salmon 1971, 34]:

(2.5.2) (L) Все мужчины, регулярно принимающие противозачаточные таблетки, не могут забеременеть.

(K) Джон Джонс — мужчина, регулярно принимающий противозачаточные таблетки.

(E) Джон Джонс не может забеременеть.

Вероятно, (L) отвечает критериям законности, налагаемым Гемпелем и многими другими авторами. (Если кто-то хочет доказать, что L — не закон, ему нужно будет некое принципиальное, общепринятое основание такого доказательства и, как показано выше, неясно, что это может быть за основание.) Более того, (2.5.2) — это, определённо, состоятельный дедуктивный аргумент, в котором L является существенной посылкой. Тем не менее большинство людей полагает, что (L) и (K) вовсе не являются объяснением (E). Существует множество подобных примеров. Например, то, что все образцы столовой соли, зачарованные прикосновением принадлежащей ведьме волшебной палочки, растворяются в воде, по всей видимости, является законом (или хотя бы не имеющим исключений обобщением, подкрепляющим истинность контрфактических высказываний) [Kyburg 1965]. Можно использовать это обобщение как посылку ДН-доказательства, которое завершится выводом, что некий конкретный зачарованный образец соли растворился в воде. Но наложение заклятия опять-таки не имеет отношения к растворению в воде, и такой вывод не является объяснением.

Один из очевидных диагнозов того, в чем состоит сложность примеров (2.5.1) и (2.5.2), указывает на роль причинности в объяснении. Согласно этому подходу, чтобы объяснить результат, мы должны назвать его причины, а (2.5.1) и (2.5.2) на это неспособны. Как пишет Сэлмон, «флагшток определённой высоты является причиной тени определённой длины, а потому объясняет длину тени» [Salmon 1989, 47]. Напротив, «тень не является причиной флагштока и, следовательно, не может объяснить его высоту» [Ibid.]. Точно так же принятие противозачаточных пилюль не является причиной того, что Джонс не может забеременеть, и именно поэтому (2.5.2) не может быть приемлемым объяснением. Согласно этому анализу, если (2.5.1) и (2.5.2) что-то доказывают, так это то, что вывод может удовлетворять ДН-критериям и при этом не быть способным определить причины экспланандума. Когда это случается, вывод не может ничего объяснить.

Как показано выше, сторонники ДН-модели сочтут этот диагноз хорошим разъяснением, только если он сопровождается каким-либо описанием причинно-следственных отношений, не просто принимающим это понятие как исходное. (На самом деле Сэлмон даёт такое описание, что мы рассмотрим в Разделе 4.) Однако нам следует отметить, что урок, который мы, по-видимому, можем извлечь из (2.5.1) и (2.5.2), заключается в том, что излюбленное теоретиками ДН-модели описание причинности как регулярности является в лучшем случае неполным: возникновение c, e и существование какой-либо связывающей их регулярности или закона (или то, что x имеет свойство P, x имеет свойство Q, и есть какой-либо закон, связывающий эти факты) — недостаточное условие для того, чтобы заявление, будто c вызывает e или будто то, что x обладает свойством P, имеет каузальное или объяснительное значение для того, что x обладает свойством Q, было истинным. В целом, если принять контрпримеры (2.5.1) и (2.5.2), из этого следует, что ДН-модель не может постулировать достаточные условия для объяснения. Объяснить исход явления не значит просто показать, что он номически ожидаем.

На это наблюдение могут быть две реакции. Во-первых, можно сказать, что идея, что объяснение — это вопрос номической ожидаемости, в известной мере верна, но что требуется и ещё кое-что. Согласно этой оценке, ДН-/ИС-модель и в самом деле постулирует необходимое условие успешного объяснения и, более того, условие, которое не является избыточным элементом достаточной для объяснения совокупности условий. Однако следует добавить в ДН-модель некую новую, независимую характеристику X (которая будет отвечать за направленность объяснения и обеспечивать такую объяснительную релевантность, которая, очевидно, отсутствует в примере с противозачаточными таблетками), чтобы получить успешное описание объяснения. Таким образом, идея заключается в том, что Номическая ожидаемость + X = Объяснение. Сходная мысль поддерживается унификационистскими моделями объяснения, разработанными Фридманом [Friedman 1974] и Китчером [Kitcher 1989], которые рассматриваются ниже, в Разделе 5.

Второй, более радикальный возможный вывод состоит в том, что ДН-описание цели объяснения фундаментально ошибочно и что ДН-модель не постулирует даже необходимые для успешного объяснения условия. Как отмечено выше, если мы не принимаем аргумент скрытой структуры, этот вывод прямо следует из примера (2.4.1) («Я толкнул письменный стол коленом, и из-за этого опрокинулась чернильница»), в котором даётся объяснение без прямой отсылки к закону или дедуктивной структуре. Чтобы оценить, обеспечивает ли ДН-/ИС-модель условия, необходимые для объяснения, мы, таким образом, должны более подробно изучить стратегию скрытой структуры.

 

2.6. Стратегия скрытой структуры

Может показаться, что тезис стратегии скрытой структуры, согласно которому уникальное каузальное объяснение наподобие (2.4.1) представляет собой неявную форму или «набросок» ДН-/ИС-объяснения, в лучшем случае имеет значение для ответа на вопрос, адекватно ли ДН-/ИС-модель реконструирует этот конкретный вид объяснения. Однако на деле стратегия Гемпеля рассматривать объяснения как способ передачи информации — но «частичным» и «неполным» образом — о лежащих в их основании «идеальных» объяснениях, имеющих, на первый взгляд, весьма отличающуюся форму и по крайней мере отчасти эпистемически скрытых от тех, кто использует оригинальное, не идеальное объяснение, продолжает оставаться очень популярной в современных дебатах о научном объяснении. Эта стратегия лежит, к примеру, в основе противопоставления «идеального объясняющего текста», содержащего всю каузальную и номологическую информацию, имеющую отношение к интересующему нас выводу, и «неидеальных» объяснений наподобие (2.4.1), которые мы обычно даём [Railton 1978, 1981]. Согласно Райлтону, последние предоставляют «объясняющую информацию» в силу того, что передают сведения о какой-то ограниченной доле или аспекте идеального текста, а потому являются объясняющими. Стратегия скрытой структуры играет также важную роль в унификационистской теории объяснения, разработанной Филиппом Китчером [Kitcher 1989], который точно так же настаивает, что мы должны «отличать то, что сказано по случаю, в котором дана объясняющая информация, от лежащего в основе такой информации идеального объяснения» [Kitcher 1989, 414]. И действительно, любая теория объяснения, которая — как унификационистская модель Китчера — настаивает, что законы (или достаточно широкие обобщения) и дедуктивная структура являются необходимыми условиями успешного объяснения, будет нуждаться в чём-то, похожем на стратегию скрытой структуры, поскольку общепризнано, что, по видимости, существует множество объяснений, структура которых не согласуется с этими условиями.

Хотя стратегия скрытой структуры заслуживает больше внимания, чем мы здесь можем ей уделить, кое-что представляется очевидным. Во-первых, требует серьёзного разъяснения идея некого объяснения, «передающего информацию о» другом, «лежащем в его основе» объяснении. В зависимости от того, как мы понимаем это «лежащее в его основе», можно утверждать, что в основе (2.4.1) лежит много объяснений: (i) объяснение (2.4.2), предполагающее, что условие K можно определить в научных терминах; (ii) объяснение на уровне классической физики, которое отсылает к законам, описывающим неупругие столкновения, поведение жидкостей, не ограниченных какой-либо ёмкостью и т. д.; (iii) объяснение, в котором поведение всей системы характеризуется в терминах какой-либо более фундаментальной физической теории (квантовой механики, теории струн и т. д.). Содержатся ли все эти объяснения в (2.4.1) неявным образом, и передаёт ли утверждение (2.4.1) частичную информацию о каждом из них? В каком смысле слова «неявным образом» или «передаёт частичную информацию» могут соответствовать истине?

Райлтон [Railton 1981] полагает, что объясняющее что-либо утверждение даёт информацию о лежащем в его основе идеальном тексте, если сокращает неопределённость в отношении некоторых свойств текста, то есть уточняет его возможную структуру. Райлтон понимает, что у его предложения есть множество контринтуитивных следствий. Если использовать пример самого Райлтона, «соответствующий идеальный текст содержит более 102 английских слов» и, если это предложение истинно, считается объяснением случая радиоактивного распада [Railton 1981, 246]. Точно так же утверждение, что существует корреляция между X и Y, будет считаться частичным объяснением X и Y на основании правдоподобного предположения, что это утверждение передаёт информацию, что одна из трёх возможностей, скорее всего, и в самом деле имеет место: либо X вызывает Y, либо Y вызывает X, либо у них есть общая причина — а это сокращает неопределённость в отношении содержания идеального текста, лежащего в основе объяснения. Это контрастирует с широко распространённым мнением, что сами по себе корреляции ничего не объясняют. В самом деле, с позиции, схожей с позицией Райлтона, даже утверждение, что у некоего исхода нет причин или что он не регулируется никакими законами, считается «объяснением» этого исхода при условии, что это утверждение верно. По сути, такое утверждение, по всей видимости, должно иметь максимальную объяснительную силу, поскольку передаёт всё, что следует сказать об идеальном объясняющем тексте, соответствующем этому событию. Из подобных примеров следует, что не каждое утверждение, которое сокращает неопределённость в отношении содержания идеального объясняющего текста, следует само по себе считать объясняющим — такой подход слишком сильно расширяет понятие объяснения.

Правдоподобно ли считать, что текст, содержащий полную и подробную каузальную и номологическую информацию, имеющую отношение к некоему исходу, будет по меньшей мере «идеалом», который может стать мерилом для различных предлагаемых объяснений данного исхода? Предположим, что перед нами — объяснение из области экономики или психологии, не отсылающее ни к какому обобщению, которое мы готовы считать законом, но что в основе этого «неидеального» объяснения лежит какой-то невероятно сложный набор фактов, описываемых в терминах классической механики и электромагнетизма, а также соответствующие законы этих теорий. Если (как почти наверняка и будет) это лежащее в основе «объяснение» не поддается количественной проверке из-за громадного объёма данных и полно не имеющих отношения к делу подробностей (об этом см. Раздел 4 ниже), можно спросить, в каком смысле оно является идеалом, с которым следует сравнивать первоначальное объяснение. Будет ли экономическое объяснение и в самом деле лучше, если будет содержать как можно больше информации обо всех имеющих отношение к объясняемому явлению деталях?

И наконец, давайте поговорим о связи между объяснением и пониманием. Обычно объяснение считают чем-то, что обеспечивает понимание. В связи с этим одной из задач теории объяснения является выявление тех структурных особенностей объяснений (или информации, которую они передают), в силу которых они обеспечивают понимание. Например, как отмечалось выше, ДН-модель связывает понимание с предоставлением информации о номической вероятности. Идея заключается в том, что понимание того, почему событие имело некий исход, состоит в том, что мы видим, что это событие было ожидаемо на основании определенного закона. Таким образом, для стратегии скрытой структуры возникает проблема: ассоциируемая со скрытой структурой информация, которая, как утверждается, должна лежать в основе «неидеальных» объяснений наподобие (2.4.1), обычно неизвестна или эпистемически недоступна тем, кто использует объяснение. Сложно понять, как эта структура или информация может повлиять на понимание, если она эпистемически скрыта. Например, кажется правдоподобным, что многие (если не почти все) люди, использующие (2.4.1) (как те, кто может привести его в качестве объяснения, так и те, кто принимает его в этом качестве), не имеют понятия о лежащей в его основе ДН-структуре. На самом деле кажется убедительным, что у многих, кто использует это объяснение, нет представления о законе природы или состоятельном дедуктивном аргументе, а потому и какого-либо понятия о том, что в основе (2.4.1) лежит какое-то (неизвестное) ДН-доказательство. Если это так, как простое обладание этой ДН-структурой (вне зависимости от того, подозревает ли кто-нибудь о её существовании) может обеспечить понимание при использовании (2.4.1)? Скорее, кажется, что те особенности (2.4.1), которые наделяют его объяснительным смыслом, — которые делают его объяснением, — должны быть как раз теми его особенностями, которые люди, использующие объяснение, могут познать или усвоить. То же самое будет касаться многих других предлагаемых объяснений, которые не соответствуют ДН-требованиям: например, объяснений в области таких наук, как экономика или психология, где, как кажется, отсутствуют законы.

Какой вывод можно сделать из этого обсуждения стратегии скрытой структуры? Если эта стратегия терпит неудачу, то будет большое количество предполагаемых объяснений, которые не смогут удовлетворить налагаемым ДН-/ИС-моделью условиям объяснения. С другой стороны, возможно, существуют способы развить стратегию скрытой структуры таким образом, чтобы она дала ответ на описанные выше сложности. Если это так, то идея, что ДН-/ИС-требования являются по меньшей мере необходимыми условиями идеального объяснения, может в конце концов оказаться обоснованной, хотя и останутся упомянутые нами контрпримеры к достаточности этой модели.

Рекомендованная литература. Наиболее авторитетным и исчерпывающим изложением ДН- и ИС-моделей, по всей видимости, является работа Гемпеля [Hempel 1965b]. Она воспроизведена в [Hempel 1965a] вместе с рядом других статей, затрагивающих различные аспекты проблемы научного объяснения. В дополнение к упомянутым в этом разделе работам, Сэлмон [Salmon 1989, 46ff] описывает несколько широко известных контрпримеров ДН-/ИС-моделей и обсуждает их значение.

 

3. СР-модель

3.1. Основная идея

Лейтмотивом большинства последующих работ об объяснении были попытки определить (обычно в описанном выше эмпирическом контексте) характерные черты каузальной или объяснительной релевантности, которую в примерах вроде (2.5.1) и (2.5.2) упускали из виду. Модель статистической релевантности (или СР) Уэсли Сэлмона [Salmon 1971] является очень важной попыткой описать эти особенности с точки зрения понятия статистической релевантности или отношений условной зависимости. Для некоторого класса или популяции A признак C будет статистически релевантен другому признаку B, если и только если P (∣ A.C) ≠ P (∣ A), то есть если и только если вероятность B при условии A и C, будет отличаться от вероятности B при одном только условии A. Лежащая в основе СР-модели интуиция заключается в том, что статистически релевантные свойства (или информация о статистически релевантных отношениях) объясняют нечто, а статистически иррелевантные свойства — нет. Другими словами, понятие важного для экспланандума свойства раскрывается в отношениях статистической релевантности.

Чтобы проиллюстрировать эту идею, предположим, что в примере с противозачаточными таблетками (2.5.2) исходная популяция T включает людей обоих полов. Тогда

P (Беременность ∣ T.Мужчина. Принимает противозачаточные таблетки) =

= P (Беременность ∣ T.Мужчина) = 0,

тогда как

P (Беременность ∣ T.Женщина. Принимает противозачаточные таблетки) ≠

≠ P (Беременность ∣ T.Женщина),

если предположить, что не все женщины в популяции принимают противозачаточные таблетки.

Другими словами, если вы — мужчина и принадлежите к этой популяции, то тот факт, что вы принимаете противозачаточные таблетки, статистически иррелевантен для вашей неспособности забеременеть, тогда как в случае женщины он релевантен. Таким образом, мы можем понять, что приём противозачаточных таблеток не может объяснить отсутствие беременности у мужчин, но может — у женщин.

Чтобы дать более точную характеристику СР-модели, нам понадобится понятие однородного распределения. Однородное распределение А — это ряд взаимоисключающих и полностью охватывающих A подклассов или ячеек Ci, где P (∣ A.Ci) ≠ P (∣ A.Cj) для всех Ci ≠ Cj и где невозможно никакое дальнейшее статистически релевантное распределение любых ячеек A.Ci в отношении B, то есть у A нет дополнительных признаков Dk, таких что P (∣ A.Ci) ≠ P (∣ A.Ci.Dk).

В СР-модели объяснение того, почему некий член x класса, характеризуемого признаком A, имеет признак B, состоит в следующей информации:

i. Предварительная вероятность B в A : P (BA) = p.

ii. Однородное распределение A в отношении B, (A.C1,…, A.Cn), вместе с вероятностью B в каждой ячейке распределения: P (∣ A.Ci) = pi, и

iii. ячейка распределения, к которой принадлежит x.

Воспользуемся одним из примеров Сэлмона. Предположим, мы хотим построить СР-объяснение того, почему x, который болен стрептококковой инфекцией = S, быстро выздоравливает = Q. Пусть (−T) означает, что x лечат (или не лечат) пенициллином, а (−R) — заражение (или отсутствие такового) устойчивым к пенициллину штаммом. Для простоты предположим, что других релевантных для быстрого выздоровления факторов нет. Есть четыре возможные комбинации этих свойств: T.R, −T.R, T.−R, −T.−R, но допустим, что

P (∣ S.T.R)

= P (∣ S.−T.R)

= P (∣ S.−T.−R)

≠ P (∣ S.T.−R).

То есть вероятность быстрого выздоровления больных стрептококковой инфекцией одинакова в случае заражения устойчивым к пенициллину штаммом вне зависимости от того, лечат их или нет, а также для тех, кого вовсе не лечат. Напротив, вероятность выздоровления тех больных, которых лечили и чей штамм чувствителен к пенициллину, отличается (как предполагается, она выше).

В этом случае [S.(T.R −T.R −R.−R)], [S.T.−R] — однородное распределение S в отношении Q. СР-объяснение излечения x будет состоять из высказывания о вероятности быстрого исцеления всех, заражённых стрептококком (это (i) выше), высказывания о вероятности излечения в каждой из двух ячеек вышеупомянутого распределения (ii) и высказывания о ячейке, к которой относится x, то есть S.T.R. (iii). Если руководствоваться интуицией, то идея сводится к тому, что эта информация сообщает нам о значении каждой из возможных комбинаций свойств T и R для быстрого выздоровления больных стрептококковой инфекцией, и как раз поэтому обладает объяснительной силой.

 

3.2. СР-модель и события малой вероятности

У СР-модели есть несколько отличительных черт, ставших предметом дискуссий. Во-первых, отметим, что, согласно СР-модели (и в противоположность ДН-/ИС-модели), объяснение не является доказательством — ни в смысле состоятельного дедуктивного аргумента, в котором экспланандум является выводом из эксплананса, ни в смысле индуктивного доказательства, где экспланандум с высокой вероятностью следует из эксплананса, как это происходит при ИС-объяснении. Вместо этого объяснение оказывается некой информацией, статистически релевантной для экспланандума. Сэлмон утверждает (и приводит в качестве иллюстрации пример с противозачаточными таблетками (2.5.2)), что критерии, которым хорошее доказательство должно удовлетворять (например, критерии, обеспечивающие дедуктивную состоятельность или её индуктивный аналог), попросту отличаются от тех, которым должно удовлетворять хорошее объяснение. Помимо прочего, как пишет Сэлмон, «случаи иррелевантности безопасны для доказательств, но смертельно опасны для объяснения» [Salmon 1989, 102]. Как показано выше, СР-модель делает попытку учесть это замечание, связав успешное объяснение с предоставлением информации об отношениях статистической релевантности.

Вторая особенность, тесно связанная с первой, состоит в том, что СР-модель отступает от ИС-модели, поскольку отказывается от идеи, что статистическое объяснение исхода должно предоставлять информацию, из которой следует, что исход имеет высокую вероятность. Читатель может проверить: приведённое выше описание СР-модели не содержит такого требования высокой вероятности; вместо этого даже весьма маловероятные исходы будут объяснены, если удовлетворены критерии СР-объяснения. Предположим, что в приведённом выше примере вероятность быстрого излечения от стрептококковой инфекции при условии, что штамм чувствителен к пенициллину, а больной получает лечение, достаточно низка (например, 0,2). Тем не менее, если соблюдаются перечисленные выше критерии (i)–(iii) — однородное распределение с правильной оценкой вероятности для каждой из ячеек распределения, — мы можем использовать эту информацию, чтобы объяснить, почему x, у которого чувствительный к пенициллину штамм и который получает лечение, быстро выздоравливает. В самом деле, согласно СР-модели, мы можем объяснить, почему некий x с признаком A имеет признак B, даже если условная вероятность при наличии A  и ячейки Ci,  к которой принадлежит  x  (p= P (∣ A . )), меньше, чем априорная вероятность B  в  (= P (∣ )). Например, если предварительная вероятность быстрого исцеления больных любой формой стрептококковой инфекции равна 0,5, а вероятность быстрого исцеления тех, кто заражён устойчивым штаммом и не получает лечения, равна 0,1, мы, тем не менее, можем объяснить, почему y, удовлетворяющий этим условиям (−T.R), быстро вылечился (если такое случилось), указав на ячейку, к которой он относится (на тот факт, что он был заражён устойчивым штаммом и не получал лечения), на вероятность излечения, если он относится к этой ячейке, и на другую информацию, о которой шла речь выше. В общем для СР-модели имеет значение не то, высока или низка вероятность результата-экспланандума (или даже высока она или низка в сравнении с её предварительной вероятностью), но скорее отсылает ли предполагаемый эксплананс ко всем статистически релевантным факторам и только к ним, и точно ли известны вероятности, на которые он ссылается. Одно из следствий этого (наличие этого следствия подтверждает Сэлмон, признавая, что многие сочтут его противоречащим интуиции) заключается в том, что в СР-модели один и тот же эксплананс T может объяснять как экспланандум M, так и экспланандумы, которые несовместимы с M, такие как −M. Например, один и тот же эксплананс объяснит как то, почему человек со стрептококковой инфекцией и рядом других признаков (скажем, T и −R) быстро выздоравливает (если это так), так и то, почему он не выздоравливает (если это так). Напротив, в ДН- и ИС-моделях, если E объясняет M, Е не может также объяснять и −M.

Интуицию, согласно которой, в противоположность ИС-модели, значение, приписываемое предлагаемым экспланансом результату-экспланандуму, не должно влиять на качество объяснения, которое он даёт, можно обосновать следующим образом. Возьмём совершенно индетерминистичную монету, которая при подбрасывании имеет устойчивую тенденцию (p=0,9) выпадать решкой. Предположим, что, если монету не бросают, она с вероятностью 0,5 будет лежать орлом или решкой вверх, и что, бросают её или не бросают, есть лишь один фактор, статистически релевантный по отношению к тому, ляжет ли она вверх орлом или решкой. Согласно ИС-модели, если монету подбрасывают, и она падает решкой вверх, мы можем объяснить этот исход, сославшись на тот факт, что монету подбросили (поскольку при этом условии вероятность выпадения решки высока), но если монету подбрасывают, и выпадает орёл, мы не можем объяснить этот исход, поскольку его вероятность низка. Лежащая в основании СР-модели противоположная интуиция такова, что мы одинаково хорошо понимаем оба исхода. Предрасположенность монеты и тот факт, что её подбросили — единственные факторы, релевантные для каждого исхода, и для обоих исходов эти факторы одинаковы: сославшись на бросок (и уточнив вероятность выпадения орла и решки при броске), мы не оставляем за пределами объяснения ничего, что могло бы повлиять на тот или другой исход. Точно так же, утверждает Сэлмон, если и в самом деле верно, что распределение в примере с быстрым выздоровлением от стрептококковой инфекции объективно однородно (если нет других факторов, статистически релевантных для быстрого исцеления, помимо того, каким штаммом заражён больной и получает ли он лечение), то, определив вероятность быстрого исцеления при любых возможных комбинациях этих факторов и комбинацию факторов, наблюдаемую у пациента, чьё исцеление (или его отсутствие, если исцеления не произошло) мы хотим объяснить, мы собрали все сведения, имеющие отношение к выздоровлению, и в этом смысле полностью объяснили исход болезни для пациента [7].

 

3.3. Что объясняют статистические теории?

Оценивая эти утверждения, будет полезно сделать шаг назад и спросить, реконструкциями чего призваны быть эти конкурирующие модели статистического объяснения (ИС-модель Гемпеля и СР-модель Сэлмона). В литературе по этой теме видное место занимают два вида примеров или способов применения. Во-первых, есть примеры, заимствованные из квантовой механики (КвМ). Предположим, например, что частица имеет вероятность пройти сквозь потенциальный барьер, находящийся в промежутке от 0 до 1. Модели статистического объяснения предполагают, что, если частица проходит сквозь барьер, КвМ объясняет этот исход — ИС- и СР-модели предназначены для описания структуры таких объяснений. Во-вторых, есть примеры, почёрпнутые из области биомедицины (или эпидемиологии) и общественных наук — излечение от стрептококка или, как в подробной иллюстрации Сэлмона [Salmon 1971], факторы, релевантные для подростковой преступности среди мальчиков.

Это, мягко говоря, весьма разнородные примеры. В случае КвМ обычно считают, что различные не содержащие скрытых параметров результаты устанавливают, что любая адекватная с точки зрения эмпирики теория квантовых явлений нередуцируемо индетерминистична. Таким образом, кажется убедительным, что, когда мы используем уравнение Шредингера, чтобы определить вероятность, с которой частица с определённой кинетической энергией преодолеет потенциальный барьер определённой формы, это представление удовлетворяет предъявляемому СР-моделью требованию «объективной однородности» — нет дополнительных опущенных переменных, которые повлияли бы на вероятность того, что частица преодолеет барьер. Напротив, кажется весьма маловероятным, что это условие будет соблюдено в большинстве примеров (или хотя бы в некоторых из них) из области биомедицины или социологии, приводимых в работах, посвящённых проблеме статистического объяснения. Например, в случае излечения от стрептококка весьма правдоподобным кажется, что на вероятность выздоровления повлияет множество факторов, помимо двух упомянутых: среди этих дополнительных факторов будет состояние иммунной системы пациента, различные особенности общего состояния его здоровья, точный характер болезни, которой он заразился (устойчивость или неустойчивость штамма к пенициллину почти наверняка является слишком грубой классификацией) и так далее. То же самое касается и детской преступности. В этих случаях, в отличие от примеров из области квантовой механики, у нас нет теории или набора результатов, позволяющих выделить факторы, потенциально имеющие значение для вероятности интересующего нас исхода. Так, в реалистических примерах совокупностей статистически релевантных факторов из биомедицины и общественных наук вряд ли будет соблюдено (и на практике вряд ли может быть соблюдено) условие объективной однородности.

С этим связано другое различие, касающаяся того, как статистическое доказательство используется в двух этих случаях. Некоторые квантовые явления (например, радиоактивный распад) нередуцируемо индетерминистичны. А вот в области биомедицины и социальных наук «статистичность» соответствующих данных обычно не предполагает допущения нередуцируемой индетерминистичности интересующих нас феноменов. Это особенно ясно при их сопоставлении с обсуждаемыми Сэлмоном примерами из общественных наук (например, факторами риска детской преступности). Здесь соответствующая методология включает так называемое каузальное моделирование или метод структурных уравнений. Как минимум в наиболее простых случаях использования этих методов, уравнения, определяющие, станет ли конкретный подросток преступником, являются (при буквальной интерпретации) детерминистскими. Согласно этим подходам, моделируемые явления выглядят индетерминистичными, поскольку некоторые важные для них переменные, влияние которых резюмируется так называемым пределом ошибки, неизвестны или не измерены. Статистическая информация о конкретном юном правонарушителе среди других подростков в различных условиях играет роль доказательства, которое используется для оценки параметров (коэффициентов) в детерминистических уравнениях, используемых для описания процесса, из-за которого начинается противоправное поведение. То же самое касается по меньшей мере значительной части биомедицинских примеров [8].

Из этих наблюдений следует несколько предварительных выводов. Во-первых, совершенно неочевидно, что нам следует пытаться построить единую, общую модель статистического объяснения, которая была бы применима как к явлениям из области квантовой механики, так и к макроскопическим феноменам наподобие преступности или излечения от инфекции. Во-вторых (и в связи с первым выводом), хотя объяснение в КвМ удовлетворяет требованию объективной однородности, сомнительно, что то же будет верно для тех видов «статистических объяснений», что применяются в общественных и биомедицинских науках. Иными словами, если статистическое объяснение обязано удовлетворять требованию объективной однородности, неясно, будут ли примеры успешных статистических объяснений существовать за пределами квантовой механики.

Приняв эти наблюдения во внимание, давайте вновь обратимся к вопросу о том, что именно объясняют статистические теории, о каких бы явлениях ни шла речь. Как мы видели, и Гемпель, и Сэлмон, а также наиболее влиятельные исследователи, писавшие о статистическом объяснении, были склонны полагать, что статистические теории, приписывающие тому или иному результату вероятность, попадающую строго в промежуток от 0 до 1, должны, тем не менее, считаться объясняющими этот результат. Приняв это за исходную посылку, Сэлмон весьма убедительно аргументирует, что считать (подобно Гемпелю), что можно объяснить лишь отдельные высоко вероятные результаты — это произвольное решение. Но почему мы должны разделять эту исходную посылку? Почему вместо этого не считать аргумент Сэлмона основанием для отказа от представления, будто статистические теории объясняют конкретные исходы вне зависимости от того, высока или низка их вероятность? Если мы согласимся с этим, то нам не придётся делать вывод, будто теория вроде квантовой механики не является объясняющей. Вместо этого мы можем воспринимать экспланандумы квантовой механики как факты о вероятностях или ожидаемых значениях исходов, а не о самих конкретных исходах. С этой точки зрения объясняемые квантовой механикой экспланандумы являются (строгим) подмножеством тех, которые могут быть из неё выведены; по крайней мере, в этом отношении даваемые квантовой механикой объяснения по структуре подобны ДС-объяснениям. Вудвард [Woodward 1989] утверждает, что такая интерпретация позволяет нам сказать всё, что мы могли бы обоснованно пожелать сказать об объяснительной силе квантовой механики. Если это верно, нет настоятельной необходимости в отдельной теории статистического объяснения конкретных исходов, которую пытались разработать Гемпель и Сэлмон (однако см. Прим. 7).

В случае подростковой преступности и методов каузального моделирования, если уж на то пошло, интуиция с ещё большей настойчивостью подсказывает нам, что объяснение даётся не тому, например, почему конкретный мальчик, Альберт, стал преступником, но некому более общему явлению, например, тому, почему мы с большей уверенностью ожидаем правонарушений от подростков, принадлежащих к какой-то конкретной подгруппе. И опять-таки, такие экспланандумы выводимы из системы уравнений, используемой для моделирования подростковой преступности. Принятие этого представления о том, что именно объясняют статистические теории, позволяет нам избежать различных контринтуитивных следствий из модели Гемпеля (например, того, что объяснение получают исходы с высокой, а не с низкой вероятностью) и модели Сэлмона (например, того, что один и тот же эксплананс E объясняет и M, и −M). Тем, кто пытается разработать модели статистического объяснения отдельных результатов, придётся по меньшей мере обеспечить более подробное разъяснение того, почему такие модели нужны и для описания каких именно характерных особенностей научного теоретизирования они предназначены [9].

 

3.4. Причинность и отношения статистической релевантности

Как мы видели, СР-модель ставит ряд интересных вопросов о статистическом объяснении конкретных исходов — вопросов, которые важны и вне связи с подробностями устройства самой СР-модели. В этом параграфе мы отвлечёмся от таких вопросов и вместо этого сосредоточимся на обосновании самой СР-модели. Мы можем согласиться с тем, что она сводится к двум идеям: (i) объяснения должны отсылать к каузальным отношениям; (ii) каузальные отношения должны описываться через отношения статистической релевантности. Даже если мы принимаем (i), фундаментальной проблемой СР-модели является ложность (ii) — как показало множество исследований [10], каузальные отношения не полностью описываются отношениями статистической релевантности. Возьмём другой пример из работы Сэлмона [Salmon 1971]: систему, в которой атмосферное давление A является общей причиной для возникновения шторма S и показаний барометра B при том, что каузальных отношений между S и B нет. Сэлмон заявляет, что в такой системе B и S будут коррелировать между собой, но   при  наличии   является  статистически  нерелевантным для  S, то  есть P ( S|  A.B ) = P ( S ∣ ), в то время как А, по утверждению Сэлмона, напротив, при наличии B остаётся релевантным для S, то есть P (S A.B) ≠ P (S B). Точно так же S нерелевантно для B при наличии A, но A остаётся релевантным для B при наличии S. Таким образом, СР-модель Сэлмона пытается отразить идею, что A (в отличие от B) является (каузально) релевантным для объяснения S, и что A (в отличие от S) является объяснительно и каузально релевантным для B.

Эти споры о взаимосвязях между каузальными утверждениями и отношениями статистической релевантности являются следствием более общего принципа, называемого каузальным условием Маркова и ставшего предметом бурной дискуссии в философской литературе последнего времени, посвящённой проблемам причинности [11]. Набор связанных каузальными отношениями переменных и распределение их вероятностей удовлетворяют условию Маркова, если и только если каждая переменная не зависит от любой другой переменной, за исключением случаев, когда они находятся в каузальных отношениях. В дискуссии об этом условии были затронуты две важные темы. Первая была, фактически, отмечена самим Сэлмоном в работе, последовавшей за статьёй 1971 года: существуют обстоятельства, в которых условие Маркова не выполняется и, следовательно, в которых каузальные утверждения не предполагают описанного выше разграничения. Это может произойти, например, если переменные, на которые налагается условие, описаны недостаточно подробно [12]. Второе и более фундаментальное наблюдение заключается в том, что, в зависимости от конкретных деталей происшествия, множество различных наборов причинно-следственных связей может быть совместимо с одними и теми же отношениями статистической релевантности, даже если предположить, что условие Маркова выполняется. Например, структура, в которой B — причина A, а A, в свою очередь, — причина S, приведёт, если мы примем условие Маркова (то есть, как Сэлмон, допустим наличие связей между каузальными отношениями и отношениями статистической релевантности), к тем же самым отношениям статистической релевантности, что и в примере, где A — общая причина B и S. То же самое произойдёт и в том случае, если S является причиной A, а A — причиной B. В структурах с большим количеством переменных эта недоопределённость каузальных отношений отношениями статистической релевантности может быть гораздо более сильной. Таким образом, список отношений статистической релевантности (то есть то, что даёт нам СР-модель) не обязательно сообщает, какие именно каузальные отношения действуют. В той мере, в которой объяснение связано с распознаванием каузальных отношений, от которых зависит исход-экспланандум, СР-модель оказывается недостаточно эффективной.

Рекомендованная литература. Статья Сэлмона [Salmon 1971a] даёт детальное изложение и обоснование СР-модели. Она, как и работы [Jeffrey 1969] и [Greeno 1970], отстаивающие взгляды, в целом сходные с СР-моделью, входит в сборник [Salmon 1971b]. Дополнительное обсуждение модели, а также более современная характеристика «объективной однородности» могут быть найдены в [Salmon 1984]. Работа [Cartwright 1979] содержит важную критику СР-модели. Теоремы, уточняющие конкретную степень недоопределённости каузальных утверждений доказательством об отношениях статистической релевантности, можно найти в [Spirtes, Glymour and Scheines 1993; 2000, ch. 4].

 

4. Каузально-механическая модель

4.1. Основная идея

В более поздних работах (см., в особенности, [Salmon 1984]) Сэлмон отказался от попыток охарактеризовать объяснение или каузальные отношения исключительно статистически. Вместо этого он разработал новую теорию, названную им Каузально-механической (КМ) моделью объяснения — теорию, содержательно и по своему духу сходную с так называемыми процессуальными теориями причинности, подобными тем, которые отстаивали такие философы, как Филипп Доу (Dowe 2000). Мы можем рассматривать КМ-модель как попытку описать «нечто большее», присутствующее в каузальных и объяснительных отношениях помимо и сверх фактов о статистической релевантности, опять-таки пытаясь не выходить за рамки юмовского в широком смысле подхода.

КМ-модель включает несколько ключевых идей. Каузальный процесс — это физический процесс, как, например, движение бейсбольного мяча в пространстве, который характеризуется способностью непрерывного перемещения метки. («Непрерывно» в общем смысле — хотя, возможно, и не всегда — означает «непрерывно в пространстве и времени».) Интуитивно кажется, что метка — это какая-то частная модификация структуры процесса — например, потёртость на поверхности бейсбольного мяча или вмятина на крыле автомобиля. В процессе возможно непрерывное перемещение метки: это происходит, если, когда метка присутствует в одной пространственно-временной точке, она будет сохраняться в других пространственно-временных точках даже без какого-либо дальнейшего взаимодействия. В этом смысле бейсбольный мяч будет перемещать потёртость из одной точки в другую. Точно так же движение автомобиля представляет собой каузальный процесс, поскольку метка в виде вмятины на его крыле будет перемещаться в ходе этого процесса из одной пространственно-временной точки в другую. Каузальные процессы противопоставляются псевдопроцессам, во время которых перемещение меток невозможно. Примером такого псевдопроцесса будет тень движущегося физического объекта. Интуитивно представляется, что, если мы попытаемся пометить тень, изменив её форму в одной точке (например, переместив источник света или поставив преграду на его пути), эта модификация не сохранится, если мы не будем постоянно вмешиваться, чтобы её поддержать при последовательном занятии тенью новых положений в пространстве и времени. Другими словами, модификации не будут перемещаться структурой самой тени, как это происходило бы в случае подлинного каузального процесса.

Следует заметить на будущее, что, согласно Сэлмону, способность к перемещению метки является в нескольких смыслах отчётливо контрфактическим понятием. Во-первых, процесс может быть каузальным, даже если на самом деле никакая метка при нём не перемещается, при условии, что, если бы такая метка присутствовала, её перемещение бы происходило. Более того, само понятие метки предполагает контрфактическое противопоставление — противопоставление того, как идёт процесс при наличии и при отсутствии метки. Хотя Сэлмон, как и Гемпель, всегда относился к контрфактическим зависимостям с подозрением, в тот момент, когда он впервые предложил КМ-модель, он полагал, что присутствующие в описании перемещения метки контрфактические зависимости сравнительно безобидны: отчасти потому, что кажутся доступными для достаточно непосредственной экспериментальной проверки. Тем не менее то, что в своей первоначальной формулировке КМ-модель опирается на контрфактические зависимости, показывает, что она не полностью соответствует описанным выше юмовским строгим требованиям. В следующей работе, речь о которой пойдёт в разделе 4.4, Сэлмон попытался разработать вариант КМ-модели, не опирающейся на какие бы то ни было контрфактические зависимости.

Другим важным элементом модели Сэлмона является понятие каузального взаимодействия. Каузальное взаимодействие предполагает наличие пространственно-временных пересечений двух каузальных процессов, изменяющих структуру обоих процессов: каждый процесс приобретает особенности, которых у него не было бы, если бы этого взаимодействия не произошло. Образцовым примером каузального взаимодействия является столкновение двух машин, в результате которого на обеих появляются вмятины.

Согласно КМ-модели, объяснение некого события E будет прослеживать каузальные процессы и взаимодействия, которые привели к E (Сэлмон называет это этиологическим аспектом объяснения), или по меньшей мере некоторые из них, а также описывать процессы и взаимодействия, создавшие само событие (конститутивный аспект объяснения). Таким образом, объяснение демонстрирует, как E «встроено в каузальную цепь» [Salmon 1984, 9].

Предположение, что объяснение включает «встраивание» экспланандума в каузальную цепь, не даёт нам точного понимания того, что должно представлять собой отношение между E и другими каузальными процессами или взаимодействиями, если информация о последних должна объяснять E. Тем не менее кажется достаточно очевидным, как именно интуитивное представление должно использоваться в конкретных случаях. Биток, начавший движение после удара кием, ударяет неподвижный шар номер восемь, в результате чего этот шар начинает движение, а траектория битка меняется. Удар кия также приводит к перемещению некоторого количества синего мела на поверхность битка, а оттуда, при соударении с битком, — на шар номер восемь. Кий, биток и шар номер восемь представляют собой каузальные процессы, что показывает перемещение меловой метки, тогда как удар кием по битку и удар битка по шару номер восемь — это каузальные взаимодействия. Идея Сэлмона состоит в том, что перечисление таких фактов о процессах и взаимодействиях объясняет движение шаров после удара; тогда как, если один из этих шаров отбрасывает тень, при движении падающую на другой шар, это не будет иметь для их последующего перемещения каузального или объяснительного значения, поскольку тень является псевдопроцессом.

 

4.2. КМ-модель и объяснительная релевантность

Как показывает пример с битком, КМ-модель использует в качестве образцов каузальных взаимодействий такие примеры, как столкновения, в которых происходит «действие посредством контакта» и нет пространственно-временных разрывов в перемещении каузального воздействия. Несомненно, что объяснения, в которых такие разрывы отсутствуют, могут показаться особенно убедительными [13]. Однако, как показал Кристофер Хичкок в своей замечательной работе [Hitchcock 1995], даже здесь КМ-модель оставляет за бортом нечто важное. Возьмём обычное элементарное «научное объяснение» движения шаров после соударения, описанное в приведённом выше примере. Это объяснение делает выводы о движении из информации о массе и скорости шаров до столкновения, предположения, что удар был абсолютно эластичным, и закона сохранения импульса. Мы обычно думаем, что такая информация демонстрирует, что именно масса и скорость шаров, а не, скажем, их цвет или присутствие пометки синим мелом, имеют отношение к объяснению их последующего движения. Однако сложно заметить, что именно в КМ-модели позволяет нам выделить импульс шаров (а не другие их характеристики) как объяснительно релевантное свойство. Отчасти сложность состоит в том, что для того, чтобы высказать такие сравнительно подробные суждения об объяснительной релевантности (то есть о том, что важным является скорее импульс, чем меловая метка), нам нужно говорить об отношениях между свойствами и величинами, и неясно, как перевести такие суждения на язык фактов о каузальных процессах и взаимодействиях. Переданные битку кием импульс и меловая метка являются метками, перемещаемыми непрерывным в пространстве и времени каузальным процессом, представляющим собой движение битка. Обе метки передаются через взаимодействие с шаром номер восемь. Кажется, что во введённом Сэлмоном понятии передачи метки или каузального процесса нет ничего, что позволяло бы провести различие между релевантным для объяснения импульсом и бесполезной для него синей меловой пометкой.

Забавно, что — как на это далее указывает Хичкок — те же самые наблюдения могут быть сделаны в отношении примера с противозачаточными таблетками (2.5.2), первоначально предложенного Сэлмоном для того, чтобы проиллюстрировать неспособность ДН-модели учесть понятие объяснительной релевантности. Когда мистер Джонс глотает противозачаточные таблетки, происходят непрерывные в пространстве и времени каузальные процессы, которые перемещают метки, а также каузальные взаимодействия: таблетки растворяются, их составляющие поступают в кровоток, усваиваются или каким-то образом обрабатываются и т. п. Сходным образом непрерывные в пространстве и времени каузальные процессы (хотя и другие) происходят, когда таблетки принимает миссис Джонс. Однако таблетки не имеют отношения к тому, что мистер Джонс не беременеет, и имеют — к тому, что не беременеет миссис Джонс. И опять-таки, создаётся впечатление, что релевантность или нерелевантность приёма противозачаточных таблеток для неспособности мистера или миссис Джонс забеременеть невозможно уловить, просто задав вопрос, являются ли ведущие к этому результату процессы каузальными в том смысле, который вкладывает в это понятие Сэлмон. То же самое можно сказать о примере с зачарованной солью (2.6.3): в нём происходят непрерывные в пространстве и времени каузальные процессы — от прикосновения палочки ведьмы к образцу соли до образования отдельных ионов натрия и хлора при растворении соли в воде, — но они не достаточны для того, чтобы связать наложение заклятия с растворением каузальной (или объяснительной) связью.

Более общий способ формулировки выявленной этими примерами проблемы заключается в том, что те особенности процесса P, в силу которых он расценивается как каузальный (способность к перемещению отметки M), могут оказаться не теми его особенностями, которые имеют каузальное или объяснительное значение для результата E, который мы хотим объяснить (M может не иметь значения для E, тогда как какое-то другое свойство R процесса P будет свойством, каузально релевантным для E). Так что, хотя перемещение метки и может быть критерием, позволяющим эффективно различить каузальные процессы и псевдопроцессы, как выясняется, оно не даёт способа отличить те особенности или свойства каузальных процессов, которые каузально или объяснительно релевантны для результата, от тех, которые таковыми не являются.

 

4.3. КМ-модель и сложные системы

Другой ряд осложнений имеет отношение к применению КМ-модели к системам, которые тем или иным образом оказываются сложнее простых физических примеров вроде описанного выше столкновения. Примеров таких систем несколько. Во-первых, есть теории наподобие ньютоновской теории тяготения, включающие «дальнодействие» в том смысле, который весьма интересен с точки зрения физики. Во-вторых, в посвящённой проблеме причинности философской литературе приводится ряд примеров, в которых нет интересных с точки зрения физики форм дальнодействия, но, вероятно, наличествуют каузальные взаимодействия, не подразумевающие наличия промежуточных непрерывных в пространстве и времени процессов или переноса энергии и импульса от причины к действию. В их число входят случаи причинности как бездействия (causation by omission) и причинности как «двойного предотвращения» или «разрыва связи» (causation by “double prevention” or “disconnection”) [14]. Во всех этих случаях буквальное применение КМ-модели, по-видимому, приводит к вынесению суждения, что объяснение не было дано: что ньютоновская теория тяготения не даёт объяснения и т. п. Многие философы не готовы согласиться с этой оценкой.

Еще один разряд проблематичных для КМ-модели примеров включает предполагаемые объяснения поведения сложных систем или систем «более высокого уровня» — объяснения, которые не отсылают непосредственно к непрерывным в пространстве и времени каузальным процессам, предполагающим перенос энергии и импульса, даже если мы можем полагать, что на более «базовом» уровне такие процессы и могут быть задействованы. В этот разряд попадает большинство объяснений из области таких дисциплин, как биология, психология и экономика, а также некоторое количество собственно физических объяснений.

В качестве примера возьмём один моль газа, содержащийся в контейнере объёма V1 при давлении P1 и температуре T1. Газу позволяют изотермически расширяться в контейнере большего объёма V2. Стандартный способ объяснения поведения газа — скорости диффузии и устанавливающегося в её результате равновесного давления P2 — отсылает к обобщениям феноменологической термодинамики — например, закону идеального газа, закону диффузии газов Грэма и т. п. Сэлмон, по-видимому, считает предполагаемые объяснения, основанные на, по крайней мере, первом из этих обобщений, лишёнными объяснительной силы, поскольку они не прослеживают непрерывный каузальный процесс (он считает каузальными процессами отдельные молекулы, но не газ в целом) [15]. Однако совершенно невозможно проследить каузальные процессы и взаимодействия каждой из 6 х 1023 молекул, составляющих газ, и их последующие взаимодействия (столкновения) со всеми остальными молекулами. Обычная статистико-механическая модель, которую Сэлмон, предположительно, мог бы рассматривать как объяснительную, не претендует на это. Вместо этого в её рамках выносятся некоторые общие предположения о распределении молекулярных скоростей и сил при столкновении молекул, а затем они используются (в сочетании с законами механики) для выведения и решения дифференциального уравнения (уравнения Больцмана), описывающего поведение всего объёма газа. Этот подход радикально абстрагируется от подробностей каузальных процессов, происходящих с отдельными молекулами, а вместо этого сосредотачивается на выявлении переменных более высокого порядка, которые объединяют множество конкретных каузальных процессов и тем самым описывают общие закономерности поведения газа.

Из этого примера следует несколько вопросов. Каковы именно требования КМ-модели в случае сложных систем, где мы не можем проследить отдельные каузальные процессы (по крайней мере, во всех подробностях)? Как именно КМ-модель избегает (катастрофического) вывода, что любое успешное объяснение поведения газа должно прослеживать траектории отдельных молекул? Успешно ли прослеживает каузальные процессы и взаимодействия описанное выше статистико-механическое объяснение, определяет ли оно каузальный механизм в том смысле, в каком того требует КМ-модель, и если это так, то что именно представляет собой прослеживание каузальных процессов и взаимодействий в связи с такой системой? В настоящий момент и КМ-модель, и процессуальные теории причинности, являющиеся позднейшими её наследниками, не завершены.

Следует сказать несколько слов и о другом аспекте данного примера. Даже если (что невозможно) и было бы создано описание, прослеживающее траектории отдельных молекул, существуют важные причины, по которым оно не дало бы того вида объяснения поведения газа на макроскопическом уровне, которое мы, скорее всего, желали бы получить, — и не только потому, что такое описание было бы слишком сложным, чтобы человеческий разум мог его воспринять. Существует очень большое количество различных возможных траекторий отдельных молекул (в дополнение к траекториям, по которым эти молекулы и в самом деле движутся), которые на макроскопическом уровне приводят к результату (давлению P2), который мы стремимся объяснить. Несомненно, эта информация имеет значение для объяснения поведения газа на макроскопическом уровне, и мы захотим, чтобы наше объяснение включало в себя данный факт. Грубо говоря, принимая во внимание законы, описывающие столкновения молекул, мы можем продемонстрировать, что почти все (то есть все, за исключением нульмерного множества) возможные начальные позиции и импульсы, согласующиеся с исходным состоянием газа на макроскопическом уровне, характеризуемом P1, T1 и V1, приведут к движению молекул по таким траекториям, что газ изменится и на макроскопическом уровне диффундирует в равновесное состояние, когда при давлении P2 его плотность будет одинаковой в любой точке камеры. Равным образом существует множество различных микросостояний газа, совместимых с каждым из множества других возможных значений температуры газа, и каждое из этих состояний приведёт к различным значениям итогового давления P2*. Если мы будем прослеживать лишь те каузальные процессы (в форме реальных траекторий движения молекул), которые приводят к P2, как того требует КМ-модель, мы не сможем представить или описать эту информацию о разнообразии условий, в которых достигается давление P2 и другие значения итогового давления P2*.

То же самое касается объяснения поведения других видов сложных систем: к примеру, тех, что изучаются в биологии и экономике. Рассмотрим стандартное объяснение роста цены на апельсины после заморозков, когда кривая предложения смещается вверх, а кривая спроса остаётся неизменной. В основе поведения рынка апельсинов лежат сэлмоновы отдельные непрерывные в пространстве и времени процессы и взаимодействия — заключается бесчисленное множество частных сделок, в ходе которых деньги в той или иной форме обмениваются на товары, и в каждом случае происходит перенос материи или энергии; ведётся обмен информацией о намерениях или обязательствах купить или продать товар по той или иной цене, и всё это должно происходить в некой физической среде, предполагать перенос энергии и т. п. Однако также кажется очевидным, что полное описание всех этих процессов (в аргументативных целях предположим, что такое описание возможно) мало что объяснит нам в поведении этих систем, если вообще объяснит хоть что-нибудь. И опять-таки это произойдёт не просто потому, что такое «объяснение» превышает нашу способность обработки информации. Дело также в том, что значительная часть включённой в такое описание информации будет иррелевантна поведению, которое мы пытаемся объяснить, — иррелевантна по той же причине, по которой подробное описание отдельных траекторий движения молекул будет содержать информацию, иррелевантную поведению газа. Например, в то время как подробное описание отдельных каузальных процессов, происходящих на рынке апельсинов, будет, предположительно, включать информацию о том, расплачиваются ли отдельные покупатели наличными, чеком или кредитной картой, распространяется ли сообщение о заморозках посредством телефона или электронной почты и т. п., всё это в первом приближении не имеет значения для равновесной цены: если говорить о кривых спроса и предложения, равновесная цена не изменится до тех пор, пока существует рынок, на котором потребители способны каким-то способом приобретать апельсины, информация о заморозках и ценах в той или иной форме доступна покупателям и продавцам и т. п. [16] Более того, факторы, важные для объяснения равновесной цены (например, форма кривых спроса и предложения), сами ни в каком непосредственном смысле не связаны с ценой непрерывными в пространстве и времени процессами (неясно даже, что могло бы означать это заявление), хотя, как подчёркивалось выше, неизвестные процессы, лежащие в основе достижения равновесия, вероятно, являются непрерывными в пространстве и времени.

Вопрос опять состоит в том, как описание наподобие сэлмонова может отразить эту особенность удачного объяснения поведения сложных систем: как описание подводит нас к выявлению «правильного» уровня описания явления, которое мы пытаемся объяснить. На деле, как показывают приведённые выше примеры, требования, налагаемые Сэлмоном на каузальные процессы (и в особенности требование непрерывности в пространстве и времени), по-видимому, часто уводят нас от подходящего уровня описания. Уровень, на котором требование пространственно-временной непрерывности наиболее явным образом соблюдается (уровень, на котором, например, мы описываем конкретного потребителя, обменивающего наличные деньги на апельсины, или садовода, который по телефону договаривается с розничным торговцем о продаже фруктов по определённой цене), — это, по-видимому, не тот уровень, на котором можно добиться понимания.

 

4.4. Современные исследования

В более новых работах (например, [Salmon 1994]), к написанию которых Сэлмона отчасти подтолкнуло желание ответить на некоторые выдвинутые Филиппом Китчером [Kitcher 1989] контрпримеры к его описанию перемещения метки, Сэлмон пытается создать теорию каузального объяснения, которая полностью свободна от каких бы то ни было обращений к контрфактическим зависимостям. В этой новой теории, разработанной под влиянием стабильно-процессуальной теории причинности Доу [Dowe 2000], Сэлмон определяет каузальный процесс как процесс, переносящий отличное от нуля количество сохраняющейся величины в каждый момент его истории. Сохраняющиеся величины — это величины, характеризуемые так в физике: импульс, момент импульса, заряд и т. п. Каузальное взаимодействие — это пересечение мировых линий, связанное с каузальными процессами, предполагающими обмен сохраняющимися величинами. Наконец, процесс переносит сохраняющуюся величину от A к B, если на каждой стадии процесса эта величина не вступает ни в какие взаимодействия, предполагающие обмен этой величиной в полуоткрытый интервал (A, B].

Можно усомниться в том, что эта новая теория и в самом деле отказывается от опоры на контрфактические зависимости, но ещё более фундаментальная проблема заключается в том, что она не может удовлетворительным образом решить описанную выше проблему каузальной или объяснительной релевантности. То есть мы всё ещё сталкиваемся с тем, что особенность, делающая процесс каузальным (перемещение той или иной сохраняющейся величины), может оказаться практически бесполезной при ответе на вопрос о том, какие характерные черты этого процесса являются каузально или объяснительно релевантными для результата, который мы хотим объяснить. Например, движущийся бильярдный шар будет перемещать множество сохраняющихся величин (импульс, момент импульса, заряд и т. д.), многие из которых могут стать предметами обмена с другим шаром при столкновении. Что же позволяет нам выделить импульс из ряда других сохраняющихся величин и сказать, что именно это свойство является каузально релевантным для последующего движения? Эта проблема представляется ещё более острой в случаях, когда создаётся впечатление, что не существует законов сохранения, описывающих релевантное для объяснения качество (то есть в случаях, когда релевантные для объяснения переменные не являются сохраняющимися величинами). Такие свойства, как «принимающий противозачаточные таблетки», «беременный» или «являющийся образцом зачарованной соли», сами по себе законами сохранения не описываются. Хотя и можно сказать, что противозачаточные таблетки и зачарованная соль представляют собой каузальные процессы, поскольку на неком базовом уровне состоят из процессов, недвусмысленно предполагающих перемещение таких сохраняющихся величин, как масса и заряд, само по себе это наблюдение не сообщает нам, какие из этих базовых процессов имеют отношение к беременности или растворению соли в воде (и имеют ли вообще какие-нибудь из них отношение к этим результатам).

В более поздней статье [Salmon 1997] Сэлмон признаёт это. Он соглашается, что само по себе понятие каузального процесса не может отразить понятие каузальной или объяснительной релевантности. Однако он предполагает, что это понятие может быть удовлетворительным образом описано, если обратиться к понятию каузального процесса и информации об отношениях статистической релевантности (то есть информации об условных и безусловных отношениях (не)зависимости), где последняя отражает элемент каузальной или объяснительной зависимости, отсутствовавший в предыдущей теории:

Теперь я бы сказал, что (1) в отсутствие информации о связующих каузальных процессах отношения статистической релевантности не имеют объяснительного значения и что (2) в отсутствие отношений статистической релевантности связующие каузальные процессы тоже не имеют объяснительного значения. [Salmon 1997, 476]

Это предположение не получило в статье Сэлмона какого-либо подробного развития, и нелегко понять, как именно его можно развить. Выше мы отмечали, что отношения статистической релевантности часто серьёзно недоопределяют каузальные взаимоотношения между рядом переменных. Какое мы имеем основание полагать, что обращение к понятию каузального процесса (в том смысле, в каком его использует Сэлмон) будет всегда (или даже как правило) устранять эту недоопределённость? Мы также отмечали, что понятие каузального процесса не может отразить более тонкие взаимосвязи между свойствами, что могут существовать отношения каузальной релевантности между свойствами, частные случаи которых (по крайней мере, на том уровне описания, где они характеризуются) не связаны пространственно-временной непрерывностью или переносом сохраняющихся величин, и что, таким образом, свойства могут быть взаимосвязаны, не будучи каузально релевантными друг относительно друга (как в случае отметки мелом, передающейся от одного биллиардного шара к другому). Поскольку различные каузальные суждения могут (и почему бы они вдруг не могли?) подразумевать одни и те же факты об отношениях статистической релевантности и отличаться друг от друга так, что эти отличия не смогут быть полностью суммированы с помощью сэлмоновых понятий каузальных процессов и взаимодействий, постольку эта новая теория также потерпит крах.

Рекомендованная литература: Работа [Salmon 1984] содержит подробное описание каузальной механической модели в её оригинальной формулировке. В [Salmon 1994] и [Salmon 1997] формулировка пересматривается и даётся ответ критикам. Обсуждение и критику КМ-модели см. в [Kitcher 1989, в особенности стр. 461ff], [Woodward 1989] и [Hitchcock 1995].

 

5. Унификационистское описание объяснения

5.1. Основная идея

Основная идея унификационистской теории заключается в том, что суть научного объяснения состоит в предоставлении единого описания ряда различных явлений. Вне всякого сомнения, эта идея интуитивно кажется привлекательной. Удачное объединение может установить наличие связей и взаимоотношений между явлениями, которые ранее считались независимыми и, таким образом, дать нам то, чего мы ожидаем от хороших объяснений. Более того, унификация теорий и в самом деле сыграла важную роль в науке. Образцовыми примерами являются объединение Ньютоном теорий движения небесных и земных тел и объединение Максвеллом электричества и магнетизма. Однако ключевой вопрос состоит в том, можно ли сделать наше интуитивное понятие (или понятия) унификации более точным таким образом, чтобы мы получили все характерные особенности, которыми, по нашему мнению, должны обладать хорошие объяснения.

Майкл Фридман [Friedman 1974] предпринял важный первый шаг в этом направлении. Впоследствии было продемонстрировано [Kitcher 1976], что данная Фридманом формулировка унификационистской идеи несвободна от разнообразных технических проблем, и дальнейшее развитие унификационистского подхода к объяснению было теснее всего связано с именем Филиппа Китчера (в особенности см. [Kitcher 1989]).

Давайте начнём с предложенных Китчером технических терминов. Схематическое предложение — это предложение, в котором некоторые не являющиеся логическими терминами слова были заменены символами. Воспользуемся примерами Китчера: предложение «В гомозиготных организмах, несущих аллели серповидно-клеточной анемии, развивается серповидно-клеточная анемия» сочетается с некоторым количеством схематических предложений вида «В гомозиготных организмах, несущих A, развивается P» и «Для всех X, если X является O и A, то X есть P». Инструкции по заполнению — это указания, определяющие, чем заменять символы в схематических предложениях. Например, инструкции по заполнению могут содержать указание заменить в первом из представленных выше схематических предложений букву A названием аллеля, а букву P — термином, обозначающим фенотипическую характеристику. Схематические аргументы — последовательности схематических предложений. Классификации описывают, какие предложения в схематических аргументах являются посылками и выводами и какие правила вывода используются. Паттерн аргумента — упорядоченная триада, состоящая из схематического аргумента, ряда наборов инструкций по заполнению (по одному на каждый элемент схематического доказательства) и классификации схематических аргументов. Чем больше ограничений паттерн аргумента налагает на конкретизирующие его доказательства, тем более строгим он считается.

Грубо говоря, главная идея Китчера заключается в выводе описаний множества разнообразных явлений путём применения раз за разом как можно меньшего количества как можно более строгих паттернов аргумента: чем меньше паттернов, чем они строже и чем больше разнообразие делаемых выводов, тем более унифицированным является наше объяснение. Китчер резюмирует этот подход следующим образом:

Наука способствует нашему пониманию природы, показывая, как выводить описания множества явлений, снова и снова используя один и тот же паттерн вывода, и, показывая это, она учит нас, как уменьшить количество фактов, которые нам приходится считать исходными. [Ibid., 423]

Китчер не предлагает абсолютно общую теорию того, как различные описываемые им критерии — количество выводов, количество паттернов и их строгость — соотносятся друг с другом, но предполагает, что часто будет достаточно очевидно, что именно эти соображения подразумевают в отношении оценки конкретных выдвигаемых объяснений. Его основная стратегия состоит в демонстрации того, что выводы, которые кажутся нам здравыми или приемлемыми объяснениями, являются примерами паттернов, которые, взятые вместе, лучше удовлетворяют только что описанным требованиям, чем паттерны, представляющие собой примеры выводов, которые кажутся нам несовершенными объяснениями. Давайте вслед за Китчером определим объяснительный резерв Е(К) как набор паттернов аргументов, который максимально унифицирует К, набор убеждений, разделяемых учёными в конкретный период времени. Тогда для доказательства, что конкретный вывод является здравым или приемлемым объяснением, нужно будет показать, что он принадлежит к объяснительному резерву.

 

5.2. Иллюстрации к унификационистской модели

В качестве примера рассмотрим подход Китчера к проблеме объяснительной асимметрии (см. раздел 2.5). Наши современные объяснительные стратегии — обозначим их P — поддерживают идею, что выведение высоты флагштока из длины его тени ничего не объясняет. Китчер сравнивает P с альтернативной систематизацией, в которой такие выводы считаются объяснениями. Согласно Китчеру, P включает использование одного-единственного паттерна аргумента, определяемого как паттерн «происхождение и развитие» (ПР); согласно ему, линейные размеры артефактов, гор, звёзд, организмов и т. д. могут быть прослежены к «условиям, в которых объект появился, и модификациям, которые он впоследствии претерпел» [Kitcher 1989, 485]. Теперь посмотрим, что случится, если к P добавить дополнительный паттерн S (паттерн тени), позволяющий делать выводы о размерах объектов из фактов об их тенях. Поскольку ПР-паттерн уже позволяет вывести все факты о линейных размерах объектов, добавление к P паттерна тени S увеличит число паттернов доказательств в P и не позволит нам делать какие-либо новые выводы. С другой стороны, если мы уберём из P паттерн ПР и заменим его паттерном тени, количество паттернов в P не изменится, но мы сможем делать значительно меньше выводов, чем могли бы, если бы паттерн ПР остался на месте, поскольку у многих объектов нет теней (или достаточного количества теней), на основании которых можно было бы делать выводы о всех их линейных размерах. Поэтому паттерн ПР принадлежит к объяснительному резерву, а паттерн тени — нет.

Сходным образом Китчер решает и другие знакомые нам проблемы. Например, он отмечает, что мы убеждены в том, что объяснение того, почему некий образец соли растворяется в воде, отсылающее к тому факту, что соль была зачарована, и обобщению (H), согласно которому вся зачарованная соль растворяется в воде, неудовлетворительно — по крайней мере, в сравнении с обычным объяснением, отсылающим к факту, что (D) вся соль растворяется в воде. Он предполагает, что «основание этого убеждения» состоит в том, что вывод, отсылающий к (H), представляет собой паттерн аргумента, принадлежащий к совокупности паттернов, менее унифицирующей в сравнении с совокупностью, в которую входит вывод, отсылающий к (D). В частности, объяснительный резерв, содержащий (H), но не (D), будет иметь более ограниченный набор последствий, чем резерв, содержащий (D), но не (H), поскольку последний, но не первый, позволяет выводить факты о растворении в воде незачарованной соли. И добавление (H) к объяснительному резерву, содержащему (D), увеличит число паттернов без увеличения числа возможных выводов.

Китчер признаёт, что в унификационистской теории самой по себе нет ничего, что требовало бы, чтобы всякое объяснение было дедуктивным: «В принципе, не существует препятствий к использованию недедуктивных аргументов в систематизации наших убеждений». Тем не менее «задача сравнения унифицирующей силы различных систематизаций кажется ещё более устрашающей, если мы рассматриваем недедуктивные аргументы», и отчасти поэтому Китчер придерживается мнения, что «в определённом смысле все объяснения являются дедуктивными» [Ibid., 448].

Какова здесь роль причинности? Китчер заявляет, что «“потому что” причинности всегда выводится из “потому что” объяснения» [Kitcher 1989, 477]. То есть наши каузальные суждения просто отражают объяснительные отношения, вытекающие из наших попыток (или попыток наших интеллектуальных предшественников) сконструировать унифицированные теории природы. Помимо и сверх этого не существует никакого независимого каузального порядка, который мог бы быть описан нашими объяснениями. Как и многие другие философы, Китчер принимает близко к сердцу обычные для эмпириков или последователей Юма тревоги об эпистемической доступности и осмысленности каузальных утверждений — даже если в конечном счёте он их и не полностью разделяет. Вызывает сомнения, что можно строить теорию объяснения, считая каузальные, контрфактические или иные понятия принадлежащими к тому же семейству, что и базовые для этой теории. По убеждению Китчера, достоинством его теории является то, что она на них не опирается. Вместо этого Китчер предлагает начать с понятия объяснительной унификации, описанной в терминах наложения ограничений на дедуктивные систематизации, где таким ограничениям может быть дано весьма общее определение, не зависящее от каузальных или контрфактических понятий, и затем показывает, как принимаемые нами каузальные утверждения выводятся из нашего стремления к унификации.

 

5.3. Критика иллюстраций

Как было отмечено в начале этого раздела, идея, будто объяснение каким-то образом связано с унификацией, интуитивно кажется привлекательной. Тем не менее предложенный Китчером конкретный способ осуществления этой связи представляется проблематичным. Давайте рассмотрим его интерпретацию примера с флагштоком. Она находится в сильной зависимости от возможной истинности утверждения, что некоторые объекты не отбрасывают достаточно теней, чтобы определить все их линейные размеры. Но представляется, что не только со здравым смыслом, но и с общепризнанной в наше время физической теорией согласуется представление, что даже в мире, где все объекты отбрасывают достаточно теней, чтобы на их основании можно было бы определить все их линейные размеры, неверно было бы ссылаться на факты об отбрасываемых объектами тенях для объяснения их линейных размеров. Неясно, как подход Китчера может справиться с этим суждением.

Проблема станет яснее, если мы обратимся к варианту этого примера, в котором, в отличие от примера с тенями, явным образом существует столько же обратных выводов от действий к причинам, сколько и от причин — к действиям. Возьмём вслед за Барнсом [Barnes 1992] симметричную в отношении времени теорию (например, ньютоновскую механику) в применении к закрытой системе (например, Солнечной системе). Назовём предиктивными выводы о состоянии движения планет в некоторый момент времени в будущем t, сделанные на основании информации об их теперешнем положении (во время t0), массах, скоростях, силах, влияющих на них в момент t0, и законах механики. Теперь сопоставим эти выводы с ретродуктивными выводами, в которых происходящие в данный момент движения планет выводятся из информации об их будущих скоростях и положениях в момент t, воздействующих на них в момент t силах и т. п. Представляется, что ретродуктивных выводов будет ровно столько же, сколько предиктивных, и каждый из них будет нуждаться в посылках одного и того же общего вида — информации о положениях, скоростях, массах и т. д. и одних и тех же законах. Таким образом, паттерн или паттерны, проявляющиеся в ретродуктивных выводах, выглядят в точности столь же унифицированными, как паттерн или паттерны, связанные с предиктивными выводами. Однако мы обычно считаем объяснительными предиктивные, а не ретродуктивные выводы, и текущее положение планет представляется нам причиной их будущего положения, а не наоборот. И опять вовсе не очевидно, как соображения унификации могут породить такую асимметрию в объяснении.

Одной из возможных реакций на этот второй пример будет принять это следствие и заявить, что с точки зрения фундаментальной физики на самом деле между предиктивными и ретродуктивными выводами нет разницы в том, что касается объяснительной силы, и что достоинством, а не недостатком унификационистского подхода является то, что он воспроизводит это суждение. Что бы мы ни говорили в пользу такой реакции, Китчер ответил иначе. Он заявил, что наши обычные суждения о каузальной асимметрии могут быть выведены из унификационистской теории. Только что приведённый пример ставит это заявление под сомнение. В более общем случае он ставит под сомнение тезис Китчера, будто можно начать с понятия объяснительной унификации, интерпретируемого без привлечения каузальных понятий, и использовать его для выведения содержания каузальных суждений.

 

5.4. Гетерогенность унификации

Это заключение подкрепляется более общим соображением: в том виде, в котором унификация используется в науке, она представляет собой весьма гетерогенное понятие, включающее в себя множество различных видов достижений [17]. Некоторые виды унификации заключаются в создании общей классификационной схемы или описательного словаря там, где ранее удовлетворительной схемы не существовало, как это происходило в ранний период развития науки при исследованиях наподобие тех, которые вёл Линней, создавший всеобъемлющую и основанную на научных принципах систему биологической классификации. Другой вид унификации предполагает создание общей математической структуры или модели описания, которую можно применить ко множеству разнообразных видов явлений, как это было, когда системы уравнений, разработанные Лагранжем и Гамильтоном, были изначально выведены в контексте механики, а затем применены в таких областях, как электромагнетизм и термодинамика. Есть и другие случаи, когда речь идёт о том, что можно было бы описать как подлинную физическую унификацию, при которой демонстрируется, что явления, которые, как ранее считалось, имеют весьма разные причины или объяснения, являются результатом общего набора механизмов или каузальных отношений. Доказательство Ньютона, что орбиты планет и поведение земных объектов, находящихся в свободном падении у поверхности земли, зависят от одной и той же силы тяготения и подчиняются одним и тем же законам движения, именно в этом смысле было физической унификацией.

Из трёх этих случаев лишь последний — физическая унификация — интуитивно представляется непосредственно связанным с объяснением: по меньшей мере если мы считаем, что объяснение предполагает отсылки к каузальным отношениям. В частности, в зависимости от конкретной ситуации, тот вид унификации, который связан с принятием классификационной схемы, мало что может сообщить нам о каузальных отношениях. Более того, исторические исследования показывают, что то же самое верно для формальной или математической унификации: тот факт, что мы можем создать формальное математическое описание ряда различных явлений, ни в коем случае не гарантирует, что мы автоматически выделим некий набор общих каузальных факторов, ответственных за эти явления, т. е. что мы дадим им единое физическое объяснение. Например, простой факт, что с помощью уравнений Лагранжа мы можем описать как поведение системы связанных силами тяготения масс, так и действие электрической цепи, не означает, что мы нашли общее объяснение для обоих или что мы «объединили» гравитацию и электричество каким-либо образом, интересным с точки зрения физики.

Это ставит перед нами следующий вопрос: является ли данная Китчером теория унификации достаточно дифференцирующей или тонкой, чтобы отличить виды унификации, имеющие отношение к объяснению, от других? Возникает подозрение, что это не так. Лежащая в основе теории Китчера концепция унификации представляется в основе своей тяготеющей к описательной экономии или сжатию информации — она стремится вывести как можно больше из как можно меньшего количества паттернов аргументов. Многие случаи классификационной и чисто формальной унификации, предполагающей разработку общего математического формализма, по-видимому, соответствуют этой характеристике. Возьмём схемы биологической классификации и схемы классификации таких геологических и астрономических объектов, как камни и звёзды. Если я знаю, что конкретные образцы относятся к определённой категории классификации (например, вид X — млекопитающие или полярные медведи), я могу использовать эту информацию для того, чтобы сделать выводы о великом множестве их свойств (у X есть позвоночники, сердца, они живородящие и т. д.), и это — паттерн аргумента, который можно раз за разом использовать для разных видов X. Но, несмотря на желание некоторых философов рассматривать такие выводы как объяснения, в науке принято считать эти схемы «просто дескриптивными» и мало что сообщающими (если вообще сообщающими что-либо) о причинах или механизмах, объясняющих, почему у X есть позвоночники или сердца [18].

Другой пример, иллюстрирующий тот же общий тезис, — многочисленные статистические процедуры (факторный анализ, кластерный анализ, методы многомерного шкалирования), которые позволяют нам резюмировать или представлять большие объёмы статистической информации в экономном, унифицированном виде и выводить более конкретные статистические факты из гораздо меньшего набора допущений, раз за разом используя один и тот же паттерн аргумента. Например, зная, какова «нагрузка» каждого из n тестов оценки интеллекта на общий фактор g, мы можем сделать гораздо большее количество (n(n−1)/2) выводов о попарной корреляции этих тестов. Однако опять-таки вызывает сомнения, что такая «унификация» сама по себе говорит нам что-нибудь о причинах, по которым испытуемые выполнили тест так, а не иначе.

 

5.5. Концепция «Победитель получает всё»

Другая фундаментальная проблема унификационистской теории связана с тем, что она опирается на концепцию унификации, которую можно было бы назвать «Победитель получает всё». С одной стороны, кажется, что любая убедительная версия этого подхода должна приводить к выводу, что обобщения и теории иногда могут быть объяснениями некого ряда явлений, даже если известны в большей степени унифицирующие объяснения этих явлений [19]. Например, закон Галилея можно использовать для объяснения фактов о поведении падающих тел, даже если он даёт менее унифицирующее объяснение, чем законы ньютоновской механики и теория тяготения, а последние, в свою очередь, могут служить объяснением, даже если они дают менее унифицированное объяснение, чем то, что даётся общей теорией относительности; теории Кулона и Ампера являются объяснениями, даже если уступают в унифицированности теории Максвелла, и т. п. Если мы отвергнем эту идею, нам придётся согласиться, что в любой области лишь наиболее унифицированная из известных теорий даёт объяснение явлениям: все остальные теории на это не способны. Назовём эту концепцию унификации концепцией «Победитель получает всё».

Концепция «Победитель получает всё» отказывается от, несомненно, весьма естественного представления, которое, как можно подумать, сторонник унификации должен был бы поддержать: представления, что одно объяснение может обеспечить меньше унификации, чем какое-нибудь альтернативное объяснение, и, значит, быть менее глубоким или подходящим, но тем не менее считаться что-то объясняющим. Однако подход Китчера к проблемам объяснительной иррелевантности и асимметрии, по-видимому, требует как раз такой концепции. Почему же мы не можем ссылаться на тот факт, что этот конкретный образец соли зачарован, чтобы объяснить то, что он растворяется в воде? Согласно Китчеру, любой объяснительный резерв, содержащий обобщения о растворении зачарованной соли, будет «менее унифицированным», чем конкурирующий объяснительный резерв, согласно которому растворение соли объясняется ссылкой на обобщение, что любая соль растворяется в воде. Равным образом причина, по которой мы не можем объяснить высоту флагштока через длину его тени, заключается в том, что эти объяснения длин объектов через факты о тенях не принадлежат «набору объяснений», которые «в совокупности обеспечивают наилучшую систематизацию наших убеждений» [Kitcher 1989, 430]. Очевидно, что такой анализ нуждается в концепции «Победитель получает всё», согласно которой объяснение Т1, являющееся с точки зрения унификации менее удовлетворительным, чем конкурирующее альтернативное объяснение Т2, не будет объяснением вовсе (а не окажется просто объяснением менее удовлетворительным, чем Т2). Если бы Китчер собирался отвергнуть концепцию «Победитель получает всё» и вместо этого придерживаться точки зрения, что, даже если Т2 является более унифицированным, чем Т1, из этого не следует автоматически, что Т1 не является объяснением, то его решение проблем объяснительной иррелевантности и асимметрии больше бы не работало: ему пришлось бы сделать вывод, что «объяснение» того, что мистер Джонс не может забеременеть, приёмом противозачаточных таблеток и в самом деле является объяснением, хотя и менее удовлетворительным, чем то, которое отсылает к полу мистера Джонса; то же касается и выведения высоты флагштока из длины его тени.

Если довериться интуиции, то проблема заключается в том, что нам нужна теория объяснения, описывающая несколько разных возможностей. С одной стороны, есть обобщения и связанные с ними мнимые объяснения (например, обобщения, связывающие показания барометра с возникновением гроз, и обобщения, связывающие наложение на соль чар с её растворением в воде), которые вовсе не являются объяснениями; они не удовлетворяют требованиям, предъявляемым к объяснениям. С другой стороны, этим требованиям удовлетворяет некий континуум: обобщения могут быть объяснениями, но менее глубокими или убедительными, чем какие-то альтернативные обобщения. Мы только что видели, что унификационистская теория не может одновременно включать обе эти возможности. Либо нет требований, отсеивающих объяснения от того, что объяснениями не является (каждый вывод является в какой-то мере объяснением, и дело просто в том, что некоторые выводы принадлежат к менее унифицирующим и тем самым — меньше объясняющим систематизациям, чем другие), либо не существует континуума (и лишь наиболее унифицирующие систематизации могут давать объяснения).

 

5.6. Эпистемология унификации

Давайте вспомним, что, согласно Китчеру, знание о каузальных отношениях возникает из наших попыток унификации. Однако (и с этим Китчер тоже согласен) весьма маловероятно, что большинство людей намеренно и сознательно будет сравнивать конкурирующие дедуктивные систематизации с точки зрения числа и строгости паттернов и количества заключений, чтобы определить, какая из них является более унифицирующей. Его ответом на это замечание является утверждение, что большинство людей обретает знание о каузальных отношениях, впитывая «практические знания», которыми обладают сообщества, к которым люди принадлежат, причём эти практические знания и в самом деле отражают ранее предложенные варианты унификации. Он пишет, что «наши обыденные знания о каузальных отношениях основаны на воспринятой в раннем возрасте теоретической картине мира, завещанной нам нашей научной традицией» [Kitcher 1989, 469].

Как именно это должно работать? Хотя, несомненно, верно то, что люди приобретают значительное количество знаний о каузальных связях благодаря культурной традиции, также очевидно, что не все подобные знания приобретаются таким способом. Некоторые сведения о каузальных отношениях требуют обучения на опыте. Более того, если мы не готовы делать в высшей степени невероятные допущения о врождённости значительного числа конкретных убеждений в отношении каузальных связей, резерв передаваемых внутри общества знаний о таких связях сам должен был быть создан неким способом, в котором важную роль играло бы научение на основе опыта. Тогда возникает вопрос, как этот процесс научения на основе опыта должен повлиять на мнение об источнике нашего знания о каузальных связях, подобное мнению Китчера? Если, как заявляет Китчер, «идея, будто любой человек обосновывает выносимые им каузальные суждения, распознавая паттерны аргументов, которые лучше всего унифицируют его или её убеждения, очевидным образом является абсурдной» [Kitcher 1989, 436], то что же именно происходит на индивидуальном уровне, когда люди учатся чему-либо на опыте? Возможно, что, хотя они и не сравнивают сознательно степени унификации, достигаемые конкурирующими систематизациями, когда, учась на опыте, приобретают новые знания о каузальных отношениях, они делают это неявно или бессознательно — возможно, из-за некой общей предрасположенности разума к поиску унификации. Однако Китчер, по всей видимости, не поддерживает это мнение, и оно не слишком хорошо сочетается с тем, как он подчёркивает роль социальной передачи информации о каузальных связях. Более того, кажется, что даже бессознательная унификация требует весьма развитых познавательных способностей (построение и сопоставление различных дедуктивных систематизаций и т. д.), то есть маловероятно, что на это способны многие обучающиеся, например, маленькие дети.

Логичная интерпретация приведённой выше цитаты и других утверждений Китчера [Kitcher 1989] такова: социальный процесс сопоставления конкурирующих систематизаций убеждений и выявления их дедуктивных следствий возникает на уровне общества, где группы людей спорят друг с другом о том, какая общая дедуктивная систематизация лучше всего унифицирует убеждения общества в целом. Конкретные убеждения в отношении каузальных связей на уровне общества обосновываются тем, что их представляют как часть наилучшей общей систематизации убеждений общества, и потому они передаются из общего резерва убеждений общества отдельным людям.

Очевидная проблема такого представления заключается в том, что идущий в обществе процесс обоснования должен, однако, тем или иным образом осуществляться отдельными людьми. Если (как и обстоит дело) существует множество обществ, обладающих значительным количеством объяснений и знаний о каузальных отношениях, но в которых никто не располагает недвусмысленным и чётко сформулированным понятием о дедуктивно валидном аргументе, не умеет выводить дедуктивные следствия из убеждений или не обладает в явном виде концепциями о числе и строгости паттернов аргументов, о которых говорит Китчер, то как именно формируются общественные убеждения, отражающие действие этих понятий? Если, как признаёт Китчер, предположение, будто отдельные люди будут намеренно и сознательно сравнивать конкурирующие систематизации, когда они благодаря опыту приобретают убеждения о каузальных связях, психологически невероятно, то с чего бы быть более вероятным предположению, будто этот процесс каким-то образом произойдёт в ходе взаимодействия индивидов на уровне общества? [20]

Существует и другая сложность, связанная с первой. Допустим, что нам бы хотелось иметь унифицированную систему убеждений в том смысле, в котором это понимает Китчер: потому ли, что унификация связана с объяснением, а последнее само по себе ценно, или потому, что унификация связана с другими желанными целями (например, подтверждением). Тем не менее всё ещё неясно, почему ценным было бы обладание набором убеждений, представляющих собой наименьшее подмножество убеждений, составляющих такую унифицированную систему (которым, по всей видимости, обладает большинство людей), если мнение Китчера о передаче знания о каузальных отношениях истинно. Вспомните общую картину, нарисованную Китчером: приобретая убеждение, скажем, о том, что факт зачарованности соли каузально иррелевантен её растворению в воде, тогда как то, что она помещена в воду, каузально релевантно, я приобретаю фрагмент систематизации S, которой располагает общество. Но, добавив фрагмент систематизации S или даже несколько её фрагментов к резерву моих убеждений, я могу и не получить систему убеждений, которая унифицирована или облегчает достижение любых эпистемических целей, связанных с унификацией. Разумеется, если в конце концов я добавлю в мой резерв убеждений большинство фрагментов S, я получу унифицированный и позволяющий воспользоваться всеми достоинствами унификации набор убеждений. Но, как соглашается Китчер, невероятно, чтобы большинство людей обладало чем-нибудь, близким к полной систематизации S, которая лучше всего унифицирует все общественные убеждения. Это кажется верным, например, для нашего собственного эпистемического сообщества, в котором знание — в особенности научное знание — распределено среди лиц, входящих в небольшую группу экспертов, и ни один человеческий разум (и тем более разум типичного представителя сообщества) не обладает систематизацией, лучше всего унифицирующей убеждения всего общества, и не действует в соответствии с ней. Говоря в более общих терминах, кажется маловероятным, что разные фрагменты Bi общественной систематизации S, которые различные субъекты i приобретают благодаря передаче культурного опыта, будут в каждом конкретном случае представлять собой высокоунифицированные систематизации. Короче говоря, значительной проблемой концепции передачи культурного опыта является то, что сложно понять, как именно унификация может иметь познавательное или практическое значение, если она не характеризует систему убеждений отдельных людей, а не только общества в целом. Однако использование унификации того типа, который Китчер связывает со знанием о каузальных отношениях и объяснениях, для характеристики индивидуальных систем убеждений кажется, на первый взгляд, нереалистичным с точки зрения психологии. Это не означает, что не существует способа объяснить, как в унификационистской картине приобретается знание, но такое объяснение требует серьезной дополнительной работы.

Рекомендованная литература: Наиболее подробное изложение позиции Китчера можно найти в [Kitcher 1989]. Работа [Salmon 1989, 94ff.] содержит критический анализ версии унификационистской интерпретации объяснения, предложенной Фридманом, но в заключение отстаивает «примирение» унификационистских подходов и каузальной механической модели самого Сэлмона. Работа [Woodward 2003] содержит дополнительную критику китчеровской версии унификационизма.

 

6. Прагматические теории объяснения

6.1. Введение

Несмотря на множество разногласий между ними, рассмотренные выше теории Гемпеля (говоря о его теориях сейчас, мы будет иметь в виду прежде всего ДН‑, а не ИС-модель), Сэлмона, Китчера и других по большей части разделяют общепринятые представления о том, что должен в себя включать именно проект создания теории объяснения и (в известной мере) каким критериям такая теория должна удовлетворять, чтобы быть успешной. Будем говорить, что теория объяснения содержит «прагматические» элементы, если (i) эти элементы требуют обязательной отсылки к фактам об интересах, убеждениях или других психологических характеристиках тех, кто даёт объяснение или его получает и/или (ii) обязательной отсылки к «контексту», в котором возникает объяснение. (О том, что это значит, будет сказано ниже.) Хотя авторы, о которых шла речь выше, согласны с тем, что прагматические элементы играют какую-то роль в процессе предоставления или получения объяснений, они полагают, что существует некое непрагматическое ядро объяснения, описание которого является главной задачей теории объяснения. То есть предполагается, что это «ядро» можно определить таким образом, чтобы обойтись без обязательных отсылок к психологическим характеристикам тех, кто даёт объяснения, или их слушателей, и что оно и его свойства могут быть описаны неконтекстуально в том смысле, что они являются достаточно общими, абстрактными и «структурными», и что мы можем рассматривать их как присутствующие в ряде объяснений с разным содержанием и в ряде разных контекстов. Часто, но не всегда, утверждалось, что многие особенности этих свойств могут быть объяснены формально, через такие отношения, как дедуктивный вывод или статистическая релевантность. Кроме того, эти авторы считали целью теории объяснения описание понятия правильного объяснения (вида «объяснение фотоэлектрического эффекта состоит в том-то и том-то») в противоположность понятию объяснения, которое считается или не считается таковым конкретной аудиторией (что, предположительно, зависит от того, понимает ли аудитория термины, в которых даётся объяснение). Наконец, как отмечалось во Введении к этой статье, работающие в русле этой традиции авторы не считали своей задачей описание всех разнообразных способов использования слова «объяснение» в повседневной английской речи. Вместо этого они занимались гораздо более ограниченным классом примеров, в которых их интересовало объяснение (или нечто вроде объяснения) того, «почему» достигается некий результат или возникает некий феномен, в противоположность объяснению, например, значения слова или того, как решать дифференциальное уравнение. Мотивом для такого ограничения является просто суждение, что интересная и содержательная теория с большей вероятностью возникнет при условии введения таких ограничений. Для простоты будем называть это «традиционным» представлением о задаче теории объяснения.

Некоторые или все эти допущения и цели отвергаются в прагматических или, как их иногда называют, «контекстуальных» теориях объяснения. Среди первых, кто разрабатывал этот подход, были Майкл Скривен (см., например, [Scriven 1962]) и Сильвейн Бромбергер (см., например, [Bromberger 1966]), а более систематические его изложения появились в 1980-х годах благодаря ван Фраассену [van Fraassen 1980] и Ахинштайну [Achinstein 1983]. Поскольку не всегда ясно, в чём именно расходятся сторонники прагматического и традиционного подходов, стоит сказать несколько слов об этом, прежде чем мы обратимся к деталям. Защитники прагматических подходов к объяснению обычно подчёркивают, что то, обеспечивает ли предоставление некой аудитории определённой совокупности информации понимание или ощущение понятности, или является ли такая совокупность подходящей для этой аудитории или что-то разъясняющей, зависит от базовых знаний и интересов отдельных членов аудитории и от других факторов, определяемых контекстом ситуации. Например, объяснение отклонения звёздного света солнцем, отсылающее к уравнениям поля общей теории относительности, может многое сказать физику, но будет непонятно профану, не обладающему необходимыми базовыми знаниями. Факторы такого рода называют «прагматическими», и считается, что их воздействие демонстрирует по меньшей мере один из способов, которыми прагматические соображения определяют понятие объяснения.

Взятое само по себе, только что описанное наблюдение кажется совершенно непротиворечивым и не вступающим в конфликт с подходами к объяснению, которые парадигматически рассматриваются как традиционные. В самом деле, как отмечалось выше, такие авторы, как Гемпель и Сэлмон, недвусмысленно соглашаются, что объяснение имеет прагматическое в только что описанном смысле измерение, — фактически Гемпель в нескольких случаях упоминает о роли прагматических факторов, когда говорит о том, что на первый взгляд кажется контрпримерами к                        ДН-модели [21]. Это предполагает, что по меньшей мере нередко [22], прагматический подход к объяснению отличает не только сама идея, что у объяснения есть «прагматическое измерение», но скорее более сильное заявление, что традиционный проект создания модели объяснения, который стремился воплотить Гемпель и другие учёные, до сих пор терпел поражение (и, возможно, обречён на неудачи) и что это происходит потому, что прагматические или контекстуальные факторы играют ключевую и неустранимую роль в объяснении, причём эта роль не может быть описана в рамках традиционных моделей. С этой точки зрения многие отличительные особенности прагматических теорий (включая теории ван Фраассена и Ахинштайна, о которых пойдёт речь ниже) состоят в их противоположности традиционным теориям и в том, как в их рамках диагностируются причины неудач традиционных теорий: традиционные теории терпят неудачу, поскольку игнорируют прагматические или контекстуальные элементы. В дальнейшем нам будет важно помнить об этом, поскольку сторонники прагматических теорий склонны вести спор так, будто превосходство их подхода основано просто на наблюдении, что у объяснения есть прагматическое измерение; вместо этого более уместным кажется считать, что вопрос состоит в том, являются ли традиционные подходы в принципе несостоятельными из-за того, что упускают из виду прагматическое измерение объяснения.

Второй вопрос касается того важного факта, что понятие «прагматический» двусмысленно. Принято считать, что прагматические соображения имеют отношение к выгоде или полезности для достижения какой-либо цели, связанной с интересами человека, причём эти интересы в некотором существенном смысле являются «практическими». Назовём это свойство «прагматичность-1». В соответствии с такой интерпретацией, ДН-модель Гемпеля можно справедливо назвать прагматической-1 теорией (или теорией, содержащей прагматические-1 элементы), поскольку в ней объяснительная информация тесно связана с предоставлением информации, полезной для выдвижения предсказаний, а предсказание, вне всякого сомнения, является прагматической целью. По тем же причинам теория объяснения Вудварда [Woodward 2003] тоже может быть сочтена прагматической-1 теорией: ведь она связывает объяснение с предоставлением информации, полезной для манипулирования и контроля, что, безусловно, является практической целью. Как подразумевают эти примеры, модели объяснения, стремящиеся к достижению традиционных целей, можно рассматривать как прагматические-1 теории.

Однако в контексте теорий объяснения ярлык «прагматический» обычно подразумевает совсем иной набор ассоциаций. В частности, понятие «прагматический» часто используется для описания соображений, касающихся фактов о психологии (об интересах, убеждениях и пр.) людей, дающих или получающих объяснения, и/или конкретного контекста, причём и те, и другие соображения могут видоизменяться сложным и нестандартным образом, что не позволяет сделать их частью какой-либо общей теории наподобие тех, к которым стремятся традиционные модели [23]. Назовём это свойство «прагматичностью-2». Теории Гемпеля и Вудварда не являются прагматическими-2. В частности, как показывает пример ДН-модели, тот факт, что теория является прагматической-1 в том смысле, что для обоснования модели объяснения она отсылает к фактам о целях, обычно разделяемых человеческими существами (например, предсказаниях), не мешает пытаться сконструировать модели объяснения, удовлетворяющие традиционным целям, и не требует приверженности представлению, будто объяснение следует понимать как прагматическое-2 понятие. Говоря об этих двух разных способах понимания «прагматического» измерения объяснения, нам следует быть осторожными.

Наконец, как подчёркивалось выше, интерес к прагматическому аспекту объяснения естественным образом связан с вниманием к «психологии» объяснения, и это, в свою очередь, предполагает важность эмпирических исследований того вида информации, который различные субъекты (обычные люди, учёные) считают объяснительным и рассматривают как обеспечивающий «понимание», а также различий, проводимых субъектами между разными объяснениями и так далее. Хотя исследователи всё чаще обращаются к этим проблемам, наиболее выдающиеся сторонники прагматических подходов к объяснению в философии до сих пор их не затрагивали. В этой связи следует сказать, что такая психологическая литература идёт значительно дальше повторяемых в философских дискуссиях банальностей о том, что разные люди в зависимости от своих интересов считают объяснительной разного рода информацию. Например, Ломброзо [Lombrozo 2010] находит доказательства того, что субъекты предпочитают объяснения, отсылающие к сравнительно стабильным отношениям (в том смысле, что они сохраняются несмотря на изменяющиеся обстоятельства) [24], а Льен и Ченг [Lien and Cheng 2000] показывают, что в случаях, когда у экспланандума E может быть лишь одна причина C, субъекты предпочитают те уровни объяснения/каузального описания, которые максимизируют Δp=Pr(EC)−Pr(E∣не-C).

Отметим, что в обоих случаях мы имеем дело с отношениями или паттернами того же вида, который стремятся описать традиционные теории объяснения. Как показывают эти примеры, проект формулировки теории объяснения, удовлетворяющей традиционным целям, необязательно будет несовместим с интересом к психологии объяснения. Возможно, субъекты считают определённого рода информацию объяснительной или обеспечивающей понимание потому, что в ней наличествуют определённые структурные характеристики того вида, который пытаются описать традиционные теории. В самом деле, именно об этом и идёт речь в статьях Ломброзо, а также Льена и Ченга.

Дистинкцию того же рода следует проводить между общим проектом исследования эмпирической психологии объяснения (к которому можно приступать, обладая разного рода предпочтениями относительно наилучшего способа рассуждения об объяснении) и более конкретным утверждением, согласно которому описывать, в чем состоит объяснительное отношение между экспланансом и экспланандумом, следует в «психологических» терминах (в том смысле, что такое описание требует неизбежных отсылок к психологическим фактам о конкретной аудитории — например, к тому, в чём эти конкретные люди заинтересованы). В целом вопрос о том, существуют ли стабильные регулярности, связывающие структурные или объективные характеристики совокупностей информации с тем, считается ли различными субъектами эта информация объяснительной, следует рассматривать как эмпирическую, а не отвлечённую проблему. Возможно, таких регулярностей и нет, и в зависимости от своих интересов и иных психологических факторов люди считают объяснением или сведениями, обеспечивающими понимание, самые разные вещи, но это следует доказать, а не принимать как предпосылку исследования.

 

6.2. Конструктивный эмпиризм и прагматическая теория объяснения

Одна из наиболее влиятельных современных прагматических теорий объяснения связана с конструктивным эмпиризмом. Это тезис, отстаивавшийся Басом ван Фраассеном в книге «Научное представление» [van Fraassen 1980]: цель науки (по крайней мере «чистой» науки) состоит в построении «эмпирически адекватных» (то есть дающих истинные или верные описания доступных наблюдению явлений) теорий, а не (как считают сторонники научного реализма) теорий, целью которых являются буквально соответствующие истине рассказы о недоступном наблюдению. Следовательно, «принятие» теории означает всего лишь убеждение в её эмпирической адекватности [van Fraassen 1980, 12]. Теория объяснения ван Фраассена, изложенная в нескольких статьях и (подробнее всего) в шестой главе «Научного представления», должна была сочетаться с общей концепцией науки: это концепция, согласно которой эпистемической целью «чистой» науки является не само по себе объяснение (единственной такой целью является эмпирическая адекватность), но скорее «прагматическое» преимущество, связанное с «применением» науки. (Отметим, что в той мере, в которой применение науки считается «прагматическим» (то есть прагматическим-1), а идея, что объяснение является прагматическим в этом смысле, используется для обоснования принятия прагматической (прагматической-2) теории объяснения, мы получаем смешение двух выделенных выше понятий «прагматического».) Поскольку объяснение имеет лишь прагматическую значимость, интерес к объяснению не потребует от учёных перехода от убеждения в эмпирической адекватности их теорий к убеждению в буквальной истинности утверждений о недоступных наблюдению сущностях.

Согласно ван Фраассену, объяснения являются ответами на вопросы, и для создания теории объяснения необходимо разобраться с логикой вопросов. Вопросы могут быть сформулированы по-разному, но, когда речь идёт о вопросах «почему», поиски объяснения обычно имеют форму поиска объяснения того, почему имеет место некий экспланандум Pk, а не любой конкретный элемент противоположного ему X (набора возможных альтернатив Pk). Кроме того, вопрос предполагает наличие некого «отношения релевантности» R. Ответ A на такой вопрос будет иметь вид: «Pk в противоположность (остальному) X, поскольку A, где A имеет к (Pk, X) отношение релевантности R». Рассмотрим пример ван Фраассена: «Почему провод погнут?» В зависимости от контекста, подразумеваемое противопоставление может заключаться, например, в том, почему этот конкретный провод погнут в отличие от другого, оставшегося прямым, или, напротив, почему этот конкретный провод погнут сейчас, хотя ранее он был прямым. Отношение релевантности R также зависит от контекста и информации, которую хотел бы получить вопрошающий. Например, R может касаться информации о причинах (мы можем спросить, что вызвало искривление), но также и о функции — если контекст предполагает, что форма провода играет некую функциональную роль на электростанции, и вопрос именно о ней. Таким образом, «контекст» оказывается важным для объяснения при уточнении как противопоставленного Pk класса X, так и отношения R. Ван Фраассен описывает разные правила «оценки» ответов. Например, Pk и A должны быть истинными, другие элементы противопоставленного класса не должны быть истинными, A должен «предпочитать» (увеличивать условную вероятность) Pk другим альтернативам и иметь преимущества перед другими ответами на тот же вопрос (условие, которое само по себе неоднозначно: например, можно спросить, подтверждает ли A предмет обсуждения в большей степени, чем другие ответы, и нет ли других ответов, которые были бы лучше, чем А, по этому основанию). Однако он также ясно даёт понять (как показывает приведённый выше пример), что в зависимости от контекста может оказаться подходящим множество различных отношений релевантности, и что оценка ответов также зависит от контекста. Более того, он недвусмысленно отрицает, что у категории научного объяснения есть какая-то характерная черта, связанная со структурой или формой; напротив, оно является просто объяснением, использующим информацию, которая основывается на «научной» теории (или, по крайней мере, рассматривается под этим углом).

Ван Фраассен резюмирует свои представления об объяснении (и указывает на то, какие у него есть основания отвергать объективистские подходы) следующим образом:

Обсуждение объяснения с самого начала пошло по неверному пути, когда его интерпретировали как отношение, подобное описанию, — как отношение между теорией и фактом. На деле это — тройственное отношение между теорией, фактом и контекстом. Неудивительно, что все предложенные отношения между теорией и фактом подходили лишь для небольшого числа примеров! Для объяснения исключительно важно то, что оно является ответом, <…> его следует оценивать на фоне вопроса, то есть запроса на информацию. Но то, что именно <…> запрашивается, отличается от контекста к контексту. [van Fraassen 1980, 156]

Ван Фраассен начинает главу об объяснении с короткого вступления, задающего тон тому, как должна работать его теория. В разделе 2.5 говорилось, что хорошо известный контрпример к ДН-модели включает утверждение, что можно объяснить длину S тени, отбрасываемой флагштоком, через его высоту H, но (по-видимому) нельзя объяснить H через S, и это несмотря на то, что можно построить ДН-умозаключение, ведущее от S к H. Это — общепризнанное доказательство того, что ДН-модель оставляет незатронутыми некоторые факторы, имеющие отношение к направленности или асимметрии объяснения: например, асимметрию отношений между причиной и действием, которая должна быть включена в модель объяснения. Во вступлении ван Фраассена сначала предлагается непосредственное каузальное объяснение S через H (хотя речь идёт о башне, а не флагштоке). Затем выдвигается второе объяснение, в котором высота башни «объясняется» тем, что она была построена так, чтобы отбрасывать тень определённой длины. Предположительно, отсюда мы должны сделать вывод, что, в зависимости от контекста и отношения релевантности R, приемлемыми (допустимыми, подходящими и т. п.) будут оба объяснения: как «H объясняет S», так и «S объясняет H». Более того, поскольку это множество контекстов и отношений релевантности оказывается зависящим от множества вещей, интересных объясняющему или его аудитории, нас подталкивают к выводу, что источником асимметрии в объяснении являются скорее психологические факты об интересах и базовых убеждениях людей, а не, скажем, асимметрия, существующая в природе независимо от них. Те, кто придерживается прагматических взглядов на объяснение, полагают, что мы должны сделать сходное заключение и для других характеристик объяснительного отношения релевантности, которое философы пытались описать посредством традиционных моделей объяснения.

Очевидным ответом на это заявление, высказанным несколькими критиками (например, [Kitcher and Salmon 1987, 317]), будет то, что на самом деле в этом примере мы имеем дело не с таким случаем, когда в зависимости от контекста H каузально объясняет S и S каузально объясняет H. Вместо этого, хотя H и в самом деле каузально объясняет S, высоту (или выбор высоты) башни объясняет (или, по меньшей мере, каузально объясняет) нечто вроде желания получить тень длиною S (а не сама длина тени S). Или, если хотите, в последнем случае мы имеем нечто вроде функционального (а не каузального) объяснения высоты башни: в том смысле, что нам говорят, какова предполагаемая функция такого выбора высоты. В любом случае это не будет примером, в котором то, H ли каузально объясняет S или S каузально объясняет H, зависит от факторов, связанных с интересами говорящего или его аудитории, или других контекстуальных факторов. Если это так, то пример с башней не доказывает, что асимметрию, которая присутствует в примере с флагштоком, следует описывать с точки зрения прагматических факторов: о ней можно говорить и иначе. На деле, хотя эта дискуссия и выходит за рамки данной статьи, было предложено несколько возможных вариантов такой непрагматической теории каузальной асимметрии как в области философии, так и за её пределами (например, к литературе по самообучению машин). Среди них — асимметрия в каузальной возможности соединения (в том виде, в каком её описывает Хаусман [Hausman 1998]), разного рода статистические асимметрии (см., например, [Spirtes, Glymour, and Scheines 2000]) и асимметрии в информационной зависимости (см., например, [Janzing 2012]). Может быть, все эти теории и неверны, но сложно сказать, как можно доказать их ошибочность с помощью одних только наблюдений наподобие того, которое выдвигает ван Фраассен в примере с башней и тенью. Чтобы доказать их ошибочность, потребуется подробный критический анализ самих непрагматических теорий каузальной асимметрии [25].

Предложенная ван Фраассеном версия прагматической теории была подвергнута критике Сэлмоном и Китчером с гораздо более общих позиций [Salmon and Kitcher 1987]. По сути, они были недовольны тем, что отношение релевантности R в теории ван Фраассена ничем не ограничено, и вследствие этого для любой пары истинных пропозиций P и А ответ А связан с P неким отношением релевантности и, таким образом, «объясняет» P (что они считали абсолютно неприемлемым). Например, согласно Сэлмону и Китчеру, мы можем определить отношение «астрального влияния» R*, удовлетворяющее критерию ван Фраассена для отношений релевантности, так что время t смерти человека объясняется через R* и положение различных небесных тел в момент t. Может показаться, что у ван Фраассена есть на это готовый ответ. Как отмечалось выше, по его мнению, базовые знания и (в случае научного объяснения) современные научные знания помогают определить, что является приемлемым отношением релевантности и ответом на вопрос, поставленный запросом на объяснение: такое знание и связанные с ним ожидания являются частью контекста, в котором мы просим объяснить, почему смерть наступила именно в момент t. Очевидно, что в рамках современных научных представлений астральное влияние не будет приемлемым или допустимым отношением релевантности — поэтому теория ван Фраассена и не сочтёт его объяснением. В общем, можно сказать, что доступное научное знание налагает ограничения на отношения релевантности и ответы, позволяя нам не беспокоиться, что «всё что угодно сойдёт» за таковые (как это делают Сэлмон и Китчер): по крайней мере до тех пор, пока мы пребываем в контексте, где принято искать «научное объяснение».

Хотя этот ответ и может показаться в известном смысле убедительным, он показывает, в сколь значительной степени необходимость различать то, что может и что не может быть объяснением в рамках теории ван Фраассена, обусловлена очень общими представлениями о том, что в современной науке принимается как допустимая базовая информация. Иными словами, это внушает тревогу: как только мы выходим за рамки формальной схемы ван Фраассена, описывающей вопросы и ответы (которые, как признаёт сам ван Фраассен, сравнительно неограниченны), то сталкиваемся с теорией, согласно которой научное объяснение — всего-навсего объяснение, включающее утверждения, почёрпнутые из современной науки, и научно подтверждаемое в данный момент отношение релевантности. Даже если это предложение и не имеет других недостатков, оно если не банально, то по крайней мере дефляционно и даёт нам куда меньше, чем можно было бы надеяться получить от теории объяснения. В частности, в случаях, когда в какой-либо области науки продолжается спор или дискуссия не о том, является ли предлагаемая теория или модель верной, но скорее о том, объясняет ли она некое явление (чему можно привести немало примеров), нелегко увидеть, каким образом предложенная теория может рассчитывать снабдить нас какими-либо руководящими указаниями. С другой стороны, очевидным возражением критикам ван Фраассена будет утверждение, что не может быть более амбициозного подхода, который удовлетворял бы ожиданиям, ассоциирующимся с более традиционными теориями объяснения (включая разделение предлагаемых объяснений на «верные» и «неверные») — такая теория, как теория ван Фраассена, настолько хороша, насколько только может быть. Если нельзя предложить приемлемой теории объяснения, которая включала бы в себя нетривиально ограничивающее отношение релевантности, то обвинять теорию ван Фраассена в том, что она на это неспособна, не будет честной критикой [26]. Так что — по крайней мере, с точки зрения ван Фраассена — традиционные модели представляют собой ориентир не лучший, чем его теория.

И наконец, теория ван Фраассена предлагает нам следующее: в случае прагматических теорий очень важно, в какой именно момент «прагматические» элементы вводятся в теорию объяснения. Один из таких моментов — выбор или описание того, объяснения чего именно ждёт аудитория. Это в теории ван Фраассена отражается в выборе Pk и связанного с ним противопоставленного класса X. Очевидно, что, ищем ли мы объяснение того, почему, скажем, этот конкретный провод теперь погнут, если ранее он был прямым, или желаем знать, почему он погнут, хотя какой-то другой провод — прямой, — это зависит от нашего интереса. Однако этот конкретный вид «относительности интереса» (и связанный с ним факт, что мы обращаем внимание на разные аспекты того, что именно мы хотим объяснить) кажется понятием, которое легко может быть признано традиционными теориями [27]. В конце концов, то, что одна аудитория заинтересована в объяснении фотоэлектрического эффекта, а не отклонения звёздного света солнцем, а у другой — абсолютно противоположные желания, не представляет угрозы для ДН-модели или других моделей с такими же традиционными притязаниями. Что было бы угрозой ДН- и подобным ей моделям, так это доказательство, что, стоит лишь полностью определить некий экспланандум Е, то, объясняет ли эксплананс М экспланандум Е (то есть есть ли объяснительное отношение между М и Е), само по себе будет «определяться интересами аудитории». Вполне естественно увидеть в теории ван Фраассена последнее утверждение: как в связи с объяснительной асимметрией, так и в более общем отношении.

 

6.3. Объяснение как иллокутивный акт

В центре внимания другой весьма влиятельной прагматической теории объяснения находится акт объяснения, понимаемый как иллокутивный акт (в том смысле, в котором это понятие используется в теории речевых актов). Наиболее систематическое изложение этого подхода дал Питер Ахинштайн (см. в особенности [Achinstein 1983]). Как и многие другие сторонники прагматических теорий, Ахинштайн стремился к описанию очень широкого понятия объяснения, включающего не только каузальные объяснения (и не только ответы на вопросы о том, почему что-то происходит), но и такие понятия, как объяснение значения слова, шахматных правил, функций каких-либо биологических структур и так далее. Его теорию очень сложно изложить во всех подробностях: в данной статье мы можем лишь попытаться представить самый беглый её набросок.

Ахинштайн начинает с того, что именно включает в себя объяснение чего-либо, данное кем-либо кому-либо. Согласно Ахинштайну, в таких случаях ключевую роль играет намерение объясняющего нечто субъекта: в частности, при объяснении объясняющий должен иметь намерение сделать нечто (грубо говоря, определённый вид непрямого вопроса q, соответствующего тому, что объясняется) «понятным». Объяснение (понимаемое как плод акта объяснения) определяется затем как упорядоченная пара, «один из элементов которой — вид действия, объясняющего q [см. выше], <…> а другой — пропозиция, дающая ответ на вопрос q» [Achinstein 2010, xi]. Например, даваемое Ньютоном объяснение того, почему возникают приливы, представлено такой парой: (Приливы возникают из-за притяжения Луны: объяснение того, почему возникают приливы). Ахинштайн проводит различие между «верными» и «подходящими» объяснениями. «Верное объяснение — то, в котором истинным является пропозициональный элемент упорядоченной пары» [Achinstein 2010, xi]. Тем не менее верное объяснение может быть и неподходящим, поскольку, например, оно каким-то из многочисленных способов не соответствует способностям и интересам аудитории, для которой предназначено. Далее Ахинштайн характеризует понятие подходящего объяснения, вводя ряд инструкций для конструирования объяснения, причём такие инструкции чувствительны к интересам, убеждениям и т. п. аудитории. Такие инструкции могут уточнять, например, что необходимо именно каузальное, а не какое-либо иное объяснение, или что необходимое в данном случае объяснение должно отсылать к явлениям микромира. Очень важной особенностью «прагматической» позиции Ахинштайна является то, что как в науке, так и в других областях не существует единого универсального набора инструкций, подходящего для любой аудитории или контекста. Следовательно, традиционные теории, стремящиеся обеспечить нас такими инструкциями, являются (в этом отношении) ошибочными. Ахинштайн пишет:

Теперь позвольте мне выдвинуть гипотезу. Предположим, вслед за Гемпелем и Сэлмоном вы формулируете ряд объективных, непрагматических критериев, которым, как вы полагаете, должны удовлетворять заслуживающие высокой оценки научные объяснения. Эти критерии будут универсальными в том смысле, что они не будут изменяться от объяснения к объяснению, но будут применимы ко всем научным объяснениям. Они также будут универсальными в том смысле, что они не будут включать конкретных эмпирических допущений или предположений, которые учёные могли бы сделать лишь в одной области или контексте. Поэтому они смогут включать использование законов, каузальных факторов и количественных гипотез, удовлетворять некоторым критериям единства или простоты и так далее. Моя гипотеза заключается в том, что, каким бы ни был этот предложенный вами набор объективных, непрагматических, универсальных критериев, вы всегда сможете найти или сконструировать для него контрпримеры, рассматриваете ли вы его как набор необходимых или как набор достаточных условий. [Achinstein 2010, 137]

Ахинштайн иллюстрирует это утверждение ссылкой на объяснение рассеивания альфа-частиц, данное в 1911 году Резерфордом. Это объяснение отсылает к предположению о структуре атома: в частности, к тому, что позитивно заряженным является ядро, объём которого по сравнению с объёмом всего атома мал. Это позволяет сделать вывод о количественном выражении амплитуды рассеивания под различными углами. Согласно Ахинштайну, другие конкурирующие объяснения (например, объяснение, просто дающее количественное выражение, описывающее рассеивание, но не связывающее его с утверждениями о структуре ядра) могут удовлетворять различным традиционным критериям объяснительной пригодности, которые можно найти в литературе по философии науки (такие объяснения могут иметь ДН-структуру, описывать причины, быть унифицирующими и т. д.), но тем не менее быть менее подходящими, чем объяснение Резерфорда. Объяснение Резерфорда является подходящим (настолько, насколько может таковым быть), поскольку оно даёт объяснение «на субатомном уровне существования материи — таким образом, каким физикам того времени хотелось бы объяснить рассеяние» [Achinstein 2010, 136 (курсив Ахинштайна)]. Иными словами, чтобы объяснить, в каком отношении объяснение Резерфорда является подходящим (или более подходящим, чем конкурирующие объяснения), мы неизбежно должны сослаться на интересы физиков его времени. В этом смысле теория «подходящего объяснения» Ахинштайна является, по его словам, «строго прагматической». Его предположение хорошо описывает большую часть расхождений (хотя, возможно, и не все) между прагматическими и традиционными (не чисто прагматическими) теориями объяснения. Центральным вопросом является то, возможно ли понять, в каком отношении объяснение Резерфорда лучше своих конкурентов, посредством объяснительного отношения, которое может быть определено независимо от интересов конкретной аудитории (и, возможно, иных относящихся к делу психологических фактов), а также неустранимо «контекстуальных» фактов (например, утверждения, что в данном случае подходящее объяснение обязательно должно отсылать к субатомному уровню существования материи; но независимо от фактов об интересах людей нельзя сказать ничего более общего о том, почему более предпочтительным является объяснение, отсылающее к этому уровню). Убедительный аргумент в пользу второй альтернативы, предположительно, будет требовать (по меньшей мере) исследования существующих традиционных теорий и демонстрации того, что они неудачны. Это исследование Ахинштайн предпринимает в работе [Achinstein 1983], и неудивительно, что существуют разные мнения о том, удалось ли ему доказать поражение объективистов.

 

6.4. Заключительные соображения о прагматических теориях

До сих пор мы говорили о «прагматических» и «традиционных» теориях как о диаметральных противоположностях. Это соответствует тому, как их обычно излагают как сторонники, так и противники. Однако стоит рассмотреть возможность того, что некоторые идеи, связанные с этими теориями, можно сочетать друг с другом, расширяя таким образом круг возможных подходов к объяснению, что позволяет лучше понять оба подхода. Во-первых, мы можем разделить утверждение, что объяснение содержит неустранимо «контекстуальные» элементы, и утверждение, что контекстуальные элементы следует понимать через факты о психологии (интересах и т. д.) участников ситуации объяснения. Альтернативная возможность состоит в том, что объяснение и в самом деле является неустранимо контекстуальным, но эти контекстуальные элементы следует рассматривать не как психологические, а, грубо говоря, с точки зрения той роли, которую конкретные эмпирические факты играют в объяснении, где релевантность таких фактов не может быть интерпретирована с помощью ресурсов ДН- и других традиционных моделей (то есть она не позволяет интерпретировать себя в терминах отношений дедуктивного следования, статистической релевантности и т. п.). Возможной иллюстрацией может стать пример самого Ахинштайна с объяснением рассеивания альфа-частиц сведениями о строении атомного ядра. Как было отмечено выше, сам Ахинштайн полагает, что в этом случае пригодность объяснения зависит от контекста, поскольку определяется психологическими фактами: в частности, она отражает тот факт, что физики особенно «заинтересованы» в объяснениях, ссылающихся на структуру атомного ядра. Альтернативная возможность состоит в том, что объяснение содержит неустранимо «контекстуальные» элементы в том смысле, что в эмпирических подробностях этого конкретного случая есть нечто, что делает факты о строении атомного ядра релевантными для объяснения рассеивания, но эта релевантность не может быть полностью объяснена с точки зрения абстрактных структурных особенностей («объективных», непрагматических, универсальных критериев Ахинштайна), находящихся в центре внимания традиционных теорий. Таким образом, эта возможность предполагает непсихологическое понятие «контекстуального», которое отличается от представления о том, что объяснительное отношение можно описать независимым от контекста способом. Чтобы разъяснить это понятие, обратимся к ДН-модели. Она не зависит от содержания в том смысле, что, согласно ей, до тех пор, пока определённые структурные отношения между экспланансом (Ci, Li) и экспланандумом E сохраняются, не имеет значения, что именно мы понимаем под Ci, Li и E, — полученная структура всё равно будет объяснением. Сторонник контекстуального (в непсихологическом смысле) подхода к объяснению вместо этого скажет, что, о каком бы независящем от содержания вероятном объяснительном отношении мы ни говорили (даётся ли это определение в терминах дедуктивных или вероятностных отношений или иных столь же формальных и абстрактных — или в той же мере притязающих на универсальность — понятий), всё равно найдутся соответствующие этой структуре примеры, являющиеся объяснениями, и примеры, таковыми не являющиеся, — в том смысле, что конкретное значение структурных элементов определяет то, получим ли мы объяснение.

Дополнительная аналогия может наполнить эту идею содержанием. Джон Нортон (например, в готовящейся к печати работе [Norton, forthcoming] и ряде других статей) отстаивает то, что называет «материальной теорией индукции». По его мнению, надёжность различных индуктивных умозаключений зависит от связанных с ними конкретных эмпирических («материальных») допущений таким образом, который препятствует формулировке любой универсальной логики индукции: не существует универсальной формы индуктивного аргумента, обеспечивающего надежность вывода вне зависимости от конкретного содержания этого аргумента. Однако Нортон не считает, что индуктивное подкрепление в каком-либо отношении является субъективным или определяется интересами и т. д. конкретной аудитории, — основанием отношения доказательства являются эмпирические факты, никак не связанные с психологией (конечно же, за исключением тех случаев, когда отношения доказательства касаются психологических гипотез). Можно сказать, что, по его мнению, индуктивное умозаключение является контекстуальным в том смысле, что оно зависит от содержания, но в то же время оно не требует отсылок к психологическим характеристикам.

Возможно, то же самое верно и для объяснения. Например, вероятно, соответствует истине то, что, чтобы понять, в каких отношениях объяснение Резерфорда является подходящим, следует учитывать (в дополнение к общим, относительно независимым от содержания требованиям унификации, выводимости из законов и т. п.) и ограничения, связанные с конкретными, касающимися именно данного случая, материальными фактами о структуре атомного ядра: в том смысле, что объяснением рассеивания альфа-частиц не может считаться объяснение, не учитывающее эти факты, и что другие объяснения той же формы, не отсылающие к структуре атомного ядра, не будут считаться объяснениями. Но, возможно, эти дополнительные ограничения касаются скорее фактов об устройстве этого мира, чем (как полагает Ахинштайн) фактов о том, что интересовало физиков во времена Резерфорда. Такого рода представления могут отражать (или признавать) некоторые из делаемых в рамках прагматических подходов утверждений о роли контекстуальных элементов в объяснении, но избегут некоторой предрасположенности таких подходов к субъективизму или психологизму. Они будут «контекстуальными» в том смысле, в котором является контекстуальной материальная теория индукции Нортона.

Со сказанным тесно связана идея, что, если кто-то склонен включать в теорию объяснения контекстуальные элементы, остаётся ряд возможных способов, которыми контекстуальные элементы могут сочетаться с другими, более универсалистскими. Как предлагалось выше, может оказаться, что лучше будет считать, что элементы обоих видов могут синергетически взаимодействовать, чем представлять их прямо противоположными друг другу. В качестве примера возьмём понятие унификации. Возможно, мы не можем дать адекватной характеристики этого понятия и его роли в объяснении, если рассматриваем его чисто формально и независимо от контекста: например, как вывод множества заключений из немногих исходных предположений или как замену теорий со многими свободными параметрами теориями, в которых таких параметров немного. Тем не менее может оказаться верным, что если конкретные материальные или эмпирические ограничения используются для того, чтобы ограничить класс рассматриваемых теорий, которые затем сравниваются с точки зрения достигаемой ими степени унификации, то нечто наподобие вычисления исходных допущений или числа свободных параметров (или, что более убедительно, нечто в том же роде, но более изощрённое) даёт полезную информацию о достигаемой степени унификации. Опять полезной оказывается аналогия с теориями индуктивного рассуждения. Разумеется, неверно, что все попытки создать в этой области формальные или общие теории ошибочны или обречены на провал: различные подходы к статистическому выводу и машинному самообучению являются очевидными тому контрпримерами. С другой стороны, успешные теории в этой области не являются совершенно универсальными или независящими от контекста; напротив, во многих случаях они дают результаты, которые представляются логичными или нормативно верными при определённом применении или когда конкретные исходные эмпирические условия удовлетворены, но не в других ситуациях. Иными словами, такие теории одновременно чувствительны к содержанию и включают элементы, представляющиеся объективными и структурными. Возможно, что-то наподобие этого и окажется нашим подлинным «объяснением».

Рекомендованная литература: Работы ван Фраассена [van Fraassen 1980], в особенности шестая глава, и Ахинштайна [Achinstein 1983] представляют классические изложения прагматических подходов к объяснению. Эти подходы обсуждаются и критически анализируются Сэлмоном [Salmon 1989]. Теория ван Фраассена разбирается также в работе [Kitcher and Salmon 1987]. Работа [De Regt and Dieks 2005] — более современная защита того, что авторы называют «контекстуальной» теорией понимания, затрагивающая некоторые проблемы «прагматики объяснения», обсуждаемые в научной литературе.

 

7. Выводы, открытые вопросы и направления дальнейших исследований

Какие выводы можно сделать из описания некоторых наиболее известных современных попыток построения моделей научного объяснения? Какие важные вопросы остались без ответа, и каковы наиболее многообещающие направления дальнейших исследований? Разумеется, любая оценка будет отражать частную точку зрения, но, если это учесть, некоторые наблюдения представляются правдоподобными, если и не совершенно свободными от противоречий.

 

7.1. Роль причинности

Первое касается роли каузальной информации в научном объяснении. Убедительным, хотя и вовсе не обязательным, кажется суждение [28], что многие из трудностей, с которыми сталкиваются описанные выше модели, связаны с тем, что они полагаются на интерпретации причинности и каузальной релевантности, представляющиеся неадекватными. Описанные в параграфе 2.5 проблемы объяснительной асимметрии и иррелевантности, по всей видимости, показывают, что наличия понимаемого как регулярность закона, связывающего С и Е, недостаточно для того, чтобы С было причиной Е, а значит, недостаточно и для присутствия С в объяснении Е. Если аргумент в параграфе 3.3 верен, фундаментальная проблема СР-модели состоит в том, что информации о статистической релевантности недостаточно для всеобъемлющего изложения каузальной информации в том смысле, что различные каузальные структуры могут сочетаться с одной и той же информацией об отношениях статистической релевантности. Равным образом КМ-модель сталкивается с проблемой, что информации о каузальных процессах и взаимодействиях также недостаточно для всеобъемлющего описания отношений каузальной релевантности и что существует ряд ситуаций, в которых имеют место каузальные отношения между С и Е (и, следовательно, С участвует в объяснении Е), хотя в них и не существует каузального процесса, связывающего С и Е. Наконец, фундаментальной проблемой унификационистских моделей является то, что содержание наших каузальных суждений, по-видимому, возникает не из-за усилий, которые мы прикладываем для достижения унификации (по крайней мере, когда унификация понимается в том смысле, который отстаивает Китчер). Например, как обсуждалось выше, соображения, касающиеся унификации, сами по себе не объясняют, почему возможно объяснять действия через их причины, а не наоборот.

По самой меньшей мере эти наблюдения предполагают, что прогресс в понимании «научного объяснения» может потребовать большего внимания к понятию причинности и более глубокого знания участниками дискуссий об объяснении растущей литературы, посвящённой причинности: как в рамках философии, так и за её пределами [29]. В этой связи многообещающими могут оказаться контрфактические теории причинности (ср. [Woodward 2003]).

Означает ли это, что внимание к причинности должно полностью вытеснить проект построения моделей объяснения или что философам следует прекратить говорить об объяснении, обратившись вместо этого к причинности? Несмотря на то, что причинность играет в объяснении центральную роль, предложение полностью заместить последнее первой ведёт к упущению некоторых важных обстоятельств. Во-первых, по-видимому, сами каузальные утверждения значительно различаются по степени своей объяснительной глубины или возможности поспособствовать пониманию. Основанные на ньютоновской механике каузальные утверждения с точки зрения объяснения кажутся более глубокими и лучше служащими своей цели, чем каузальные утверждения типа «камень разбил окно». Обычно считается, что подобные различия связаны с другими характеристиками: например, с тем, насколько общим, неизменным, сочетаемым с базовыми знаниями является каузальное утверждение. Однако, как мы уже отметили, не все виды всеобщности, неизменности и т. д. кажутся значимыми для объяснения (или связанными с пригодностью объяснения). Поэтому даже если мы занимаемся лишь каузальным объяснением, остаётся важный проект, цель которого — постараться лучше понять, какого рода различия между каузальными утверждениями имеют значение для пригодности объяснения. В той мере, в которой это верно, те виды вопросов, которые вдохновляли традиционные интерпретации объяснения, по-видимому, не будут полностью поглощены стандартными теориями причинности.

Возникает также важный вопрос о том, все ли допустимые формы «почему-объяснения» являются каузальными. Некоторые авторы (см., например, [Nerlich 1979]) утверждают, что существует множество физических объяснений, которые являются скорее «геометрическими», чем каузальными, — в том смысле, что они состоят в объяснении явлений с помощью ссылок на структуру пространственно-временного континуума, а не на факты о силе или передаче энергии/импульса (говоря о последних, Нерлих рассматривает каузальные объяснения в области физики). Согласно Нерлиху, объяснение траектории, по которой движется свободная частица, указанием на то, что она следует геодезической линии в пространственно-временном континууме, будет примером скорее геометрического, а не каузального объяснения. Подлинно удовлетворительная теория объяснения должна давать некий апеллирующий к принципам ответ на вопрос о том, все ли объяснения, отвечающие на вопрос «почему», должны быть каузальными (и если да, то в соответствии с каким именно понятием каузальности), а не просто предполагать утвердительный (или отрицательный) ответ на этот вопрос. И опять-таки, в той степени, в которой возможно существование некаузальных форм объяснения, объяснение останется темой, по меньшей мере в некоторых отношениях независимой от понятия причинности.

 

7.2. Объяснение и другие эпистемические цели

В работе [Koertge 1992] Норетта Кёртге отметила, что, хотя посвящённая объяснению литература и очень обширна, при построении различных конкурирующих моделей объяснения сравнительно мало внимания уделяется вопросу о том, для чего они используются или в чём состоит их более общее назначение (помимо описания «нашего» понятия об объяснении). Вместе с этим авторы, пишущие об объяснении, не всегда уделяют достаточно внимания тому, как само объяснение связано или взаимодействует с более общими целями исследования (или отступает от них): например, какова связь между объяснительной пригодностью (explanatory goodness) и другими часто предлагаемыми целями исследования — доказательным подкреплением, предсказанием, контролем над природой, простотой и т. д. В результате не вполне ясно, как оценивать значение наших интуитивных суждений о пригодности объяснений или определять, почему мы выносим то, а не иное суждение. Например, как мы отмечали, большинство людей интуитивно считает, что невозможно объяснить высоту флагштока ссылкой на длину его тени.

Однако последовательный сторонник ДН-модели (например, Гемпель [Hempel 1965, 353–354]) легко может спросить, почему эти интуитивные суждения должны нас так впечатлять. Возможно, наша предшествующая критическому анализу оценка в том или ином смысле противоречива или ошибочна, или, возможно, она просто отражает прагматические соображения, которым нет места в теории объяснения. Одним из ответов на такой скептицизм было бы предоставление не предрешающего вопрос описания того, какие именно важные элементы будут потеряны или упущены, если мы не сумеем провести различие между объяснениями длины тени через высоту флагштока и «объяснениями», двигающимися в противоположном направлении. (Отметим, что в той мере, в которой нас интересует просто предсказание, между двумя умозаключениями, по-видимому, существует паритет. «Не предрешающий вопрос» означает здесь, что мы не просто говорим, что высота является причиной тени, а не наоборот, но что мы даём некое дальнейшее разъяснение того, в чём состоит разница и почему она важна.) Возможным ответом будет ссылка на эпистемическую цель: получить информацию, важную для манипулирования и контроля; одним из способов изменения длины тени является изменение длины флагштока, но не наоборот. Эта разница реальна вне зависимости от наших интуиций об объяснении в обоих описанных случаях [30]

Что бы мы ни думали о конкретном ответе, более важным является то, что одним из способов уточнения оценок, которые мы даём конкурирующим моделям объяснения, будет в меньшей степени (или не только) сосредоточение внимания на том, описывают ли они наши интуитивные суждения, и в большей — на том, являются ли требуемые ими виды информации ценными (и достижимыми), насколько ценными и достижимыми они являются и как эта информация соотносится с другими важными для нас целями исследования.

В качестве другого примера рассмотрим КМ-модель. В её основе, предположительно, лежит суждение о том, что прослеживание каузальных процессов и их взаимодействий — достойная цель исследования. Конечно, мы можем попытаться защитить правоту этого суждения, просто заявив, что выделение причин — важная цель и что теории каузальных процессов приводят к верным описаниям причин. Но стратегией, не предрешающей вопрос и способной принести больше ясности, будет спросить, как эти цели относятся к другим эпистемическим ценностям. Например, какова связь между целью выявления каузальных процессов и построением унифицированных теорий? или между выявлением каузальных процессов и открытием информации, важной для предсказания или делающей возможной манипулирование и контроль? Будут ли это одни и те же цели? или независимые, но взаимодополняющие? или конкурирующие цели (в том смысле, что достижение одной из них может усложнить достижение другой)? Очевидно, что то же самое можно спросить о цели унификации.

Потребность в таких интерпретациях объяснения, которые более адекватно связывают это понятие с другими понятиями и целями, особенно очевидна в связи с ролью законов в объяснении — ещё одной проблемой из этой области, требующей дальнейшего изучения. Теория законов, в данный момент считающаяся многими философами самой многообещающей, — это теория Милля-Рамси-Льюиса (МРЛ). Согласно этой теории, законы — это такие обобщения, которые в качестве аксиом или теорем участвуют в дедуктивной систематизации наших эмпирических знаний, достигающей наилучшего сочетания простоты и силы (где сила имеет отношение к количеству эмпирических истин, которые можно таким образом вывести) [31]. Естественно связывать концепцию законов с унификационистскими подходами к объяснению: если законы — это обобщения, играющие центральную роль в достижении простых (и, предположительно, унифицированных) дедуктивных систематизаций, то, отсылая к законам при даче объяснения, мы достигаем объяснительной унификации; это делает понятным, почему желательно, чтобы объяснения отсылали к законам [32]. Если мы сможем довести такую теорию до рабочего состояния, то получим своего рода всеобъемлющее описание законов и объяснения, которых почти нет в ДН-модели; в этом описании законы будут тем, что напрямую связано с представлением о цели объяснения. Разумеется, остаются настоящие проблемы (о некоторых из которых мы говорили выше) с унификационистской теорией объяснения и, собственно говоря, с МРЛ-теорией законов [33], но всеобъемлющее описание, которое мы можем получить, объединив их, тем не менее, можно будет использовать в качестве иллюстрации того, к чему мы стремимся.

 

7.3. Возможна ли единая модель объяснения?

Ещё одна общая проблема касается степени, в которой возможно конструирование единой модели объяснения, подходящей для всех областей науки. Без сомнения, объяснительная практика (то, что́ мы принимаем в качестве объяснения, как цели объяснения взаимодействуют с другими целями исследования, какого рода объяснительная информация считается достижимой, что́ можно обнаружить, проверить и т. д.) в различных дисциплинах значительно различается. Тем не менее все описанные выше модели объяснения являются «универсалистскими» по своим целям: они утверждают, что единая, «универсальная» модель объяснения подходит для всех областей до тех пор, пока в них наличествует обоснованное притязание на объяснение. Хотя крайняя позиция, согласно которой объяснение в биологии или истории не имеет ничего общего с объяснением в физике, кажется непривлекательной (и в любом случае имеет мало сторонников), разумным представляется ожидать, что в будущем больше усилий будет приложено к разработке моделей объяснения, чувствительных к различиям научных дисциплин. В идеале такие модели будут выявлять общие для разных дисциплин свойства, но одновременно они также должны позволять нам понять, почему объяснительная практика в них так различается и в чём состоит значение этих различий. Например, как отмечалось выше, биологи, в отличие от физиков, часто описывают цели объяснения как открытие скорее механизмов, чем законов. Хотя и возможно, что эта разница чисто терминологическая, стоит также рассмотреть возможность того, что можно сказать нечто специфическое о том, что такое механизм (в том смысле, в котором это понятие используется биологами) и что именно информация о механизмах добавляет к объяснению.

С этим тесно связан тот факт, что по меньшей мере некоторые из описанных выше моделей налагают на объяснение требования, которые в некоторых областях исследования могут быть удовлетворены, в то время как либо окажутся недостижимыми (в любом практическом смысле слова) в других дисциплинах, либо в той мере, в которой они будут в них достижимы, не будут иметь никакого очевидного отношения к общепринятым в данной дисциплине целям исследования. Например, выше мы отмечали, что многие учёные и философы придерживаются мнения, что в биологии и науках об обществе и поведении законов, которые можно открыть, либо мало, либо вовсе нет. Если это так, то модели объяснения, в которых центральную роль играют законы, мало что сообщат нам о том, как работает объяснение в этих дисциплинах. Возьмём иной пример: даже если мы предположим, что рекомендуемое СР-моделью разделение на объективно однородные классы представляет собой цель, достижимую в связи с определёнными явлениями в области квантовой механики, может оказаться (как предполагается выше), что эта цель попросту недостижима каким-либо значимым образом в экономике и социологии — дисциплинах, где каузальные выводы, делаемые на основании статистических данных, также играют важную роль. В подобных дисциплинах может оказаться, что дополнительное статистически релевантное разделение любого интересующего исследователей множества или подмножества будет, фактически, всегда возможно, так что обнаружение таких разделений окажется ограниченным лишь издержками на сбор дополнительной информации. Подобная оценка может оказаться справедливой для большинства применений КМ-модели в области общественных наук.

 

Библиография

          • Achinstein, P., 1983, The Nature of Explanation, New York: Oxford University Press.

          • Achinstein, P., 2010, Evidence, Explanation, and Realism: Essays in Philosophy of Science, New York: Oxford University Press.

          • Barnes, E., 1992, ‘Explanatory Unification and the Problem of Asymmetry.’ Philosophy of Science, 59: 558–71.

          • Braithwaite, R., 1953, Scientific Explanation, Cambridge: Cambridge University Press.

          • Bromberger, S., 1966, ‘Why Questions’, in Mind and Cosmos: Essays in Contemporary Science and Philosophy, R. Colodny, (ed), Pittsburgh: University of Pittsburgh Press.

          • Cartwright, N., 1979, ‘Causal Laws and Effective Strategies’ Noûs, 13: 419–437.

          • Cartwright, N., 1983, How the Laws of Physics Lie, Oxford: Clarendon Press.

          • Cartwright, N., 2004, ‘From Causation to Explanation and Back’ In B. Leiter (ed) The Future for Philosophy Oxford: Oxford University Press.

          • De Regt, H. and Dieks, D., 2005, “A Contextual Account of Scientific Understanding”, Synthese144: 137–170.

          • Dowe, P., 2000, Physical Causation, Cambridge: Cambridge University Press.

          • Earman, J., 1986, A Primer on Determinism, Dordrecht: Reidel.

          • Friedman, M., 1974, ‘Explanation and Scientific Understanding’, Journal of Philosophy, 71: 5–19.

          • Gardiner, P., 1959, The Nature of Historical Explanation, Oxford: Oxford University Press.

          • Gardiner, P.,(ed), 1952, Theories of History. New York: The Free Press.

          • Goodman, N., 1955, Fact, Fiction, and Forecast, Cambridge, MA: Harvard University Press.

          • Greeno, J., 1970, ‘Evaluation of Statistical Hypotheses Using Information Transmitted’, Philosophy of Science, 37: 279–93. Reprinted in Salmon, 1971b.

          • Hall, N., 2004, ‘Two Concepts of Causation’, in Causation and Counterfactuals. J. Collins, N. Hall, and L.Paul (eds), Cambridge: MIT Press, pp. 225–276.

          • Hausman, D. and Woodward, J., 1999, ‘Independence, Invariance, and the Causal Markov Condition.’, British Journal for the Philosophy of Science, 50: 521–583.

          • Hausman, D., 1998, Causal Asymmetries, Cambridge: Cambridge University Press.

          • Hausman, D., 1998, Causal Asymmetries, Cambridge: Cambridge University Press.

          • Hempel, C. and P. Oppenheim., 1948, ‘Studies in the Logic of Explanation.’, Philosophy of Science, 15: 135–175. Reprinted in Hempel, 245–290, 1965a.

          • Hempel, C., 1942, ‘The Function of General Laws in History’, Journal of Philosophy, 39: 35–48; reprinted in Hempel 1965b, pp. 231–244.

          • Hempel, C., 1965a, Aspects of Scientific Explanation and Other Essays in the Philosophy of Science, New York: Free Press.

          • Hempel, C., 1965b, ‘Aspects of Scientific Explanation.’ In Hempel 1965a, 331–496.

          • Hitchcock, C., 1995, ‘Discussion: Salmon on Explanatory Relevance.’, Philosophy of Science, 62: 304–20.

          • Janzing, D., Mooij, J., Zhang, K., Lemeire, J., Zscheischler, J., Daniusis, D., Steudel, B. and Scholkopf, B., 2012. “Information-geometric Approach to Inferring Causal Directions”, Artificial Intelligence 182–183: 1–31.

          • Jeffrey, R., 1969, ‘Statistical Explanation vs. Statistical Inference’ in N. Rescher (ed.), Essays in Honor of Carl G. Hempel. Dordrecht: D. Reidel. Reprinted in Salmon, 1971b.

          • Kitcher, P and Salmon, W., 1987, “Van Fraassen on Explanation”, Journal of Philosophy 84: 315–330.

          • Kitcher, P., 1989, ‘Explanatory Unification and the Causal Structure of the World’, in Scientific Explanation, P. Kitcher and W. Salmon, 410–505. Minneapolis: University of Minnesota Press.

          • Koertge, N., 1992, ‘Explanation and Its Problems.’, British Journal for the Philosophy of Science, 43: 85–98.

          • Kyburg, H., 1965, ‘Comment.’, Philosophy of Science, 32: 147–51.

          • Lewis, D., 1973a, Counterfactuals, Cambridge, MA: Harvard University Press.

          • Lewis, D., 1973b, ‘Causation.’, Journal of Philosophy, 70: 556–67. Reprinted with Postscripts in Lewis, 1986, 159–213.

          • Lewis, D., 1986, Philosophical Papers, Volume II, Oxford: Oxford University Press.

          • Lewis, D., 2000, ‘Causation as Influence.’, Journal of Philosophy, 97: 182–197.

          • Lien, Y., and Cheng, P., 2000, “Distinguishing genuine from spurious causes: a coherence hypothesis”, Cognitive Psychology, 40: 87–137.

          • Lombrozo, T., 2010, “Causal-Explanatory Pluralism: How Intentions, Functions, and Mechanisms Influence Causal Ascriptions”, Cognitive Psychology, 61: 303–32.

          • Mitchell, S., 1997, ‘Pragmatic Laws’ PSA 96 (Supplement to Philosophy of Science, 64 (4): S468–S479.

          • Morrison, M., 2000, Unifying Scientific Theories, Cambridge: Cambridge University Press.

          • Nagel, E., 1961, The Structure of Science: Problems in the Logic of Scientific Explanation, New York: Harcourt, Brace and World.

          • Nerlich, G., 1979, ‘What Can Geometry Explain?’ British Journal for the Philosophy of Science, 30: 69–83.

          • Norton, J., forthcoming, “A Material Dissolution of the Problem of Induction”, Synthese.

          • Pearl, J., 2000, Causality: Models, Reasoning and Inference, Cambridge: Cambridge University.

          • Pitt, J. (ed.), 1988, Theories of Explanation. New York: Oxford University Press.

          • Popper, K., 1959, The Logic of Scientific Discovery, London: Hutchinson.

          • Psillos, S., 2002, Causal Asymmetries, Stocksfield, UK: Acumen Publishing.

          • Railton, P., 1978, ‘A Deductive-Nomological Model of Probabilistic Explanation.’, Philosophy of Science, 45: 206–26.

          • Railton, P., 1981, ‘Probability, Explanation, and Information.’, Synthese, 48: 233–56.

          • Ruben, D., (ed.), 1993, Explanation, Oxford: Oxford University Press.

          • Salmon, W. and Kitcher, P., (eds.), 1989, Minnesota Studies in the Philosophy of Science, Vol 13: Scientific Explanation, Minneapolis: University of Minnesota Press.

          • Salmon, W., (ed.), 1971b, Statistical Explanation and Statistical Relevance, Pittsburgh: University of Pittsburgh Press.

          • Salmon, W., 1971a, ‘Statistical Explanation’, in Statistical Explanation and Statistical Relevance, W. Salmon, (ed.), 29–87, Pittsburgh: University of Pittsburgh Press.

          • Salmon, W., 1984, Scientific Explanation and the Causal Structure of the World, Princeton: Princeton University Press.

          • Salmon, W., 1989, Four Decades of Scientific Explanation, Minneapolis: University of Minnesota Press.

          • Salmon, W., 1994, ‘Causality Without Counterfactuals.’, Philosophy of Science, 61: 297–312.

          • Salmon, W., 1997, ‘Causality and Explanation: A Reply to Two Critiques.’, Philosophy of Science, 64: 461–477.

          • Salmon, W., 1989, Four Decades of Scientific Explanation, Minneapolis: University of Minnesota Press.

          • Schaffer, J., 2000, ‘Causation by Disconnection.’, Philosophy of Science, 67: 285–300.

          • Scriven, M., 1959, ‘Truisms as the Grounds of Historical Explanations.’, In Gardiner (ed.).

          • Scriven, M., 1962, ‘Explanations, Predictions, and Laws’, in Scientific Explanation, Space, and Time (Minnesota Studies in the Philosophy of Science: Vol. 3), H. Feigl and G. Maxwell (eds), 170–230. Minneapolis: University of Minnesota Press.

          • Sober, E., 1983, ‘Equilibrium Explanation’, Philosophical Studies, 43: 201–210.

          • Sober, E., 1999, ‘The Multiple Realizability Argument Against Reductionism’ Philosophy of Science, 66: 542–564.

          • Sober, E., 2003, ‘Two Uses of Unification’, in F. Stadler, ed., Institute Vienna Circle Yearbook 2002, Dordrecht: Kluwer.

          • Spirtes, P. Glymour, C. and Scheines, R., 1983, Causation, Prediction and Search, New York: Springer-Verlag. Second Edition, 2000. Cambridge: MIT Press.

          • Van Fraassen, B., 1980, The Scientific Image. Oxford: Oxford University Press.

          • Woodward, J., 1989, ‘The Causal/Mechanical Model of Explanation.’, In Scientific Explanation. Minnesota Studies in the Philosophy of Science, volume 13, P. Kitcher and W. Salmon (eds.), 357–383.

          • Woodward, J., 2000, ‘Explanation and Invariance in the Special Sciences.’, British Journal for the Philosophy of Science, 51: 197–254.

          • Woodward, J., 2003, Making Things Happen: A Theory of Causal Explanation, Oxford: Oxford University Press.

          • Woodward, J., 2003, Making Things Happen: A Theory of Causal Explanation, New York: Oxford University Press.

          • Woodward, J., 2006, “Sensitive and Insensitive Causation”, The Philosophical Review.115: 1–50.

             

            Перевод М.В. Семиколенных и М.А. Секацкой


            Примечания

            [1] См. [Cartwright 2004], где ставится сходный диагноз и предлагается ещё один обзор описанных здесь проблем.

            [2] В дополнение к [Hempel 1965] и [Salmon 1989] см. также [Cartwright 1983], [Earman 1986, 80–110] и [van Fraassen 1989].

            [3] В качестве иллюстрации такого подхода рассмотрим рассуждение Гемпеля о «подкреплении контрфактических высказываний» как критерии, позволяющем отличить законы от случайных обобщений в его [Hempel 1965]. Хотя Гемпель соглашается, что само по себе подкрепление контрфактических высказываний позволяет отличить закон от обобщения, он также полагает, что контрфактические высказывания «являются причиной печально известных философских затруднений» [Ibid., 339] и поэтому не могут использоваться для составления какого-либо независимого суждения, отделяющего законы от случайным образом соответствующих истине обобщений.

            [4] В дополнение к тому, что законы должны представлять собой обобщения, из которых нет исключений, они также не должны содержать терминов, отсылающих к конкретным объектам или местам, и должны включать в себя лишь проектируемые предикаты в том смысле, который вкладывает в это понятие Гудман [Goodman 1955].

            [5] Сходную оценку см. в [Salmon 1989, 15].

            [6] Например, согласно Сэлмону [Salmon 1984], все «почему»-объяснения являются каузальными, а каузальные объяснения требуют прослеживать каузальные процессы и их пересечения (см. Раздел 4). Грэхем Нерлих [Nerlich 1979], напротив, хотя он в целом согласен с Сэлмоном по вопросу о том, что считать каузальным объяснением, полагает, что существует важная некаузальная форма объяснения, которую он называет геометрическим объяснением: например, объяснение траекторий свободных частиц в гравитационном поле отсылкой к аффинному строению пространства-времени. Сэлмон, скорее всего, не согласился бы, что такая отсылка что-либо объясняет. Собер [Sober 1983] предлагает иначе различать каузальные и некаузальные формы объяснения: он противопоставляет объяснения, которые прослеживают существующую в действительности последовательность событий, приводящую к некому исходу (такие объяснения он считает каузальными), некаузальной форме объяснения, называемой им равновесным объяснением, в котором исход объясняется демонстрацией того, что очень большое количество начальных состояний системы в своём развитии приводит к конечному состоянию или исходу, который мы желаем объяснить; при такой демонстрации не делается попыток проследить конкретную последовательность событий, ведущую к этому исходу.

            [7] Этот довод основан на допущении, что, как только мы детально изложили всю релевантную информацию, не упустив из вида ничего, что имеет значение, — мы дали объяснение. Иными словами, предполагается, что ситуация, в которой всей имеющей отношение к некому М информации недостаточно для его объяснения, невозможна. Назовём этот аргумент «Нечего Больше Сказать»-аргументом (НБС). Многие другие подходы к объяснению (например, [Railton 1978]) содержат сходное допущение. Его истинность далеко не самоочевидна. Почему не может случиться так, что даже изложения всей релевантной для некого экспланандума номической и каузальной информации окажется недостаточно для его объяснения? Почему не может быть попросту необъяснимых экспланандумов? В качестве предельной вероятности вообразим экспланандум (событие М), который не обусловлен какими-либо законами, не имеет причин и частота возникновения которого непредсказуемым образом изменяется в пространстве и времени. Если об М нельзя сказать ничего, кроме того, что это событие иногда спонтанно происходит, значит ли это, что такая информация объясняет его возникновение? Противоположная интуиция заключается в том, что возникновение М — парадигмальный случай того, что мы не можем объяснить. Если это верно, НБС-аргумент в общем случае не выдерживает проверки, и встаёт вопрос, почему мы должны принимать его в частном случае, в котором вся имеющая отношение к исходу информация определяет лишь его вероятность. Иными словами, зачем принимать тезис, общий для ИС- и СР-моделей, что статистические теории объясняют конкретные исходы? Этот вопрос более подробно обсуждается ниже.

            [8] Некоторые авторы полагают, что детерминистическая интерпретация структурных уравнений опциональна; предел ошибки, наличествующий в подобных уравнениях, может пониматься как отражение суммарного воздействия подлинно индетерминистического процесса. Также можно утверждать, что, хотя общепринятые методы каузального моделирования допускают детерминистичность макроскопических причин подростковой преступности, это не исключает возможности, что на неком микроуровне протекают влияющие на неё индетерминистические процессы. Если это утверждение верно, методы каузального моделирования безразличны к индетерминизму. Однако этого недостаточно для того, чтобы обосновать применение СР-модели к примерам, охватываемым методами каузального моделирования, поскольку СР-модель требует индетерминизма. Я благодарю Эллиота Собера за полезные комментарии по этому вопросу.

            [9] Рискуя истощить терпение читателей, я всё-таки осмелюсь добавить, что отказ от взглядов Гемпеля и Сэлмона о том, в каких случаях можно говорить о статистическом объяснении отдельных исходов и о структуре таких объяснений, не требует от нас утверждения, что мы никак не можем объяснить отдельные непредопределённые исходы. Из этого, однако, следует, что, если такие объяснения непредопределённых исходов существуют, они будут структурно отличаться от ИС- и СР-моделей. С моей точки зрения, индетерминистские контексты, в которых естественнее всего рассуждать в терминах объяснения конкретных исходов, — это контексты, в которых действуют индетерминистические причины, и такие объяснения, по-видимому, имеют структуру, весьма отличную от той, что описывается ИС- или СР-моделью. Рассмотрим следующий пример действия индетерминистической причины, основанный на [Dretske and Snyder 1972]. Некоторое количество радиоактивного вещества помещено в камеру на конкретный период времени. Если за это время произойдёт радиоактивный распад, сработает счётчик Гейгера, который впустит в камеру ядовитый газ, убив находящегося там кота. Предположим, что распад произошёл и кот умер. В этом случае кажется естественным счесть помещение радиоактивного вещества в камеру одновременно причиной и частью объяснения смерти кота, даже если связь между этими двумя событиями индетерминистична. В качестве контраста к ИС- и СР-модели рассмотрим следующее (очень грубое и схематичное) предложение (ср. [Woodward 2003]): для использования S (помещения в камеру радиоактивного вещества) для объяснения D (смерти кота) достаточным будет соблюдения следующих трёх условий. (i) S и D произошли, (ii) если бы S не произошло, не случилось бы и D, (iii) вероятность p смерти кота D, если произошло S, выше нуля по меньшей мере в некоторых других случаях, когда происходит S, — где условные утверждения в (ii) и (iii) интерпретируются как утверждения, не подразумевающие обратной контрфактической зависимости (non-backtracking counterfactuals). Назовём это моделью вероятностной каузальности (ВК). (Формулировка (i)–(iii) должна применяться только в случаях, когда от S к D ведёт один-единственный каузальный маршрут и отсутствуют упреждающие (preemptive) или потенциально дублирующие (back up) причины.) ВК-модель заметно отличается как от ИС-, так и от СР-модели. В противоположность ИС-модели и в согласии с СР-моделью, согласно ВК-модели, величина вероятности p не имеет значения для приемлемости даваемого объяснения. Даже если вероятность радиоактивного распада очень низка, если он произойдёт и будет пущен газ, помещение радиоактивного вещества в камеру станет одновременно причиной и объяснением смерти кота. Это воспроизводит наше первоначальное суждение об этом примере. Но, в противоположность СР-модели, из ВК-модели не следует, что, если произойдут S и −D, то S объяснит −D. Это происходит потому, что в результате замены D на −D в (ii) мы получаем ложное контрфактическое высказывание.

            [10] См. в особенности [Cartwight 1979] и [Spirtes, Glymour and Scheines 1993, 2000].

            [11] См., например, [Spirtes, Glymour and Scheines 1993, 2000; Pearl 2000; Hausman and Woodward 1999].

            [12] Пример приводится в [Salmon 1984] и впоследствии обсуждается в [Spirtes, Glymour, and Scheines 1993, 2000]. Столкновение C между битком и двумя другими биллиардными шарами посылает первый в правую лузу (A), а второй — в левую (B). C является общей причиной A и B, а A не является причиной B (и наоборот). Тем не менее из-за сохранения импульса информация о том, что произошло A, сообщает нам о том, произошло ли B, даже при наличии C. Иными словами, A статистически релевантно для B при условии C, несмотря даже на то, что A не является причиной B. Если следовать интуиции, то проблема заключается в том, что свойство C слишком общее. Поскольку система, предположительно, является детерминистической на более детальном уровне описания, где мы указываем конкретные положения и импульсы шаров М, обусловленность М сделает А независимым от (или иррелеваным по отношению к) B. Но если мы используем недостаточно подробно описанные переменные наподобие C, связи между причинностью и статистической релевантностью, предполагаемой и каузальным условием Маркова, и СР-моделью, не будет.

            [13] В психологии развития доказано (например, [Leslie and Keeble 1987]), что очень маленькие дети чувствительны к разнице между изменением траекторий движущихся мячей, при котором между мячами происходит пространственно-временной контакт, и изменениями траекторий в отсутствие такого контакта. Взрослые с гораздо большей готовностью воспринимают (или оценивают) первый вид изменений как предполагающий каузальные взаимодействия. Можно сделать вывод, что при вынесении таких суждений задействованы психологические механизмы, которые также лежат в основе того, что мы склонны отдавать предпочтение каузальным объяснениям, в которых описывается действие посредством контакта. Но, хотя пространственно-временные указания помогают выделить каузальные взаимодействия в некоторых случаях (например, при столкновениях), как мы увидим ниже, в других случаях они мало помогают и, на самом деле, могут ввести в заблуждение. Поэтому, хотя с точки зрения психологии может быть вполне естественным отдавать предпочтение каузальным объяснениям, свободным от пространственно-временных разрывов, сомнительно, что они обеспечат надёжный фундамент для построения общей теории каузального объяснения.

            [14] Случаи причинности как бездействия — это случаи, когда, говоря интуитивно, отсутствие некоторого события приводит к результату (например, когда непредоставление врачом медицинской помощи приводит к смерти пациента). В таких случаях не происходит передачи энергии или импульса от причины к действию, и нет процесса, который претендовал бы на роль посредника между ними. Некоторые авторы (например, Доу [Dowe 2000]) делают на этом основании вывод, что причинность как бездействие — это не настоящая причинность, хотя она обладает некоторыми характеристиками, которые делают её сходной с примерами подлинной причинности. Если отсутствие действия может быть причиной или использоваться в каузальном объяснении, то это представляет собой очевидную проблему для таких теорий каузальных процессов, как теория Сэлмона. Примеры причинности как двойного предотвращения или разрыва связи — это случаи, когда фактор С предотвращает действие второго фактора, D, или изменяет его в ситуации, когда наличие фактора D мешает возникновению E. Устранив препятствующий Е фактор D, С обеспечивает появление Е. Примеры такой причинности широко распространены в биологии (см. [Schaffer 2000; Woodward 2002]). Более общее обсуждение этого явления см. в [Hall, forthcoming; Lewis 2000]. И опять, если мы согласны, что причинность как разрыв связи обеспечивает (научное) объяснение, возникает проблема для теории каузальных процессов (по крайней мере, в том её виде, в котором она сформулирована Сэлмоном).

            [15] Можно спросить, каковы основания такого суждения. Разве весь объём газа целиком не может быть «помечен» (например, нагреванием), и не будет ли он перемещать эту метку — по крайней мере некоторое время?

            [16] Напомним о замечании, сделанном в связи со стратегией скрытой структуры: объяснения более низкого уровня, «лежащие в основе» объяснений более высокого уровня, не всегда будут «идеальными» с той точки зрения, с которой оцениваются объяснения более высокого уровня.

            [17] Моррисон [Morrison 2000] подчёркивает гетерогенность унификации и приводит ряд примеров, иллюстрирующих тезис, что многие виды унификации, по-видимому, имеют мало общего с объяснением. Собер [Sober 1999, forthcoming], настаивает, что во многих случаях мы предпочитаем унифицированные теории их менее унифицированным конкурентам, поскольку первые дают лучшие объяснения, чем вторые. Иными словами, унификация — эпистемическое преимущество, имеющее отношение к подтверждению, но не объяснительное преимущество.

            [18] Эти замечания затушевывают некоторые сложные проблемы. Некоторые классификационные схемы используют каузальную или этиологическую информацию как основание для построения классификаций. Можно утверждать, что такие классификационные схемы являются не просто описательными, а объяснительными, поскольку «привлекают» каузальную информацию и «отсылают» к ней. Однако представляется очевидным, что существуют и иные классификационные схемы, не руководствующиеся каузальной информацией, но тем не менее добивающиеся сжатия информации. Такие классификации не дают каузальных объяснений.

            [19] Собер [Sober 1999, 551] настаивает на более сильном, хотя и родственном тезисе, что не существует «объективной причины» предпочесть унифицированные объяснения неунифицированным: что именно мы предпочтём, будет зависеть от того, объяснение чего именно нас интересует. Он также отмечает, что объяснения, часто отсылающие к микро-подробностям, которые такие философы, как Китчер, считают «менее унифицированными», чем объяснения, абстрагирующиеся от таких подробностей (и потому применимые к системам с другой микроструктурой), не следует рассматривать как конкурирующий вид объяснений (то есть нам не нужно выбирать между более подробными и более абстрактными объяснениями). Достаточно заглянуть в любой учебник по молекулярной биологии, чтобы доказать, что Собер прав, когда полагает, что учёные не всегда предпочитают объяснения, абстрагирующиеся от микро-подробностей, и что нам следует отвергнуть любую теорию объяснения, автоматически требующую такого абстрагирования. Разумеется, остаётся предметом дальнейшего обсуждения вопрос о том, следует ли рассматривать абстрагирующие объяснения как «более унифицированные». На самом деле, объяснения, обращающиеся к микро-подробностям, обычно более интегрированы с фундаментальными физическими и химическими теориями, и в этом отношении их можно назвать более унифицированными.

            [20] Аналогичная проблема касается предположения, будто всякое объяснение обладает ДН-структурой, если только нельзя задействовать какой-либо вариант стратегии скрытой структуры.

            [21] Вспомним, в частности, что на предполагаемые контрпримеры, призванные доказать, что ДН-модель не в состоянии отразить направленность объяснения, заявляя, что такую направленность следует интерпретировать с точки зрения скорее «прагматики», чем свойств, описываемых традиционной, непрагматической теорией. Критиков обычно поражало, что такой ответ был очень ad hoc. Как ни странно, представления ван Фраассена о причинах объяснительной асимметрии совпадают с мнением Гемпеля на этот счёт (как будет показано ниже), хотя во многих отношениях его теория является диаметрально противоположной теории Гемпеля. Можно сказать, что ван Фраассен просто обобщает предложенную Гемпелем интерпретацию объяснительной асимметрии, полностью относя объяснение к области прагматического.

            [22] Я пишу здесь «нередко» из-за следующего осложнения: сторонники прагматических подходов иногда пишут так, словно они вовлечены в исследовательский проект, отличающийся от традиционного (в том смысле, что их задача — дать характеристику понятию объяснения, согласно которому, например, одна и та же совокупность информации для одной аудитории будет объяснением, а для другой — нет, и цель состоит в том, чтобы установить, что именно является общим для всех или большинства случаев использования слова «объяснение»: то есть речь идёт о понятии объяснения, попросту не интересующем традиционные теории). Если говорить о прагматических теориях таким образом, то их можно рассматривать как дополнение к традиционному проекту, а не его конкурентов. Поэтому у сторонников традиционных подходов, в принципе, нет причин возражать против подходов прагматических, хотя традиционалисты и могут быть скептиками в отношении результатов таких проектов. Однако, поскольку сторонники прагматических подходов обычно стремились использовать их для критики традиционных теорий, они, предположительно, не рассматривали свою работу исключительно под вышеописанным углом. Это — одна из нескольких ситуаций, в которых полезно было бы прояснить цели как традиционалистов, так и их критиков-прагматиков.

            [23] Мне не известно о каком-либо систематическом историческом исследовании такого использования понятия «прагматический» в связи с теориями объяснения. Согласно одному предположению (всего лишь предположению!), его источник следует искать в лингвистике и, в частности, в противопоставлении синтаксиса и семантики (часто понимаемых как «объективные» или приемлемые предметы общих, систематических исследований), с одной стороны, и «прагматики», которую связывают с использованием языка конкретными людьми для обращения к конкретной аудитории в определённых ситуациях для достижения конкретных результатов, — с другой. Это понятие «прагматического» предполагает наличие связи со специфическими психологическими характеристиками конкретных носителей языка и конкретными контекстами и противопоставляется подходам, которые выявляют «синтаксис» или «семантику» объяснения.

            [24] Соответствующее понятие неизменности (стабильности) обсуждается в [Woodward 2006].

            [25] Этот пример также напоминает нам, что попытки охарактеризовать с традиционных позиций характерные особенности объяснительных (или, по крайней мере, каузальных) отношений вовсе не обязательно должны предприниматься лишь философами: их также можно обнаружить в области машинного обучения (см., например, [Janzing et al. 2012]) и в нормативных теориях каузального суждения, предложенных психологами (например, [Lombrozo 2010] и [Cheng 2000]).

            [26] В очень здравом обсуждении прагматических теорий объяснения Сэлмон [Salmon 1989] подчёркивает, что и теория ван Фраассена, и теория Ахинштайна не смогли охарактеризовать объективное отношение объяснительной релевантности. Хотя здесь он и прав, его замечания не принимают всерьез мнение ван Фраассена и Ахинштайна, что такое описание невозможно.

            [27] С этим тесно связан тот факт, что описание, «связывающее» некоторые характерные черты объяснения с контекстом, может подчас быть, так сказать, «отвязанным»: для этого надо показать, как эти особенности зависят от контекста, — иными словами, предполагаемая контекстуальность может быть всего лишь отражением того факта, что какая-то важная особенность не была выявлена. Например, может показаться, что экспланандум, чей противопоставленный класс остался подразумеваемым, подкрепляет представление о том, что объяснение чувствительно к контексту (например, что допустимы разные объяснения искривления провода в зависимости от контекста), но по меньшей мере иногда мы можем развеять это предположение, выявив противопоставленный класс. Можно сказать, что, как только мы ясно покажем, что нас интересует, почему один провод погнут, тогда как другие остались прямыми, вопрос о том, существует ли эксплананс, улавливающий это противопоставление, станет «объективным». Поэтому представляется, что нам следует рассматривать радикальную прагматическую теорию (подобную теории Ахинштайна и, возможно, ван Фраассена) как такую теорию, в которой благодаря выявлению контекста показывается, что контекстуальный элемент невозможно устранить (то есть его нельзя устранить, не выйдя за рамки объективистских ограничений).

            [28] Соглашаемся ли мы с такой оценкой, отчасти зависит от того, считаем ли мы возможным существование некаузальных форм почему-объяснений (в широком и не вполне определённом смысле понятия «почему-объяснения», о котором говорилось в разделе 1). Если мы считаем их возможными, то более адекватная теория причинности лишь отчасти позволит нам продвинуться к построению более удовлетворительной теории объяснения.

            [29] Важные современные работы включают [Hall, forthcoming; Lewis 1986, 2000; Pearl 2000; Spirtes, Glymour and Scheines 1993, 2000].

            [30] Эта асимметрия тесно связана с тем фактом, что длина тени — результат действия нескольких разных факторов, изменяющихся независимо друг от друга: высоты флагштока, его положения и углового положения солнца над горизонтом. Можно менять длину тени, меняя два последних фактора, и при этом высота флагштока останется неизменной. См. [Hausman 1998] и [Woodward 2003].

            [31] Изложение этой основополагающей идеи см. в [Lewis 1973a].

            [32] Подобное наблюдение см. в [Psillos 2002]. Отметим, однако, что, хотя это логическое обоснование и подводит к теории, поясняющей, почему желательно создавать объяснения, отсылающие к законам (когда это возможно), неясно, как именно мы приходим к результату, что объяснение всегда требует ссылки на законы. Возможно, существуют обобщения достаточно унифицированные, чтобы считаться объяснительными, согласно теории унификации, но при этом не рассматривающиеся как законы в рамках МРЛ-теории. Вариант унификационистской модели, предложенный Китчером, по-видимому, признаёт существование такой возможности.

            [33] См. [Woodward 2003, 288–295, 358–373].


            Как цитировать эту статью

            Вудвард, Джеймс. Научное объяснение // Стэнфордская философская энциклопедия: переводы избранных статей / под ред. Д.Б. Волкова, В.В. Васильева, М.О. Кедровой. URL=<http://philosophy.ru/scientific-explanation/>.

            Оригинал: Woodward, James, "Scientific Explanation", The Stanford Encyclopedia of Philosophy (Spring 2017 Edition), Edward N. Zalta (ed.), forthcoming URL = <https://plato.stanford.edu/archives/spr2017/entries/scientific-explanation/>.

              

            Нашли ошибку на странице?
            Выделите её и нажмите Ctrl + Enter