Энциклопедия

Научное объяснение

Со времён досократиков и до наших дней проблемы, связанные с научным объяснением, привлекали внимание философов. Однако современные дискуссии по-настоящему начались с разработки Дедуктивно-Номологической (ДН) модели. У неё было немало сторонников (включая Поппера [1935, 1959], Брейтуэйта [1953], Гардинера [1959] и Нагеля [1961]), но наиболее подробное и влиятельное её изложение, безусловно, принадлежит Карлу Гемпелю [Hempel 1942, 1965; Hempel & Oppenheim 1948]. Эти статьи и реакция на них в значительной степени заложили основу для последующего обсуждения понятия научного объяснения. После нескольких общих замечаний о подоплёке этих дебатов и направлении, в котором они развивались (Раздел 1), мы опишем ДН-модель и её варианты, а затем обратимся к некоторым известным возражениям к ней (Раздел 2). Затем последует изложение истории различных попыток предложить альтернативную модель объяснения, включая модель Статистической релевантности Уэсли Сэлмона (Раздел 3), Каузально-механическую модель (Раздел 4) и Унификационистскую модель, предложенную Майклом Фридманом и Филипом Китчером (Раздел 5). В Разделе 7 резюмируется содержание статьи и обсуждаются направления дальнейших исследований.

 

1. Контекст и введение

2. ДН-модель

2.1. Основная идея

2.2. Роль законов в ДН-модели

2.3. Индуктивное статистическое объяснение

2.4. Мотивация ДН-модели: Номическая вероятность и теория причинности как регулярности

2.5. Объяснительное понимание и номическая ожидаемость: Контрпримеры к достаточности

2.6. Стратегия скрытой структуры

3. СР-модель

3.1. Основная идея

3.2. СР-модель и события малой вероятности

3.3. Что объясняют статистические теории?

3.4. Причинность и отношения статистической релевантности

4. Каузально-механическая модель

4.1. Основная идея

4.2. КМ-модель и объяснительная релевантность

4.3. КМ-модель и сложные системы

4.4. Современные исследования

5. Унификационистское описание объяснения

5.1. Основная идея

5.2. Иллюстрации к унификационистской модели

5.3. Критика иллюстраций

5.4. Гетерогенность унификации

5.5. Концепция «Победитель получает всё»

5.6. Эпистемология унификации

6. Прагматические теории объяснения

6.1. Введение

6.2. Конструктивный эмпиризм и прагматическая теория объяснения

6.3. Объяснение как иллокутивный акт

6.4. Заключительные соображения о прагматических теориях

7. Выводы, открытые вопросы и направления дальнейших исследований

7.1. Роль причинности

7.2. Объяснение и другие эпистемические цели

7.3. Возможна ли единая модель объяснения?

Библиография

 

1. Контекст и введение

Как вскоре станет ясно, проблема «научного объяснения» ставит перед исследователем несколько взаимосвязанных вопросов. Прежде чем обратиться к подробному обсуждению конкурирующих моделей, будет полезно дать небольшое введение в проблему. Исходной предпосылкой большинства недавних дискуссий было то, что иногда наука даёт нам объяснения (а не то, что до объяснения не дотягивает — например, «простое описание»), и задача «теории» или «модели» научного объяснения — охарактеризовать структуру таких объяснений. Таким образом, предполагается, что существует (на некоем достаточно абстрактном и общем уровне описания) единственный вид или форма объяснения, являющегося «научным». На деле понятие «научного объяснения» предполагает наличие по меньшей мере двух противопоставлений: во-первых, противопоставления тех «объяснений», которые типичны для «науки» и тех, которые для неё не типичны; во-вторых, противопоставления «объяснений» и того, что не является объяснением. Однако, если говорить о первом противопоставлении, чаще всего в современной философской литературе считается, что существует значительная преемственность между теми видами объяснений, которые приняты в науке, и, по меньшей мере, некоторыми формами объяснения, используемыми в более повседневном, ненаучном контексте, причём последние в большей или меньшей степени обладают теми чертами, которые в детально проработанной, точной, строгой и т. д. форме характерны для первых. Далее, считается, что задача теории объяснения — понять, какие черты являются общими как для научного, так и для хотя бы некоторых более повседневных форм объяснения. Эти допущения помогают объяснить то, что в иной ситуации могло бы вызвать недоумение читателя, а именно, почему (как покажет эта статья) дискуссии о научном объяснении так часто используют как примеры, заимствованные из подлинной науки (например, объяснения траекторий движения планет, отсылающие к ньютоновской механике), так и более обыденные, в том числе опрокидывание чернильниц.

Если же говорить о втором противопоставлении, то, согласно большинству моделей объяснения, некий набор заявлений может быть истинным, точным, подкреплённым доказательствами и т. п., и, однако, ничего не объясняющим (по меньшей мере, ничего, чему типичный искатель объяснений хотел бы найти объяснение). Например, все приведённые ниже модели научного объяснения будут согласны между собой в том, что описание облика конкретного вида птиц, которое можно найти в соответствующем указателе, сколь бы точным оно не было, не является объяснением чего-либо, что может заинтересовать биолога (например, развития, характерных черт или поведения представителей вида). Такие описания являются «всего лишь дескриптивными». Однако различные модели объяснения по-разному определяют, в чем состоит противопоставление объясняющего и всего лишь дескриптивного описания.

С этим связана и другая проблема: хотя большинство создателей теорий научного объяснения предложили модели, включающие, по меньшей мере, некоторые случаи объяснения, которые мы не сочли бы относящимися к сфере науки, они, тем не менее, предполагали некоторые имплицитные ограничения того, какие виды объяснения они стремятся реконструировать. Нередко отмечалось, что слово «объяснение» (explanation) используется в повседневной речи по-разному: мы говорим об объяснении значения слова, объяснении подоплёки философских теорий объяснения, объяснении того, как испечь пирог, объяснении того, почему было принято определённое решение (то есть, обоснование решения) и т. п. Хотя различные обсуждаемые ниже модели иногда критиковали за то, что они не могли охватить все эти формы «объяснения» [см., например, Scriven, 1959], очевидно, что это никогда и не было их целью. Вместо этого они, грубо говоря, стремились к объяснению того, почему случаются те или иные вещи, причём под «вещами» здесь можно понимать как конкретные события, так и нечто более общее: например, регулярности или повторяющиеся явления в природе. Парадигмы такого вида объяснения включают объяснение смещения перигелия Меркурия в рамках общей теории относительности, объяснение вымирания динозавров падением большого астероида в конце Мелового периода, предоставленное полицией объяснение автомобильной аварии (водитель был пьян, а на дороге — гололёд) и приводящееся в учебниках экономики стандартное объяснение того, почему монополии (в отличие от фирм на совершенно конкурентном рынке) будут повышать цены, сокращая выпуск продукции.

Наконец, скажем несколько слов о более широком эпистемологическом/методологическом контексте описанных ниже моделей. Многие философы считают такие понятия, как «объяснение», «закон», «причина» и «подкрепление контрфактуальных высказываний», принадлежащими к взаимосвязанному семейству или кругу «модальных» понятий. По хорошо знакомым «эмпирическим» мотивам Гемпель (и многие другие ранние сторонники ДН-модели) считал эти понятия недостаточно ясными — по меньшей мере, до проведения анализа. Предполагалось, что объяснение одного понятия из этого семейства через другие приведёт к «кругу» в рассуждении, и что вместо этого их следует истолковывать в других понятиях, не относящихся к семейству модальных — понятиях, которые будут лучше удовлетворять тому, что считалось эмпирицистскими критериями понятности и проверяемости. Например, в предложенной Гемпелем версии ДН-модели понятие «закон» играет ключевую роль в истолковании понятия «объяснение», и его предположение заключается в том, что законы — это всего лишь регулярности, удовлетворяющие определённым дополнительным условиям, которые также приемлемы для эмпириков. Как мы увидим, эти эмпирицистские критерии (и связанное с ними нежелание использовать модальные понятия в качестве исходных) продолжали играть главную роль в моделях объяснения, разработанных вслед за ДН-моделью.

С ДН-моделью связано множество интересных исторических вопросов, которые по большей части остаются без ответа. Почему, раз возникнув, проблема «научного объяснения» становится важной темой философских дискуссий? Почему философы науки, придерживавшиеся «логического эмпиризма» и отстаивавшие ДН-модель, с такой готовностью приняли идею, что наука даёт «объяснения», учитывая склонность многих ранних позитивистов считать «объяснение» явлением достаточно субъективным или «метафизическим» и сравнивать его (не в его пользу) с «описанием», которое они считали гораздо более подходящей целью эмпирической науки? И почему обсуждение, по крайней мере, поначалу, разворачивалось вокруг «объяснения», а не «причинности», хотя (как мы увидим), именно последнее понятие находилось в центре внимания в последующих дебатах, тогда как первое на вкус многих наших современников представляется несколько расплывчатым и плохо определённым? По меньшей мере отчасти ответ на этот последний вопрос состоит в том, что (опять-таки, как будет более подробно объяснено ниже) Гемпель и другие сторонники ДН-модели унаследовали характерные для эмпириков или последователей Юма сомнения в отношении понятия причинности. Они полагали, что идеи каузальности приемлемы (научно или метафизически) только в той мере, в какой их возможно переформулировать или описать так, чтобы они удовлетворяли критериям осмысленности и правильности, принятым у эмпириков. Одним из очевидных способов добиться этого было счесть каузальные утверждения равносильными заявлениям о нахождении «регулярностей» (то есть явлений единообразной взаимосвязи в природе). Как раз эта идея и описывается ДН-моделью (см. ниже). Отчасти обаяние темы «научного объяснения» заключалось, таким образом, в том, что оно представляло собой более приемлемую замену сомнительной темы причинности (или позволяла к ней подступиться).[1] Другим побудительным мотивом стал интерес Гемпеля и прочих ранних сторонников ДН-модели к таким неочевидно каузальным формам объяснения, как «функциональное объяснение» (которое используется в таких частных науках, как биология и антропология). Это тоже естественным образом привело к тому, что дискуссия развернулась вокруг более широкой категории объяснения, а не более узкого понятия «причинности» [ср. Hempel, 1965b].

Рекомендованная литература: Сэлмон [1989] даёт превосходный критический обзор всех моделей научного объяснения, обсуждаемых в данной статье. Питт [1988] и Рубен [1993] — антологии, в которые включены важные работы.

 

2. ДН-модель

2.1. Основная идея

Согласно дедуктивно-номологической модели, научное объяснение состоит из двух основных «элементов»: экспланандума (explanandum) — предложения, «описывающего явление, которое следует объяснить», и эксплананса (explanans) — «класса предложений, приводимых для объяснения явления» [Hempel and Oppenheim, 1948, переиздано в Hempel, 1965, p. 247]. Чтобы эксплананс успешно объяснил экспланандум, следует соблюсти несколько условий. Во-первых, «экспланандум должен быть логическим следствием эксплананса», и «предложения, из которых состоит эксплананс, должны быть истинными» [Hempel, 1965, p. 248]. То есть, объяснение должно иметь форму состоятельного дедуктивного аргумента, в котором экспланандум является выводом из посылок, составляющих эксплананс. В этом и заключается «дедуктивный» компонент модели. Во-вторых, эксплананс должен содержать по меньшей мере один «закон природы», который должен быть необходимым для вывода посылкой в том смысле, что при исчезновении этой посылки выведение экспланандума не будет валидным. Это — «номологический» компонент модели (где «номологический» представляет собой специальный философский термин, который — если вынести за скобки все тонкости — означает попросту «законный»). В самой своей общей формулировке ДН-модель может применяться для объяснения как «общих закономерностей» или «законов» (например, если воспользоваться примерами Гемпеля и Оппенгейма, почему свет подчиняется закону рефракции), так и конкретных событий, случающихся в конкретном месте в конкретное время (например, то, что в конкретном случае наблюдения частично погружённые в воду лодочные вёсла кажутся искривлёнными). Дополнительной иллюстрацией ДН-объяснения конкретного события может быть вычисление положения Марса в какой-то момент в будущем на основании ньютоновских законов движения, ньютоновского закона обратных квадратов, информации о массе Солнца, Марса, скорости обоих и занимаемом ими в данный момент положении. При таком вычислении различные ньютоновские законы оказываются существенными посылками, вместе с соответствующей информацией об исходных условиях (массе Марса, Солнца и т. п.) используемыми для выведения экспланандума (будущего положения Марса) посредством валидного дедуктивного аргумента. Таким образом, ДН-критерии оказываются удовлетворены.

 

2.2. Роль законов в ДН-модели

Понятие состоятельного дедуктивного аргумента, вероятно, кажется сравнительно ясным (или его хотя бы можно считать априорно понятым с точки зрения того, чтобы дать характеристику научного объяснения). Но что можно сказать о другом существенном элементе ДН-модели — законе природы? Основная интуиция, которой руководствуется ДН-модель, выглядит примерно так: Внутри класса соответствующих истине обобщений можно отличить те, которые являются истинными лишь случайно, от тех, которые представляют собой «законы». Если использовать примеры Гемпеля, то обобщение

(2.2.1.) Все члены школьного комитета Гринбери в 1964 году — лысые

если и является верным, то лишь случайным образом. Напротив, обобщение

(2.2.2) При неизменном давлении все газы при нагревании расширяются

является законом. Таким образом, согласно ДН-модели, последнее обобщение в сочетании с информацией о том, что некий конкретный образец газа был нагрет при неизменном давлении, можно использовать для объяснения того факта, что газ расширился. Напротив, первое обобщение (2.2.1) в сочетании с информацией, что n являлся в 1964 году членом школьного комитета Гринсбери, не объясняет, почему n — лысый.

Хотя этот пример и может показаться достаточно понятным, но что именно отличает случайным образом соответствующие истине обобщения от законов? Это было предметом множества философских дискуссий, рассказ о большей части которых выходит за рамки данной статьи.[2] По причинам, раскрытым в Разделе 1, Гемпель полагал, что адекватная теория должна объяснять понятие закона без использования модальных терминов.[3] В своей работе 1965 года он рассматривает некоторое количество таких теорий[4] и приходит к выводу, что все они не удовлетворяют условиям, отмечая, что проблема определения понятия закона оказалась «чрезвычайно сложной» [1965, p. 338]. Однако кажется справедливым, что, по сути дела, он подразумевает, что законы — это всего лишь обобщения, из которых нет исключений, и которые описывают регулярности, удовлетворяющие определённым дополнительным характерным условиям, которые он в данный момент не способен сформулировать. В последующие десятилетия было предложено несколько других критериев законности. Хотя у каждого из этих предложений были свои сторонники, ни одно не получило всеобщего признания.[5] Какие последствия это имеет для ДН-модели? Одна из возможных интерпретаций состоит в том, что всё, чего ДН-модель на самом деле требует, это наличие согласия относительно того, какие именно обобщения являются законами. Если такое согласие существует, то для ДН-модели не так важно, что мы неспособны сформулировать абсолютно общие критерии, позволяющие во всех возможных случаях отличить случайным образом соответствующие истине обобщения от законов. Например, даже без адекватного представления о понятии законности мы, несомненно, можем согласиться, что (2.2.2) — закон, тогда как (2.2.1) — нет, и это всё, что нам нужно, чтобы сделать вывод, что (2.2.2) может использоваться в ДН-объяснениях, а (2.2.1) — не может.

Однако, к сожалению, рассматриваемые нами ситуации не всегда так просты. Одним из важных вопросов, поставленных ДН-моделью, является объяснительный статус так называемых частных наук — биологии, психологии, экономики и т. п. Эти науки полны обобщений, по-видимому, играющих роль объяснений, но, тем не менее, не способных удовлетворить стандартным критериям законности. Например, хотя закон расщепления Менделя (М), согласно которому при половом размножении каждая из двух альтернативных форм (аллелей) гена, определяющая признак в хромосоме конкретного организма, имеет равную 0,5 вероятность попасть в гамету, широко используется в моделях эволюционной биологии, из него есть исключения (например, мейотический дрейф). То же самое можно сказать о принципах теории рационального выбора (например, обобщении, согласно которому предпочтения транзитивны), играющей центральную роль в экономической теории. Другие широко используемые в частных науках обобщения в сравнении с парадигматическими законами имеют очень узкие границы применимости, действуют лишь в ограниченных пространственно-временных сферах и лишены явной теоретической целостности.

По вопросу о том, считать ли подобные обобщения законами, ведутся довольно жаркие споры. Некоторые философы [например, Woodward, 2000] полагают, что такие обобщения удовлетворяют слишком малому количеству стандартных критериев, чтобы считаться законами, но, тем не менее, могут исполнять роль объяснений; если это так, то мы, вероятно, должны отказаться от требования ДН-модели, что все объяснения должны апеллировать к законам. Другие [например, Mitchell, 1997], выдвигая на передний план иные критерии законности, вместо этого заключают, что такие обобщения, как (М), являются законами, а потому не создают угрозы для требования, чтобы объяснения отсылали к законам. В отсутствие более строгого представления о законах, сложно сопоставить эти конкурирующие утверждения и, тем самым, оценить последствия использования ДН-модели для частных наук. В целом, в отсутствие общепризнанного представления о законности, разумное объяснение лежащего в основании ДН-модели фундаментального отличия законов от утверждений, не являющихся законами, недостижимо: сложно оценить заявление, что все объяснения должны ссылаться на законы, без чёткого понимания того, что такое закон, и почему он необходим для успешного объяснения. По меньшей мере, достижение такого понимания — важная и пока ещё нерешённая задача для сторонников ДН-модели.

 

2.3. Индуктивное статистическое объяснение

Предназначение ДН-модели — представить объяснение посредством его выведения из детерминистских законов, и это ставит очевидный вопрос об объяснительном статусе статистических законов. Объясняют ли они что-либо вообще, и если объясняют, то что именно и при каких условиях? В своей работе [1965] Гемпель различает два вида статистических объяснений. Первый — это дедуктивно-статистическое (ДС) объяснение, которое предполагает выведение «более узкой статистической равномерности» из более общего набора посылок, по меньшей мере одна из которых является общим статистическим законом. Поскольку ДС-объяснение предполагает выведение объясняемого из закона, оно разворачивается в соответствии с общей моделью ДН-объяснения регулярности. Однако помимо ДС-объяснения Гемпель также выделяет особый вид статистического объяснения, называемого им индуктивно-статистическим (ИС). Оно предполагает категоризацию отдельных событий (например, излечение конкретного человека от стрептококковой инфекции) на основании статистических законов (например, закона, определяющего вероятность излечения при приёме пенициллина).

В то время как экспланандум в ДН– или ДС-объяснении может быть выведен из эксплананса, на основании приведённого выше статистического закона и информации о приёме пенициллина невозможно сделать вывод, что некий конкретный человек, Джон Джонс, излечился. Самое большее, что можно предположить, это большую или меньшую вероятность излечения. В ИС-объяснении отношение между экспланансом и экспланандумом является, согласно Гемпелю, скорее «индуктивным», чем дедуктивным — потому-то оно и называется индуктивно-статистическим объяснением. Детали предложенной Гемпелем теории сложны, но в целом, основная идея такова: ИС-объяснение будет подходящим и успешным в той степени, в которой эксплананс обеспечивает высокую вероятность выводимого из него экспланандума.

Таким образом, если статистическим законом является то, что при приёме пенициллина вероятность излечения от стрептококка высока, и Джонс принял пенициллин и вылечился, эта информация может использоваться для ИС-объяснения излечения Джонса. Однако если вероятность исцеления невысока (например, ниже 0,5), а Джонс принял пенициллин, то, даже если он поправится, мы не можем использовать эту информацию для объяснения его выздоровления.

 

2.4. Мотивация ДН-модели: Номическая вероятность и теория причинности как регулярности

Почему мы предполагаем, что все (или хотя бы некоторые) объяснения имеют ДН– или ИС-структуру? Есть две идеи, играющие у Гемпеля [1965] роль основного мотива для этого предположения. Первая связывает информацию, предоставляемую ДН-аргументом, с определённой концепцией того, что значит понимать, почему нечто происходит (она отсылает к цели или смыслу предоставления объяснения). Гемпель пишет:

ДН-объяснение отвечает на вопрос «Почему возникает объясняемое явление?», показывая, что явление вызывается определёнными частными обстоятельствами, указанными в С1, С2,…Ck, в соответствии с законами L1, L2,…Lr. Отмечая это, аргумент демонстрирует, что в конкретных обстоятельствах и при действии указанных законов следует ожидать возникновения определённого явления; и именно в этом смысле объяснение позволяет нам понять, почему это явление возникает [1965, p. 337. — Курсив автора].

Можно интерпретировать ИС-объяснение как естественное обобщение этой идеи. Хотя оно и не доказывает с точностью, что нам следует ожидать возникновения объясняемого явления, оно обеспечивает лучшее, на что можно в данных обстоятельствах рассчитывать: доказательство того, что возникновения объясняемого явления можно ожидать, по меньше мере, с высокой вероятностью, — и, таким образом, позволяет его понять. Говоря в более общем смысле, и ДН-, и ИС-модели объединяет идея, сформулированная Сэлмоном: «Суть научного объяснения может быть охарактеризована как номическая ожидаемость, то есть ожидаемость, основанная на законосообразных связях» [1989, p. 57].

Второй основной мотив использования ДН-/ИС-модели связан с ролью в научном объяснении утверждений, описывающих каузальные связи. Среди философов существуют значительные разногласия по вопросу о том, являются ли все объяснения в науке и повседневной жизни каузальными, а также в чём состоит (и существует ли вообще) различие между каузальными и некаузальными объяснениями.[6] Тем не менее, практически все, включая Гемпеля, согласны, что многие научные объяснения содержат информацию о причинах явлений. Однако Гемпель, как и большинство других первых сторонников ДН-модели, не желал рассматривать понятие причинно-следственных отношений как основу теории объяснения — то есть, он не хотел просто сказать, что X должно присутствовать в объяснении Y если, и только если X — причина Y. Вместо этого приверженцы ДН-модели обычно искали такое описание причинно-следственных связей, которое удовлетворяло бы требованиям эмпириков, приведённым в Разделе 1. В частности, защитники ДН-модели, как правило, принимали в широком смысле юмовскую теорию причинности (теорию регулярности), согласно которой (в очень грубой формулировке) все каузальные утверждения предполагают существование некоторой соответствующей регулярности («закона»), связывающей причину и следствие. Затем из этого делался вывод, что все каузальные объяснения «предполагают» (возможно, лишь «неявным образом»), что такой закон/регулярность существует, и, следовательно, что законы «задействованы» во всех подобных объяснениях — в точности так, как утверждает ДН-модель.

В качестве иллюстрации этого рассуждения, рассмотрим следующее утверждение:

(2.4.1) Я толкнул письменный стол коленом, и из-за этого опрокинулась чернильница.

Утверждение (2.4.1) — это так называемое единичное каузальное объяснение, выдвинутое Майклом Скривеном [1962] в качестве контрпримера для утверждения, будто ДН-модель описывает необходимые условия успешного объяснения. Согласно Скривену, утверждение (2.4.1) объясняет, почему чернильница опрокинулась, несмотря даже на то, что в нём явным образом не упомянут ни один закон или обобщение, и само оно состоит из одного-единственного предложения, а не дедуктивного аргумента. Гемпель ответил на это [1965, 360ff], что «произошедший по некой причине» инцидент в (2.4.1) не следует оставлять без анализа или без всяких оговорок считать объяснением. Вместо этого следует проинтерпретировать (2.4.1) как утверждение, «имплицитно» или «неявным образом» отсылающее к существованию «закона» или регулярности, связывающей толчки коленом с опрокидыванием чернильниц. По мнению Гемпеля, именно имплицитное утверждение, что такой закон существует, «отличает» (2.4.1) от «простого повествования», в котором рассказывается, как чернила разлились вслед за толчком, но не подразумевается никакой каузальной связи, — повествования, которое (как думает Гемпель), очевидно, не будет объяснением. Такой связующий закон в ДН-доказательстве является номологической посылкой, которая, согласно Гемпелю, «имплицитно» подразумевается утверждением (2.2.1).

Существуют два родственных, но всё же отличающихся друг от друга способа интерпретации этого аргумента, каждый из которых может быть выведен из рассуждения Гемпеля. Согласно первому, Гемпель утверждает, что подлинная базовая структура (2.4.1) представляет собой нечто наподобие:

(2.4.2) (L) Каждый раз, когда кто-либо задевает коленом стол, на котором стоит чернильница, и выполнены дополнительные условия K (где K уточняют, что толчок достаточно силён и т. д.), чернильница опрокидывается. (Оговорка о K необходима, поскольку не каждый толчок стола коленом заканчивается опрокидыванием чернильницы.)

(I) Я толкнул коленом письменный стол, на котором стоит чернильница, и выполнены дополнительные условия K.

(E) Чернильница опрокинулась.

Следовательно, в той мере, в которой (2.4.1) является объяснением, оно всё-таки «имплицитно» удовлетворяет ДН-/ИС-условиям и является ДН-/ИС-доказательством (а именно, замаскированным (2.4.2)).

Существует вторая интерпретация аргумента Гемпеля, которая, в отличие от первой, не требует от нас считать полное содержание (2.4.2) чем-то имплицитно содержащимся в (2.4.1). Вместо этого (2.4.2) рассматривается как идеал, с которым следует сопоставлять (2.4.1). (2.4.2) разъясняет, какую информацию должно содержать полное, абсолютно достаточное объяснение события E: эта информация содержится в (2.4.1) лишь частично, не полностью. Рассматривая вопрос с этой точки зрения, мы думаем о (2.4.1) как о наброске объяснения [ср. Hempel, 1965b, 423ff] сообщающем часть сведений, содержащихся в (2.4.2) или отсылающем к более полному объяснению (2.4.2). В идеале единичные каузальные объяснения наподобие (2.4.1) следует заменить подробными ДН-объяснениями наподобие (2.4.2).

Однако основная идея каждой из этих интерпретаций заключается в том, что корректное объяснение роли каузальных утверждений в объяснении учитывает юмовскую теорию причинности (теорию регулярности) и приводит к заключению, что (по крайней мере, в идеале) объяснения должны соответствовать ДН-/ИС-модели. Давайте назовём этот аргумент аргументом «скрытой структуры» в ознаменование роли, отводимой им скрытой (или, по меньшей мере, неявной) ДН-структуре, которая, как утверждается, присутствует в (2.4.1).

Эта стратегия будет рассмотрена в параграфе 2.6, но позвольте мне для начала отметить характерную особенность обсуждаемой нами в данный момент дискуссии, которая может показаться загадочной. Далеко не очевидно, что конкретно входит в категорию «научное объяснение», но, поскольку (2.4.1), вероятно, является объяснением, речь идёт не об области, которую мы обычно называем «наукой», а о «повседневной жизни» или «здравом смысле». Это заставляет спросить, почему сторонники ДН-/ИС-модели не ответят на мнимый контрпример (2.4.1), просто указав, что данный случай не относится к категории «научное объяснение» — то есть, заявив, что ДН-/ИС-модель не является попыткой реконструкции структуры таких объяснений, как (2.4.1), а, скорее, может применяться лишь для подлинно «научных» доказательств. Тот факт, что защитники ДН-модели нечасто избирают такую стратегию, свидетельствует о том, в какой степени (как отмечалось в Разделе 1) в большинстве дискуссий о научном объяснении неявным образом подразумевается, что существует значительное сходство и преемственность в структуре объяснений наподобие (2.4.1) и объяснений, которые с большей очевидностью относятся к категории «научных», и что это сходство должно отражаться неким общим описанием, подходящим для объяснений обоих видов. В самом деле, поразительной особенностью не только рассуждений Гемпеля [1965], но и других размышлений о научном объяснении является то, что на самом деле значительное внимание уделяется «повседневным» единичным каузальным объяснениям наподобие (2.4.1), причём неявно предполагается, что выводы о структуре таких объяснений могут напрямую применяться для понимания объяснений научных.

 

2.5. Объяснительное понимание и номическая ожидаемость: Контрпримеры к достаточности

Как было показано выше, такие примеры, как (2.4.1), являются потенциальными контрпримерами для утверждения, что ДН-модель обеспечивает необходимые условия объяснения. Существует также некоторое количество хорошо известных контрпримеров для утверждения, что ДН-модель обеспечивает достаточные условия для удачного научного объяснения. Вот две иллюстрации.

Нарушения симметрии в объяснении. Во многих случаях выведение экспланандума E из закона L и исходных условий I кажется объясняющим его, но «обратное» выведение I из E и того же закона L таковым не кажется, несмотря даже на то, что последнее, как и первое, по всей видимости, удовлетворяет критериям успешного ДН-объяснения. Например, можно вывести длину s тени, отбрасываемой флагштоком, из его высоты h и положения солнца в отношении к горизонту θ, а также законов прямолинейного распространения света. Такой вывод соответствует ДН-критериям и кажется содержащим объяснение. С другой стороны, выведение h из s и θ также соответствует этим критериям, но не кажется содержащим объяснение. Такие примеры предполагают, что по меньшей мере некоторые объяснения отличаются направленностью или асимметрией, к которым нечувствительна ДН-модель.

Иррелевантность в объяснении. Вывод может удовлетворять ДН-критериям и при этом, тем не менее, не быть объяснением, поскольку он содержит иррелевантные элементы помимо тех, что связаны с направленностью объяснения. Рассмотрим пример Уэсли Сэлмона [Salmon, 1971, p.34]:

(2.5.2) (L) Все мужчины, регулярно принимающие противозачаточные таблетки, не могут забеременеть.

(K) Джон Джонс — мужчина, регулярно принимающий противозачаточные таблетки.

(E) Джон Джонс не может забеременеть.

Вероятно, (L) отвечает критериям законности, налагаемым Гемпелем и многими другими авторами. (Если кто-то хочет доказать, что L — не закон, ему нужно будет некое принципиальное, общепринятое основание такого доказательства и, как показано выше, неясно, что это может быть за основание.) Более того, (2.5.2) — это, определённо, состоятельный дедуктивный аргумент, в котором L является необходимой посылкой. Тем не менее, большинство людей полагает, что (L) и (K) вовсе не являются объяснением (E). Существует множество подобных примеров. Например, то, что все образцы столовой соли, зачарованные прикосновением принадлежащей ведьме волшебной палочки, растворяются в воде, по всей видимости, является законом (или хотя бы не имеющим исключений обобщением, подкрепляющим истинность контрфактуальных высказываний) [Kyburg 1965]. Можно использовать это обобщение как посылку ДН-доказательства, которое завершится выводом, что некий конкретный зачарованный образец соли растворился в воде. Но наложение заклятия, опять-таки, не имеет отношения к растворению в воде, и такой вывод не является объяснением.

Один из очевидных диагнозов того, в чем состоит сложность примеров (2.5.1) и (2.5.2), указывает на роль причинности в объяснении. Согласно этому подходу, чтобы объяснить результат, мы должны назвать его причины, а (2.5.1) и (2.5.2) на это неспособны. Как пишет Сэлмон: «Флагшток определённой высоты является причиной тени определённой длины, а потому объясняет длину тени» [1989, p. 47]. Напротив, «тень не является причиной флагштока и, следовательно, не может объяснить его высоту». Точно так же принятие противозачаточных пилюль не является причиной того, что Джонс не может забеременеть, и именно поэтому (2.5.2) не может быть приемлемым объяснением. Согласно этому анализу, если (2.5.1) и (2.5.2) что доказывают, так это то, что вывод может удовлетворять ДН-критериям и при этом не быть способным определить причины экспланандума. Когда это случается, вывод не сможет ничего объяснить.

Как показано выше, сторонники ДН-модели сочтут этот диагноз хорошим разъяснением, только если он сопровождается каким-либо описанием причинно-следственных отношений, не просто принимающим это понятие как исходное. (На самом деле, Сэлмон даёт такое описание, что мы рассмотрим в Разделе 4.) Однако нам следует отметить, что урок, который мы, по-видимому, можем извлечь из (2.5.1) и (2.5.2), заключается в том, что излюбленное теоретиками ДН-модели описание причинности как регулярности является, в лучшем случае, неполным: возникновение c, e и существование какой-либо связывающей их регулярности или закона (или того, что x имеет свойство P, x имеет свойство Q, и есть какой-либо закон, связывающий эти факты) — недостаточное условие для того, чтобы заявление, будто c вызывает e, или будто то, что x обладает свойством P, имеет каузальное или объяснительное значение для того, что x обладает свойством Q, было истинным. В целом, если принять контрпримеры (2.5.1) и (2.5.2), из этого следует, что ДН-модель не может постулировать достаточные условия для объяснения. Объяснить исход явления не значит просто показать, что он номически ожидаем.

На это наблюдение могут быть две реакции. Во-первых, можно сказать, что идея, что объяснение — это вопрос номической ожидаемости, в известной мере верна, но что требуется и ещё кое-что. Согласно этой оценке, ДН-/ИС-модель и в самом деле постулирует необходимое условие успешного объяснения и, более того, условие, которое не является избыточным элементом достаточной для объяснения совокупности условий. Однако следует добавить в ДН-модель некую новую, независимую характеристику X (которая будет отвечать за направленность объяснения и обеспечивать такую объяснительную релевантность, которая, очевидно, отсутствует в примере с противозачаточными таблетками), чтобы получить успешное описание объяснения. Таким образом, идея заключается в том, что Номическая ожидаемость + X = Объяснение. Сходная мысль поддерживается унификационистскими моделями объяснения, разработанными Фридманом [1974] и Китчером [1989], которые рассматриваются ниже, в Разделе 5.

Второй, более радикальный возможный вывод состоит в том, что ДН-описание цели объяснения фундаментально ошибочно, и что ДН-модель не постулирует даже необходимые для успешного объяснения условия. Как отмечено выше, если мы не принимаем аргумент скрытой структуры, этот вывод прямо следует из примера (2.4.1) («Я толкнул письменный стол коленом, и из-за этого опрокинулась чернильница»), в котором даётся объяснение без прямой отсылки к закону или дедуктивной структуре. Чтобы оценить, обеспечивает ли ДН-/ИС-модель условия, необходимые для объяснения, мы, таким образом, должны более подробно изучить стратегию скрытой структуры.

 

2.6. Стратегия скрытой структуры

Может показаться, что тезис стратегии скрытой структуры, согласно которому уникальное каузальное объяснение наподобие (2.4.1) представляет собой неявную форму или «набросок» ДН-/ИС-объяснения, в лучшем случае имеет значение для ответа на вопрос, адекватно ли ДН-/ИС-модель реконструирует этот конкретный вид доказательства. Однако на деле стратегия Гемпеля рассматривать объяснения как способ передачи информации, но «частичным» и «неполным» образом, так что в их основании лежат «идеальные» объяснения, имеющие, на первый взгляд, весьма отличающуюся форму и, по крайней мере, отчасти эпистемически скрытые от тех, кто использует оригинальное доказательство, продолжает оставаться очень популярной в современных дебатах о научном объяснении. Эта стратегия лежит, к примеру, в основе противопоставления «идеального объясняющего текста», содержащего всю каузальную и номологическую информацию, имеющую отношение к интересующему нас выводу, и «неидеальных» объяснений наподобие (2.4.1), которые мы обычно даём [Peter Railton 1978, 1981]. Согласно Райлтону, последние предоставляют «объясняющую информацию» в силу того, что передают сведения о какой-то ограниченной доле или аспекте идеального текста, а потому являются объясняющими. Стратегия скрытой структуры играет также важную роль в унификационистской теории объяснения, разработанной Филипом Китчером [1989], который точно так же настаивает, что мы должны «отличать то, что сказано по случаю, в котором дана объясняющая информация, от лежащего в основе такой информации идеального объяснения» [Kitcher, 1989, p. 414]. И действительно, любая теория объяснения, которая — как унификационистская модель Китчера — настаивает, что законы (или достаточно широкие обобщения) и дедуктивная структура являются необходимыми условиями успешного объяснения, будет нуждаться в чём-то, похожем на стратегию скрытой структуры, поскольку общепризнано, что, по-видимости, существует множество объяснений, структура которых не согласуется с этими условиями.

Хотя стратегия скрытой структуры заслуживает больше внимания, чем мы здесь можем ей уделить, кое-что представляется очевидным. Во-первых, требует серьёзного разъяснения идея некого объяснения, «передающего информацию о» другом, «лежащем в его основе», объяснении. В зависимости от того, как мы понимаем это «лежащее в его основе», можно утверждать, что в основе (2.4.1) лежит много объяснений: (i) объяснение (2.4.2), предполагающее, что условие K можно определить в научных терминах; (ii) объяснение на уровне классической физики, которое отсылает к законам, описывающим неупругие столкновения, поведение жидкостей, неограниченных какой-либо ёмкостью и т. д.; (iii) объяснение, в котором поведение всей системы характеризуется в терминах какой-либо более фундаментальной физической теории (квантовой механики, теории струн и т. д.). Содержатся ли все эти объяснения в (2.4.1) неявным образом, и передаёт ли утверждение (2.4.1) частичную информацию о каждом из них? В каком смысле слова «неявным образом» или «передаёт частичную информацию» могут соответствовать истине?

Райлтон [1981] полагает, что объясняющее что-либо утверждение даёт информацию о лежащем в его основе идеальном тексте, если сокращает неопределённость в отношении некоторых свойств текста, то есть уточняет его возможную структуру. Райлтон понимает, что у его предложения есть множество контринтуитивных следствий. Если использовать пример самого Райлтона, «соответствующий идеальный текст содержит более 102 английских слов» и, если это предложение истинно, считается объяснением случая радиоактивного распада [1981, p. 246]. Точно так же утверждение, что существует корреляция между X и Y, будет считаться частичным объяснением X и Y на основании правдоподобного предположения, что это утверждение передаёт информацию, что одна из трёх возможностей, скорее всего, и в самом деле имеет место: либо X вызывает Y, либо Y вызывает X, либо у них есть общая причина, — а это сокращает неопределённость в отношении содержания идеального текста, лежащего в основе объяснения. Это контрастирует с широко распространённым мнением, что сами по себе корреляции ничего не объясняют. В самом деле, с позиции, схожей с позицией Райлтона, даже утверждение, что у некоего исхода нет причин, или что он не регулируется никакими законами, считается «объяснением» этого исхода при условии, что это утверждение верно. На деле такое утверждение, по видимости, имеет максимальную объяснительную силу, поскольку передаёт всё, что следует сказать об идеальном объясняющем тексте, соответствующем этому событию. Из подобных примеров следует, что не каждое утверждение, которое сокращает неопределённость в отношении содержания идеального объясняющего текста, следует само по себе считать объясняющим — такой подход слишком сильно расширяет понятие объяснения.

Правдоподобно ли считать, что текст, содержащий полную и подробную каузальную и номологическую информацию, имеющую отношение к некоему исходу, будет, по меньшей мере, «идеалом», который может стать мерилом для различных предлагаемых объяснений данного исхода? Предположим, перед нами объяснение из области экономики или психологии, не отсылающее ни к какому обобщению, которое мы готовы считать законом, но что в основе этого «неидеального» объяснения лежит какой-то невероятно сложный набор фактов, описываемых в терминах классической механики и электромагнетизма, а также соответствующие законы этих теорий. Если (как почти наверняка и будет) это лежащее в основе «объяснение» не поддается количественной проверке из-за громадного объёма данных и полно не имеющих отношения к делу подробностей (об этом см. Раздел 4 ниже), можно спросить, в каком смысле оно является идеалом, с которым следует сравнивать первоначальное объяснение. Будет ли экономическое объяснение и в самом деле лучше, если будет содержать как можно больше информации обо всех имеющих отношение к объясняемому явлению деталях?

И наконец, давайте поговорим о связи между объяснением и пониманием. Обычно объяснение считают чем-то, обеспечивающим понимание. В связи с этим одной из задач теории объяснения является выявление тех структурных особенностей объяснений (или информации, которую они передают), в силу которых они обеспечивают понимание. Например, как отмечалось выше, ДН-модель связывает понимание с предоставлением информации о номической вероятности. Идея заключается в том, что понимание того, почему событие имело некий исход, состоит в том, что мы видим, что это событие было ожидаемо на основании определенного закона. Таким образом, для стратегии скрытой структуры возникает проблема: ассоциируемая со скрытой структурой информация, которая, как утверждается, должна лежать в основе «неидеальных» объяснений наподобие (2.4.1), обычно неизвестна или эпистемически недоступна тем, кто использует объяснение. Сложно понять, как эта структура или информация может повлиять на понимание, если она эпистемически скрыта. Например, кажется правдоподобным, что многие (если не почти все) люди, использующие (2.4.1) (как те, кто может привести его в качестве объяснения, так и те, кто принимает его в этом качестве), не имеют понятия о лежащей в его основе ДН-структуре. На самом деле, кажется убедительным, что у многих, кто использует это объяснение, нет представления о законе природы или состоятельном дедуктивном аргументе, а потому и какого-либо понятия о том, что в основе (2.4.1) лежит какое-то (неизвестное) ДН-доказательство. Если это так, как простое обладание этой ДН-структурой (вне зависимости от того, подозревает ли кто-нибудь о её существовании), может обеспечить понимание при использовании (2.4.1)? Скорее, кажется, что те особенности (2.4.1), которые наделяют его объяснительным смыслом — которые делают его объяснением, — должны быть как раз теми его особенностями, которые люди, использующие объяснение, могут познать или усвоить. То же самое будет касаться многих других предлагаемых объяснений, которые не соответствуют ДН-требованиям: например, объяснений в области таких наук, как экономика или психология, где, как кажется, отсутствуют законы.

Какой вывод можно сделать из этого обсуждения стратегии скрытой структуры? Если эта стратегия терпит неудачу, то будет большое количество предполагаемых объяснений, которые не смогут удовлетворить налагаемым ДН-/ИС-моделью условиям объяснения. С другой стороны, возможно, существуют способы развить стратегию скрытой структуры таким образом, чтобы она дала ответ на описанные выше сложности. Если это так, то идея, что ДН-/ИС-требования являются, по меньшей мере, необходимыми условиями идеального объяснения, может, в конце концов, оказаться обоснованной, хотя и останутся упомянутые нами контрпримеры достаточности этой модели.

Рекомендованная литература. Наиболее авторитетным и исчерпывающим изложением ДН– и ИС-моделей, по всей видимости, является работа Гемпеля [1965b]. Она воспроизведена в [Hempel, 1965a] вместе с рядом других статей, затрагивающих различные аспекты проблемы научного объяснения. В дополнение к упомянутым в этом разделе работам, Сэлмон [1989, pp. 46ff] описывает несколько широко известных контрпримеров ДН-/ИС-моделей и обсуждает их значение.

 

3. СР-модель

3.1. Основная идея

Лейтмотивом большинства последующих работ об объяснении были попытки определить (обычно в описанном выше эмпирическом контексте) характерные черты каузальной или объяснительной релевантности, которую в примерах вроде (2.5.1) и (2.5.2) упускали из вида. Модель статистической релевантности (или СР) Уэсли Сэлмона [Salmon, 1971] является очень важной попыткой описать эти особенности с точки зрения понятия статистической релевантности или отношений условной зависимости. Предположим, у некого класса или популяции A есть признак C, который будет статистически релевантен другому признаку B если и только если P(BA.C)≠P(BA), то есть если и только если вероятность B при условии A и C, будет отличаться от вероятности B при условии только A. Лежащая в основе СР-модели интуиция заключается в том, что статистически релевантные свойства (или информация о статистически релевантных отношениях) объясняют нечто, а статистически иррелевантные свойства — нет. Другими словами, понятие важного для экспланандума свойства раскрывается в отношениях статистической релевантности.

Чтобы проиллюстрировать эту идею, предположим, что в примере с противозачаточными таблетками (2.5.2) исходная популяция T включает людей обоих полов. Тогда

P (Беременность∣T.Мужчина. Принимает противозачаточные таблетки) =

= P (Беременность∣T.Мужчина) = 0

тогда как

P (Беременность∣T.Женщина. Принимает противозачаточные таблетки) ≠ ≠ P (Беременность∣T.Женщина),

если предположить, что не все женщины в популяции принимают противозачаточные таблетки.

Другими словами, если вы — мужчина, и принадлежите к этой популяции, то тот факт, что вы принимаете противозачаточные таблетки, статистически иррелевантен для вашей неспособности забеременеть, тогда как в случае женщины он релевантен. Таким образом, мы можем понять, что приём противозачаточных таблеток не может объяснить отсутствие беременности у мужчин, но может — у женщин.

Чтобы дать более точную характеристику СР-модели, нам понадобится понятие однородного распределения. Однородное распределение А — это ряд взаимоисключающих и полностью охватывающих A подклассов или ячеек Ci, где P(BA.Ci) ≠ P(BA.Cj) для всех Ci ≠ Cj, и где невозможно никакое дальнейшее статистически релевантное распределение любых ячеек A.Ci в отношении B, то есть у A нет дополнительных признаков Dk таких, что P(B A.Ci) ≠ P(B A.Ci.Dk).

В СР-модели объяснение того, почему некий член x класса, характеризуемого признаком A, имеет признак B, состоит в следующей информации:

i. априорная вероятность B в A : P(BA) = p.

ii. Однородное распределение A в отношении B, (A.C1,…, A.Cn), вместе с вероятностью B в каждой ячейке распределения: P(B A.Ci) = pi и

iii. ячейка распределения, к которой принадлежит x.

Воспользуемся одним из примеров Сэлмона. Предположим, мы хотим построить СР-объяснение того, почему x, который болен стрептококковой инфекцией = S, быстро выздоравливает = Q. Пусть T(-T) означает, что x лечат (или не лечат) пенициллином, а R(-R) — заражение (или отсутствие такового) устойчивым к пенициллину штаммом. Для простоты предположим, что других релевантных для быстрого выздоровления факторов нет. Есть четыре возможные комбинации этих свойств: T.R, −T.R, T.−R, −T.−R, но допустим, что

P(QS.T.R)=P(QS.−T.R)=P(QS.−T.−R)≠P(QS.T.−R).

То есть, вероятность быстрого выздоровления больных стрептококковой инфекцией одинакова в случае заражения устойчивым к пенициллину штаммом вне зависимости от того, лечат их или нет, а также для тех, кого вовсе не лечат. Напротив, вероятность выздоровления тех больных, которых лечили, и чей штамм чувствителен к пенициллину, различается (видимо, в сторону увеличения).

В этом случае [S.(T.R −T.R−R.−T)], [S.T.−R] — однородное распределение S в отношении Q. СР-объяснение излечения x будет состоять из высказывания о вероятности быстрого исцеления всех, заражённых стрептококком (это (i) выше), высказывания о вероятности излечения в каждой из двух ячеек вышеупомянутого распределения (ii) и в высказывании о ячейке, к которой относится x, то есть S.T.R. (iii). Если руководствоваться интуицией, то идея сводится к тому, что эта информация сообщает нам о значении каждой из возможных комбинаций свойств T и R для быстрого выздоровления больных стрептококковой инфекцией, и как раз поэтому обладает объяснительной силой.

 

3.2. СР-модель и события малой вероятности

У СР-модели есть несколько отличительных черт, ставших предметом дискуссий. Во-первых, отметим, что, согласно СР-модели (и в противоположность ДН/ИС-модели) объяснение не является доказательством — ни в смысле состоятельного дедуктивного аргумента, в котором экспланандум является выводом из эксплананса, ни в смысле индуктивного доказательства, где экспланандум с высокой вероятностью следует из эксплананса, как это происходит при ИС-объяснении. Вместо этого объяснение оказывается некой информацией, статистически релевантной для экспланандума. Сэлмон утверждает (и приводит в качестве иллюстрации пример с противозачаточными таблетками (2.5.2)), что критерии, которым хорошее доказательство должно удовлетворять (например, критерии, обеспечивающие дедуктивную состоятельность или её индуктивный аналог), попросту отличаются от тех, которым должно удовлетворять хорошее объяснение. Помимо прочего, как пишет Сэлмон, «случаи иррелевантности безопасны для доказательств, но смертельно опасны для объяснения» [1989, p. 102]. Как показано выше, СР-модель делает попытку учесть это замечание, связав успешное объяснение с предоставлением информации об отношениях статистической релевантности.

Вторая особенность, тесно связанная с первой, состоит в том, что СР-модель отступает от ИС-модели, поскольку отказывается от идеи, что статистическое объяснение исхода должно предоставлять информацию, из которой следует, что исход имеет высокую вероятность. Читатель может проверить: приведённое выше описание СР-модели не содержит такого требования высокой вероятности; вместо этого даже весьма маловероятные исходы будут объяснены, если удовлетворены критерии СР-объяснения. Предположим, что в приведённом выше примере вероятность быстрого излечения от стрептококковой инфекции при условии, что штамм чувствителен к пенициллину, а больной получает лечение, достаточно низка (например, 0,2). Тем не менее, если соблюдаются перечисленные выше критерии (i)-(iii) — однородное распределение с правильной оценкой вероятности для каждой из ячеек распределения, — мы можем использовать эту информацию, чтобы объяснить, почему x, у которого чувствительный к пенициллину штамм, и который получает лечение, быстро выздоравливает. В самом деле, согласно СР-модели, мы можем объяснить, почему некий x с признаком A имеет признак B, даже если условная вероятность B при наличии A и ячейки Ci, к которой принадлежит x (pi = P(BA.Ci)), меньше, чем априорная вероятность B в A (p = P(BA)). Например, если априорная вероятность быстрого исцеления больных любой формой стрептококковой инфекции равна 0,5, а вероятность быстрого исцеления тех, кто заражён устойчивым штаммом и не получает лечения, равна 0,1, мы, тем не менее, можем объяснить, почему y, удовлетворяющий этим условиям (-T.R), быстро вылечился (если такое случилось), указав на ячейку, к которой он относится (тот факт, что он был заражён устойчивым штаммом и не получал лечения), вероятность излечения, если он относится к этой ячейке, и другую информацию, о которой шла речь выше. В общем, для СР-модели имеет значение не то, высока или низка вероятность результата-экспланандума (или даже высока она или низка в сравнении с её априорной вероятностью), но, скорее, отсылает ли предполагаемый эксплананс ко всем статистически релевантным факторам и только им, и точно ли известны вероятности, на которые он ссылается. Одно из следствий этого (наличие этого следствия подтверждает Сэлмон, признавая, что многие сочтут его противоречащим интуиции) заключается в том, что в СР-модели один и тот же эксплананс T может объяснять как экспланандум M, так и экспланандумы, которые несовместимы с M, например, –M. Например, один и тот же эксплананс объяснит как то, почему человек со стрептококковой инфекцией и рядом других признаков (скажем, T и –R) быстро выздоравливает (если это так), так и то, почему он не выздоравливает (если это так). Напротив, в ДН– и ИС-моделях, если E объясняет M, он не может также объяснить и –M.

Интуицию, согласно которой, в противоположность ИС-модели, значение, приписываемое предлагаемым экспланансом результату-экспланандуму, не должно влиять на качество объяснения, которое он даёт, можно обосновать следующим образом. Возьмём совершенно индетерминистскую монету, которая при подбрасывании имеет устойчивую тенденцию (p=0,9) выпадать решкой. Предположим, что, если монету не бросают, она с вероятностью 0,5 будет лежать орлом или решкой вверх, и что, бросают её или не бросают, есть лишь один фактор, статистически релевантный для того, ляжет она вверх орлом или решкой. Согласно ИС-модели, если монету подбрасывают, и она падает решкой вверх, мы можем объяснить этот исход, сославшись на тот факт, что монету подбросили (поскольку при этом условии вероятность выпадения решки высока), но если монету подбрасывают, и выпадает орёл, мы не можем объяснить этот исход, поскольку вероятность низка. Лежащая в основании СР-модели противоположная интуиция такова, что мы одинаково хорошо понимаем оба исхода. Предрасположенность монеты и тот факт, что её подбросили — единственные факторы, релевантные для каждого исхода, и для обоих исходов эти факторы одинаковы: сославшись на бросок (и уточнив вероятность выпадения орла и решки при броске), мы не оставляем за пределами объяснения ничего, что могло бы повлиять на тот или другой исход. Точно так же, утверждает Сэлмон, если и в самом деле верно, что распределение в примере с быстрым выздоровлением от стрептококковой инфекции объективно однородно (если нет других факторов, статистически релевантных для быстрого исцеления, помимо того, каким штаммом заражён больной и получает ли он лечение), то, определив вероятность быстрого исцеления при любых возможных комбинациях этих факторов и комбинацию факторов, наблюдаемую у пациента, чьё исцеление (или его отсутствие, если исцеления не произошло) мы хотим объяснить, мы собрали все сведения, имеющие отношение к выздоровлению, и, в этом смысле, полностью объяснили исход болезни для пациента.[7]

 

3.3. Что объясняют статистические теории?

Оценивая эти утверждения, будет полезно сделать шаг назад и спросить, реконструкциями чего призваны быть эти конкурирующие модели статистического объяснения (ИС-модель Гемпеля и СР-модель Сэлмона). В литературе по этой теме видное место занимают два вида примеров или способов применения. Во-первых, есть примеры, заимствованные из квантовой механики (КвМ). Предположим, например, что частица имеет вероятность пройти сквозь потенциальную преграду, которая находится в промежутке от 0 до 1. Модели статистического объяснения предполагают, что, если частица проходит сквозь преграду, КвМ объясняет этот исход — ИС– и СР-модели предназначены для описания структуры таких объяснений. Во-вторых, есть примеры, почёрпнутые из области биомедицины (или эпидемиологии) и общественных наук — излечение от стрептококка или, как в подробной иллюстрации Сэлмона [Salmon, 1971], факторы, релевантные для подростковой преступности среди мальчиков.

Это, мягко говоря, весьма разнородные примеры. В случае КвМ обычно считают, что различные не содержащие скрытых переменных результаты устанавливают, что любая адекватная с точки зрения эмпирики теория квантовых явлений нередуцируемо индетерминистична. Таким образом, кажется убедительным, что, когда мы используем уравнение Шредингера, чтобы определить вероятность, с которой частица с определённой кинетической энергией проникнет через потенциальную преграду определённой формы, это представление удовлетворяет предъявляемому СР-моделью требованию «объективной однородности» — нет дополнительных опущенных переменных, которые повлияли бы на вероятность того, что частица проникнет через преграду. Напротив, кажется весьма маловероятным, что это условие будет соблюдено в большинстве (или хотя бы в некоторых) примеров из области биомедицины или социологии, приводимых в работах, посвящённых проблеме статистического объяснения. Например, в случае излечения от стрептококка весьма правдоподобным кажется, что на вероятность выздоровления повлияет множество факторов, помимо двух упомянутых: среди этих дополнительных факторов будет состояние иммунной системы пациента, различные особенности общего состояния его здоровья, точный характер болезни, которой он заразился (устойчивость или неустойчивость штамма к пенициллину почти наверняка является слишком грубой классификацией) и так далее. То же самое касается и детской преступности. В этих случаях, в отличие от примеров из области квантовой механики, у нас нет теории или набора результатов, позволяющих выделить факторы, потенциально имеющие значение для вероятности интересующего нас исхода. Так, в реалистических примерах совокупностей статистически релевантных факторов из биомедицины и общественных наук, вряд ли будет соблюдено (и на практике вряд ли может быть соблюдено) условие объективной однородности.

С этим связана другая трудность, касающаяся того, как статистическое доказательство используется в двух этих случаях. Некоторые квантовые явления (например, радиоактивный распад) нередуцируемо индетерминистичны. Это особенно ясно при их сопоставлении с обсуждаемыми Сэлмоном примерами из общественных наук (например, факторами риска детской преступности). Здесь соответствующая методология включает так называемое каузальное моделирование или метод структурных уравнений. Как минимум в наиболее простых случаях использования этих методов, уравнения, определяющие, станет ли конкретный подросток преступником, являются (при буквальной интерпретации) детерминистскими. Согласно этим подходам, моделируемые явления выглядят индетерминистичными, поскольку некоторые важные для них переменные, влияние которых резюмируется так называемым пределом ошибки, неизвестны или не измерены. Статистическая информация о конкретном юном правонарушителе среди других подростков в различных условиях играет роль доказательства, которое используется для оценки параметров (коэффициентов) в детерминистических уравнениях, используемых для описания процесса, из-за которого начинается противоправное поведение. То же самое касается, по меньшей мере, значительной части биомедицинских примеров.[8]

Из этих наблюдений следует несколько предварительных выводов. Во-первых, совершенно неочевидно, что нам следует пытаться построить единую, общую модель статистического объяснения, которая применима как к явлениям из области квантовой механики, так и к макроскопическим феноменам наподобие преступности или излечения от инфекции. Во-вторых (и в связи с первым выводом), хотя объяснение в КвМ удовлетворяет требованию объективной однородности, сомнительно, что то же будет верно для тех видов «статистических объяснений», что применяются в общественных и биомедицинских науках. Иными словами, если статистическое объяснение обязано удовлетворять требованию объективной однородности, неясно, будут ли примеры успешных статистических объяснений существовать за пределами квантовой механики.

Приняв эти наблюдения во внимание, давайте вновь обратимся к вопросу о том, что именно объясняют статистические теории, о каких бы явлениях ни шла речь. Как мы видели, и Гемпель, и Сэлмон, а также наиболее влиятельные исследователи, писавшие о статистическом объяснении, были склонны полагать, что статистические теории, приписывающие тому или иному результату вероятность, попадающую строго в промежуток от 0 до 1, должны, тем не менее, считаться объясняющими этот результат. Приняв это за исходную посылку, Сэлмон весьма убедительно аргументирует, что считать (подобно Гемпелю), что можно объяснить лишь отдельные высоко вероятные результаты — это произвольное решение. Но почему мы должны разделять эту исходную посылку? Почему вместо этого не считать аргумент Сэлмона основанием для отказа от представления, будто статистические теории объясняют конкретные исходы вне зависимости от того, высока или низка их вероятность? Если мы согласимся с этим, то нам не придётся делать вывод, будто теория вроде квантовой механики не является объясняющей. Вместо этого мы можем воспринимать экспланандумы квантовой механики как факты о вероятностях или ожидаемых значениях исходов, а не сами конкретные исходы. С этой точки зрения объясняемые квантовой механикой экспланандумы являются (строгим) подмножеством тех, которые могут быть из неё выведены; по крайней мере, в этом отношении даваемые квантовой механикой объяснения по структуре подобны ДС-объяснениям. Вудвард [1989] утверждает, что такая интерпретация позволяет нам сказать всё, что мы могли бы обоснованно пожелать сказать об объяснительной силе квантовой механики. Если это верно, нет настоятельной необходимости в отдельной теории статистического объяснения конкретных исходов, которую пытались разработать Гемпель и Сэлмон. (Однако см. Прим. 7.)

В случае подростковой преступности и методов каузального моделирования, если уж на то пошло, интуиция с ещё большей настойчивостью подсказывает нам, что объяснение даётся не тому, например, почему конкретный мальчик, Альберт, стал преступником, но некому более общему явлению, например, тому, почему мы с большей уверенностью ожидаем правонарушений от подростков, принадлежащих к какой-то конкретной подгруппе. И опять-таки, такие экспланандумы выводимы из системы уравнений, используемой для моделирования подростковой преступности.  Принятие этого представления о том, что именно объясняют статистические теории, позволяет нам избежать различных контринтуитивных следствий из модели Гемпеля (например, того, что объяснение получают исходы с высокой, а не с низкой вероятностью) и модели Сэлмона (например, того, что один и тот же эксплананс E объясняет и M, и –M). Тем, кто пытается разработать модели статистического объяснения отдельных результатов, придётся, по меньшей мере, обеспечить более подробное разъяснение того, почему такие модели нужны, и для описания каких именно характерных особенностей научного теоретизирования они предназначены.[9]

3.4. Причинность и отношения статистической релевантности

Как мы видели, СР-модель ставит ряд интересных вопросов о статистическом объяснении конкретных исходов — вопросов, которые важны и вне связи с подробностями устройства самой СР-модели. В этом параграфе мы отвлечёмся от таких вопросов и, вместо этого, сосредоточимся на обосновании самой СР-модели. Мы можем согласиться с тем, что она сводится к двум идеям: (i) объяснения должны отсылать к каузальным отношениям; (ii) каузальные отношения должны описываться через отношения статистической релевантности. Даже если мы принимаем (i), фундаментальной проблемой СР-модели является ложность (ii) — как показало множество исследований,[10] каузальные отношения не полностью описываются отношениями статистической релевантности. Возьмём другой пример из работы Сэлмона [1971]: систему, в которой атмосферное давление A является общей причиной для возникновения шторма S и показаний барометра B при том, что каузальных отношений между S и B нет. Сэлмон заявляет, что в такой системе B и S будут коррелировать между собой, но B при наличии A является статистически нерелевантным для S, то есть P(S|A.B) = P(SA), в то время как А, по утверждению Сэлмона, напротив, при наличии B остаётся релевантным для S, то есть P(SA.B) ≠ P(SB). Точно также S нерелевантно для B при наличии A, но A остаётся релевантным для B при наличии S. Таким образом, СР-модель Сэлмона пытается отразить идею, что A (в отличие от B) является (каузально) релевантным для объяснения S, и что A (в отличие от S) является объяснительно и каузально релевантным для B.

Эти споры о взаимосвязях между каузальными утверждениями и отношениями статистической релевантности являются следствием более общего принципа, называемого каузальным условием Маркова и ставшего предметом бурной дискуссии в философской литературе последнего времени, посвящённой проблемам причинности.[11] Набор связанных каузальными отношениями переменных и распределение их вероятностей удовлетворяют условию Маркова, если и только если каждая переменная не зависит от любой другой переменной, за исключением случаев, когда они находятся в каузальных отношениях. В дискуссии об этом условии были затронуты две важные темы. Первая была, фактически, отмечена самим Сэлмоном в работе, последовавшей за статьёй 1971 года: существуют обстоятельства, в которых условие Маркова не выполняется, и, следовательно, в которых каузальные утверждения не предполагают описанного выше разграничения. Это может произойти, например, если переменные, на которые налагается условие, описаны недостаточно подробно.[12] Второе и более фундаментальное наблюдение заключается в том, что, в зависимости от конкретных деталей происшествия, множество различных наборов причинно-следственных связей может быть совместимо с одними и теми же отношениями статистической релевантности, даже если предположить, что условие Маркова выполняется. Например, структура, в которой B — причина A, а A, в свою очередь, — причина S, приведёт, если мы примем условие Маркова (то есть, как Сэлмон, допустим наличие связей между каузальными отношениями и отношениями статистической релевантности), к тем же самым отношениям статистической релевантности, что и в примере, где A — общая причина B и S. То же самое произойдёт и если S является причиной A, а A — причиной B. В структурах с большим количеством переменных эта недоопределённость каузальных отношений отношениями статистической релевантности может быть гораздо более сильной. Таким образом, список отношений статистической релевантности (то есть, то, что даёт нам СР-модель) не обязательно сообщает, какие именно каузальные отношения действуют. В той мере, в которой объяснение связано с распознаванием каузальных отношений, от которых зависит исход-экспланандум, СР-модель оказывается недостаточно эффективной.

Рекомендованная литература. Статья Сэлмона [Salmon, 1971a] даёт детальное изложение и обоснование СР-модели. Она, как и [Jeffrey, 1969] и [Greeno, 1970], отстаивающие взгляды, в целом, сходные с СР-моделью, входит в сборник [Salmon, 1971b]. Дополнительное обсуждение модели, а также более современная характеристика «объективной однородности» могут быть найдены в [Salmon, 1984]. [Cartwright, 1979] содержит важную критику СР-модели. Теоремы, уточняющие конкретную степень недоопределённости каузальных утверждений доказательством об отношениях статистической релевантности, можно найти в [Spirtes, Glymour and Scheines, 1993, 2000, Глава 4].

 

4. Каузально-механическая модель

4.1. Основная идея

В более поздних работах [см., в особенности, Salmon, 1984] Сэлмон отказался от попыток охарактеризовать объяснение или каузальные отношения исключительно статистически. Вместо этого он разработал новую теорию, названную им Каузально-механической (КМ) моделью объяснения — теорию, содержательно и по своему духу сходную с так называемыми процессуальными теориями причинности, подобными тем, которые отстаивали такие философы, как Филип Дауэ [2000]. Мы можем рассматривать КМ-модель как попытку описать «нечто большее», присутствующее в каузальных и объяснительных отношениях помимо и сверх фактов о статистической релевантности, опять-таки, пытаясь не выходить за рамки юмовского в широком смысле подхода.

КМ-модель включает несколько ключевых идей. Каузальный процесс представляет собой такой же физический процесс, как движение бейсбольного мяча в пространстве, то есть характеризуется способностью непрерывного перемещения метки. («Непрерывно» в общем смысле, — хотя, возможно, и не всегда, — означает «непрерывно в пространстве и времени».) Интуитивно кажется, что метка — это какая-то частная модификация структуры процесса — например, потёртость на поверхности бейсбольного мяча или вмятина на крыле автомобиля. В процессе возможно непрерывное перемещение метки: это происходит, если, когда метка присутствует в одной пространственно-временной точке, она будет сохраняться в других пространственно-временных точках даже без какого-либо дальнейшего взаимодействия. В этом смысле бейсбольный мяч будет перемещать потёртость из одной точки в другую. Точно так же движение автомобиля представляет собой каузальный процесс, поскольку метка в виде вмятины на его крыле будет перемещаться в ходе этого процесса из одной пространственно-временной точки в другую. Каузальные процессы противопоставляются псевдопроцессам, во время которых перемещение меток невозможно. Примером такого псевдопроцесса будет тень движущегося физического объекта. Интуитивно представляется, что, если мы попытаемся пометить тень, изменив её форму в одной точке (например, переместив источник света или поставив преграду на его пути), эта модификация не сохранится, если мы не будем постоянно вмешиваться, чтобы её поддержать при последовательном занятии тенью новых положений в пространстве и времени. Другими словами, модификации не будут перемещаться структурой самой тени, как это происходило бы в случае подлинного каузального процесса.

Следует заметить на будущее, что, согласно Сэлмону, способность к перемещению метки является в нескольких смыслах отчётливо контрфактуальным понятием. Во-первых, процесс может быть каузальным, даже если на самом деле никакая метка при нём не перемещается, при условии, что, если бы такая метка присутствовала, перемещение бы происходило. Более того, само понятие метки предполагает контрфактуальное противопоставление — противопоставление между тем, как идёт процесс при наличии и при отсутствии метки. Хотя Сэлмон, как и Гемпель, всегда относился к контрфактуальным зависимостям с подозрением, но в тот момент, когда он впервые предложил КМ-модель, он полагал, что присутствующие в описании перемещения метки контрфактуальные зависимости сравнительно безобидны: отчасти потому, что кажутся доступными для достаточно непосредственной экспериментальной проверки. Тем не менее, то, что в своей первоначальной формулировке КМ-модель опирается на контрфактуальные зависимости, показывает, что она не полностью соответствует описанным выше юмовским строгим требованиям. В следующей работе, речь о которой пойдёт в разделе 4.4, Сэлмон попытался разработать вариант КМ-модели, не опирающейся на какие бы то ни было контрфактуальные зависимости.

Другим важным элементом модели Сэлмона является понятие каузального взаимодействия. Каузальное взаимодействие предполагает наличие пространственно-временных пересечений двух каузальных процессов, изменяющих структуру обоих процессов: каждый процесс приобретает особенности, которых у него не было бы, не произойди взаимодействие. Образцовым примером каузального взаимодействия является столкновение двух машин, в результате которого на обеих появляются вмятины.

Согласно КМ-модели, объяснение некого события E будет прослеживать каузальные процессы и взаимодействия, которые привели к E (Сэлмон называет это этиологическим аспектом объяснения), или, по меньшей мере, некоторые из них, а также описывать процессы и взаимодействия, создавшие само событие (конститутивный аспект объяснения). Таким образом, объяснение демонстрирует, как E «встроено в каузальную цепь» [1984, p. 9].

Предположение, что объяснение предполагает «встраивание» экспланандума в каузальную цепь, не даёт нам точного понимания того, что должно представлять собой отношение между E и другими каузальными процессами или взаимодействиями, если информация о последних должна объяснять E. Тем не менее, кажется достаточно очевидным, как именно интуитивное представление должно использоваться в конкретных случаях. Биток, начавший движение после удара кием, ударяет неподвижный шар номер восемь, в результате чего этот шар начинает движение, а траектория битка меняется. Удар кия также приводит к перемещению некоторого количества синего мела на поверхность битка, а оттуда, при соударении с битком, — на шар номер восемь. Кий, биток и шар номер восемь представляют собой каузальные процессы, что показывает перемещение меловой метки, тогда как удар кием по битку и удар битка по шару номер восемь — это каузальные взаимодействия. Идея Сэлмона состоит в том, что перечисление таких фактов о процессах и взаимодействиях объясняет движение шаров после удара; напротив, если один из этих шаров отбрасывает тень, при движении падающую на другой шар, это не будет иметь для их последующего перемещения каузального или объяснительного значения, поскольку тень является псевдопроцессом.

 

4.2. КМ-модель и объяснительная релевантность

Как показывает пример с битком, КМ-модель использует в качестве образцов каузальных взаимодействий такие примеры, как столкновения, в которых происходит «действие посредством контакта» и нет пространственно-временных разрывов в перемещении каузального воздействия. Несомненно, что объяснения, в которых такие разрывы отсутствуют, могут показаться особенно убедительными.[13] Однако, как показал Кристофер Хичкок в своей замечательной работе [Hitchcock, 1995], даже здесь КМ-модель оставляет за бортом нечто важное. Возьмём обычное элементарное «научное объяснение» движения шаров после соударения, описанное в приведённом выше примере. Это объяснение делает выводы о движении из информации о массе и скорости шаров до столкновения, предположения, что удар был абсолютно эластичным, и закона сохранения импульса. Мы обычно думаем, что такая информация демонстрирует, что именно масса и скорость шаров, а не, скажем, их цвет или присутствие пометки синим мелом, имеют отношение к объяснению их последующего движения. Однако сложно заметить, что именно в КМ-модели позволяет нам выделить импульс шаров (а не другие их характеристики) как объяснительно релевантное свойство. Отчасти сложность состоит в том, что для того, чтобы высказать такие сравнительно подробные суждения об объяснительной релевантности (то есть о том, что важным является, скорее, импульс, чем меловая метка), нам нужно говорить об отношениях между свойствами и величинами, и неясно, как перевести такие суждения на язык фактов о каузальных процессах и взаимодействиях. Переданные битку кием импульс и меловая метка являются метками, перемещаемыми непрерывным в пространстве и времени каузальным процессом, представляющим собой движение битка. Обе метки передаются через взаимодействие с шаром номер восемь. Кажется, что во введённом Сэлмоном понятии передачи метки или каузального процесса нет ничего, что позволяло бы провести различие между релевантным для объяснения импульсом и бесполезной для него синей меловой пометкой.

Забавно, что — как на это далее указывает Хичкок — те же самые наблюдения могут быть сделаны в отношении примера с противозачаточными таблетками (2.5.2), первоначально предложенного Сэлмоном для того, чтобы проиллюстрировать неспособность ДН-модели учесть понятие объяснительной релевантности. Когда мистер Джонс глотает противозачаточные таблетки, происходят непрерывные в пространстве и времени каузальные процессы, которые перемещают метки, а также каузальные взаимодействия: таблетки растворяются, их составляющие поступают в кровоток, усваиваются или каким-то образом обрабатываются и т. п. Сходным образом непрерывные в пространстве и времени каузальные процессы (хотя и другие) происходят, когда таблетки принимает миссис Джонс. Однако таблетки не имеют отношения к тому, что мистер Джонс не беременеет, и имеют — к тому, что не беременеет миссис Джонс. И опять-таки, создаётся впечатление, что релевантность или нерелевантность приёма противозачаточных таблеток для неспособности мистера или миссис Джонс забеременеть невозможно уловить, просто задав вопрос, являются ли ведущие к этому результату процессы каузальными в том смысле, который вкладывает в это понятие Сэлмон. То же самое можно сказать о примере с зачарованной солью (2.6.3): в нём происходят непрерывные в пространстве и времени каузальные процессы — от прикосновения палочки ведьмы к образцу соли до образования отдельных ионов натрия и хлора при растворении соли в воде, — но они не достаточны для того, чтобы связать наложение заклятия с растворением каузальной (или объяснительной) связью.

Более общий способ формулировки выявленной этими примерами проблемы заключается в том, что те особенности процесса P, в силу которых он расценивается как каузальный (способность к перемещению отметки M), могут оказаться не теми его особенностями, которые имеют каузальное или объяснительное значение для результата E, который мы хотим объяснить (M может не иметь значения для E, тогда как какое-то другое свойство R процесса P будет свойством, каузально релевантным для E). Так что, хотя перемещение метки и может быть критерием, позволяющим эффективно различить каузальные процессы и псевдопроцессы, как выясняется, оно не даёт способа отличить те особенности или свойства каузальных процессов, которые каузально или объяснительно релевантны для результата, от тех, которые таковыми не являются.

 

4.3. КМ-модель и сложные системы

Другой ряд осложнений имеет отношение к применению КМ-модели к системам, которые тем или иным образом оказываются сложнее простых физических примеров вроде описанного выше столкновения. Примеров таких систем несколько. Во-первых, есть теории наподобие ньютоновской теории тяготения, включающей «дальнодействие» в смысле, который весьма интересен с точки зрения физики. Во-вторых, в посвящённой проблеме причинности философской литературе приводится ряд примеров, в которых нет интересных с точки зрения физики форм дальнодействия, но, вероятно, наличествуют каузальные взаимодействия, не подразумевающие наличия промежуточных непрерывных в пространстве и времени процессов или переноса энергии и импульса от причины к следствию. В их число входят случаи причинности как бездействия (causation by omission) и причинности как «двойного предотвращения» или «разрыва связи» (causation bydouble preventionordisconnection).[14] Во всех этих случаях буквальное применение КМ-модели, по-видимому, приводит к вынесению суждения, что объяснение не было дано: что ньютоновская теория тяготения не даёт объяснения и т. п. Многие философы не готовы согласиться с этой оценкой.

Еще один разряд проблематичных для КМ-модели примеров включает предполагаемые объяснения поведения сложных систем или систем «более высокого уровня» — объяснения, которые не отсылают непосредственно к непрерывным в пространстве и времени каузальным процессам, предполагающим перенос энергии и импульса, даже если мы можем полагать, что на более «базовом» уровне такие процессы и могут быть задействованы. В этот разряд попадает большинство объяснений из области таких дисциплин, как биология, психология и экономика, а также некоторое количество собственно физических объяснений.

В качестве примера возьмём один моль газа, содержащийся в контейнере объёма V1 при давлении P1 и температуре T1. Газу позволяют изотермически расширяться в контейнере большего объёма V2. Стандартный способ объяснения поведения газа: скорости диффузии и устанавливающегося в её результате равновесного давления P2, — отсылает к обобщениям феноменологической термодинамики — например, закону идеального газа, закону диффузии газов Грэма и т. п. Сэлмон, по-видимому, считает предполагаемые объяснения, основанные на, по крайней мере, первом из этих обобщений, лишёнными объяснительной силы, поскольку они не прослеживают непрерывный каузальный процесс (он считает каузальными процессами отдельные молекулы, но не газ в целом).[15] Однако совершенно невозможно проследить каузальные процессы и взаимодействия каждой из 6 х 1023 молекул, составляющих газ, и их последующие взаимодействия (столкновения) со всеми остальными молекулами. Обычная статистико-механическая модель, которую Сэлмон, предположительно, мог рассматривать как объяснительную, не делает такой попытки. Вместо этого в её рамках выносятся некоторые общие предположения о распределении молекулярных скоростей и сил при столкновении молекул, а затем они используются (в сочетании с законами механики) для выведения и решения дифференциального уравнения (уравнение Больцмана), описывающего поведение всего объёма газа. Этот подход радикально абстрагируется от подробностей каузальных процессов, происходящих с отдельными молекулами, а вместо этого сосредотачивается на выявлении переменных более высокого порядка, которые объединяют множество конкретных каузальных процессов и, тем самым, описывают общие закономерности поведения газа.

Из этого примера следует несколько вопросов. Каковы именно требования КМ-модели в случае сложных систем, где мы не можем проследить отдельные каузальные процессы (по крайней мере, во всех подробностях)? Как именно КМ-модель избегает (катастрофического) вывода, что любое успешное объяснение поведения газа должно прослеживать траектории отдельных молекул? Успешно ли прослеживает каузальные процессы и взаимодействия описанное выше статистико-механическое объяснение и определяет ли оно каузальный механизм в том смысле, в каком того требует КМ-модель, и если это так, то что именно представляет собой прослеживание каузальных процессов и взаимодействий в связи с такой системой? В настоящий момент и КМ-модель, и процессуальные теории причинности, являющиеся позднейшими её наследниками, не завершены.

Следует сказать несколько слов и о другом аспекте данного примера. Даже если (что невозможно) и было бы сделано описание, прослеживающее траектории отдельных молекул, существуют важные причины, по которым оно не дало бы того вида объяснения поведения газа на макроскопическом уровне, которое мы, скорее всего, желали бы получить — и не только потому, что такое описание было бы слишком сложным, чтобы человеческий разум мог его воспринять. Существует очень большое количество различных возможных траекторий отдельных молекул (в дополнение к траекториям, по которым эти молекулы и в самом деле движутся), которые на макроскопическом уровне приведут к результату (давлению P2), который мы стремимся объяснить. Несомненно, эта информация имеет значение для объяснения поведения газа на макроскопическом уровне, и мы захотим, чтобы наше объяснение включало в себя данный факт. Грубо говоря, принимая во внимание законы, описывающие столкновения молекул, мы можем продемонстрировать, что почти все (то есть, все за исключением нульмерного множества) возможные начальные позиции и импульсы, согласующиеся с исходным состоянием газа на макроскопическом уровне, характеризуемом P1, T1 и V1, приведут к движению молекул по таким траекториям, что газ изменится и на макроскопическом уровне диффундирует в равновесное состояние, когда при давлении P2 его плотность будет одинаковой в любой точке камеры. Равным образом, существует множество различных микросостояний газа, совместимых с каждым из множества других возможных значений температуры газа, и каждое из этих состояний приведёт к различным значениям итогового давления P2*. Если мы прослеживаем лишь те каузальные процессы (в форме реальных траекторий движения молекул), которые приводят к P2, как того требует КМ-модель, мы не сможем представить или описать эту информацию о разнообразии условий, в которых достигается давление P2 и другие значения итогового давления P2*.

То же самое касается объяснения поведения других видов сложных систем: к примеру, тех, что изучаются в биологии и экономике. Рассмотрим стандартное объяснение роста цены на апельсины после заморозков, когда кривая предложения смещается вверх, а кривая спроса остаётся неизменной. В основе поведения рынка апельсинов лежат сэлмоновы отдельные непрерывные в пространстве и времени процессы и взаимодействия — заключается бесчисленное множество частных сделок, в ходе которых деньги в той или иной форме обмениваются на товары, и в каждом случае происходит перенос материи или энергии; ведётся обмен информацией о намерениях или обязательствах купить или продать товар по различной цене, и всё это должно происходить в некой физической среде, предполагает перенос энергии и т. п. Однако также кажется очевидным, что полное описание всех этих процессов (в аргументативных целях предположим, что такое описание возможно) мало что объяснит нам в поведении этих систем, если вообще объяснит хоть что-нибудь. И опять-таки, это произойдёт не просто потому, что такое «объяснение» превышает нашу способность обработки информации. Дело также в том, что значительная часть включённой в такое описание информации будет иррелевантна поведению, которое мы пытаемся объяснить, и произойдёт это по тем же самым причинам, по которым подробное описание отдельных траекторий движения молекул будет содержать информацию, иррелевантную поведению газа. Например, в то время как подробное описание отдельных каузальных процессов, происходящих на рынке апельсинов, будет, предположительно, включать информацию о том, расплачиваются ли отдельные покупатели наличными, чеком или кредитной картой, распространяется ли сообщение о заморозках посредством телефона или электронной почты и т. п., всё это в первом приближении не имеет значения для равновесной цены: если говорить о кривых спроса и предложения, равновесная цена не изменится до тех пор, пока существует рынок, на котором потребители способны каким-то способом приобретать апельсины, информация о заморозках и ценах в той или иной форме доступна покупателям и продавцам и т.п.[16] Более того, факторы, важные для объяснения равновесной цены (например, форма кривых спроса и предложения), сами ни в каком непосредственном смысле не связаны с ценой непрерывными в пространстве и времени процессами (неясно даже, что означает это заявление), хотя, как подчёркивалось выше, неизвестные процессы, лежащие в основе достижения равновесия, вероятно, являются непрерывными в пространстве и времени.

Вопрос опять состоит в том, как описание наподобие сэлмонова может отразить эту особенность удачного объяснения поведения сложных систем: как описание подводит нас к выявлению «правильного» уровня описания явления, которое мы пытаемся объяснить. На деле, как показывают приведённые выше примеры, требования, налагаемые Сэлмоном на каузальные процессы (и, в особенности, требование непрерывности в пространстве и времени), по-видимому, часто уводят нас от подходящего уровня описания. Уровень, на котором требование пространственно-временной непрерывности наиболее явным образом соблюдается (уровень, на котором, например, мы описываем конкретного потребителя, обменивающего наличные деньги на апельсины, или садовода, который по телефону договаривается с розничным торговцем о продаже фруктов по определённой цене), — это, по-видимому, не тот уровень, на котором можно добиться понимания.

 

4.4. Современные исследования

В более новых работах [например, Salmon, 1994], к написанию которых его отчасти подтолкнуло желание ответить на некоторые выдвинутые Филипом Китчером [Kitcher, 1989] контрпримеры к его описанию перемещения метки, Сэлмон пытается создать теорию каузального объяснения, которая полностью свободна от каких бы то ни было обращений к контрфактуальным зависимостям. В этой новой теории, разработанной под влиянием стабильно-процессуальной теории причинности Дауэ [Dowe, 2000], Сэлмон определяет каузальный процесс как процесс, переносящий отличное от нуля количество сохраняющейся величины в каждый момент его истории. Сохраняющиеся величины — это величины, характеризуемые так в физике: импульс, момент импульса, заряд и т. п. Каузальное взаимодействие — это пересечение мировых линий, связанное с каузальными процессами, предполагающими обмен сохраняющимися величинами. Наконец, процесс переносит сохраняющуюся величину от A к B, если на каждой стадии процесса эта величина не вступает ни в какие взаимодействия, предполагающие обмен этой величиной в полуоткрытый интервал (A, B].

Можно усомниться в том, что эта новая теория и в самом деле отказывается от опоры на контрфактуальные зависимости, но ещё более фундаментальная проблема заключается в том, что она не может удовлетворительным образом решить описанную выше проблему каузальной или объяснительной релевантности. То есть мы всё ещё сталкиваемся с тем, что особенность, делающая процесс каузальным (перемещение той или иной сохраняющейся величины), может оказаться практически бесполезной при ответе на вопрос о том, какие характерные черты этого процесса являются каузально или объяснительно релевантными для результата, который мы хотим объяснить. Например, движущийся биллиардный шар будет перемещать множество сохраняющихся величин (импульс, момент импульса, заряд и т. д.), многие из которых могут стать предметами обмена с другим шаром при столкновении. Что же позволяет нам выделить импульс из ряда других сохраняющихся величин и сказать, что именно это свойство является каузально релевантным для последующего движения? Эта проблема представляется ещё более острой в случаях, когда создаётся впечатление, что не существует законов сохранения, описывающих релевантное для объяснения качество (то есть, в случаях, когда релевантные для объяснения переменные не являются сохраняющимися величинами). Такие свойства, как «принимающий противозачаточные таблетки», «беременный» или «являющийся образцом зачарованной соли», сами по себе законами сохранения не описываются. Хотя и можно сказать, что противозачаточные таблетки и зачарованная соль представляют собой каузальные процессы, поскольку на некоем базовом уровне состоят из процессов, недвусмысленно предполагающих перемещение таких сохраняющихся величин, как масса и заряд, само по себе это наблюдение не сообщает нам, какие из этих базовых процессов имеют отношение к беременности или растворению соли в воде (и имеют ли вообще какие-нибудь из них отношение к этим результатам).

В более поздней статье [Salmon, 1997] Сэлмон признаёт это. Он соглашается, что само по себе понятие каузального процесса не может отразить понятие каузальной или объяснительной релевантности. Однако он предполагает, что это понятие может быть удовлетворительным образом описано, если обратиться к понятию каузального процесса и информации об отношениях статистической релевантности (то есть, информации об условных и безусловных отношениях (не)зависимости), где последняя отражает элемент каузальной или объяснительной зависимости, отсутствующий в предыдущей теории:

Теперь я бы сказал, что (1) в отсутствие информации о связующих каузальных процессах отношения статистической релевантности не имеют объяснительного значения, и что (2) в отсутствие отношений статистической релевантности связующие каузальные процессы тоже не имеют объяснительного значения [1997, p. 476].

Это предположение не получило в статье Сэлмона какого-либо подробного развития, и нелегко понять, как именно его можно развить. Выше мы отмечали, что отношения статистической релевантности часто серьёзно недоопределяют каузальные взаимоотношения между рядом переменных. Какое мы имеем основание полагать, что обращение к понятию каузального процесса (в том смысле, в каком его использует Сэлмон) будет всегда (или даже как правило) устранять эту недоопределённость? Мы также отмечали, что понятие каузального процесса не может отразить более тонкие взаимосвязи между свойствами, что могут существовать отношения каузальной релевантности между свойствами, частные случаи которых (по крайней мере, на том уровне описания, где они характеризуются) не связаны пространственно-временной непрерывностью или переносом сохраняющихся величин, и что, таким образом, свойства могут быть взаимосвязаны, не будучи каузально релевантными друг для друга (как в случае отметки мелом, передающейся от одного биллиардного шара к другому). Поскольку различные каузальные суждения могут (и почему бы они вдруг не могли?) подразумевать одни и те же факты об отношениях статистической релевантности и отличаться друг от друга так, что эти отличия не могут быть полностью суммированы с помощью сэлмоновых понятий каузальных процессов и взаимодействий, постольку эта новая теория также потерпит крах.

Рекомендованная литература: [Salmon, 1984] содержит подробное описание каузальной механической модели в её оригинальной формулировке. В [Salmon, 1994] и [Salmon, 1997] формулировка пересматривается и даётся ответ критикам. Обсуждение и критику КМ-модели см. [Kitcher, 1989, в особенности pp. 461ff], [Woodward, 1989] и [Hitchcock, 1995].

 

5. Унификационистское описание объяснения

5.1. Основная идея

Основная идея унификационистской теории заключается в том, что суть научного объяснения состоит в предоставлении единого описания ряда различных явлений. Вне всякого сомнения, эта идея интуитивно кажется привлекательной. Удачное объединение может установить наличие связей и взаимоотношений между явлениями, которые ранее считались независимыми и, таким образом, дать нам то, чего мы ожидаем от хороших объяснений. Более того, унификация теорий и в самом деле сыграла важную роль в науке. Образцовыми примерами являются объединение Ньютоном теорий движения небесных и земных тел и объединение Максвеллом электричества и магнетизма. Однако ключевой вопрос состоит в том, можно ли сделать наше интуитивное понятие (или понятия) унификации более точным таким образом, чтобы мы получили все характерные особенности, которыми, по нашему мнению, должны обладать хорошие объяснения.

Майкл Фридман [1974] предпринял важный первый шаг в этом направлении. Впоследствии было продемонстрировано [Kitcher, 1976], что данная Фридманом формулировка унификационистской идеи несвободна от разнообразных технических проблем, и дальнейшее развитие унификационистского подхода к объяснению было теснее всего связано с именем Филипа Китчера [в особенности, Kitcher, 1989].

Давайте начнём с предложенных Китчером технических терминов. Схематическое предложение — это предложение, в котором некоторые не являющиеся логическими терминами слова были заменены символами. Воспользуемся примерами Китчера: предложение «В гомозиготных организмах, несущих аллели серповидно-клеточной анемии, развивается серповидно-клеточная анемия» сочетается с некоторым количеством схематических предложений вида «В гомозиготных организмах, несущих A, развивается P» и «Для всех X, если X является O и A, то X есть P». Инструкции по заполнению — это указания, определяющие, чем заменять символы в схематических предложениях. Например, инструкции по заполнению могут содержать указание заменить в первом из представленных выше схематических предложений букву A названием аллеля, а букву P — термином, обозначающим фенотипическую характеристику. Схематические аргументы — последовательности схематических предложений. Классификации описывают, какие предложения в схематических аргументах являются посылками и выводами, и какие правила вывода используются. Паттерн аргумента — упорядоченная триада, состоящая из схематического аргумента, ряда наборов инструкций по заполнению (по одному на каждый элемент схематического доказательства) и классификации схематических аргументов. Чем больше ограничений паттерн аргумента налагает на конкретизирующие его доказательства, тем более строгим он считается.

Грубо говоря, главная идея Китчера заключается в выводе описаний множества разнообразных явлений путём применения раз за разом как можно меньшего количества как можно более строгих паттернов аргумента: чем меньше паттернов, чем они строже, и чем больше разнообразие делаемых выводов, тем более унифицированным является наше объяснение. Китчер резюмирует этот подход следующим образом:

Наука способствует нашему пониманию природы, показывая, как выводить описания множества явлений, снова и снова используя один и тот же паттерн вывода, и, показывая это, она учит нас, как уменьшить количество фактов, которые нам приходится считать исходными [p. 423].

Китчер не предлагает абсолютно общую теорию того, как различные описываемые им критерии — количество выводов, количество паттернов и их строгость — соотносятся друг с другом, но предполагает, что часто будет достаточно очевидно, что именно эти соображения подразумевают в отношении оценки конкретных выдвигаемых объяснений. Его основная стратегия состоит в демонстрации того, что выводы, которые кажутся нам здравыми или приемлемыми объяснениями, являются примерами паттернов, которые, взятые вместе, лучше удовлетворяют только что описанным требованиям, чем паттерны, представляющие собой примеры выводов, которые кажутся нам несовершенными объяснениями. Давайте вслед за Китчером определим объяснительный резерв Е(К) как набор паттернов аргументов, который максимально унифицирует К, набор убеждений, разделяемых учёными в конкретный период времени. Тогда для доказательства, что конкретный вывод является здравым или приемлемым объяснением, нужно будет показать, что он принадлежит к объяснительному резерву.

 

5.2. Иллюстрации к унификационистской модели

В качестве примера рассмотрим подход Китчера к проблеме объяснительной асимметрии (см. раздел 2.5). Наши современные объяснительные стратегии — обозначим их P — поддерживают идею, что выведение высоты флагштока из длины его тени ничего не объясняет. Китчер сравнивает P с альтернативной систематизацией, в которой такие выводы считаются объяснениями. Согласно Китчеру, P включает использование одного-единственного паттерна аргумента, определяемого как паттерн «происхождение и развитие» (ПР; согласно ему, линейные размеры артефактов, гор, звёзд, организмов и т. д. могут быть прослежены к «условиям, в которых объект появился, и модификациям, которые он впоследствии претерпел» [1989, p. 485]. Теперь посмотрим, что случится, если к P добавить дополнительный паттерн S (паттерн тени), позволяющий делать выводы о размерах объектов из фактов об их тенях. Поскольку ПР-паттерн уже позволяет вывести все факты о линейных размерах объектов, добавление к P паттерна тени S увеличит число паттернов доказательств в P и не позволит нам делать какие-либо новые выводы. С другой стороны, если мы уберём из P паттерн ПР и заменим его паттерном тени, количество паттернов в P не изменится, но мы сможем делать значительно меньше выводов, чем могли бы, если бы паттерн ПР остался на месте, поскольку у многих объектов нет теней (или достаточного количества теней), на основании которых можно было бы делать выводы о всех их линейных размерах. Поэтому паттерн ПР принадлежит к объяснительному резерву, а паттерн тени — нет.

Сходным образом Китчер решает и другие знакомые нам проблемы. Например, он отмечает, что мы убеждены в том, что объяснение того, почему некий образец соли растворяется в воде, отсылающее к тому факту, что соль была зачарована, и обобщению (H), согласно которому вся зачарованная соль растворяется в воде, неудовлетворительно, по крайней мере в сравнении с обычным объяснением, отсылающим к факту, что (D) вся соль растворяется в воде. Он предполагает, что «основание этого убеждения» состоит в том, что вывод, отсылающий к (H), представляет собой паттерн аргумента, принадлежащий к совокупности паттернов, менее унифицирующей в сравнении с совокупностью, в которую входит вывод, отсылающий к (D). В частности, объяснительный резерв, содержащий (H), но не (D), будет иметь более ограниченный набор последствий, чем резерв, содержащий (D), но не (H), поскольку последний, но не первый, позволяет выводить факты о растворении в воде незачарованной соли. И добавление (H) к объяснительному резерву, содержащему (D), увеличит число паттернов без увеличения числа возможных выводов.

Китчер признаёт, что в унификационистской теории самой по себе нет ничего, что требовало бы, чтобы всякое объяснение было дедуктивным: «В принципе, не существует препятствий к использованию недедуктивных аргументов в систематизации наших убеждений». Тем не менее, «задача сравнения унифицирующей силы различных систематизаций кажется ещё более устрашающей, если мы рассматриваем недедуктивные аргументы», и отчасти поэтому Китчер придерживается мнения, что «в определённом смысле все объяснения являются дедуктивными» [p. 448].

Какова здесь роль причинности? Китчер заявляет, что «“потому что” причинности всегда выводится из “потому что” объяснения» [1989, p. 477]. То есть, наши каузальные суждения просто отражают объяснительные отношения, вытекающие из наших (или наших интеллектуальных предшественников) попыток сконструировать унифицированные теории природы. Помимо и сверх этого не существует никакого независимого каузального порядка, который мог бы быть описан нашими объяснениями. Как многие другие философы, Китчер принимает близко к сердцу обычные для эмпириков или последователей Юма тревоги об эпистемической доступности и осмысленности каузальных утверждений — даже если в конечном счёте он их и не полностью разделяет. Вызывает сомнения, что можно строить теорию объяснения, принимая каузальные, контрфактуальные или иные понятия, принадлежащие к тому же семейству как базовые. По убеждению Китчера, достоинством его теории является то, что она на них не опирается. Вместо этого Китчер предлагает начать с понятия объяснительной унификации, описанной в терминах наложения ограничений на дедуктивные систематизации, где таким ограничениям может быть дано весьма общее определение, не зависящее от каузальных или контрфактуальных понятий, и затем показывает, как принимаемые нами каузальные утверждения выводятся из нашего стремления к унификации.

 

5.3. Критика иллюстраций

Как было отмечено в начале этого раздела, идея, будто объяснение каким-то образом связано с унификацией, интуитивно кажется привлекательной. Тем не менее, предложенный Китчером конкретный способ осуществления этой связи представляется проблематичным. Давайте рассмотрим его интерпретацию примера с флагштоком. Она сильно зависит от возможной истинности утверждения, что некоторые объекты не отбрасывают достаточно теней, чтобы определить все их линейные размеры. Но представляется, что не только со здравым смыслом, но и с общепризнанной в наше время физической теорией согласуется представление, что даже в мире, где все объекты отбрасывают достаточно теней, чтобы на их основании можно было бы определить все их линейные размеры, неверно было бы ссылаться на факты об отбрасываемых объектами тенях для объяснения их линейных размеров. Неясно, как подход Китчера может справиться с этим суждением.

Проблема станет яснее, если мы обратимся к варианту этого примера, в котором, в отличие от примера с тенями, очевидно, существует столько же обратных выводов от следствий к причинам, сколько выводов от причин к следствиям. Возьмём, вслед за Барнсом [1992], симметричную в отношении времени теорию (например, ньютоновскую механику) в применении к закрытой системе (например, Солнечной системе). Назовём предиктивными выводы о движении планет в какое-то будущее время t, сделанные на основании информации об их теперешнем положении (во время t0), массах, скоростях, силах, влияющих на них в момент t0, и законах механики. Теперь сопоставим эти выводы с ретродуктивными выводами, в которых происходящие в данный момент движения планет выводятся из информации об их будущих скоростях и положениях в момент t, воздействующих на них в момент t силах и т. п. Представляется, что ретродуктивных выводов будет ровно столько же, сколько предиктивных, и каждый из них будет нуждаться в посылках одного и того же общего вида — информации о положениях, скоростях, массах и т. д. и одних и тех же законах. Таким образом, паттерн или паттерны, проявляющиеся в ретродуктивных выводах, выглядят в точности столь же унифицированными, как паттерн или паттерны, связанные с предиктивными выводами. Однако мы обычно считаем объяснительными предиктивные, а не ретродуктивные выводы, и текущее положение планет представляется нам причиной их будущего положения, а не наоборот. И опять вовсе не очевидно, как соображения унификации могут породить такую асимметрию в объяснении.

Одной из возможных реакций на этот второй пример будет принять это следствие и заявить, что с точки зрения фундаментальной физики, на самом деле между предиктивными и ретродуктивными выводами нет разницы в том, что касается объяснительной силы, и что достоинством, а не недостатком унификационистского подхода является то, что он воспроизводит это суждение. Что бы мы ни говорили в пользу такой реакции, Китчер так не поступил. Он заявил, что наши обычные суждения о каузальной асимметрии могут быть выведены из унификационистской теории. Только что приведённый пример ставит это заявление под сомнение. В более общем случае он ставит под сомнение тезис Китчера, будто можно начать с понятия объяснительной унификации, интерпретируемого без привлечения каузальных понятий, и использовать его для выведения содержания каузальных суждений.

 

5.4. Гетерогенность унификации

Это заключение подкрепляется более общим соображением: в том виде, в котором она используется в науке, унификация представляет собой весьма гетерогенное понятие, включающее в себя множество различных видов достижений.[17] Некоторые виды унификации заключаются в создании общей классификационной схемы или описательного словаря там, где ранее удовлетворительной схемы не существовало, как это происходило в ранний период развития науки при исследованиях наподобие тех, которые вёл Линней, создавший всеобъемлющую и основанную на научных принципах систему биологической классификации. Другой вид унификации предполагает создание общей математической структуры или модели описания, которую можно применить ко множеству разнообразных видов явлений, как это было, когда системы уравнений, разработанные Лагранжем и Гамильтоном, были изначально выведены в контексте механики, а затем применены в таких областях, как электромагнетизм и термодинамика. Есть и другие случаи, когда речь идёт о том, что можно было бы описать как подлинную физическую унификацию, при которой демонстрируется, что явления, которые, как ранее считалось, имеют весьма разные причины или объяснения, являются результатом общего набора механизмов или каузальных отношений. Доказательство Ньютона, что орбиты планет и поведение земных объектов, находящихся в свободном падении у поверхности земли, зависят от одной и той же силы тяготения и подчиняются одним и тем же законам движения, именно в этом смысле было физической унификацией.

Из трёх этих случаев лишь последний — физическая унификация — интуитивно представляется непосредственно связанным с объяснением: по меньшей мере, если мы считаем, что объяснение предполагает отсылки к каузальным отношениям. В частности, в зависимости от конкретной ситуации, тот вид унификации, который связан с принятием классификационной схемы, немного может сообщить нам о каузальных отношениях. Более того, исторические исследования показывают, что то же самое верно для формальной или математической унификации: тот факт, что мы можем создать формальное математическое описание ряда различных явлений, ни в коем случае не гарантирует, что мы автоматически выделим некий набор общих каузальных факторов, ответственных за эти явления, т. е., что мы дадим им единое физическое объяснение. Например, простой факт, что с помощью уравнений Лагранжа мы можем описать как поведение системы связанных силами тяготения масс, так и действие электрической цепи, не означает, что мы нашли общее объяснение для обоих, или что мы «объединили» гравитацию и электричество каким-либо образом, интересным с точки зрения физики.

Это ставит перед нами следующий вопрос: Является ли данная Китчером теория унификации достаточно дифференцирующей или тонкой, чтобы отличить виды унификации, имеющие отношение к объяснению, от других? Возникает подозрение, что это не так. Лежащая в основе теории Китчера концепция унификации представляется в основе своей тяготеющей к описательной экономии или сжатию информации — она стремится вывести как можно больше из как можно меньшего количества паттернов аргументов. Многие случаи классификационной и чисто формальной унификации, предполагающей разработку общего математического формализма, по-видимому, соответствуют этой характеристике. Возьмём схемы биологической классификации и схемы классификации таких геологических и астрономических объектов, как камни и звёзды. Если я знаю, что конкретные образцы относятся к определённой категории классификации (например, вид X — млекопитающие или полярные медведи), я могу использовать эту информацию для того, сделать выводы о великом множестве их свойств (у X есть позвоночники, сердца, они живородящие и т. д.), и это — паттерн аргумента, который можно раз за разом использовать для разных видов X. Но, несмотря на желание некоторых философов рассматривать такие выводы как объяснения, в науке принято считать эти схемы «просто дескриптивными» и мало что сообщающими (если вообще сообщающими) о причинах или механизмах, объясняющих, почему у X есть позвоночники или сердца.[18]

Другой пример, иллюстрирующий тот же общий тезис, — многочисленные статистические процедуры (факторный анализ, кластерный анализ, методы многомерного шкалирования), которые позволяют нам резюмировать или представить большие объёмы статистической информации в экономном, унифицированном виде, и выводить более конкретные статистические факты из гораздо меньшего набора допущений, раз за разом используя один и тот же паттерн аргумента. Например, зная, какова нагрузка каждого из n тестов оценки интеллекта на общий фактор g, мы можем сделать гораздо большее количество (n(n−1)/2) выводов о попарной корреляции этих тестов. Однако опять-таки вызывает сомнения, что такая «унификация» сама по себе говорит нам что-нибудь о причинах, по которым испытуемые выполнили тест так, а не иначе.

 

5.5. Концепция «Победитель получает всё»

Другая фундаментальная проблема унификационистской теории связана с тем, что она опирается на концепцию унификации, которую можно было бы назвать «Победитель получает всё». С одной стороны, кажется, что любая убедительная версия этого подхода должна приводить к выводу, что обобщения и теории иногда могут быть объяснениями некого ряда явлений, даже если известны более унифицирующие объяснения этих явлений.[19] Например, закон Галилея можно использовать для объяснения фактов о поведении падающих тел, даже если он даёт менее унифицирующее объяснение, чем законы ньютоновской механики и теория тяготения, а последние, в свою очередь, могут служить объяснением, даже если они дают менее унифицированное объяснение, чем те, что даются общей теорией относительности; теории Кулона и Ампера являются объяснениями, даже если уступают в унифицированности теории Максвелла, и т. п. Если мы отвергнем эту идею, нам придётся согласиться, что в любой области лишь наиболее унифицированная из известных теорий даёт объяснение явлениям: все остальные теории на это не способны. Назовём эту концепцию унификации концепцией «Победитель получает всё».

Концепция «Победитель получает всё» отказывается от, несомненно, весьма естественного представления, которое, как можно подумать, сторонник унификации должен бы поддержать: представления, что одно объяснение может обеспечить меньше унификации, чем какое-нибудь альтернативное объяснение, и, значит, быть менее глубоким или подходящим, но, тем не менее, считаться что-то объясняющим. Однако подход Китчера к проблемам объяснительной иррелевантности и асимметрии, по-видимому, требует как раз такой концепции. Почему же мы не можем ссылаться на тот факт, что этот конкретный образец соли зачарован, чтобы объяснить то, что он растворяется в воде? Согласно Китчеру, любой объяснительный резерв, содержащий обобщения о растворении зачарованной соли, будет «менее унифицированным», чем конкурирующий объяснительный резерв, согласно которому растворение соли объясняется ссылкой на обобщение, что вся соль растворяется в воде. Равным образом, причина, по которой мы не можем объяснить высоту флагштока через длину его тени, заключается в том, что эти объяснения длин объектов через факты о тенях не принадлежат «набору объяснений», которые «в совокупности обеспечивают наилучшую систематизацию наших убеждений» [1989, p. 430]. Очевидно, что такой анализ нуждается в концепции «Победитель получает всё», согласно которой объяснение Т1, являющееся с точки зрения унификации менее удовлетворительным, чем конкурирующее альтернативное объяснение Т2, не будет объяснением вовсе (а не окажется просто объяснением менее удовлетворительным, чем Т2). Если бы Китчер собирался отвергнуть концепцию «Победитель получает всё» и вместо этого придерживаться точки зрения, что, даже если Т2 является более унифицированным, чем Т1, из этого не следует автоматически, что Т1 не является объяснением, то его решение проблем объяснительной иррелевантности и асимметрии больше бы не работало: ему пришлось бы сделать вывод, что «объяснение» того, что мистер Джонс не может забеременеть, приёмом противозачаточных таблеток, и в самом деле является объяснением, хотя и менее удовлетворительным, чем то, которое отсылает к полу мистера Джонса; то же касается и выведения высоты флагштока из длины его тени.

Если довериться интуиции, то проблема заключается в том, что нам нужна теория объяснения, описывающая несколько разных возможностей. С одной стороны, есть обобщения и связанные с ними мнимые объяснения (например, обобщения, связывающие показания барометра с возникновением гроз, и обобщения, связывающие наложение на соль чар с её растворением в воде), которые вовсе не являются объяснениями; они не удовлетворяют требованиям, предъявляемым к объяснениям. С другой стороны, этим требованиям удовлетворяет некий континуум: обобщения могут быть объяснениями, но менее глубокими или убедительными, чем какие-то альтернативные обобщения. Мы только что видели, что унификационистская теория не может одновременно включать обе эти возможности. Либо нет требований, отсеивающих объяснения от того, что объяснениями не является (каждый вывод является в какой-то мере объяснением, и дело просто в том, что некоторые выводы принадлежат к менее унифицирующим и, тем самым, меньше объясняющим систематизациям, чем другие), либо не существует континуума (и лишь наиболее унифицирующие систематизации могут давать объяснения).

 

5.6. Эпистемология унификации

Давайте вспомним, что, согласно Китчеру, знание о каузальных отношениях возникает из наших попыток унификации. Однако (и с этим Китчер тоже согласен) весьма маловероятно, что большинство людей намеренно и сознательно будет сравнивать конкурирующие дедуктивные систематизации с точки зрения числа и строгости паттернов и количества заключений, чтобы определить, какая из них является более унифицирующей. Его ответом на это замечание является утверждение, что большинство людей обретает знание о каузальных отношениях, впитывая «практические знания», которыми обладают сообщества, к которым люди принадлежат, причём эти практические знания и в самом деле отражают ранее предложенные варианты унификации. Он пишет, что «наши обыденные знания о каузальных отношениях основаны на воспринятой в раннем возрасте теоретической картине мира, завещанной нам нашей научной традицией» [1989, p. 469].

Как именно это должно работать? Хотя, несомненно, верно то, что люди приобретают значительное количество знаний о каузальных связях благодаря культурной традиции, также очевидно, что не все подобные знания приобретаются таким способом. Некоторые сведения о каузальных отношениях требуют обучения на опыте. Более того, если мы не готовы делать в высшей степени невероятные допущения о врождённости значительного числа конкретных убеждений в отношении каузальных связей, резерв передаваемых внутри общества знаний о таких связях сам должен был быть создан неким способом, в котором важную роль играло бы научение на основе опыта. Тогда возникает вопрос, как этот процесс научения на основе опыта должен повлиять на мнение об источнике нашего знания о каузальных связях, подобное мнению Китчера? Если, как заявляет Китчер, «идея, будто любой человек обосновывает выносимые им каузальные суждения, распознавая паттерны аргументов, которые лучше всего унифицируют его или её убеждения, очевидным образом, является абсурдной» [1989, p. 436], то что же именно происходит на индивидуальном уровне, когда люди учатся чему-либо на опыте? Возможно, что, хотя они и не сравнивают сознательно степени унификации, достигаемые конкурирующими систематизациями, когда, учась на опыте, приобретают новые знания о каузальных отношениях, они делают это неявно или бессознательно — возможно, из-за некой общей предрасположенности разума к поиску унификации. Однако Китчер, по всей видимости, не поддерживает это мнение, и оно не слишком хорошо сочетается с тем, как он подчёркивает роль социальной передачи информации о каузальных связях. Более того, кажется, что даже бессознательная унификация требует весьма развитых познавательных способностей (построение и сопоставление различных дедуктивных систематизаций и т. д.), то есть маловероятно, что на это способны многие обучающиеся, например, маленькие дети.

Логичная интерпретация приведённой выше цитаты и других утверждений Китчера [1989] такова: социальный процесс сопоставления конкурирующих систематизаций убеждений и выявления их дедуктивных следствий возникает на уровне общества, где группы людей спорят друг с другом о том, какая общая дедуктивная систематизация лучше всего унифицирует убеждения общества в целом. Конкретные убеждения в отношении каузальных связей на уровне общества обосновываются тем, что их представляют как часть наилучшей общей систематизации убеждений общества, и потому они передаются из общего резерва убеждений общества отдельным людям.

Очевидная проблема такого представления заключается в том, что идущий в обществе процесс обоснования должен, однако, тем или иным образом осуществляться отдельными людьми. Если (как и обстоит дело) существует множество обществ, обладающих значительным количеством знаний о каузальных отношениях и объяснений, в которых никто не располагает недвусмысленным и чётко сформулированным понятием о дедуктивно валидном аргументе, или не умеет выводить дедуктивные следствия из убеждений, или не обладает в явном виде концепциями о числе и строгости паттернов аргументов, о которых говорит Китчер, то как именно формируются общественные убеждения, отражающие действие этих понятий? Если, как признаёт Китчер, предположение, будто отдельные люди будут намеренно и сознательно сравнивать конкурирующие систематизации, когда они благодаря опыту приобретают убеждения о каузальных связях, психологически невероятно, то с чего бы быть более вероятным предположению, будто этот процесс каким-то образом происходит в ходе взаимодействия индивидов на уровне общества?[20]

Существует и другая сложность, связанная с первой. Допустим, что нам бы хотелось иметь унифицированную систему убеждений в том смысле, в котором это понимает Китчер: потому ли, что унификация связана с объяснением, а последнее само по себе ценно, или потому, что унификация связана с другими желанными целями (например, подтверждением). Тем не менее всё ещё неясно, почему ценным было бы обладание набором убеждений, представляющих собой наименьшее подмножество убеждений, составляющих такую унифицированную систему (которым, по всей видимости, обладает большинство людей), если мнение Китчера о передаче знания о каузальных отношениях истинно. Вспомните общую картину, нарисованную Китчером: приобретая убеждение, скажем, о том, что факт зачарованности соли каузально иррелевантен её растворению в воде, тогда как то, что она помещена в воду, каузально релевантно, я приобретаю фрагмент систематизации S, которой располагает общество. Но, добавив фрагмент систематизации S или даже несколько её фрагментов к резерву моих убеждений, я могу и не получить систему убеждений, которая унифицирована или облегчает достижение любых эпистемических целей, связанных с унификацией. Разумеется, если в конце концов я добавлю в мой резерв убеждений большинство фрагментов S, я получу унифицированный и позволяющий воспользоваться всеми достоинствами унификации набор убеждений. Но, как соглашается Китчер, невероятно, чтобы большинство людей обладало чем-нибудь, близким к полной систематизации S, которая лучше всего унифицирует все общественные убеждения. Это кажется верным, например, для нашего собственного эпистемического сообщества, в котором знание — в особенности научное знание — распределено среди лиц, входящих в небольшую группу экспертов, и ни один человеческий разум (и тем более разум типичного представителя сообщества) не обладает систематизацией, лучше всего унифицирующей убеждения всего общества, и не действует в соответствии с ней. Говоря в более общих терминах, кажется маловероятным, что разные фрагменты Bi общественной систематизации S, которые различные субъекты i приобретают благодаря передаче культурного опыта, будут в каждом конкретном случае представлять собой высокоунифицированные систематизации. Короче говоря, значительной проблемой концепции передачи культурного опыта является то, что сложно понять, как именно унификация может иметь познавательное или практическое значение, если она не характеризует систему убеждений отдельных людей, а не только общества в целом. Однако использование унификации того типа, который Китчер связывает со знанием о каузальных отношениях и объяснениях, для характеристики индивидуальных систем убеждений кажется, на первый взгляд, нереалистичным с точки зрения психологии. Это не означает, что не существует способа объяснить, как в унификационистской картине приобретается знание, но такое объяснение требует серьезной дополнительной работы.

Рекомендованная литература: Наиболее подробное изложение позиции Китчера можно найти в [Kitcher, 1989]. [Salmon, 1989, pp. 94ff.] содержит критический анализ версии унификационистской интерпретации объяснения, предложенной Фридманом, но в заключении отстаивает “примирение” унификационистских подходов и каузальной механической модели самого Сэлмона. [Woodward, 2003] содержит дополнительную критику китчеровской версии унификационизма.

 

6. Прагматические теории объяснения

6.1. Введение

Несмотря на множество разногласий между ними, рассмотренные выше теории Гемпеля (говоря его теориях сейчас, мы будет иметь в виду прежде всего ДН‑, а не ИС-модель), Сэлмона, Китчера и других, по большей части разделяют общепринятые представления о том, что должен в себя включать именно проект создания теории объяснения, и (в известной мере) каким критериям такая теория должна удовлетворять, чтобы быть успешной. Скажем, что теория объяснения содержит «прагматические» элементы, если (i) эти элементы требуют обязательной отсылки к фактам об интересах, убеждениях или других психологических характеристиках тех, кто даёт объяснение или его получает и/или (ii) обязательной отсылки к «контексту», в котором возникает объяснение. (О том, что это значит, будет сказано ниже.) Хотя авторы, о которых шла речь выше, согласны с тем, что прагматические элементы играют какую-то роль в процессе предоставления или получения объяснений, они полагают, что существует некое непрагматическое ядро объяснения, описание которого является главной задачей теории объяснения. То есть, предполагается, что это «ядро» можно определить таким образом, чтобы обойтись без обязательных отсылок к психологическим характеристикам тех, кто даёт объяснения, или их слушателей, и что оно и его свойства могут быть описаны неконтекстуально в том смысле, что они являются достаточно общими, абстрактными и «структурными», и что мы можем рассматривать их как присутствующие в ряде объяснений с разным содержанием и в ряде разных контекстов. Часто, но не всегда, утверждалось, что многие особенности этих свойств могут быть объяснены формально, через такие отношения, как дедуктивный вывод или статистическая релевантность. Кроме того, эти авторы считали целью теории объяснения описание понятия правильного объяснения (вида «объяснение фотоэлектрического эффекта таково») в противоположность понятию объяснения, которое считается или не считается таковым конкретной аудиторией (что, предположительно, зависит от того, понимает ли аудитория термины, в которых даётся объяснение). Наконец, как отмечалось во введении к этой статье, работающие в русле этой традиции авторы не считали своей задачей описание всех разнообразных способов использования слова «объяснение» в повседневной английской речи. Вместо этого они занимались гораздо более ограниченным классом примеров, в которых их интересовало объяснение (или нечто вроде объяснения) «почему» достигается некий результат или возникает некий феномен, в противоположность объяснению, например, значения слова или того, как решать дифференциальное уравнение. Мотивом для такого ограничения является просто суждение, что интересная и содержательная теория с большей вероятностью возникнет при условии введения таких ограничений. Для простоты будем называть это «традиционным» представлением о задаче теории объяснения.

Некоторые или все эти допущения и цели отвергаются в прагматических или, как их иногда называют, «контекстуальных» теориях объяснения. Среди первых, кто разрабатывал этот подход, были Майкл Скривен [например, 1962] и Сильвейн Бромбергер [например, 1966], а более систематические его изложения появились в 1980-х годах благодаря ван Фраассену [1980] и Ахинштайну [1983]. Поскольку не всегда ясно, в чём именно расходятся сторонники прагматического и традиционного подходов, стоит сказать несколько слов об этом, прежде чем мы обратимся к деталям. Защитники прагматических подходов к объяснению обычно подчёркивают, что то, обеспечивает ли предоставление некой аудитории определённой совокупности информации понимание или ощущение понятности, или является ли такая совокупность подходящей для этой аудитории или что-то разъясняющей, зависит от базовых знаний и интересов отдельных членов аудитории, и от других факторов, определяемых контекстом ситуации. Например, объяснение отклонения звёздного света солнцем, отсылающее к уравнениям поля общей теории относительности, может многое сказать физику, но будет непонятно профану, не обладающему необходимыми базовыми знаниями. Факторы такого рода называют «прагматическими», и считается, что их воздействие демонстрирует по меньшей мере один из способов, которыми прагматические соображения определяют понятие объяснения.

Взятое само по себе только что описанное наблюдение кажется совершенно непротиворечивым и не вступающим в конфликт с подходами к объяснению, которые парадигматически рассматриваются как традиционные. В самом деле, как отмечалось выше, такие авторы, как Гемпель и Сэлмон, недвусмысленно соглашаются, что объяснение имеет прагматическое в только что описанном смысле измерение — фактически, Гемпель в нескольких случаях упоминает о роли прагматических факторов, когда говорит о том, что на первый взгляд кажется контрпримерами к ДН-модели.[21] Это предполагает, что, по меньшей мере, нередко,[22] прагматический подход к объяснению отличает не только сама идея, что у объяснения есть «прагматическое измерение», но, скорее, более сильное заявление, что традиционный проект создания модели объяснения, который стремился воплотить Гемпель и другие учёные, до сих пор терпел поражение (и, возможно, обречён на неудачи), и что это происходит потому, что прагматические или контекстуальные факторы играют ключевую и неустранимую роль в объяснении, причём эта роль не может быть описана в рамках традиционных моделей. С этой точки зрения многие отличительные особенности прагматических теорий (включая теории ван Фраассена и Ахинштайна, о которых пойдёт речь ниже) состоят в их противоположности традиционным теориям и том, как в их рамках диагностируются причины неудач традиционных теорий: традиционные теории терпят неудачу, поскольку игнорируют прагматические или контекстуальные элементы. В дальнейшем нам будет важно помнить об этом, поскольку сторонники прагматических теорий склонны вести спор так, будто превосходство их подхода основано просто на наблюдении, что у объяснения есть прагматическое измерение; вместо этого более уместным кажется считать, что вопрос состоит в том, являются ли традиционные подходы в принципе несостоятельными из-за того, что упускают из виду прагматическое измерение объяснения.

Второй вопрос касается того важного факта, что понятие «прагматический» двусмысленно. Принято считать, что прагматические соображения имеют отношение к выгоде или полезности для достижения какой-либо цели, связанной с интересами человека, причём эти интересы в некотором существенном смысле являются «практическими». Назовём это свойство «прагматичность-1». В соответствии с такой интерпретацией, ДН-модель Гемпеля можно справедливо назвать прагматической-1 теорией (или теорией, содержащей прагматические-1 элементы), поскольку в ней объяснительная информация тесно связана с предоставлением информации, полезной для выдвижения предсказаний, а предсказание, вне всякого сомнения, является прагматической целью. По тем же причинам теория объяснения Вудварда [2003] тоже может быть сочтена прагматической-1 теорией: ведь она связывает объяснение с предоставлением информации, полезной для манипулирования и контроля, что, безусловно, является практической целью. Как подразумевают эти примеры, модели объяснения, стремящиеся к достижению традиционных целей, можно рассматривать как прагматические-1 теории.

Однако в контексте теорий объяснения ярлык «прагматический» обычно подразумевает совсем иной набор ассоциаций. В частности, понятие «прагматический» часто используется для описания соображений, касающихся фактов о психологии (интересах, убеждениях и пр.) людей, дающих или получающих объяснения, и/или конкретного контекста, причём и те, и другие могут видоизменяться сложным и нестандартным образом, что не позволяет сделать их частью какой-либо общей теории наподобие тех, к которым стремятся традиционные модели.[23] Назовём это свойство «прагматичностью-2». Теории Гемпеля и Вудварда не являются прагматическими-2. В частности, как показывает пример ДН-модели, тот факт, что теория является прагматической-1 в том смысле, что для обоснования модели объяснения она отсылает к фактам о целях, обычно разделяемых человеческими существами (например, предсказаниях), не мешает пытаться сконструировать модели объяснения, удовлетворяющие традиционным целям, и не требует приверженности представлению, будто объяснение следует понимать как прагматическое-2 понятие. Говоря об этих двух разных способах понимания «прагматического» измерения объяснения, нам следует быть осторожными.

Наконец, как подчёркивалось выше, интерес к прагматическому аспекту объяснения естественным образом связан с вниманием к «психологии» объяснения, и это, в свою очередь, предполагает важность эмпирических исследований тех видов информации, которую различные субъекты (обычные люди, учёные) считают объяснительной и рассматривают как обеспечивающую «понимание», а также различий, проводимых субъектами между разными объяснениями и так далее. Хотя исследователи всё чаще обращаются к этим проблемам, наиболее выдающиеся философы, сторонники прагматических подходов к объяснению, до сих пор их не затрагивали. В этой связи следует сказать, что такая психологическая литература идёт значительно дальше повторяемых в философских дискуссиях банальностей о том, что разные люди в зависимости от своих интересов считают объяснительной разного рода информацию. Например, Ломброзо [2010] находит доказательства того, что субъекты предпочитают объяснения, отсылающие к сравнительно стабильным отношениям (в том смысле, что они сохраняются несмотря на изменяющиеся обстоятельства)[24], а Льен и Ченг [2000] показывают, что в случаях, когда у экспланандума E может быть лишь одна причина C, субъекты предпочитают те уровни объяснения/каузального описания, которые максимизируют Δp = Pr(EC) − Pr(E∣не-C).

Отметим, что в обоих случаях мы имеем дело с отношениями или паттернами того же вида, который стремятся описать традиционные теории объяснения. Как показывают эти примеры, проект формулировки теории объяснения, удовлетворяющей традиционным целям, необязательно будет несовместим с интересом к психологии объяснения. Возможно, субъекты считают определённого рода информацию объяснительной или обеспечивающей понимание потому, что в ней наличествуют определённые структурные характеристики того вида, который пытаются описать традиционные теории. В самом деле, именно об этом и идёт речь в статьях Ломброзо, а также Льена и Ченга.

Дистинкцию того же рода следует проводить между общим проектом исследования эмпирической психологии объяснения (к которому можно приступать, обладая разного рода предпочтениями относительно наилучшего способа рассуждения об объяснении) и более конкретным утверждением, согласно которому описывать, в чем состоит объяснительное отношение между экспланансом и экспланандумом, следует в «психологических» терминах (в том смысле, что такое описание требует неизбежных отсылок к психологическим фактам о конкретной аудитории — например, тому, в чём эти конкретные люди заинтересованы). В целом, вопрос о том, существуют ли стабильные регулярности, связывающие структурные или объективные характеристики совокупностей информации, с тем, считается ли различными субъектами эта информация объяснительной, следует рассматривать как эмпирическую, а не отвлечённую проблему. Возможно, таких регулярностей и нет, и в зависимости от своих интересов и иных психологических факторов люди считают объяснением или сведениями, обеспечивающими понимание, самые разные вещи, но это следует доказать, а не принимать как предпосылку исследования.

 

6.2. Конструктивный эмпиризм и прагматическая теория объяснения

Одна из наиболее влиятельных современных прагматических теорий объяснения связана с конструктивным эмпиризмом. Это тезис, отстаивавшийся Басом ван Фраассеном в книге «Научное представление» [1980]: цель науки (по крайней мере, «чистой» науки) состоит в построении «эмпирически адекватных» (то есть, дающих истинные или верные описания доступных наблюдению явлений) теорий, а не (как считают сторонники научного реализма) теории, целью которых являются буквально соответствующие истине рассказы о недоступном наблюдению. Следовательно, «принятие» теории означает всего лишь убеждение в её эмпирической адекватности [van Fraassen, 1980, p. 12]. Теория объяснения ван Фраассена, изложенная в нескольких статьях и, подробнее всего, в шестой главе «Научного представления» [1980], должна была сочетаться с общей концепцией науки: это концепция, согласно которой эпистемической целью «чистой» науки является не само по себе объяснение (единственной такой целью является эмпирическая адекватность), но, скорее, «прагматическое» преимущество, связанное с «применением» науки. (Отметим, что в той мере, в которой применение науки считается «прагматическим» (то есть, прагматическим-1), а идея, что объяснение является прагматическим в этом смысле, используется для обоснования принятия прагматической (прагматической-2) теории объяснения, мы получаем смешение двух выделенных выше понятий «прагматического».) Поскольку объяснение имеет лишь прагматическую значимость, интерес к объяснению не потребует от учёных перехода от убеждения в эмпирической адекватности их теорий к убеждению в буквальной истинности утверждений о недоступных наблюдению сущностях.

Согласно ван Фраассену, объяснения являются ответами на вопросы, и для создания теории объяснения необходимо разобраться с логикой вопросов. Вопросы могут быть сформулированы по-разному, но, когда речь идёт о вопросах «почему», поиски объяснения обычно имеют следующую форму: это поиск объяснения того, почему имеет место некий экспланандум Pk, а не любой конкретный элемент противоположного ему X (набора возможных альтернатив Pk). Кроме того, вопрос предполагает наличие некого «отношения релевантности» R. Ответ A на такой вопрос будет иметь вид: «Pk в противоположность (остальному) X, поскольку A, где A имеет к [Pk, X] отношение релевантности R». Рассмотрим пример ван Фраассена: «Почему провод погнут?» В зависимости от контекста, подразумеваемое противопоставление может заключаться, например, в том, почему этот конкретный провод погнут в отличие от другого, оставшегося прямым, или, напротив, почему этот конкретный провод погнут сейчас, хотя ранее он был прямым. Отношение релевантности R также зависит от контекста и информации, которую хотел бы получить вопрошающий. Например, R может касаться информации о причинах (мы можем спросить, что вызвало искривление), но также и о функции — если контекст предполагает, что форма провода играет некую функциональную роль на электростанции, и вопрос именно о ней. Таким образом, «контекст» оказывается важным для объяснения при уточнении как противопоставленного Pk класса X, так и отношения R. Ван Фраассен описывает разные правила «оценки» ответов. Например, Pk и A должны быть истинными, другие элементы противопоставленного класса не должны быть истинными, A должен «предпочитать» (увеличивать условную вероятность) Pk другим альтернативам и иметь преимущества перед другими ответами на тот же вопрос (условие, которое само по себе неоднозначно: например, можно спросить, подтверждает ли A предмет обсуждения в большей степени, чем другие ответы, и нет ли других ответов, которые были бы лучше, чем А, по этому основанию). Однако он также ясно даёт понять (как показывает приведённый выше пример), что в зависимости от контекста может оказаться подходящим множество различных отношений релевантности, и что оценка ответов также зависит от контекста. Более того, он недвусмысленно отрицает, что у категории научного объяснения есть какая-то характерная черта, связанная со структурой или формой; напротив, оно является просто объяснением, использующим информацию, которая основывается на «научной» теории (или, по крайней мере, рассматривается под этим углом).

Ван Фраассен резюмирует свои представления об объяснении (и указывает на то, какие у него есть основания отвергать объективистские подходы) следующим образом:

Обсуждение объяснения с самого начала пошло по неверному пути, когда его интерпретировали как отношение, подобное описанию: отношение между теорией и фактом. На деле это тройственное отношение между теорией, фактом и контекстом. Неудивительно, что все предложенные отношения между теорией и фактом подходили лишь для небольшого числа примеров! Для объяснения исключительно важно то, что оно является ответом… его следует оценивать на фоне вопроса, то есть запроса на информацию. Но то, что именно… запрашивается, отличается от контекста к контексту [1980, p. 156].

Ван Фраассен начинает главу об объяснении с короткого вступления, задающего тон тому, как должна работать его теория. В разделе 2.5 говорилось, что хорошо известный контрпример к ДН-модели включает утверждение, что можно объяснить длину S тени, отбрасываемой флагштоком, через его высоту H, но (по-видимому) нельзя объяснить H через S, и это несмотря на то, что можно построить ДН-умозаключение, ведущее от S к H. Это — общепризнанное доказательство того, что ДН-модель оставляет незатронутыми некоторые факторы, имеющие отношение к направленности или асимметрии объяснения: например, асимметрию отношений между причиной и следствием, которая должна быть включена в модель объяснения. Во вступлении ван Фраассена сначала предлагается непосредственное каузальное объяснение S через H (хотя речь идёт о башне, а не флагштоке). Затем выдвигается второе объяснение, в котором высота башни «объясняется» тем, что она была построена так, чтобы отбрасывать тень определённой длины. Предположительно, отсюда мы должны сделать вывод, что, в зависимости от контекста и сущностного отношения R приемлемыми (допустимыми, подходящими и т. п.) будут оба объяснения: как «H объясняет S», так и «S объясняет H». Более того, поскольку это множество контекстов и отношений релевантности оказывается зависящим от множества вещей, интересных объясняющему или его аудитории, нас подталкивают к выводу, что источником асимметрии в объяснении являются, скорее, психологические факты об интересах и базовых убеждениях людей, а не, скажем, асимметрия, существующая в природе независимо от них. Те, кто придерживается прагматических взглядов на объяснение, полагают, что мы должны сделать сходное заключение и для других характеристик объяснительного отношения релевантности, которое философы пытались описать посредством традиционных моделей объяснения.

Очевидным ответом на это заявление, данным несколькими критиками [например, Kitcher and Salmon, 1987, p. 317], будет то, что на самом деле в этом примере мы имеем дело не с таким случаем, когда в зависимости от контекста H каузально объясняет S и S каузально объясняет H. Вместо этого, хотя H и в самом деле каузально объясняет S, высоту (или выбор высоты) башни объясняет (или, по меньшей мере, каузально объясняет) нечто вроде желания получить тень длиною S (а не сама длина тени S). Или, если хотите, в последнем случае мы имеем нечто вроде функционального (а не каузального) объяснения высоты башни: в том смысле, что нам говорят, какова предполагаемая функция такого выбора высоты. В любом случае, это не будет примером, в котором то, H ли каузально объясняет S или S каузально объясняет H, зависит от факторов, связанных с интересами говорящего или его аудитории, или других контекстуальных факторов. Если это так, то пример с башней не доказывает, что асимметрию, которая присутствует в примере с флагштоком, следует описывать с точки зрения прагматических факторов: о ней можно говорить и иначе. На деле, хотя эта дискуссия и выходит за рамки данной статьи, было предложено несколько возможных вариантов такой непрагматической теории каузальной асимметрии как в области философии, так и за её пределами (например, к литературе по самообучению машин): среди них асимметрия в каузальной возможности соединения (в том виде, в каком её описывает Хаусман [1998]), разного рода статистические асимметрии [например, Spirtes, Glymour, and Scheines, 2000] и асимметрии в информационной зависимости [например, Janzing, 2012]. Может быть, все эти теории и неверны, но сложно сказать, как можно доказать их ошибочность с помощью одних только наблюдений наподобие того, которое выдвигает ван Фраассен в примере с башней и тенью. Чтобы доказать их ошибочность, потребуется подробный критический анализ самих непрагматических теорий каузальной асимметрии.[25]

Критике с гораздо более общих позиций предложенная ван Фраассеном версия прагматической теории была подвергнута Сэлмоном и Китчером [1987]. По сути, они были недовольны тем, что отношение релевантности R в теории ван Фраассена ничем не ограничено, и вследствие этого для любой пары истинных пропозиций P и А ответ А связан с P неким отношением релевантности и, таким образом, «объясняет» P (что они считали абсолютно неприемлемым). Например, согласно Сэлмону и Китчеру, мы можем определить отношение «астрального влияния» R*, удовлетворяющее критерию ван Фраассена для отношений релевантности, так что время t смерти человека объясняется через R* и положение различных небесных тел в момент t. Может показаться, что ван Фраассену легко на это ответить. Как отмечалось выше, по его мнению, базовые знания и (в случае научного объяснения) современные научные знания помогают определить, что является приемлемым сущностным отношением и ответом на вопрос, поставленный запросом на объяснение: такое знание и связанные с ним ожидания являются частью контекста, в котором мы просим объяснить, почему смерть наступила именно в момент t. Очевидно, что в рамках современных научных представлений астральное влияние не будет приемлемым или допустимым сущностным отношением — поэтому теория ван Фраассена и не сочтёт его объяснением. В общем, можно сказать, что доступное научное знание налагает ограничения на сущностные отношения и ответы, позволяя нам не беспокоиться, что «всё, что угодно сойдёт» за таковые (как это делают Сэлмон и Китчер): по крайней мере, до тех пор, пока мы пребываем в контексте, где принято искать «научное объяснение».

Хотя этот ответ и может показаться в известном смысле убедительным, он показывает, в сколь значительной степени необходимость различать между тем, что может, и что не может быть объяснением в рамках теории ван Фраассена, обусловлена очень общими представлениями о том, что в современной науке принимается как допустимая базовая информация. Иными словами, это внушает тревогу: как только мы выходим за рамки формальной схемы ван Фраассена, описывающей вопросы и ответы (которые, как признаёт сам ван Фраассен, сравнительно неограниченны), то сталкиваемся с теорией, согласно которой научное объяснение — всего-навсего объяснение, включающее утверждения, почёрпнутые из современной науки, и в данный момент научно подтверждаемое отношение релевантности. Даже если это предложение и не имеет других недостатков, оно если не банально, то, по крайней мере, дефляционно, и даёт нам куда меньше, чем можно было бы надеяться получить от теории объяснения. В частности, в случаях, когда в какой-либо области науки продолжается спор или дискуссия не о том, является ли предлагаемая теория или модель верной, но, скорее, о том, объясняет ли она некое явление (чему можно привести немало примеров), нелегко увидеть, каким образом предложенная теория может рассчитывать снабдить нас какими-либо руководящими указаниями. С другой стороны, очевидным возражением критикам ван Фраассена будет утверждение, что не может быть более амбициозного подхода, который удовлетворял бы ожиданиям, ассоциирующимся с более традиционными теориями объяснения (включая разделение предлагаемых объяснений на «верные» и «неверные») — такая теория, как теория ван Фраассена, настолько хороша, насколько только может быть. Если нельзя предложить приемлемой теории объяснения, которая включала бы в себя существенно ограничивающее отношение релевантности, то обвинять теорию ван Фраассена в том, что она на это неспособна, не будет честной критикой.[26] Так что — по крайней мере, с точки зрения ван Фраассена — традиционные модели представляют собой ориентир не лучший, чем его теория.

И наконец, теория ван Фраассена предлагает нам следующее: в случае прагматических теорий очень важно, в какой именно момент «прагматические» элементы вводятся в теорию объяснения. Один из таких моментов — выбор или описание того, объяснения чего именно ждёт аудитория. Это в теории ван Фраассена отражается в выборе Pk и связанного с ним противопоставленного класса X. Очевидно, что, ищем ли мы объяснение того, почему, скажем, этот конкретный провод теперь погнут, если ранее он был прямым, или желаем знать, почему он погнут, хотя какой-то другой провод — прямой, — это зависит от нашего интереса. Однако этот конкретный вид «относительности интереса» (и связанный с ним факт, что мы обращаем внимание на разные аспекты того, что именно мы хотим объяснить) кажется понятием, которое легко может быть признано традиционными теориями.[27] В конце концов, то, что одна аудитория заинтересована в объяснении фотоэлектрического эффекта, а не отклонения звёздного света солнцем, а у другой — абсолютно противоположные желания, не представляет угрозы для ДН-модели или других моделей с такими же традиционными притязаниями. Что было бы угрозой ДН– и подобным ей моделям, так это доказательство, что, стоит полностью определить некий экспланандум Е, то, объясняет ли эксплананс М экспланандум Е (то есть, есть ли объяснительное отношение между М и Е) само по себе будет «определяться интересами аудитории». Вполне естественно увидеть в теории ван Фраассена последнее утверждение: как в связи с объяснительной асимметрией, так и в более общем отношении.

 

6.3. Объяснение как иллокутивный акт

В центре внимания другой весьма влиятельной прагматической теории объяснения находится акт объяснения, понимаемый как иллокутивный акт (в том смысле, в котором это понятие используется в теории речевых актов). Наиболее систематическое изложение этого подхода дал Питер Ахинштайн [см., в особенности, Achinstein, 1983]. Как многие сторонники прагматических теорий, Ахинштайн стремился к описанию очень широкого понятия об объяснении, включающего не только каузальные объяснения (и не только ответы на вопросы о том, почему что-то происходит), но и такие понятия, как объяснение значения слова, шахматных правил, функций каких-либо биологических структур и так далее. Его теорию очень сложно изложить во всех подробностях: в данной статье мы можем лишь попытаться представить самый беглый её набросок.

Ахинштайн начинает с того, что именно включает в себя объяснение чего-либо, данное кем-либо кому-либо. Согласно Ахинштайну, в таких случаях ключевую роль играет намерение объясняющего нечто субъекта: в частности, при объяснении объясняющий должен иметь намерение сделать нечто (грубо говоря, определённый вид непрямого вопроса q, соответствующего тому, что объясняется) «понятным». Объяснение (понимаемое как плод акта объяснения), определяется затем как упорядоченная пара «один из элементов которой — вид действия, объясняющего q [см. выше]… а другой — пропозиция, дающая ответ на вопрос q» [2010, p. xi]. Например, даваемое Ньютоном объяснение того, почему возникают приливы, представлено такой парой: (Приливы возникают из-за притяжения Луны: объяснение того, почему возникают приливы). Ахинштайн различает между «верными» и «подходящими» объяснениями. «Верное объяснение — то, в котором истинным является пропозициональный элемент упорядоченной пары» [2010, xi]. Тем не менее, верное объяснение может быть и не подходящим, поскольку, например, оно каким-то из многочисленных способов не соответствует способностям и интересам аудитории, для которой предназначено. Далее Ахинштайн характеризует понятие подходящего объяснения, вводя ряд инструкций для конструирования объяснения, причём такие инструкции чувствительны к интересам, убеждениям и т. п. аудитории. Такие инструкции могут уточнять, например, что необходимо именно каузальное, а не какое-либо иное объяснение, или что необходимое в данном случае объяснение должно отсылать к явлениям микромира. Очень важной особенностью «прагматической» позиции Ахинштайна является то, что, как в науке, так и в других областях, не существует единого универсального набора инструкций, подходящего для любой аудитории или контекста. Следовательно, традиционные теории, стремящиеся обеспечить нас такими инструкциями, являются (в этом отношении) ошибочными. Ахинштайн пишет:

Теперь позвольте мне выдвинуть гипотезу. Предположим, вслед за Гемпелем и Сэлмоном, вы формулируете ряд объективных, непрагматических критериев, которым, как вы полагаете, должны удовлетворять заслуживающие высокой оценки научные объяснения. Эти критерии будут универсальными в том смысле, что они не должны изменяться от объяснения к объяснению, но должны быть применимы ко всем научным объяснениям. Они также являются универсальными в том смысле, что они не включают конкретных эмпирических допущений или предположений, которые учёные могли бы сделать лишь в одной области или контексте. Поэтому они могут включать использование законов, каузальных факторов и количественных гипотез, удовлетворять некоторым критериям единства или простоты и так далее. Моя гипотеза заключается в том, что, каким бы ни был этот предложенный вами набор объективных, непрагматических, универсальных критериев, вы всегда сможете найти или сконструировать для него контрпримеры, рассматриваете ли вы его как набор необходимых или как набор достаточных условий [2010, p. 137].

Ахинштайн иллюстрирует это утверждение ссылкой на объяснение рассеивания альфа-частиц, данное в 1911 году Резерфордом. Это объяснение отсылает к предположению о структуре атома: в частности, к тому, что позитивно заряженным является ядро, объём которого по сравнению с объёмом всего атома мал. Это позволяет сделать вывод о количественном выражении амплитуды рассеивания под различными углами. Согласно Ахинштайну, другие конкурирующие объяснения (например, объяснение, просто дающее количественное выражение, описывающее рассеивание, но не связывающее его с утверждениями о структуре ядра, могут удовлетворять различным традиционным критериям объяснительной пригодности, которые можно найти в литературе по философии науки (такие объяснения могут иметь ДН-структуру, описывать причины, быть унифицирующими и т. д.) но, тем не менее, быть менее подходящими, чем объяснение Резерфорда. Объяснение Резерфорда является подходящим (настолько, насколько может таковым быть), поскольку оно даёт объяснение «на субатомном уровне существования материи таким образом, каким физикам того времени хотелось бы объяснить рассеяние» [2010, p. 136, курсив Ахинштайна]. Иными словами, чтобы объяснить, в каком отношении объяснение Резерфорда является подходящим (или более подходящим, чем конкурирующие объяснения) мы неизбежно должны сослаться на интересы физиков его времени. В этом смысле теория «подходящего объяснения» Ахинштайна является, по его словам, «строго прагматической». Его предположение хорошо описывает большую часть (хотя, возможно, и не все) расхождения между прагматическими и традиционными (не чисто прагматическими) теориями объяснения. Центральным вопросом является то, возможно ли понять, в каком отношении объяснение Резерфорда лучше своих конкурентов, посредством объяснительного отношения, которое может быть определено независимо от интересов конкретной аудитории (и, возможно, иных относящихся к делу психологических фактов), а также неустранимо «контекстуальных» фактов (например, утверждения, что в данном случае подходящее объяснение обязательно должно отсылать к субатомному уровню существования материи, но независимо от фактов об интересах людей нельзя сказать ничего более общего о том, почему более предпочтительным является объяснение, отсылающее к этому уровню). Убедительный аргумент в пользу второй альтернативы, предположительно, будет требовать (по меньшей мере) исследования существующих традиционных теорий и демонстрации того, что они неудачны. Это исследование Ахинштайн предпринимает в работе [1983], и неудивительно, что существуют разные мнения о том, удалось ли ему доказать поражение объективистов.

 

6.4. Заключительные соображения о прагматических теориях

До сих пор мы говорили о «прагматических» и «традиционных» теориях как о диаметральных противоположностях. Это соответствует тому, как их обычно излагают как сторонники, так и противники. Однако стоит рассмотреть возможность того, что некоторые идеи, связанные с этими теориями, можно сочетать друг с другом, расширяя таким образом круг возможных подходов к объяснению, что позволяет лучше понять оба подхода. Во-первых, мы можем разделить утверждение, что объяснение содержит неустранимо «контекстуальные» элементы, и утверждение, что контекстуальные элементы следует понимать через факты о психологии (интересах и т. д.) участников ситуации объяснения. Альтернативная возможность состоит в том, что объяснение и в самом деле является неустранимо контекстуальным, но эти контекстуальные элементы следует рассматривать не как психологические, а, грубо говоря, с точки зрения той роли, которую конкретные эмпирические факты играют в объяснении, где релевантность таких фактов не может быть интерпретирована с помощью ресурсов ДН– и других традиционных моделей (то есть, она не позволяет интерпретировать себя в терминах отношений дедуктивного следования, статистической релевантности и т. п.). Возможной иллюстрацией может стать пример самого Ахинштайна с объяснением рассеивания альфа-частиц сведениями о строении атомного ядра. Как было отмечено выше, сам Ахинштайн полагает, что в этом случае пригодность объяснения зависит от контекста, поскольку определяется психологическими фактами: в частности, она отражает тот факт, что физики особенно «заинтересованы» в объяснениях, ссылающихся на структуру атомного ядра. Альтернативная возможность состоит в том, что объяснение содержит неустранимо «контекстуальные» элементы в том смысле, что в эмпирических подробностях этого конкретного случая есть нечто, что делает факты о строении атомного ядра значимыми для объяснения рассеивания, но эта значимость не может быть полностью объяснена с точки зрения абстрактных структурных особенностей («объективные», непрагматические, универсальные критерии Ахинштайна), находящихся в центре внимания традиционных теорий. Таким образом, эта возможность предполагает непсихологическое понятие «контекстуального», которое отличается от представления о том, что объяснительное отношение можно описать независимым от контекста способом. Чтобы разъяснить это понятие, обратимся к ДН-модели. Она не зависит от контекста в том смысле, что, согласно ей, до тех пор, пока определённые структурные отношения между экспланансом (Ci, Li) и экспланандумом E сохраняются, не имеет значения, что именно мы понимаем под Ci, Li и E — полученная структура всё равно будет объяснением. Сторонник контекстуального (в непсихологическом смысле) подхода к объяснению вместо этого скажет, что, о каком бы независящем от контекста вероятном объяснительном отношении мы не говорили (даётся ли это определение в терминах дедуктивных или вероятностных отношений или иных столь же формальных и абстрактных — или в той же мере притязающих на универсальность — понятий), всё равно будут соответствующие этой структуре примеры, являющиеся объяснениями, и примеры, таковыми не являющиеся — в том смысле, что конкретное значение структурных элементов определяет то, получим ли мы объяснение.

Дополнительная аналогия может наполнить эту идею содержанием. Джон Нортон (например, в готовящейся к печати работе и ряде других статей) отстаивает то, что называет «материальной теорией индукции». По его мнению, надёжность различных индуктивных умозаключений зависит от связанных с ними конкретных эмпирических («материальных») допущений таким образом, который препятствует формулировке любой универсальной логики индукции: не существует универсальной формы индуктивного аргумента, обеспечивающего надежность вывода вне зависимости от конкретного содержания этого аргумента. Однако Нортон не считает, что индуктивное подкрепление в каком-либо отношении является субъективным или определяется интересами и т. д. конкретной аудитории — основанием отношения доказательства являются эмпирические факты, никак не связанные с психологией (конечно же, за исключением тех случаев, когда отношения доказательства касаются психологических гипотез). Можно сказать, что, по его мнению, индуктивное умозаключение является контекстуальным в том смысле, что оно зависит от содержания, но, в то же время, не требует отсылок к психологическим характеристикам.

Возможно, то же самое верно и для объяснения. Например, вероятно, соответствует истине то, что, чтобы понять, в каких отношениях объяснение Резерфорда является подходящим, следует учитывать (в дополнение к общим, относительно независимым от содержания требованиям унификации, выводимости из законов и т. п.) и ограничения, связанные с конкретными, касающимися именно данного случая, материальными фактами о структуре атомного ядра: в том смысле, что объяснением рассеивания альфа-частиц не может считаться объяснение, не учитывающее эти факты, и что другие объяснения той же формы, не отсылающие к структуре атомного ядра, не будут считаться объяснениями. Но, возможно, эти дополнительные ограничения касаются, скорее, фактов об устройстве этого мира, чем (как полагает Ахинштайн) фактов о том, что интересовало физиков во времена Резерфорда. Такого рода представления могут отражать (или признавать) некоторые из делаемых в рамках прагматических подходов утверждений о роли контекстуальных элементов в объяснении, но избегут некоторой предрасположенности таких подходов к субъективизму или психологизму. Они будут «контекстуальными» в том смысле, в котором является контекстуальной материальная теория индукции Нортона.

Со сказанным тесно связана идея, что, если кто-то склонен включать в теорию объяснения контекстуальные элементы, остаётся ряд возможных способов, которыми контекстуальные элементы могут сочетаться с другими, более универсалистскими. Как предлагалось выше, может оказаться, что лучше будет считать, что элементы обоих видов могут синергетически взаимодействовать, чем представлять их прямо противоположными друг другу. В качестве примера возьмём понятие унификации. Возможно, мы не можем дать адекватной характеристики этого понятия и его роли в объяснении, если рассматриваем его чисто формально и независимо от контекста: например, как вывод множества заключений из немногих исходных предположений или замену теорий со многими свободными параметрами теориями, в которых таких параметров немного. Тем не менее, может оказаться верным, что, если конкретные материальные или эмпирические ограничения используются для того, чтобы ограничить класс рассматриваемых теорий, которые затем сравниваются с точки зрения достигаемой ими степени унификации, то нечто наподобие вычисления исходных допущений или числа свободных параметров (или, что более убедительно, нечто в том же роде, но более изощрённое) даёт полезную информацию о достигаемой степени унификации. Опять полезной оказывается аналогия с теориями индуктивного рассуждения. Разумеется, неверно, что все попытки создать в этой области формальные или общие теории ошибочны и обречены на провал: различные подходы к статистическому выводу и машинному самообучению являются очевидными тому контрпримерами. С другой стороны, успешные теории в этой области не являются совершенно универсальными или независящими от контекста; напротив, во многих случаях они дают результаты, которые представляются логичными или нормативно верными при определённом применении, или когда конкретные исходные эмпирические условия удовлетворены, но не в других ситуациях. Иными словами, такие теории одновременно чувствительны к содержанию и включают элементы, представляющиеся объективными и структурными. Возможно, что-то наподобие этого и окажется нашим подлинным «объяснением».

Рекомендованная литература: ван Фраассен [1980], в особенности шестая глава, и Ахинштайн [1983] — классические изложения прагматических подходов к объяснению. Эти подходы обсуждаются и критически анализируются Сэлмоном [1989]. Теория ван Фрассена разбирается также в работе [Kitcher and Salmon 1987]. [De Regt and Dieks 2005] — более современная защита того, что авторы называют «контекстуальной» теорией понимания, затрагивающая некоторые проблемы «прагматики объяснения», обсуждаемые в научной литературе.

 

7. Выводы, открытые вопросы и направления дальнейших исследований

Какие выводы можно сделать из описания некоторых наиболее известных современных попыток построения моделей научного объяснения? Какие важные вопросы остались без ответа, и каковы наиболее многообещающие направления дальнейших исследований? Разумеется, любая оценка будет отражать частную точку зрения, но, если это учесть, некоторые наблюдения представляются достоверными, если и не совершенно свободными от противоречий.

 

7.1. Роль причинности

Первое касается роли каузальной информации в научном объяснении. Убедительным, хотя и вовсе не обязательным кажется суждение,[28] что многие из трудностей, с которыми сталкиваются описанные выше модели, связаны с тем, что они полагаются на интерпретации причинности и каузальной релевантности, представляющиеся неадекватными. Описанные в параграфе 2.5 проблемы объяснительной асимметрии и иррелевантности, по всей видимости, показывают, что наличия понимаемого как регулярность закона, связывающего С и Е, недостаточно для того, чтобы С было причиной Е, а значит, недостаточно и для присутствия С в объяснении Е. Если аргумент в параграфе 3.3 верен, фундаментальная проблема СР-модели состоит в том, что информации о статистической релевантности недостаточно для всеобъемлющего изложения каузальной информации в том смысле, что различные каузальные структуры могут сочетаться с той же самой информацией об отношениях статистической релевантности. Равным образом, КМ-модель сталкивается с проблемой, что информации о каузальных процессах и взаимодействиях также недостаточно для всеобъемлющего описания отношений каузальной релевантности, и что существует ряд ситуаций, в которых имеют место каузальные отношения между С и Е (и, следовательно, С участвует в объяснении Е), хотя и не существует каузального процесса, связывающего С и Е. Наконец, фундаментальной проблемой унификационистских моделей является то, что содержание наших каузальных суждений, по-видимому, возникает не из-за усилий, которые мы прикладываем для достижения унификации (по крайней мере, когда унификация понимается в том смысле, который отстаивает Китчер). Например, как обсуждалось выше, соображения, касающиеся унификации, сами по себе не объясняют, почему возможно объяснять следствия через их причины, а не наоборот.

По самой меньшей мере эти наблюдения предполагают, что прогресс в понимании «научного объяснения» может потребовать большего внимания к понятию причинности и более глубокого знания участниками дискуссий об объяснении растущей литературы, посвящённой причинности: как в рамках философии, так и за её пределами.[29] В этой связи многообещающими могут оказаться контрфактуальные теории причинности [ср. Woodward, 2003].

Означает ли это, что внимание к причинности должно полностью вытеснить проект построения моделей объяснения, или что философам следует прекратить говорить об объяснении, обратившись вместо этого к причинности? Несмотря на то, что причинность играет в объяснении центральную роль, предложение полностью заместить последнее первой ведёт к упущению некоторых важных обстоятельств. Во-первых, по-видимому, сами каузальные утверждения значительно различаются по степени своей объяснительной глубины или возможности поспособствовать пониманию. Основанные на ньютоновской механике каузальные утверждения с точки зрения объяснения кажутся более глубокими и лучше служащими своей цели, чем каузальные утверждения типа «камень разбил окно». Обычно считается, что подобные различия связаны с другими характеристиками: например, с тем, насколько общим, неизменным, сочетаемым с базовыми знаниями является каузальное утверждение. Однако, как мы уже отметили, не все виды всеобщности, неизменности и т.д. кажутся значимыми для объяснения (или связанными с пригодностью объяснения). Поэтому даже если мы занимаемся лишь каузальным объяснением, остаётся важный проект, цель которого — постараться лучше понять, какого рода различия между каузальными утверждениями имеют значение для пригодности объяснения. В той мере, в которой это так, те виды вопросов, которые вдохновляли традиционные интерпретации объяснения, по-видимому, не будут полностью поглощены стандартными теориями причинности.

Возникает также важный вопрос о том, все ли допустимые формы «почему-объяснения» являются каузальными. Некоторые авторы [например, Nerlich, 1979] утверждают, что существует множество физических объяснений, которые являются, скорее, «геометрическими», чем каузальными — в том смысле, что они состоят в объяснении явлений с помощью ссылок на структуру пространственно-временного континуума, а не на факты о силе или передаче энергии/импульса. (Говоря о последних, Нерлих рассматривает каузальные объяснения в области физики.) Согласно Нерлиху, объяснение траектории, по которой движется свободная частица, указанием на то, что она следует геодезической линии в пространственно-временном континууме, будет примером, скорее, геометрического, а не каузального объяснения. Подлинно удовлетворительная теория объяснения должна давать некий апеллирующий к принципам ответ на вопрос о том, все ли объяснения должны быть каузальными (и, если да, то в соответствии с каким именно понятием каузальности), а не просто предполагать утвердительный (или отрицательный) ответ на этот вопрос. И опять-таки, в той степени, в которой возможно существование некаузальных форм объяснения, объяснение останется темой, по меньшей мере в некоторых отношениях независимой от понятия причинности.

 

7.2. Объяснение и другие эпистемические цели

В работе [1992] Норетта Кёртге отметила, что, хотя посвящённая объяснению литература и очень обширна, при построении различных конкурирующих моделей объяснения сравнительно мало внимания уделяется вопросу о том, для чего они используются, или в чём состоит их более общее назначение (помимо описания «нашего» понятия об объяснении). Вместе с этим авторы, пишущие об объяснении, не всегда уделяют достаточно внимания тому, как само объяснение связано или взаимодействует (или отличается) от более общих целей исследования: например, какова связь между объяснительной пригодностью (explanatory goodness) и другими часто предлагаемыми целями исследования — доказательным подкреплением, предсказанием, контролем над природой, простотой и т. д. В результате не вполне ясно, как оценивать значение наших интуитивных суждений о пригодности объяснений или определять, почему мы выносим то, а не иное суждение. Например, как мы отмечали, большинство людей интуитивно считает, что невозможно объяснить высоту флагштока ссылкой на длину его тени.

Однако последовательный сторонник ДН-модели [например, Hempel, 1965, pp. 353–4] легко может спросить, почему эти интуитивные суждения должны нас так впечатлять. Возможно, наша предшествующая критическому анализу оценка в том или ином смысле противоречива или ошибочна, или, возможно, она просто отражает прагматические соображения, которым нет места в теории объяснения. Одним из ответов на такой скептицизм было бы предоставление формально непротиворечивого описания того, какие именно важные элементы будут потеряны или упущены, если мы не сумеем провести различие между объяснениями длины тени посредством высоты флагштока и «объяснениями», двигающимися в противоположном направлении. (Отметим, что в той мере, в которой нас интересует просто предсказание, между двумя умозаключениями, по-видимому, существует паритет. «Формально непротиворечивый» означает здесь, что мы не просто говорим, что высота является причиной тени, а не наоборот, но что мы даём некое дальнейшее разъяснение того, в чём состоит разница и почему она важна.) Возможным ответом будет ссылка на эпистемическую цель: получить информацию, важную для манипулирования и контроля; одним из способов изменения длины тени является изменение длины флагштока, но не наоборот. Эта разница реальна вне зависимости от наших интуиций об объяснении в обоих описанных случаях.[30]

Что бы мы ни думали о конкретном ответе, более важным является то, что одним из способов уточнения оценок, которые мы даём конкурирующим моделям объяснения, будет в меньшей степени (или не только) сосредоточение внимания на том, описывают ли они наши интуитивные суждения, и в большей — на том, являются ли требуемые ими виды информации ценными (и достижимыми), насколько ценными и достижимыми они являются, и как эта информация соотносится с другими важными для нас целями исследования.

В качестве другого примера рассмотрим КМ-модель. В её основе, предположительно, лечит суждение о том, что прослеживание каузальных процессов и их взаимодействий — достойная цель исследования. Конечно, мы можем попытаться защитить правоту этого суждения, просто заявив, что выделение причин — важная цель, и что теории каузальных процессов приводят к верным описаниям причин. Но стратегией, формально непротиворечивой и способной принести больше ясности, будет спросить, как эти цели относятся к другим эпистемическим ценностям. Например, какова связь между целью выявления каузальных процессов и построением унифицированных теорий? Или между выявлением каузальных процессов и открытием информации, важной для предсказания, или делающей возможной манипулирование и контроль? Будут ли это одни и те же цели? Или независимые, но взаимодополняющие? Или конкурирующие цели (в том смысле, что достижение одной из них может усложнить достижение другой)? Очевидно, что то же самое можно спросить о цели унификации.

Потребность в таких интерпретациях объяснения, которые более адекватно связывают это понятие с другими понятиями и целями, особенно очевидна в связи с ролью законов в объяснении — ещё одной проблемой из этой области, требующей дальнейшего изучения. Теория законов, в данный момент считающаяся многими философами самой многообещающей, — это теория Милля-Рамси-Льюиса (МРЛ). Согласно этой теории, законы — это такие обобщения, которые в качестве аксиом или теорем участвуют в дедуктивной систематизации наших эмпирических знаний, достигающей наилучшего сочетания простоты и силы (где сила имеет отношение к количеству эмпирических истин, которые можно таким образом вывести).[31] Естественно связывать концепцию законов с унификационистскими подходами к объяснению: если законы — это обобщения, играющие центральную роль в достижении простых (и, предположительно, унифицированных) дедуктивных систематизаций, то, отсылая к законам при даче объяснения, мы достигаем объяснительной унификации; это делает понятным, почему желательно, чтобы объяснения отсылали к законам.[32] Если мы сможем довести такую теорию до рабочего состояния, то получим своего рода всеобъемлющее описание законов и объяснения, которых почти нет в ДН-модели; в этом описании законы будут тем, что напрямую связано с представлением о цели объяснения. Разумеется, остаются настоящие проблемы (о некоторых из которых мы говорили выше) с унификационистской теорией объяснения и, собственно говоря, с МРЛ-теорией законов,[33] но всеобъемлющее описание, которое мы можем получить, объединив их, тем не менее, можно будет использовать в качестве иллюстрации того, к чему мы стремимся.

 

7.3. Возможна ли единая модель объяснения?

Ещё одна общая проблема касается степени, в которой возможно конструирование единой модели объяснения, подходящей для всех областей науки. Без сомнения, объяснительная практика (то, что мы принимаем в качестве объяснения, как цели объяснения взаимодействуют с другими целями исследования, какого рода объяснительная информация считается достижимой, что можно обнаружить, проверить и т. д.) в различных дисциплинах значительно различается. Тем не менее, все описанные выше модели объяснения являются «универсалистскими» по своим целям: они утверждают, что единая, «универсальная» модель объяснения подходит для всех областей до тех пор, пока в них наличествует обоснованное притязание на объяснение. Хотя крайняя позиция, согласно которой объяснение в биологии или истории не имеет ничего общего с объяснением в физике, кажется непривлекательной (и в любом случае имеет мало сторонников), разумным представляется ожидать, что в будущем больше усилий будет приложено к разработке моделей объяснения, чувствительных к различиям научных дисциплин. В идеале такие модели будут выявлять общие для разных дисциплин свойства, но одновременно они также должны позволять нам понять, почему объяснительная практика в них так различается, и в чём состоит значение этих различий. Например, как отмечалось выше, биологи, в отличие от физиков, часто описывают цели объяснения как открытие, скорее, механизмов, чем законов. Хотя и возможно, что эта разница чисто терминологическая, стоит также рассмотреть возможность того, что можно сказать нечто специфическое о том, что такое механизм (в том смысле, в котором это понятие используется биологами), и что именно информация о механизмах добавляет к объяснению.

С этим тесно связан тот факт, что, по меньшей мере, некоторые из описанных выше моделей налагают на объяснение требования, которые в некоторых областях исследования могут быть удовлетворены, в то время как либо окажутся недостижимыми (в любом практическом смысле слова) в других дисциплинах, либо в той мере, в которой они достижимы, не будут иметь никакого очевидного отношения к общепринятым в данной дисциплине целям исследования. Например, выше мы отмечали, что многие учёные и философы придерживаются мнения, что в биологии и науках об обществе и поведении законов, которые можно открыть, либо мало, либо вовсе нет. Если это так, то модели объяснения, в которых центральную роль играют законы, не многое сообщат нам о том, как работает объяснение в этих дисциплинах. Возьмём иной пример: даже если мы предположим, что рекомендуемое СР-моделью разделение на объективно однородные классы представляет собой цель, достижимую в связи с определёнными явлениями в области квантовой механики, может оказаться (как предполагается выше), что эта цель попросту недостижима каким-либо значимым образом в экономике и социологии — дисциплинах, где каузальные выводы, делаемые на основании статистических данных, также играют важную роль. В подобных дисциплинах может оказаться, что дополнительное статистически релевантное разделение любого интересующего исследователей множества или подмножества будет, фактически, всегда возможно, так что обнаружение таких разделений окажется ограниченным лишь издержками на сбор дополнительной информации. Подобная оценка может оказаться справедливой для большинства применений КМ-модели в области общественных наук.

 

Библиография

  • Achinstein, P., 1983,The Nature of Explanation, New York: Oxford University Press.
  • Achinstein, P., 2010,Evidence, Explanation, and Realism: Essays in Philosophy of Science, New York: Oxford University Press.
  • Barnes, E., 1992, ‘Explanatory Unification and the Problem of Asymmetry.’Philosophy of Science, 59: 558–71.
  • Braithwaite, R., 1953,Scientific Explanation, Cambridge: Cambridge University Press.
  • Bromberger, S., 1966, ‘Why Questions’, inMind and Cosmos: Essays in Contemporary Science and Philosophy, R. Colodny, (ed), Pittsburgh: University of Pittsburgh Press.
  • Cartwright, N., 1979, ‘Causal Laws and Effective Strategies’Noûs, 13: 419–437.
  • Cartwright, N., 1983,How the Laws of Physics Lie, Oxford: Clarendon Press.
  • Cartwright, N., 2004, ‘From Causation to Explanation and Back’ In B. Leiter (ed)The Future for Philosophy Oxford: Oxford University Press.
  • De Regt, H. and Dieks, D., 2005, “A Contextual Account of Scientific Understanding”,Synthese144:  137–170.
  • Dowe, P., 2000,Physical Causation, Cambridge: Cambridge University Press.
  • Earman, J., 1986,A Primer on Determinism, Dordrecht: Reidel.
  • Friedman, M., 1974, ‘Explanation and Scientific Understanding’,Journal of Philosophy, 71: 5–19.
  • Gardiner, P., 1959,The Nature of Historical Explanation, Oxford: Oxford University Press.
  • Gardiner, P.,(ed), 1952,Theories of History. New York: The Free Press.
  • Goodman, N., 1955,Fact, Fiction, and Forecast, Cambridge, MA: Harvard University Press.
  • Greeno, J., 1970, ‘Evaluation of Statistical Hypotheses Using Information Transmitted’,Philosophy of Science, 37: 279–93. Reprinted in Salmon, 1971b.
  • Hall, N., 2004, ‘Two Concepts of Causation’, inCausation and Counterfactuals. J. Collins, N. Hall, and L.Paul (eds), Cambridge: MIT Press, pp. 225–276.
  • Hausman, D., 1998,Causal Asymmetries, Cambridge: Cambridge University Press.
  • Hausman, D. and Woodward, J., 1999, ‘Independence, Invariance, and the Causal Markov Condition.’,British Journal for the Philosophy of Science, 50: 521–583.
  • Hempel, C., 1965a,Aspects of Scientific Explanation and Other Essays in the Philosophy of Science, New York: Free Press.
  • Hempel, C., 1965b, ‘Aspects of Scientific Explanation.’ In Hempel 1965a, 331–496.
  • Hempel, C., 1942, ‘The Function of General Laws in History’,Journal of Philosophy, 39: 35–48; reprinted in Hempel 1965b, pp. 231–244.
  • Hempel, C. and P. Oppenheim., 1948, ‘Studies in the Logic of Explanation.’,Philosophy of Science, 15: 135–175. Reprinted in Hempel, 245–290, 1965a.
  • Janzing, D., Mooij, J., Zhang, K., Lemeire, J., Zscheischler, J., Daniusis, D., Steudel, B. and Scholkopf, B., 2012. “Information-geometric Approach to Inferring Causal Directions”,Artificial Intelligence 182–183: 1–31.
  • Jeffrey, R., 1969, ‘Statistical Explanation vs. Statistical Inference’ in N. Rescher (ed.),Essays in Honor of Carl G. Hempel. Dordrecht: D. Reidel. Reprinted in Salmon, 1971b.
  • Hausman, D., 1998,Causal Asymmetries, Cambridge: Cambridge University Press.
  • Hitchcock, C., 1995, ‘Discussion: Salmon on Explanatory Relevance.’,Philosophy of Science, 62: 304–20.
  • Kitcher, P., 1989, ‘Explanatory Unification and the Causal Structure of the World’, inScientific Explanation, P. Kitcher and W. Salmon, 410–505. Minneapolis: University of Minnesota Press.
  • Kitcher, P and Salmon, W., 1987, “Van Fraassen on Explanation”,Journal of Philosophy 84: 315–330.
  • Koertge, N., 1992, ‘Explanation and Its Problems.’,British Journal for the Philosophy of Science, 43: 85–98.
  • Kyburg, H., 1965, ‘Comment.’,Philosophy of Science, 32: 147–51.
  • Lewis, D., 1973a,Counterfactuals, Cambridge, MA: Harvard University Press.
  • Lewis, D., 1973b, ‘Causation.’,Journal of Philosophy, 70: 556–67. Reprinted with Postscripts in Lewis, 1986, 159–213.
  • Lewis, D., 1986,Philosophical Papers, Volume II, Oxford: Oxford University Press.
  • Lewis, D., 2000, ‘Causation as Influence.’,Journal of Philosophy, 97: 182–197.
  • Lien, Y., and Cheng, P., 2000, “Distinguishing genuine from spurious causes: a coherence hypothesis”,Cognitive Psychology, 40: 87–137.
  • Lombrozo, T., 2010, “Causal-Explanatory Pluralism: How Intentions, Functions, and Mechanisms Influence Causal Ascriptions”,Cognitive Psychology, 61:303–32.
  • Mitchell, S., 1997, ‘Pragmatic Laws’PSA 96 (Supplement to Philosophy of Science, 64 (4): S468–S479.
  • Morrison, M., 2000,Unifying Scientific Theories, Cambridge: Cambridge University Press.
  • Nagel, E., 1961,The Structure of Science: Problems in the Logic of Scientific Explanation, New York: Harcourt, Brace and World.
  • Nerlich, G., 1979, ‘What Can Geometry Explain?’British Journal for the Philosophy of Science, 30: 69–83.
  • Norton, J., forthcoming, “A Material Dissolution of the Problem of Induction”,Synthese.
  • Pearl, J., 2000,Causality: Models, Reasoning and Inference, Cambridge: Cambridge University.
  • Pitt, J. (ed.), 1988,Theories of Explanation. New York: Oxford University Press.
  • Popper, K., 1959,The Logic of Scientific Discovery, London: Hutchinson.
  • Psillos, S., 2002,Causal Asymmetries, Stocksfield, UK: Acumen Publishing.
  • Railton, P., 1978, ‘A Deductive-Nomological Model of Probabilistic Explanation.’,Philosophy of Science, 45: 206–26.
  • Railton, P., 1981, ‘Probability, Explanation, and Information.’,Synthese, 48: 233–56.
  • Ruben, D., (ed.), 1993,Explanation, Oxford: Oxford University Press.
  • Salmon, W., 1989,Four Decades of Scientific Explanation, Minneapolis:University of Minnesota Press.
  • Salmon, W., 1971a, ‘Statistical Explanation’, inStatistical Explanation and Statistical Relevance, W. Salmon, (ed.), 29–87, Pittsburgh: University of Pittsburgh Press.
  • Salmon, W.,1989,Four Decades of Scientific Explanation, Minneapolis: University of Minnesota Press.
  • Salmon, W., 1984,Scientific Explanation and the Causal Structure of the World, Princeton: Princeton University Press.
  • Salmon, W., 1994, ‘Causality Without Counterfactuals.’,Philosophy of Science, 61: 297–312.
  • Salmon, W., 1997, ‘Causality and Explanation: A Reply to Two Critiques.’,Philosophy of Science, 64: 461–477.
  • Salmon, W., (ed.), 1971b,Statistical Explanation and Statistical Relevance, Pittsburgh: University of Pittsburgh Press.
  • Salmon, W. and Kitcher, P., (eds.), 1989,Minnesota Studies in the Philosophy of Science, Vol 13: Scientific Explanation, Minneapolis: University of Minnesota Press.
  • Schaffer, J., 2000, ‘Causation by Disconnection.’,Philosophy of Science, 67: 285–300.
  • Scriven, M., 1959, ‘Truisms as the Grounds of Historical Explanations.’, In Gardiner (ed.).
  • Scriven, M., 1962, ‘Explanations, Predictions, and Laws’, inScientific Explanation, Space, and Time (Minnesota Studies in the Philosophy of Science: Vol. 3), H. Feigl and G. Maxwell (eds), 170–230. Minneapolis: University of Minnesota Press.
  • Sober, E., 1983, ‘Equilibrium Explanation’,Philosophical Studies, 43: 201–210.
  • Sober, E., 1999, ‘The Multiple Realizability Argument Against Reductionism’Philosophy of Science, 66: 542–564.
  • Sober, E., 2003, ‘Two Uses of Unification’, in F. Stadler, ed.,Institute Vienna Circle Yearbook 2002, Dordrecht: Kluwer.
  • Spirtes, P. Glymour, C. and Scheines, R., 1983,Causation, Prediction and Search, New York: Springer-Verlag. Second Edition, 2000. Cambridge: MIT Press.
  • Woodward, J., 1989, ‘The Causal/Mechanical Model of Explanation.’, InScientific ExplanationMinnesota Studies in the Philosophy of Science, volume 13, P. Kitcher and W. Salmon (eds.), 357–383.
  • Woodward, J., 2000, ‘Explanation and Invariance in the Special Sciences.’,British Journal for the Philosophy of Science, 51: 197–254.
  • Woodward, J., 2003,Making Things Happen: A Theory of Causal Explanation, Oxford: Oxford University Press.
  • Woodward, J., 2003,Making Things Happen: A Theory of Causal Explanation, New York: Oxford University Press.
  • Woodward, J., 2006, “Sensitive and Insensitive Causation”,The Philosophical Review.115: 1–50.
  • Van Fraassen, B., 1980,The Scientific Image. Oxford: Oxford University Press

 

Перевод М.В. Семиколенных и М.А. Секацкой

 

Как цитировать эту статью

Вудвард, Джеймс. Научное объяснение // Стэнфордская энциклопедия философии (версия зимы 2014 года) / Ред. Эдвард Н. Залта. Пер. с англ. М.В. Семиколенных и М.А. Секацкой. URL=<http://philosophy.ru/scientific_explanation>.

Оригинал: Woodward, James, “Scientific Explanation”, The Stanford Encyclopedia of Philosophy (Spring 2017 Edition), Edward N. Zalta (ed.), forthcoming URL = <https://plato.stanford.edu/archives/spr2017/entries/scientific-explanation/>.

Примечания