Expand Cut Tags

No cut tags
mns2012: (Default)
[personal profile] mns2012
Французский математик Émile Borel (1971 - 1956).
Источник: Getty images.

В дискуссиях о маловероятных событиях нередко можно слышать такие слова: "Кому-то же должен был выпасть счастливый билет". С этим можно согласиться в отношении единичного выигрыша. Однако ситуация с верностью этих слов может измениться, если счастливый билет оказывается в руках одного и того же человека множество раз. Наличие спецификации, то есть указания на именно такой, а не иной исход, влияет на то, к какому выводу мы должны прийти, анализируя возможные причины наблюдаемого. Этот вопрос связан с проблематикой распознавания дизайна, поэтому он мне представляется интересным. Об этом мы сейчас и поговорим.

Французский специалист по статистике Эмиль Борель занимался этим вопросом. Он пришел к следующему выводу.

События, характеризующиеся достаточно малой вероятностью и при этом удовлетворяющие заранее заданной спецификации, на практике не случайны [то есть, формально говоря, это либо дизайн, либо закономерность — [livejournal.com profile] mns2012].

Поясним это на простом примере, который позаимствуем из статьи У.Дембского, незначительно изменив детали.

Представим, что мы сидим у окна дома в г.Урюпинск и смотрим на проезжую часть. Видим автомобиль бугатти чёрного цвета.

Article_167428_860_575.jpg

Да, редкое событие в Урюпинске, но возможно допустить, что никто специально не хотел произвести на нас впечатление: так уж и быть, случайность. Но вот за этим автомобилем следующий, и тоже бугатти и тоже чёрный. Wunderbar, однако и тут мы вполне можем списать всё на случай. Следующее авто — снова чёрный бугатти. И так далее до двадцати. По мере поступления новых чёрных бугатти, когда-то мы должны будем сказать, что наиболее вероятный сценарий — всё-таки не случай, а дизайн или закон природы, пропускающий только чёрные бугатти по улицам г.Урюпинска.

Исключение закономерности — отдельная интересная тема, которой я здесь не буду касаться в простом предположении, что закономерность, проявляющаяся как крайне маловероятные события, — экзотика. Я не хочу сказать, что она невозможна, просто я вывожу её за рамки обсуждения. В своё оправдание здесь я могу сказать, что те феномены, о которых мы говорим в контексте распознавания дизайна (сложная функция, лингвистические машины и пр.), обладают интересной особенностью: дизайн является абдуктивно наилучшим объяснением наблюдаемой сложной функции, поскольку мы знаем, что подобные системы может создавать разум, как знаем и то, что естественных закономерностей, производящих их, пока не обнаружено. Об этом я много писал в других записях.

Поэтому мы будем считать, что нулевая гипотеза — это случайность, а конкурирующая гипотеза — дизайн. Напомню, что в соответствии с логикой тестирования гипотез по Р.Фишеру, в ходе статистического анализа мы пытаемся отбросить нулевую гипотезу как недостаточно статистически обоснованную и тем самым утвердить конкурирующую гипотезу, представляющую собой отрицание нулевой гипотезы.

В зависимости от требований в конкретных задачах мы должны будем установить тот или иной порог вероятности верности предположения о случайности, который мы можем допустить исходя из данных о контексте нашей задачи. Это повлияет на отбраковку нулевой гипотезы и, следовательно, на появление ошибок первого и второго рода: ложноотрицательных и ложноположительных выводов.

  • В контексте распознавания дизайна ложноотрицательным будет ошибочный вывод о том, что наблюдаемый феномен Х не является дизайном, тогда как Х в действительности — дизайн, а ложноположительным будет ошибочный вывод о том, что наблюдаемый феномен Y является дизайном, тогда как Y в действительности им не является.

То есть в каких-то задачах мы сможем сказать, что мы исключаем случайность после пятого автомобиля подряд, а в каких-то, что лишь после десятого. Однако очень скоро (разумеется, при условии, что бугатти чёрного цвета всё продолжают и продолжают проезжать друг за дружкой мимо нас) допущение случайности потеряет всякий смысл для любой практической задачи.

Вот это и есть принцип Э.Бореля.

Обратим внимание на следующие ключевые моменты.

Спецификация

Первый ключевой момент: наличие спецификации, то есть более или менее краткого описания того, вероятность чего мы хотим охарактеризовать. В нашем примере: "20 бугатти черного цвета подряд" — это и есть спецификация. Фокус с распознаванием дизайна не удастся, как только мы скажем, что автомобиль может быть любой марки и любого цвета. В таком случае вероятность верности нулевой гипотезы слишком высока и случайность не может быть исключена. При отсутствии иных данных мы просто не сможем распознать дизайн, если 20 водителей договорятся и проедут мимо нас друг за другом в разных автомобилях.

Ещё пример. Один человек рассказывал мне, что, когда он служил в армии, старшина ставил в тупик очкариков-новобранцев:

— Если вы, — говорит, — такие умные, скажите, как так получается, что фотон с далёкой звезды попадает мне прямо в глаз.

Понятно, что поскольку здесь не предполагается наличия спецификации, то и событие попадания некоторого фотона в глаз старшине не является из ряда вон выходящим. Но ситуация резко изменилась бы, если мы могли бы пометить, скажем, два случайно выбранных фотона (в выборке по простанству и по времени), и оба они бы попали ему в глаз. Это было бы статистически исключено, и поэтому при решении практических задач мы могли бы спокойно положить вероятность такого двойного попадания равной нулю.

Практические расчёты

Второй момент. Теоретически возможно всё, что угодно: вероятность того, что этот текст получился в результате того, что кошка пробежала по клавиатуре, теоретически отлична от нуля. Однако, с практической точки зрения, вероятности менее некоторого порогового значения, зависящего от контекста конкретной задачи, являются практически нулевыми.

Здесь мы говорим о решении практических задач и о статистическом принципе распознавания дизайна. Следует иметь в виду различие в постановках задач теории вероятностей и статистики. В задачах по теории вероятностей известна популяция и требуется охарактеризовать выборку:


  • Теория вероятностей: в мешке 3 красных и 4 черных шарика; какова вероятность, что я вытащу наугад красный?

тогда как в статистической постановке известна выборка и необходимо охарактеризовать популяцию:

  • Статистика: по опросам голосовавших на нескольких участках предсказать исход голосования по стране.

Формально говоря, вероятность абсолютно любого события не равна ни нулю, ни единице. Я подчёркиваю: любого, включая флуктуацию гравитационного поля Земли, в результате чего брошенные предметы вдруг полетят не вниз, а вверх. Шотландский философ Дэвид Юм, рассматривавший данный вопрос, выражал его суть следующим образом:

— Можем ли мы, — говорит, — утверждать, что Солнце взойдёт над горизонтом завтра? И сам же отвечал: —Да, но только при условии, что не случится ничего, что может существенно повлиять на восход Солнца, например, что Земля не взорвётся в результате попадания в неё гигантского метеорита.

Очень важно понять, что имеется в виду, когда говорят: "достаточно малая". Достаточно малая вероятность — это практический нуль. С практической точки зрения, при исследовании некоторой реально существующей системы привнесение экзотических, но формально возможных случайных факторов, ничего не даёт, а поэтому бессмысленно (см. последнюю цитату здесь). Для различных исследуемых систем пороговое значение, ниже которого вероятности в практических расчётах можно смело обнулять, различно.


  • Принцип его вычисления таков. Берётся оптимистическая оценка макс. числа взаимодействий N в системе за время её жизни (оптимизм заключается в предположении о возможно большем N). Тогда пороговая вероятность p = 1/N. Смысл формулы: это вероятность одного определённого события из N равновероятных исходов.

Искусство вычисления этого порога заключается в том, чтобы наша оценка сверху была как можно ближе к реальному максимуму, чтобы не исключить редкие возможные события, которые нам интересны, чем достигается минимизация числа ложноотрицательных выводов. С другой стороны, нельзя и слишком занизить N, чтобы не увеличить вероятность ложноположительных выводов. Под взаимодействиями подразумевается то, что нам интересно, например, для оценки вероятностных ресурсов биосферы имеет смысл рассматривать число событий размножения за всю историю биосферы.

Имея такую оценку, автор G.Puccio вывел практический критерий распознавания дизайна в биологических системах: максимальное количество функциональной информации (не путать с информацией Шеннона), которое может быть сгенерировано дарвиновским механизмом NS+RV, составляет 140 бит (это несколько десятков АА, если рассматривать белковые строки). Нетрудно догадаться, что 140 — это двоичный логарифм 2140 😁, это и есть оценка числа состояний (событий размножения), которые эволюция может просмотреть в режиме блуждания ДО ТОГО, как включится отбор (выделяю капслоком с красненьким, во избежание реплик из зала про "всемогущий" естественный отбор...).


  • Физический смысл формулы подсчёта функциональной информации рассмотрен здесь.

2140  — это поистине щедрая со стороны разумнотворщиков оценка сверху и, вероятно, значительно урезает наш фильтр дизайна, порождая множество ложноотрицательных результатов, но мы люди добрые, так уж и быть, дадим фору нашим друзьям самособойщикам. Однако всё, что сопровождается скачкообразным возрастанием функциональной информации на более чем 140 функциональных бит, таким образом, необъяснимо с позиции эволюции, ergo design.

  • Можно было бы возразить: а как же дарвиновская постепенность? Да никак, потому что функция не аддитивна, нельзя дарвиновским методом потихоньку набрать сложную функцию, от велосипеда до самолета. Поэтому того, о чём эти товарищи любят рассуждать на пальцах, не может быть в реальности, и в статистическом смысле можно рассчитывать только на скачкообразное появление сложной функции.

Итак, 140 функциональных бит. А, между тем, в биосфере есть много чего такого, что серьезно превышает это значение. Есть даже белки с линейной структурой на 2 Кб функциональной информации, например, а ведь каждый бит ф. информации соответствует удвоению числа состояний, которые надо просмотреть в режиме random walk. Все такие биоструктуры дизайн-положительны.

Реальные возражения данному подходу систематически рассмотрены в статьях G.Puccio, которые я перевёл и прокомментировал у себя в блоге biosemiotics.livejournal.com/tag/gpuccio (например, здесь). Если есть вопросы, то просьба сначала обратиться к этим материалам в целях экономии времени.


Возвращаясь к Эмилю нашему Борелю, скажу, что без этого практического принципа у нас нет средств отделить, так сказать, полезный сигнал от шума. Посудите сами. Вероятность того, что моя нога испытает эффект тунеллирования сегодня в 2 часа пополудни, больше нуля. Больше нуля!
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

mns2012: (Default)
mns2012

January 2026

S M T W T F S
    1 23
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Page generated Jan. 15th, 2026 09:48 am
Powered by Dreamwidth Studios