Функция, определенная в пространстве Ω строк символов фиксированного алфавита A, по необходимости является разреженной (sparse). Причём степень разреженности тем больше, чем выше сложность функции.
Прежде всего заметим, что функция определена в нашем случае на множестве дискретных переменных.
Функциональная сложность переменной (строки s ∈ Ω) измеряется количеством функциональной информации в строке:
If(s) = —log2(|Tf|/|Ω(A)|),
где:
- Ω(A) -- пространство возможных строк символов алфавита А.
- Tf -- целевое подпространство, включающее лишь строки, доставляющие функцию f.
- |X| -- число элементов множества Х.
Почему функция, определённая в таком пространстве, по необходимости разрежена?
Проиллюстрируем это на простом примере, который мы позаимствуем из замечательной лекции Стивена Майера.
Велосипедный замок позволяет установить кодовую комбинацию цифр, которая его открывает.
Итак, функция кодовой комбинации цифр -- открывать замок. В данном случае:
- А = {0,1,...,9}, |A| = 10.
- |Ω| = 104.
- |Tf| = 1.
- If = 4 log210 ≈ 13.3 бит.
- |Ω| = 105.
- |Tf| = 1 (число функциональных комбинаций не изменилось).
- If = 5 log210 ≈ 16.6 бит (количество функциональной информации возросло).
В случае сложных функций размер |Tf| целевого подпространства (то есть фактически число синонимов функциональной строки s) с ростом длины строки L растёт медленнее, чем взрывается размер |Ω| пространства возможных строк:
O(|Tf(L)|) < O(|Ω(L)|).
Попросту говоря, с увеличением длины строки экспоненциально растет число нефункциональных строк. Почему, собственно, в распознавании дизайна и интересны сложные функции.
Кстати, Douglas Axe во время оно показал, что для белкового домена средних размеров (если не ошибаюсь, ~150 АА) отдельно взятого белкового семейства (beta-lactamase), редкость функциональных строк оценивается отношением 1 функциональная строка на каждые 1077. Причём максимальное число организмов, когда-либо живших за всю историю биосферы, в предположениях, благоприятных для эволюционной парадигмы, Майер оценивает как 1040 ≈ 2133 (более оптимистичная для эволюции оценка GPuccio в 2140 организмов отличается в 27=128 раз). Если использовать оценку Майера, то получается, что доля состояний, которые теоретически могли быть просмотрены эволюцией, за всю её славную и неповторимую историю, в процессе поиска функциональной аминокислотной строки для фермента beta-lactamase, составляет 1040/1077 = 10-37. Для осознания масштаба стоящих перед эволюцией задач надо иметь в виду, что размер протеома одноклеточной E.Coli оценивается в 1620-2260 различных типов белков. Как-то многовато для незатейливой схемы RV+NS...
no subject
Date: 2024-09-20 03:28 pm (UTC)Это скорее опровержение мысли, что случайность надо понимать как равномерную. Если пространство структуры реальности неравномерно (а оно очевидно неравномерно), то брать всё пространство возможных строк для таких оценок не вполне корректно. Если взять клавиатуру, руки человека, привычки человека, то генерируемые им "случайные последовательности" будут иметь вполне заметные особенности и даже близко не покроют всё пространство возможных последовательностей равномерными примерами.
no subject
Date: 2024-09-20 04:37 pm (UTC)no subject
Date: 2024-09-20 04:54 pm (UTC)Контр-пример. rand()
Тут надо как-то обозначит границы этого утверждения. В общем случае это не так.
no subject
Date: 2024-09-20 06:11 pm (UTC)no subject
Date: 2024-09-20 06:13 pm (UTC)no subject
Date: 2024-09-20 06:15 pm (UTC)no subject
Date: 2024-09-20 06:16 pm (UTC)Скажите операторам дронов противника )
Случайность и целесообразность вещи ортогональные. Случайность это функция и ей есть место в реальности.
Случайность это кроме прочего ещё и метод, я думаю вы прекрасно знаете метод стохастической оптимизации Монте-Карло. Проблема, что для использования функции нужна цель, а вот целевая функция из метода никак не следует.
no subject
Date: 2024-09-20 06:29 pm (UTC)no subject
Date: 2024-09-20 06:32 pm (UTC)Ничего подобного. Функция в методе Монте-Карло определяет что и как нужно делать со случайными последовательностями. Сама эта функция отнюдь не случайна.
Википедия:
Суть метода заключается в следующем: процесс описывается математической моделью с использованием генератора случайных величин, модель многократно обсчитывается, на основе полученных данных вычисляются вероятностные характеристики рассматриваемого процесса. Например, чтобы узнать методом Монте-Карло, какое в среднем будет расстояние между двумя случайными точками в круге, нужно взять координаты большого числа случайных пар точек в границах заданной окружности, для каждой пары вычислить расстояние, а потом для них посчитать среднее арифметическое.
Garbage in -- garbage out.
no subject
Date: 2024-09-20 06:38 pm (UTC)no subject
Date: 2024-09-20 06:47 pm (UTC)Оптимизируемая функция не случайна, конечно. Случайность тут метод.
Но в реальности никто не говорит, что случайна оптимизируемая функция. Нет такой теории. Говорят о случайности как методе.
no subject
Date: 2024-09-20 06:47 pm (UTC)no subject
Date: 2024-09-20 06:48 pm (UTC)Это вас с праздником! У нас ещё не наступил )
no subject
Date: 2024-09-20 06:50 pm (UTC)Посмотрите вот эту статью
no subject
Date: 2024-09-20 06:55 pm (UTC)Да, с этим я не спорю.
no subject
Date: 2024-09-21 03:28 pm (UTC)no subject
Date: 2024-09-21 03:30 pm (UTC)UTC+3
no subject
Date: 2024-09-21 03:42 pm (UTC)no subject
Date: 2024-09-21 04:08 pm (UTC)Точно, с вечерни же. Упускаю специфику.